2. ARCHIVI TESTUALI E LINGUISTICI
Nota 1: Un utile strumento di indagine sugli indirizzi di conservazione di testi in formato elettronico è Alex (A Catalogue of Electronic Texts on the Internet). Permette all'utente di cercare e ricevere testi, tra l'altro quelli del Project Gutenberg (s.v.s.), On-line Book Initiative, the Eris System presso Virginia Tech, l'English server presso Carnegie Mellon University e parte dell'OTA (cfr. infra): gopher: //rsl.ox.ac.uk:70/11/lib-corn/hunter; http://www.lib.ncsu.edu/stacks/alex-index.html.
Nota 2: Un utile strumento, aggiornato mensilmente, dedicato soprattutto alla letteratura, è intitolato "A Guide to Literature on the Internet". http://www.cis.ohio-state.edu:80/text/faq/usenet/internet/literary-resources/faq.html.
- ARTFL: American and French Research on the Treasury of the French Language. Il centro conserva un'enorme banca dati di testi francesi. Si possono effettuare ricerche in linea. Lo scopo del corpus è soprattutto di carattere linguistico e lessicologico.
http://tuna.uchicago.edu/ARTFL.html
- CCAT. Presso il centro sono conservati molti testi inglesi o traduzioni inglesi di testi antichi. Post-Nicene Fathers: La vecchia serie "Select Library of Nicene and Post-Nicene Fathers" è on-line in file di notevoli dimensioni, codifica ASCII "but with some html-fying going on (notably for Jerome)". (Messaggio su lt-antiq di Jim O'Donnel).
http://ccel.wheaton.edu/fathers
Persona di riferimento: Jim O'Donnel.
mailto:jod@ccat.sas.upenn.edu).
Vi è una pagina dedicata ad Agostino di Ippona.
http://ccat.sas.upenn.edu/jod/augustine.html
- CETH: Center for Electronic Texts, Rutgers and Princeton Universities. Vi sono svariati progetti sui testi elettronici. La pagina web è una delle migliori per il collegamento che fornisce a siti che conservano testi elettronici o li analizzano.
http://www.ceth.rutgers.edu
Persona di riferimento: Hockey Susan mailto:ceth@zodiac.rutgers.edu.
Il gruppo di interesse etextctr (Electronic Discussion Group on Electronic Text Centers) è legato al CETH.
mailto:etextctr@lists.princeton.edu
Sottoscrizione mailto:listproc@lists.princeton.edu
- Comparative literature, University of Alberta:
http://www.ualberta.ca/ARTS/ricl.html
- CPET: Georgetown Catalogue of Projects in Electronic Text, Center for Text & Technology.
Schedatura dei centri o delle imprese che si occupano della codifica di testi. Strumento di notevole utilità.
gopher://gopher.georgetown.edu
telnet:// guvax3.georgetown.edu (al login rispondere con "CPET", premere ENTER e poi dare il proprio indirizzo elettronico).
- Dartmouth Dante Project (301 Bartlett Hall, HB 6087, Dartmouth College, Hanover, NH 03755). Sono conservati i commenti alla Divina Commedia.
telnet://baker.dartmouth.edu:1835
telnet://library.dartmouth.edu
- Gutenberg. Il Project Gutenberg ha lo scopo di porre in formato elettronico il massimo numero di testi letterarii (e non) in inglese.
http://med-amsa.bu.edu/Gutenberg/welcome.html
Project Gutenberg List of Texts.
http://jg.cso.uiuc.edu/pg_home.html
- HTI: Humanities Text Initiative, University of Michigan. Si tratta di testi di vario genere (per es. Middle English Prose, Migne latino), di cui alcuni sono disponibili al pubblico.
http://www.hti.umich.edu
- ICAME: International Computer Archive of Modern English. Si trova presso il Norwegian Computing Centre for the Humanities, Bergen, Norvegia:http://www.hd.uib.no/index-e.html. Si occupa soprattutto di linguistica e lessicologia, di grandi corpora, di traduzione (testi paralleli norvegesi / inglesi). Fornisce un software di analisi lessicale (lexa). Vi è sul sito un link ad altre iniziative direttamente legate al progetto: UCREL (cfr. infra), Leeds School of Computing Studies (cfr. infra).
http://nora.hd.uib.no
Il centro tiene una lista di notevole interesse per chi studia le applicazioni informatiche ai corpora testuali: corpora.
mailto:corpora@hd.uib.no
Sottoscrizione: mailto:majordomo@uib.nora
Vedi anche http://www.hd.uib.no/corpora/archive.html
- IdS= Institut für Deutsche Sprache, Mannheim, Friedrich-Karl-Strasse 12, Postfach 5409, D-6800 Mannheim Germania. Presso l'istituto sono conservati corpora elettronici di vario tipo (lingua orale e scritta).
http://www.ids-mannheim.de.
- Laboratorio di linguistica, Scuola Normale Superiore di Pisa. Sono a disposizione le ultime due annate dei Quaderni del Laboratorio di Linguistica.
http://alphalinguistica.sns.it/
- LASLA: Laboratoire d'Analyse Statistique des Langues Anciennes, Place du 20 aout 32, B-4000, Liège, Belgio.
mailto:u0013a1@bliulg11
- Leeds School of Computing Studies.
http://agora.leeds.ac.uk
- LETRS: Indiana University Library Electronic Text Resource Service for links to language and linguistics materials.
http://www.indiana.edu/~letrs
- MLA guidelines on Evaluating Computer-Related Work in the Modern Languages.
http://jefferson.village.virginia.edu/mla.guidelines.html
- OTA: Oxford Text Archive. Si tratta di uno dei più grandi archivi testuali, in cui sono registrati testi in tutte le maggiori lingue europee, antiche e moderne. Si segnala che parecchi testi sono oggi disponibili al pubblico codificati secondo il sistema SGML.
http://users.ox.ac.uk/~archive/ota.html (si segnala che dal sito si può anche accedere a informazioni sul Susanne corpus, che può essere raggiunto via ftp nella directory pub/ota/public/susanne).
http://sable.ox.ac.uk/departments/humanities.
- PERSEUS. I testi inclusi nei CD-ROM del progetto Perseus sono disponibili anche on line, in una duplice versione:
1) testi da importare:
http://www.perseus.tufts.edu/Texts/dump_TOC.html
2) testi da consultare on line:
http://www.perseus.tufts.edu/Texts/chunk_TOC.html.
Alcuni dei testi greci sono corredati da links alle pagine di analisi morfologica di Perseus.
- Proyecto Filosofia en español: Universidad de Oviedo:
http://www.uniovi.es/~filesp
- TITUS: Thesaurus Indogermanischer Text- und Sprachmaterialien. Testi di diverse lingue indeuropee, importabili via ftp, notizie su corsi universitari.
ftp://ftp.rz.uni-frankfurt.de/pub/titus/texte
http://www.rz.uni-frankfurt.de/home/ftp/pub/titus/public_html
- TLG: Thesaurus Linguae Graecae. Il CD-ROM del TLG, elaborato presso la University of California di Irvine, si propone di raccogliere tutta la produzione letteraria in lingua greca, da Omero al 1200 d.C. I testi non sono on-line, ma solo su CD-ROM.
mailto:tlg@uci.edu
gopher://tlg.cwi.uci.edu:7011/11/
http://www.tlg.uci.edu/~tlg
- Thesaurus Linguarum Hiberniae, Project Curia. Codifica SGML / TEI di testi antichi e moderni in irlandese.
ftp://curia.ucc.ie
http://curia.ucc.ie/curia/intro.html
- TLL = Electronic Thesaurus Linguae Latinae (The). Presso la HomePage sono reperibili notizie sulla informatizzazione del TLL e sulle attività del Consortium of Latin Lexicography, California, Irvine.
http://www.cs.usask.ca/grads/devito/e-TLL
- UCREL: University Centre for Computer Corpus Research on Language, Lancaster University. Vi sono qui degli importanti corpora linguistici: 1) LOB: Lancaster/Oslo-Bergen Corpus; 2) SEC: Lancaster/IBM Spoken English Corpus; 3) Brown University Corpus; 4) Kolhapur Corpus (inglese parlato in India)
http://www.lancs.ac.uk
Per tornare all'indice