Text Encoding Initiative

L’iniziativa, promossa dalle tre più importanti associazioni nel campo dell’informatica umanistica e della linguistica computazionale (l’Association for Computers and the Humanities - ACH, l’Association for Computational Linguistics - ACL - e l’Association for Literary and Linguistic Computing (ALLC), è stata avviata durante il convegno tenutosi nel 1987 al Vassar College di Poughkeepsie a New York, nel corso del quale sono stati redatti i cosiddetti Poughkeepsie Principles, ossia i principi base cui ci si sarebbe dovuti attenere nella realizzazione di uno schema di codifica dei testi letterari per la ricerca umanistica.

Le prime specifiche  provvisorie sono state pubblicate nel 1991 con il titolo Guidelines for Electronic Text Encoding and Interchange, TEI P1. Successive revisioni del linguaggio si sono avute nel 1992, TEI P2, nel quale la struttura della DTD è stata notevolmente rimaneggiata e nel 1994, TEI P3.

L’indirizzo da cui è possibile prelevare o consultare una copia delle direttive per la codifica è: http://www.tei-c.org/P4X/; ne esiste anche un’edizione a stampa, per i tipi della University of Virginia Press, scaricabile dal sito: http://www.upress.virginia.edu/books/tei.html.

Il principale supporto finanziario al progetto è fornito dall’U.S. National Endowment for the Humanities (NEH), dal XIII Direttorato della Commissione Europea (Information Society Directorate-General CEC/DG-XIII), dalla Andrew W. Mellon Foundation e dal Social Science and Humanities Research Council of Canada.

Sull’onda del successo ottenuto dal linguaggio TEI, adottato in numerosi progetti accademici a livello internazionale, nel dicembre del 2000 i membri della Text Encoding Initiative hanno deciso di rendere permanente il progetto, costituendo il TEI Consortium,  una organizzazione internazionale senza scopo di lucro fondata al fine di sostenere e mantenere lo sviluppo e la diffusione dello standard TEI.

Il TEI Consortium ha i suoi uffici esecutivi a Bergen in Norvegia ed è ospitato da quattro università nel mondo: University of Bergen, Brown University, Oxford University, e University of Virginia. Il Consorzio è diretto da un Consiglio di Direzione e la sua attività tecnico-scientifica è controllata da un Consiglio elettivo. Le attività sono svolte tipicamente da piccoli gruppi internazionali di esperti, coordinati da due curatori, uno in Nord America e uno in Europa.

La Document Type Definition della TEI prevede oltre 500 elementi, ripartiti in uno schema caratterizzato da una forte modularità (DTD Fragments).

I DTD Fragments definiscono tre gruppi di tag (tag sets), che vengono combinati fra di loro per produrre uno schema adatto alla tipologia del testo da sottoporre a codifica: un Core tag set, che contiene il nucleo minimo di elementi comuni ad ogni tipo di testo, un Base tag set, checontiene diversi tag set specifici per vari tipi di documenti fondamentali (lirica, prosa, dramma) e un Additional DTD tag set, che include elementi per la rappresentazione di caratteristiche utili ad evidenziare determinate peculiarità del testo (codifica di apparati di varianti, rappresentazione di strutture ipertestuali, codifica di fonti primarie).

Al fine di aiutare gli utenti nella costruzione di versioni personalizzate della DTD nel sito del TEI Consortium si trova una applicazione Web, chiamata scherzosamente Pizza Chef con cui è possibile senza grande sforzo “cucinarsi”, per adottare l’ironica definizione usata nel sito dell’applicazione, la propria DTD.

Sempre con l’obiettivo di favorire la diffusione della TEI, la commissione editoriale del progetto ha inoltre prodotto una versione ridotta dello schema di codifica battezzata, TEI-Lite, ovvero una DTD, che contiene soltanto un sottoinsieme degli elementi (circa 170) dell’intero sistema TEI, pur mantenendo la piena compatibilità e conformità con esso. TEI-Lite è praticamente una versione semplificata dell’intero schema di codifica definito dalla TEI, creato per soddisfare le esigenze più comuni nella codifica dei testi e facilitare la realizzazione di testi in formato elettronico compatibili con l’intero schema, senza richiedere lo studio di tutta la DTD. Al momento TEI-Lite è il sottinsieme di TEI più diffuso e adottato in numerosi progetti di codifica testuale e nella creazione di archivi documentali.

 

Sulla TEI si veda, in particolare,

  • Sperberg-McQueen C.M., Burnard L., Guidelines for the Encoding and Interchange of Electronic Texts (TEI P3), Chicago and Oxford, The TEI Consortium 1994 (Text Encoding Initiative).