La struttura della fonte e la sua resa digitale: la DTD
Fruire in modo non superficiale delle potenzialità offerte dall’automazione di alcuni procedimenti implica, quale presupposto metodologico, la conoscenza puntale quanto approfondita del contenuto e della struttura dei dati codificati e assieme, dei criteri che hanno presieduto la loro costruzione. Come è più volte emerso, l’operazione fondamentale da compiere per poter utilizzare la codifica informatica nel campo storico
Una definizione, in via preliminare: una Document Type Definition è un insieme di regole per costruire documenti XML sintatticamente validi (well formed), essenzialmente una grammatica per la descrizione dei tag e del loro innestamento.
Di più: una DTD definisce l’insieme di tutte le possibili marcature valide per un documento e in essa vengono stabiliti, a priori, tutti gli elementi che si ritengono significativi della struttura e il contenuto dei documenti, ma anche i loro attributi e i rapporti tra essi intercorrenti. Una DTD è dunque un file che definisce nomi, attributi e restrizioni di occorrenza simultanea per tutti gli elementi e le entità identificate e usate da un’intera classe di documenti, stabilendone la forma e le reciproche relazioni.
In concreto essa è costituita da un insieme di dichiarazioni di markup definite da un nome (identificatore generico) e un modello di contenuti (content model), divise in:
L’elemento identifica un’unità testuale considerata come componente strutturale: in questo senso, contenendo un nucleo informativo, è in qualche modo simile ad un campo di database anche se, diversamente da questo, mostra una flessibilità ben maggiore, rendendo possibile allargare o specificare l’informazione in esso contenuta. Ad ogni elemento viene associato un content model che specifichi cosa possa essere contenuto al suo interno: altri elementi, attributi o testo libero (#PCDATA) attraverso indicatori di occorrenza deputati a stabilire quante volte quel determinato contenuto possa essere utilizzato (* = zero o più occorrenze, ? = zero o 1 occorrenza, + = una o più occorrenze); l’assenza di indicatori indica una e una sola occorrenza. Un esempio, molto semplice, di occorrenze di elementi in una Document Type Definition può essere il seguente:
In questo modello, all’interno dell’elemento capitolo sono previsti un titolo, qualora presente un unico sottitolo, mentre si stabilisce che l’elemento paragrafo debba essere presente almeno una volta. L’elemento note invece, contenuto all’interno del paragrafo, può essere ripetuto infinite volte oppure essere totalmente assente. Gli attributi associati ad ogni elemento vengono esplicitati attraverso una lista introdotta dalla dichiarazione <!ATTLIST…> nella quale il singolo attributo viene definito da un nome, il tipo di dato e un valore di default, stabilito tra #REQUIRED (quando il valore deve essere specificato) e #IMPLIED (quando non deve essere specificato nessun particolare valore):
Nel caso illustrato si stabilisce ad esempio che nell’inserire l’attributo edizione il codificatore debba sempre segnalare se si tratta di una bozza, di un testo rivisto oppure di un testo già pubblicato. Già da questi esempi basilari si intuisce quella che può essere la centralità di una Document Type Definition in una procedura di codifica informatica, vista la sua indubbia utilità nell’orientare e vincolare l’interpretazione della fonte analizzata, sia per quanto concerne il contenuto che si intende comunicare, sia con riferimento alla predisposizione di un quadro di riferimento utile all’utente che si approcci al testo codificato. Tra gli indubbi vantaggi insiti nell’utilizzo di una DTD nella composizione di un’edizione elettronica, vanno infatti annoverati la possibilità – per ogni documento edito – di contenere al suo interno una descrizione del proprio formato, ma anche quella – per gruppi di utenti diversi – di concordare un modello unitario di codifica che faciliti lo scambio della documentazione. Avendo inoltre predisposto preventivamente una Document Type Definition, qualunque editor deputato alla produzione di documenti XML è in grado di sfruttare le sue regole per la creazione di un’interfaccia di inserimento dei dati che sia conforme con il modello, evitando in questo modo eventuali errori di inserimento di marcatori da parte del codificatore. Resta per inteso che, dal momento che ogni definizione di tipologia documentaria, ogni modellizzazione, si delinea come interpretazione soggettiva, non esiste una Document Type Definition in grado di riflettere una verità assoluta del testo trattato. La DTD, in sostanza, è uno strumento che non fornisce informazioni sulla semantica né tantomeno sulla rappresentazione di un documento, ma il cui scopo è esercitare un controllo sulla marcatura: una guida, il cui uso assicura che tutti i documenti stabiliti siano informaticamente costruiti e strutturati in maniera omogenea e conforme.
Lo schema proposto rispecchia fedelmente gli interessi della ricerca in atto, che sono tutti orientati al contenuto del cartulario e dei documenti in esso trascritti, escludendo pertanto la codifica degli aspetti materiali del manoscritto, per i quali si è pensato di riservare all’interno del sito un’apposita sezione illustrativa.
|