Il progetto Atti Chiari, che intende costituire la prima banca dati testuale di atti di parte a uso anzitutto linguistico e lessicografico, presenta numerose specificità e sfide per la sua digitalizzazione, a cominciare dalla necessità di eliminare ogni dato personale senza tuttavia sfigurare il tessuto linguistico del testo. A questo scopo si adotta una nuova procedura di pseudonomizzazione, affiancata dalla costante preoccupazione di modellare i requisiti dell'analisi linguistica dei testi che confluiranno poi in un adeguato sistema di archiviazione e ricerca.
Digitalizzazione e marcatura XML degli atti
Daniele Fusi
2021-01-01
Abstract
Il progetto Atti Chiari, che intende costituire la prima banca dati testuale di atti di parte a uso anzitutto linguistico e lessicografico, presenta numerose specificità e sfide per la sua digitalizzazione, a cominciare dalla necessità di eliminare ogni dato personale senza tuttavia sfigurare il tessuto linguistico del testo. A questo scopo si adotta una nuova procedura di pseudonomizzazione, affiancata dalla costante preoccupazione di modellare i requisiti dell'analisi linguistica dei testi che confluiranno poi in un adeguato sistema di archiviazione e ricerca.File in questo prodotto:
File | Dimensione | Formato | |
---|---|---|---|
Fusi_2021_Digitalizzazione_e_marcatura_XML_degli_atti.pdf
accesso aperto
Tipologia:
Documento in Post-print
Licenza:
Accesso gratuito (solo visione)
Dimensione
3.04 MB
Formato
Adobe PDF
|
3.04 MB | Adobe PDF | Visualizza/Apri |
I documenti in ARCA sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.