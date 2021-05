Che le lingue servano a far comunicare le persone lo sappiamo dalla notte dei tempi. Ma che le lingue ci fanno comunicare con i dispositivi digitali è cosa alquanto recente. Siri è mia amica dal 2011, Alexa parla italiano solo dal 2018, e a seguire gli altri assistenti vocali, Microsoft Cortana, Google Assistant… sono amici che poco frequento.

Noi umani siamo predisposti all’apprendimento, sviluppo e uso della lingua, che studi recenti descrivono sempre più come una sorta di biotecnologia di cui siamo simultaneamente proprietari, utilizzatori, diffusori, custodi e innovatori.

La lingua è un bene che ognuno di noi possiede e ne ha competenza per apprendimento e per uso. È un bene che si evolve nel tempo con l’uso individuale e comune. Ed è per questo un raro umano esempio di proprietà privata che diventa bene collettivo. E se si possiedono più lingue si ha accesso a più beni collettivi.

Ma in che modo questo nostro bene comune serve alla digitalizzazione del nostro Paese? E perché noi umani parliamo e siamo capiti abbastanza bene dai nostri assistenti vocali ma, a oggi, i sistemi informativi, in particolare quelli delle PA, non dialogano tra di loro?

I sistemi informativi per dialogare tra loro si scambiano dati descritti attraverso metadati, vale a dire informazioni sui dati.

Troppo spesso, però, i sistemi informativi delle PA non dialogano tra loro e reciprocamente non si comprendono proprio perché non hanno la capacità di essere aperti allo scambio dei dati. Usando un termine della lingua dell’informatica: non hanno “interoperabilità semantica”. E dall’interoperabilità semantica scaturisce l’accessibilità e il riuso dei dati.

Le PA sono grandi produttrici di dati pubblici, che sono poi i nostri dati. Alcuni sono da proteggere perché sensibili; altri sono pubblici e devono essere facilmente accessibili. I dati pubblici sono gestiti dalle banche dati delle PA, ma sono nostri. I dati sono un bene comune.

Nostri sono i dati di dove e quando siamo nati che sono inscritti nel codice fiscale, i nostri Comuni sono identificati con il CAP e chi siamo nel mondo digitale è il nostro SPID. Ma sono nostri anche i dati pubblici che riguardano la sanità, l’ambiente, la gestione dei soldi pubblici delle tasse, degli investimenti, dei ristori o sostegni. E tanti altri.

In questi anni, però, le PA hanno interpretato la parola testa “banca” della polirematica “banca dati” con l’accezione terminologica della lingua del diritto “deposito di denaro custodito” (art. 1834 Codice Civile). Ma come possiamo prelevare/depositare i nostri soldi attraverso un qualsiasi bancomat così dobbiamo poter accedere dai tutti i nostri dispositivi digitali ai nostri dati pubblici che devono essere aperti per essere scambiati.

La Gigabit society si basa su questo scambio di dati, sul loro riuso nei circuiti comunicativi che li trasformano e rigenerano come energie rinnovabili.

I testi verbali contengono dati e sono essi stessi dati negli ambienti digitali.

Nel Piano Nazionale Ripresa e Resilienza (PNRR) – denominato e comunicato usando tanti termini diversi per uno stesso referente – ci saranno circa 50 miliardi di euro per la digitalizzazione del nostro Paese per superare il gap rilevato dall’indice di digitalizzazione dell’economia e della società (DESI 2020) della Commissione europea che inchioda l’Italia alla 25° posizione sugli allora 28 Stati membri dell’UE (pre Brexit).

Nella Missione 1 una buona quota andrà nella digitalizzazione del sistema produttivo, ma un discreto gruzzolo sarà destinato anche alla digitalizzazione della PA (nella versione del Piano del 5 maggio €. 9,75 Miliardi di euro).

Da linguista ho cercato la frequenza del termine “interoperabilità” nelle 269 pagine del documento del PNRR e ho trovato 26 occorrenze. Ma per raggiungere gli obiettivi di “interoperabilità” descritti nel Piano abbiamo bisogno di dati aperti. Le PA devono rendere disponibili i nostri dati preferibilmente con licenza CC-BY 4.0 (Creative Commons Attribution), che vincola l’utilizzatore a riconoscere la fonte mantenendo la natura della licenza della condivisione.

Da tempo da linguista mi chiedo se i dati abbiano bisogno della lingua per essere scambiati negli ambienti digitali. E dico agli informatici che sì, i dati devono essere descritti e arricchiti da metadati terminologici linguistici perché questi metadati nell’infosfera facilitano il loro scambio e migliorano il dialogo tra i dispositivi digitali e gli esseri umani.

Ma questa è storia per il prossimo post 😉