Un progetto rivoluzionario nella storia dell’informazione italiana. Un’idea dell’AgCom, l’autorità per le garanzie nelle comunicazioni, per avere a disposizione una banca dati immensa, online e consultabile in qualunque momento. Per farlo, il Garante ha lanciato un bando e impostato un budget da oltre 150.000 mila euro in 5 anni. Il fornitore esterno che vincerà il servizio dovrà essere in grado di creare un contenitore capace di raccogliere fino a 100 milioni di documenti.
Intelligenza artificiale
Una simile banca dati può essere creata a condizione di mettere in campo i software più sofisticati dell’Intelligenza Artificiale. Servono, per la precisione, gli algoritmi della famiglia del natural language processing, software in grado di comprendere il linguaggio dell’uomo. Servono, più in generale, algoritmi dinamici della famiglia del machine learning, che sono software capaci di migliorare le loro prestazioni attraverso l’esperienza sul campo. Il database, nelle idee dell’AgCom, sarà disponibile per la navigazione di tutti con un motore di ricerca interno, sulla falsariga di Google. L’obiettivo principale è permettere al Servizio economico-statistico dell’Autorità di studiare la nostra informazione – le parole che usa, i temi che affronta – in maniera molto più analitica che in passato.
L’organizzazione del database
Perché lo studio sia attendibile, c’è bisogno di disporre di grandi quantità di documenti. Per questo, l’Autorità ambisce a un sistema di monitoraggio che guardi ad almeno 2000 fonti d’informazione. Le varie testate saranno sempre controllate e verificate, anche se non saranno prese in considerazione solo redazioni giornalistiche. Oltre ai quotidiani nazionali e locali, sia cartacei che online, le altre fonti accreditate saranno i telegiornali (anche regionali), i programmi televisivi di informazione, i giornali radio e affini, le agenzie di stampa e le fonti scientifiche. Anche le testate esclusivamente online rientrano nell’elenco, così come i profili social delle principali fonti d’informazione. Infine, sempre in questa direzione, saranno monitorati gli influencer legati al mondo dell’informazione e altri siti web, pagine e account social di “fonti di informazione non tradizionale”.
Il destino delle fonti
Tutte queste fonti dovranno essere raccolti per 5 anni dal momento della firma del contratto tra il fornitore e l’Autorità. Il fornitore dovrà andare anche un po’ a ritroso, includendo anche tutto quello che è stato pubblicato dal primo gennaio del 2020. Ovviamente avere quantità sconfinate di documenti equivale a non averne, se non si dispone anche degli strumenti per catalogare le informazioni e per navigarle. I tecnici dell’Autorità, in altre parole, devono avere la possibilità di interrogare la banca dati (“con operatori logici come AND OR, NOT, e con parentesi).
I tecnici dovranno disporre anche di “una serie di filtri. Data di inizio, data di fine, fonti e gruppi di fonti”. E la banca dati dovrà fornire risposte in forme aggregate ed esaurienti. La banca dati potrà dare queste risposte se progettata da esperti di intelligenza artificiale. A ciascuna notizia presente nel database dovranno essere associati quelli che gli esperti chiamano metadati. Un numero identificativo del documento, il titolo della notizia, il sottotitolo, la data di pubblicazione, l’autore, la fonte,la categoria (cronaca, cultura, economia, esteri, politica, scienza, spettacolo, sport).
Leave A Reply