DSC_0082.jpgDSC_0044 1.jpgDSC_0058.jpgDSC_0189.jpgDSC_0202.jpgDSC_0059.jpgDSC_0057.jpgDSC_0188.jpgDSC_0054 1.jpgDSC_0084 2.jpgDSC_0152.jpg

Open Data

Gli open data: cosa sono e perchè servono.

In parole povere, gli Open Data sono dati pubblici riutilizzabili. Il concetto di Open Data va a braccetto con quello di Open Government, con il quale si intende un modello di Governance a livello centrale e locale basato sull'apertura (partecipazione e collaborazione) e sulla trasparenza nei confronti dei cittadini. Seguendo gli esempio delle amministrazioni pubbliche statunitensi e della Gran Bretagna (e qui), le nostre PA dovrebbero/potrebbero raccogliere dati per poi rimetterli a disposizione, lasciando che sia poi la rete a riutilizzarli ed analizzarli secondo le proprie esigenze.

Inoltre, Open Data permette di sfruttare l’intelligenza collettiva, ovvero più persone che utilizzano, rivedono, controllano i dati ed i relativi elaborati (esempi ben noti di intelligenza collettiva sono Linux, Open Street Map, R...).
A grandi linee, impiegando gli Open Data si va verso  la produzione di applicazioni (stand alone, web, per smartphone, …) che consentono un uso "interattivo" del dato, dall'altra verso l'analisi, la ricerca, il data journalism, dove invece il dato e' un dato commentato, contestualizzato in un discorso piu' ampio e  omogeneo.
Esempi di Apps sugli open data le possiamo trovare su appsfordevelopment e opendatachallenge - who were the winners, mentre sul fronte del data journalism abbiamo ad esempio il Data Blog del Guardian o, in Italia, quello del Sole24Ore. Si tenga comunque presente che parlare di data journalism è in effetti un po’ fuorviante, dato che si parla comunque di interpretazione e visualizzazione del dato in senso generale e per qualunque tipo di uso, non necessariamente giornalistico.
I dati si possono prendere dalle banche dati (Portali, Sistemi Informativi, siti DataGov, siti Open Data,...) oppure si possono prendere direttamente dalle pagine internet, facendo il cosiddetto web scraping. In questo secondo caso, ovviamente, bisogna essere sicuri che tali dati possano essere effettivamente utilizzati e che non si vada incontro a problemi di licenza. Ciò in genere non accade per le banche dati, perchè già il fatto che i dati siano disponibili significa che possono essere utilizzati (in realtà poi la cosa non è comunque così semplice e scontata, perchè potrebbero non essere ripubblicabili o utilizzabili per applicazioni commerciali, ecc.).
Secondo Tim Berners-Lee si può pensare ad una disponibilità del dato ordinabile su 5 livelli:

  • livello 1: dati disponibili sul web (ad esempio un pdf o un’immagine)
  • livello 2: dati disponibili sul web in formato non strutturato (file excel)
  • livello 3: dati disponibili sul web in formato non strutturato su file non proprietario (file csv)
  • livello 4: dati disponibili sul web in formato non strutturato su file non proprietario (file csv) con un URL ben identificabile e permanente, in modo che siano raggiungibili
  • livello 5: dati disponibili sul web in formato strutturato, Linked Open Data

(ovviamente si da per scontato che i dati abbiano licenza open che ne consenta il riuso).
I Linked Open Data sono dati strutturati con dei metatag (ogni numero ha uno o più tag) cosicchè data set differenti, prodotti e pubblicati in modo indipendente da diversi soggetti, possono essere incrociati liberamente da terze parti (2).

In sintesi gli Open Data devono essere:

  • pubblici (visibili a tutti)
  • accessibili (nessuna condizione di di contratti o iscrizione, formato aperto)
  • tempestivi (accessibili immediatamente senza tempi di attesa)
  • liberi (licenze non proprietarie)
  • esportabili e scaricabili
  • elaborabili (il più possibile disaggregati)
  • riutilizzabili (chiunque è libero di riutilizzarli)
  • documentati (sono descritti i passaggi di raccolta ed elaborazione)
  • permanenti


Le prospettive relative all’uso degli Open Data sono tantissime, sia dal punto di vista della trasparenza che dello sviluppo economico, come ben evidenziato in un recente studio realizzato dal Laboratorio di Economia e Management della Scuola Superiore Sant’Anna di Pisa (3).

 

Nota: devo ringraziare @lucadex e @vincpatruno per avermi fatto approdare al mondo degli Open Data

"m. calderisi @ chemiometria.it", used under a Attribution-NonCommercial-ShareAlike license
joomla template by a4joomla
Privacy Policy