ANALISI DEL DATASET

basato su schema di www.odmc.org

 

2.1 Individuazione priorità di pubblicazione

Qualunque documento di cui l’ente dispone oppure che ha acquisito durante le proprie funzioni istituzionali è un potenziale candidato ad essere individuato all’interno della categoria degli open data.

Sono considerati di proprietà dell’ente non soltanto i dati di cui dispone, ma anche tutti quei dati acquisiti direttamente e/o indirettamente dai fornitori di servizi. Pertanto, coloro che detengono tali dati devono fornirli all’ente in forma disaggregata, in formato aperto, possibilmente tabellare, per consentire all’amministrazione di acquisirne la piena disponibilità.

I dati che sono stati identificati, in accordo al Piano Triennale per l’Informatica nella Pubblica Amministrazione, come maggiormente significativi per i cittadini e che costituiscono il cosiddetto “paniere” sono appartenenti alle seguenti categorie:

  • Agricoltura, pesca, silvicoltura e prodotti alimentari
  • Ambiente
  • Economia e Finanza
  • Energia
  • Giustizia, sistema giuridico e sicurezza pubblica
  • Governo e settore pubblico
  • Istruzione, cultura e sport
  • Popolazione e società
  • Regioni e città
  • Salute
  • Scienza e tecnologia
  • Tematiche internazionali
  • Trasporti

Il Responsabile Open Data ha il compito di esaminare e individuare i dati che saranno oggetto di pubblicazione in formato aperto seguendo il metodo MoSCoW (Must-Should-Could-Won’t). Questo metodo consente di individuare le priorità di pubblicazione dei dati secondo la seguente scala:

MUST: i dataset che rientrano in questa categoria hanno la massima priorità di pubblicazione e sono, quindi, di massimo interesse per la collettività. In alcuni casi questi dati sono o possono rappresentare Best Practice da e per altre PA.

SHOULD: il grado di priorità dei dataset è alto, per cui devono essere pubblicati appena possibile, rappresentando un medio interesse da parte della collettività.

COULD: sono dataset la cui pubblicazione è potenziale e auspicabile, ma con un interesse ridotto per i fruitori.

WON’T: i dataset hanno una priorità bassa, pertanto non saranno pubblicati se non eventualmente in futuro, in quando non c’è interesse su di essi da parte della collettività.

 

2.2 Analisi di riservatezza e titolarità

Non tutti i dati prodotti all’interno dell’Ente potranno essere pubblicati liberamente. In particolare, non saranno rilasciati come dati di tipo aperto per il riutilizzo, quindi saranno archiviati dallo Staff Tutela Dati, quelli che potrebbero violare:

  • la sicurezza pubblica, la difesa nazionale, lo svolgimento di indagini penali o disciplinari;
  • il diritto di terzi al segreto statistico, industriale e commerciale, o altri vincoli di segretezza fissati in obblighi di legge;
  • i diritti di proprietà intellettuale di terze parti;
  • il diritto alla protezione dei dati personali.

La classificazione che andrà operata sarà dunque tra tre diversi tipi di dati:

  • Dati Pubblici, che quindi possono essere pubblicati liberamente;
  • Dati Riservati, che appartengono alla categoria sopra descritta e che quindi dovranno essere archiviati;
  • Dati Vincolati, che sono tutti i dati in possesso dell’Ente sui cui terzi detengono diritti di proprietà intellettuale ai sensi della Legge n. 633 del 22 aprile 1941 e/o diritti di proprietà industriale ai sensi del D.Lgs n. 30 del 10 febbraio 2005, o che comunque sono stati originati da terze parti. Tali dati potranno essere aperti soltanto dopo la clearance dei diritti di copyright.           

Oltre alla classificazione del livello di riservatezza del dataset, lo Staff Tutela Dati deve indicare il nominativo e dati di contatto del titolare del dato, classificandoli in dati di proprietà di:

  • pubblica amministrazione o l'organismo di diritto pubblico che ha originariamente formato per uso proprio o commissionato ad altro soggetto pubblico o privato il documento che rappresenta il dato, o che ne ha la disponibilità; come definito dall’articolo 2, comma 1, lettera i, del D.Lgs n. 36 del 24 gennaio 2006 e successiva modificazione;
  • terzi che detengano diritti di proprietà intellettuale ai sensi della Legge n. 633 del 22 aprile 1941 e/o diritti di proprietà industriale ai sensi del D.Lgs n. 30 del 10 febbraio 2005.

Lo spostamento dei dati da un sistema informativo ad un altro non modifica la titolarità e quindi rimane immutata la responsabilità sulla gestione dello stesso e sulla sua esattezza e veridicità, come previsto dall’art. 58 comma 1 del d.lgs. 82/2005. Ciò comporta che l’uso legittimo del dato in tutti gli altri casi (ossia dati formati da altri soggetti) avvenga ottenendo dal titolare apposita licenza.

Il Responsabile del Dataset deve, nel rispetto della legge 633/1941, essere attento alla titolarità delle informazioni che si vogliono pubblicare al fine di evitare la violazione dei diritti di autore o altri diritti di privativa di soggetti terzi. L’esistenza del diritto di autore e dei diritti connessi potrebbero impedire o limitare l’utilizzo dei dati per scopi diversi da quelli istituzionali.

I limiti alla conoscibilità dei dati sono quelli previsti dalle leggi e regolamenti in vigore con particolare riferimento alla tutela della riservatezza dei soggetti a cui i dati si riferiscono (d.lgs. 196/2003 “Codice in materia di protezione dei dati personali” e provvedimenti del Garante n. 17/2007 “Linee guida in materia di trattamento di dati personali per finalità di pubblicazione e diffusione di atti e documenti di enti locali” e n. 88/2011 “Linee guida in materia di trattamento dei dati personali contenuti anche in atti e documenti amministrativi, effettuati da soggetti pubblici per finalità di pubblicazione e diffusione sul web”). I dati anonimi sono comunque pubblicabili.

 

2.3 Archiviazione

Un dataset potrebbe non essere idoneo alla pubblicazione per i seguenti motivi:

  • per riservatezza: come indicato nel processo 2.2 Analisi di riservatezza e titolarità, i dati classificati come “riservati” non sono pubblicabili come Open Data;
  • per titolarità: il processo 2.4 Copyright clearence identifica quali dati non possono essere considerati “aperti” per impedimento contrattuale o mancati accordi per la clearence dei diritti d’autore;
  • altro: ad esempio costi di dematerializzazione troppo alti.

 

2.4 Copyright Clearence

La copyright clearance è l’attività necessaria a contattare l’effettivo titolare del dato e predisporre un accordo di utilizzo o l’applicazione di una licenza aperta al dataset identificato, che permetta il suo riuso e la sua diffusione da parte dell’Ente e da chiunque abbia accesso ai dati.

Idealmente, si dovrebbe provare ad ottenere che il detentore dei diritti sui dati rinunci a tutti gli interessi sulla opera attribuendola al Pubblico Dominio con l’utilizzo dello strumento IODL (Italian Open Data License), dettagliata nel processo 4.2.11 Applicazione della licenza d’uso, a cui si rimanda.

 

2.5 Analisi del formato e della struttura

In considerazione della molteplicità e varietà di dati che devono essere esaminati, è necessaria preliminarmente una loro classificazione sulla base di formato/struttura e, quindi, della diversa “leggibilità” dello stesso. A tale scopo è utile fare riferimento al Modello 5 stars a cui si rimanda.

A partire da questa classificazione, saranno poi effettuate una serie di operazioni volte ad ottenere un dataset pronto per la pubblicazione e cioè che sia in formato digitale, strutturato e aperto.

 

2.6 Dematerializzazione

Non è raro trovare molti dei potenziali dataset in formato cartaceo. In tale caso, è necessario documentare accuratamente lo stato di conservazione, le caratteristiche, la quantità e il formato primario dei dati (tabelle, testo, immagini), informazioni necessarie ad avviare un progetto di dematerializzazione.

 

2.7 Strutturazione del dataset

A seconda del dato analizzato, gli attori responsabili del processo devono classificare la situazione del dato (se in formato digitale) all’origine tra le seguenti categorie e livelli:

  • Dati grezzi: disponibili in formati che non consentono l’estrapolazione immediata degli stessi come ad esempio immagini nei diversi formati grafici (.gif, .jpg, .png, .bmp, etc) o documenti in formato proprietario Adobe PDF o Microsoft Word. Questi dati, senza trasformazioni, possono essere aperti con livello ★
  • Dati strutturati: dati disponibili in formati – aperti o proprietari - che ne consentono l’elaborazione in forma strutturata (es. righe e colonne). Ad esempio, fogli di calcolo in formato proprietario create con Microsoft Excel (in formato .xls, .xlsx) possono essere aperti con livello ★★. Se salvati in formati non proprietari (come .csv, .ods) raggiungono il livello ★★★.
  • Database: di norma di questi dati è possibile scegliere il formato di esportazione più idoneo (es. XML, JSON o altri formati aperti). L’esportazione può produrre file classificabili con livello ★★★★ o ★★★★★ (Linked Open Data) se relazionati ad altri dataset.

Nel caso in cui l’Ente sia in possesso di dati grezzi (cioè non aperti e classificabili come ★), la trasformazione di questi in dati aperti dovrà essere valutata dal Responsabile Open Data, data la sua onerosità, sia in relazione al valore dei dati, sia in termini di risorse che di tempi.

Nel caso di dati a ★★ (strutturati, ma in formato proprietario) sarà opportuno convertirli in formati aperti e raggiungere quindi un livello ★★★.

I database che potranno generare dati a ★★★★ o ★★★★★ avranno bisogno di competenze tecniche specifiche dello Staff tecnico/operativo (o esterno), in quanto richiedono la costruzione di dataset basati su standard aperti definiti dalla W3C (come RDF, SPARQL) per identificare le risorse, in modo che si possano creare collegamenti ai dati.

La strutturazione del dato permette di restituire un dataset di qualità, cioè assente da difetti che ne possano impedire o rendere difficile l’analisi ed il confronto.

 

2.8 Tecniche di trattamento dei dati personali

Il trattamento dei dati personali è un’attività preliminare alla pubblicazione degli open data, necessaria da parte dell’Ente per ottemperare a tutti gli adempimenti previsti dalla normativa di riferimento. Si parla di “tecniche di trattamento” per riferirsi all’insieme delle attività di individuazione degli strumenti tecnici per la protezione della privacy, cioè di tutela della riservatezza dei soggetti a cui i dati fanno riferimento.

All’interno dello svolgimento delle sue funzioni istituzionali, ciascun Ente si occupa del trattamento dei dati mediante modalità che permettono di identificare l’interessato solo in caso di necessità, senza che ciò pregiudichi le finalità di trasparenza e di comunicazione alla base dell’Open Data.

La principale tecnica di trattamento che minimizza o elimina del tutto l’utilizzo di dati personali è l’anonimizzazione. Il “dato anonimo” è il dato che non può essere associato ad un interessato identificato o identificabile.

La normativa privacy fornisce esempi diversi di tecniche di anonimizzazione in relazione a

specifiche categorie di dati quali:

  1. anonimizzazione con chiave di collegamento o mascheramento: è il trattamento prescritto nel caso in cui i dati personali detenuti per scopi statistici siano oggetto di comunicazione a soggetti privati terzi. I dati saranno quindi ceduti a terzi in una forma che renda impossibile il riferimento o l’associazione con l’interessato. In sostanza, l’interessato viene identificato da un codice e la chiave che crea il collegamento tra il codice e gli interessati rimane in possesso del Titolare del trattamento.
  2. oscuramento: è il trattamento prescritto nel caso in cui su richiesta dell’interessato, o disposta “d’ufficio” dall’Autorità giudiziaria, siano precluse l'indicazione delle generalità e degli altri dati identificativi dell'interessato in qualsiasi forma per finalità di informazione giuridica, su riviste giuridiche, supporti elettronici o mediante reti di comunicazione elettronica.
  3. anonimizzazione in senso stretto: è il trattamento prescritto in caso di diffusione dei dati dei minori e delle parti nei procedimenti giudiziari in materia di rapporti di famiglia e di stato delle persone. La norma impone di omettere non solo le generalità e gli altri dati identificativi dei soggetti tutelati ma anche gli “altri dati anche relativi a terzi dai quali può desumersi anche indirettamente l’identità di tali soggetti”.

Una volta definita ed eseguita la tecnica di trattamento dati più idonea si passa alla fase successiva del processo che porterà alla pubblicazione del dataset, vale a dire la definizione del formato.

 

2.9 Conversione in formato aperto

Ogni dominio di applicazione utilizza propri standard tecnici: i formati dei documenti sono diversi da quelli delle tabelle e diversi da quelli dei grafici, delle immagini, dei video ecc. Di seguito si definiscono i formati aperti più comunemente utilizzati e suggeriti per la pubblicazione sul catalogo dati.veneto.it

I formati aperti adatti alla pubblicazione dei dati aperti di “tipo strutturato” generale, ovvero non relativo a specifici domini applicativi o di settore sono elencati nella tabella seguente:

Nome

Descrizione

Tipo

Estensione

Comma Separated Value (CSV)

Formato di file testuale usato per rappresentare informazioni con struttura tabellare, le cui righe corrispondono a linee e i cui valori delle singole colonne sono separati da una virgola (o punto e virgola). Esso è spesso usato per importare ed esportare il contenuto di tabelle di database e fogli elettronici. Le righe delle tabelle corrispondono a righe nel file di testo CSV e i valori delle celle sono divisi da un carattere separatore.

 

 

 

Dato tabellare

.csv

Open Document Spreadsheet (ODS)

Formato di file XML basato su standard aperto per fogli di calcolo. Come nel caso precedente, è stato adottato come formato principale per i fogli di calcolo in alcune suite per l'automazione d'ufficio come OpenOffice.org e LibreOffice ed è supportato da altre

come Microsoft Office, Google Docs e IBM Lotus. Si incoraggia a farne uso per la distribuzione di tabelle.

Dato tabellare

 

Extensible Markup Language (XML)

 

XML è un linguaggio generale di marcatura, ovvero basato su un meccanismo che consente di definire e controllare il significato degli elementi contenuti in un documento o in un testo attraverso delle etichette (markup), standardizzato dal W3C usato per l'annotazione di documenti e per la costruzione di altri linguaggi più specifici per l'annotazione di documenti. Esistono strumenti che possono essere utilizzati per definire la struttura dell’XML come DTD e/o XML schema. Il formato XML è utilizzato per rappresentare altri formati standard quali ad esempio RDF, ODS e molti altri formati specifici di settore.

Dato strutturato

.xml

Resource Description Framework (RDF)

Formato di file XML basato su uno standard aperto proposto da Worl Wide Web Consortium (W3C) per la codifica, lo scambio e il riutilizzo di dati linked e metadati strutturati e consente l’interoperabilità tra applicazioni che si scambiano informazioni sul Web.

Dato strutturato

.rdf

JavaScript Object Notation (JSON)

E’ un formato maggiormente leggibile dagli umani e che mantiene, rispetto a formati simili come l'XML, una sintassi poco prolissa. Questo aspetto ne fa un formato flessibile e compatto. Esso nasce dalla rappresentazione di strutture dati semplici nel linguaggio di programmazione JavaScript, ma mantiene indipendenza rispetto ai linguaggi di programmazione. Ha avuto ampia diffusione per il fatto di essere flessibile e compatto.

Dato strutturato

.json

 

 

Fra i vari tipi di dati su specifici domini, i dati geografici sono stati i primi ad essere rivisti in ottica di standardizzazione e riutilizzo in modalità aperta, così che oggi l’ambito applicativo più diffuso e consolidato in tema di standard sono proprio i dati geografici-ambientali.

Nome

Descrizione

Tipo

Estensione

Keyhole Markup Language (KML)

Il formato KML è un formato di file utilizzato per visualizzare i dati geografici in Google Earth, Google Maps ecc. KML utilizza una struttura basata su tag annidati e si basa sullo standard XML e ogni locazione ha obbligatoriamente una longitudine e una latitudine. Spesso i file KML sono distribuiti come KMZ, che sono file ZIP compressi con estensione .kmz. Il sistema supporta il caricamento di entrambi i tipi di file e il dato in essi contenuto sarà visualizzabile in mappa.

 

 

 

Dato geografico

.kml

ESRI Shapefile (SHP)

Il formato Shapefile della ESRI è un formato vettoriale, diventato ormai uno standard, per il dato vettoriale spaziale per sistemi informativi geografici (GIS). Con "shapefile" si indica un insieme di file con estensione .shp, .dbf, .shx e altre che hanno in comune il prefisso dei nomi (per es. "laghi.*"). Per caricare un dato di questa tipologia nel sistema è necessario caricare un file .zip contenente almeno i seguenti file:

  • .shp - il file che conserva le geometrie;
  • .shx - il file che conserva l'indice delle geometrie;
  • .dbf - il database degli attributi.
  • .prj - il file che conserva l'informazione sul sistema di coordinate, espresso in Well-Known Text;

Le coordinate del dato devono essere Geografiche WGS84 (non proiettato).

Se nel dato ci sono colonne che contengono informazioni per l’aggancio territoriale, queste devono contenere i codici ISTAT di comuni, province o regioni oppure i nomi ufficiali (ISTAT).

Dato geografico vettoriale

.shp, .shx, .dbf, .prj

 

 

Si elenca, nella tabella a seguire, una serie di formati proprietari “de facto” più diffusi di cui è comunque suggerita sempre la pubblicazione anche di una versione del dato in un formato di tipo aperto. Si sottolinea che, nel caso di pubblicazione di dati in forma solo tabellare, senza elementi aggiuntivi (es. metadati, grafici, formule) è possibile evitare di utilizzare formati quali PDF o ODT e utilizzare il formato CSV. Negli altri casi di dati in forma tabellare, con elementi aggiuntivi quali in particolare metadati, si raccomanda l’uso del formato ODS. Nel caso di documenti in generale, si raccomanda, ove esistano, l’utilizzo di standard XML documentali internazionali o nazionali.

Nome

Descrizione

Tipo

Estensione

File Excel 2003 (XLS)

Questo tipo di file è supportato per il caricamento, ma nel caso di documento con fogli multipli verrà caricato solo il primo. I nomi delle colonne devono necessariamente essere disposti nella prima riga e non ci devono essere duplicati e il file da caricare non può contenere più di 65.536 righe.

Inoltre, i numeri contenuti nel foglio da caricare non devono avere il separatore delle migliaia e se ci sono colonne che contengono informazioni per l’aggancio territoriale, queste devono contenere i codici ISTAT di comuni, province o regioni oppure i nomi ufficiali (ISTAT).

 

 

 

Dato tabellare

.xls

File Excel 2007 (XLSX)

Anche in questo caso, come nel caso precedente, questo tipo di file è supportato per il caricamento, ma nel caso di documento con fogli multipli verrà caricato solo il primo. I nomi delle colonne devono necessariamente essere disposti nella prima riga e non ci devono essere duplicati.

Inoltre, i numeri contenuti nel foglio da caricare non devono avere il separatore delle migliaia e se ci sono colonne che contengono informazioni per l’aggancio territoriale, queste devono contenere i codici ISTAT di comuni, province o regioni oppure i nomi ufficiali (ISTAT).

Dato tabellare

.xlsx

File Access 2003 (MDB)

Questo tipo di file è supportato per il caricamento, ma in caso di file con più tabelle viene caricata solo la prima tabella del database.

Se nel dato ci sono colonne che contengono informazioni per l’aggancio territoriale, queste devono contenere i codici ISTAT di comuni, province o regioni oppure i nomi ufficiali (ISTAT).

Dato tabellare

.mdb

 

 

2.10 Definizione dei metadati 

I metadatati svolgono un ruolo importante nell’ottica di riutilizzo del dato della PA e sono definiti come quelle informazioni a corredo dei dataset resi disponibili come dati aperti.

I metadati, letteralmente “dato su un (altro) dato”, consentono una maggiore comprensione dei dati e aiutano la ricerca e la scoperta degli stessi mediante l’aggiunta a cataloghi.

Al fine di rendere tali dati interoperabili tra I cataloghi delle diverse PP.AA. è di fondamentale importanza che il rilascio del dataset sia accompagnato da un insieme minimo di informazioni a carattere generale redatto secondo regole standard.

Il Responsabile Open Data, con il supporto dello Staff tecnico/operativo e attraverso consultazioni con il Referente Tecnico del Dataset, deve identificare quali saranno i metadati definitivi che saranno pubblicati con il dataset. Questa operazione si avvale anche dello schema di “mappatura” tra i campi della “Scheda Informativa” ed i metadati del catalogo dati.veneto.it.

Infine, poiché i dataset possono essere soggetti a cambiamenti nel tempo (correzioni, aggiornamenti, elaborazioni, etc), è bene che lo Staff tecnico/operativo garantisca l’allineamento e la validità tra i metadati e i dati modificati. Alcuni riferimenti temporali da applicare ai metadati stessi debbono includere la data creazione dei metadati, la data dell’ultimo aggiornamento dei metadati, la lingua in cui i metadati sono scritti (ita, eng).  

  

2.11 Applicazione della licenza d’uso

Le licenze definiscono le condizioni e le modalità di riutilizzo dei dati pubblici e dei documenti contenenti dati pubblici, consentendone la più ampia e libera utilizzazione gratuita, anche per fini commerciali, in conformità all’art. 8 del D. Lgs. 36/2006 e s.m.i., e all’art. 9 della L. P. 27 luglio 2012, n. 16.

La licenza di riferimento individuata dal Progetto Open Data nel catalogo dati.veneto.it è la Italian Open Data License (IODL) v2.0.

La Italian Open Data License v2 (IODL v2) ha lo scopo di consentire agli utenti di condividere, modificare, usare e riusare liberamente la banca di dati, i dati e le informazioni con essa rilasciati, garantendo al contempo la stessa libertà per altri. Questa licenza mira a facilitare il riutilizzo delle informazioni pubbliche nel contesto dello sviluppo della società dell'informazione.

Le banche di dati, i dati e le informazioni sono protetti dalle leggi applicabili in materia di diritto d'autore (incluso il diritto sui generis del costitutore di banche di dati) e/o dalle altre leggi applicabili.

I diritti concessi da questa licenza non implicano alcun trasferimento di diritto di titolarità sulle banche di dati, sui dati e sulle informazioni pubbliche.

Gli utenti possono utilizzare e riutilizzare la banca di dati ed i dati in essa contenuti in base ai termini di questa licenza; ogni utilizzazione che non sia espressamente autorizzata licenza stessa o delle leggi vigenti è proibita.

Con tale licenza è possibile:

  • riprodurre, distribuire al pubblico, concedere in locazione, presentare e dimostrare in pubblico, comunicare al pubblico, mettere a disposizione del pubblico, trasmettere e ritrasmettere in qualunque modo, eseguire, recitare, rappresentare, includere in opere collettive e/o composte, pubblicare, estrarre e reimpiegare le informazioni;
  • creare un lavoro derivato ed esercitare sul lavoro derivato i diritti di cui al punto precedente, per esempio attraverso la combinazione con altre Informazioni (mashup).

Quanto esposto nei due punti precedenti è valido a condizione di:

  • indicare la fonte delle Informazioni e il nome del Licenziante, includendo, se possibile, una copia di questa licenza o un collegamento (link) ad essa.
  • non riutilizzare le Informazioni in un modo che suggerisca che abbiano carattere di ufficialità o che il Licenziante approvi l'uso che se ne fa delle Informazioni;
  • prendere ogni misura ragionevole affinché gli usi innanzi consentiti non traggano in inganno altri soggetti e le Informazioni medesime non vengano travisate.

E’ consentito esercitare i diritti concessi con questa licenza in modo libero e gratuito, anche qualora la finalità sia di tipo commerciale. Inoltre, questa licenza non intende in alcun modo creare ulteriori diritti in capo al Licenziante rispetto a quelli previsti dalla legge sul diritto d'autore o ridurre, limitare o restringere alcun diritto di libera utilizzazione o l'operare della regola dell'esaurimento del diritto od altre limitazioni dei diritti sulle Informazioni derivanti dalle leggi applicabili.

La suddetta licenza deve ritenersi regolata dalla Legge italiana e deve, di conseguenza, essere interpretata applicando tale normativa.

Ciascuno è tenuto ad utilizzare le Informazioni licenziate nel rispetto della legge. Pertanto, la licenza IODL, come tutte quelle individuate dalla Regione Veneto, non costituisce un'autorizzazione a violare la legislazione italiana in materia di diritto d’autore (Legge n. 633/1941) e di protezione dei dati personali (D. Lgs. n. 196/2003).

La licenza IODL v2.0 è stata individuata in ragione dell'ampiezza del riutilizzo concesso dalla licenza, anche per fini commerciali; del suo alto livello di interoperabilità con altri modelli di licenze standard; della sua facilità di comprensione e soprattutto diffusione fra il pubblico.

Le licenza si caratterizza per un linguaggio semplice e facilmente comprensibile da parte degli utenti e garantiscono la redistribuibilità del dato, nonché un livello di diffusione e di conoscenza a livello nazionale, europeo ed internazionale.

La sua diffusione minimizza le barriere al riuso, riducendo i costi per i riutilizzatori e massimizzando la probabilità che i dati dell'amministrazione provinciale possano essere combinati con altri dati pubblici e con dati generati dagli utenti della rete o da operatori privati.

Al momento dell’individuazione del dataset da pubblicare in formato aperto, la struttura che pubblica il dato indicherà il tipo di licenza con cui verrà rilasciato.

Il riutilizzo presuppone l’accettazione della licenza associata al dato o al documento d’interesse.

Conformemente a quanto disposto dall'art. 52, comma 2 del Codice dell’Amministrazione Digitale (c.d. Open by Default), i dati già pubblicati sul sito dati.veneto.it, qualora non sia indicata una specifica licenza, si intendono rilasciati “come dati di tipo aperto” e quindi sono disponibili per il riutilizzo “come se forniti di una licenza” che in tal caso non può prevedere alcuna specificazione e di fatto il riutilizzo si allinea ad una Licenza IODL, ad eccezione dei casi in cui la pubblicazione riguardi dati personali.

Qualora ricorrano giustificati motivi tali da orientare la scelta verso una licenza standard diversa da quelle di riferimento, la specifica licenza, per quanto possibile, deve rispettare il principio di consentire la più ampia e libera utilizzazione gratuita, anche per fini commerciali e con finalità di lucro.

In particolare, e di concerto con la struttura competente, in caso di presenza di dati personali all’interno dei dataset, devono essere predisposte apposite note di licenza utili al corretto

trattamento di questi dati.

Per attribuire una licenza ai dati da pubblicare è sufficiente citare la licenza (nome e versione) che si intende adottare, in modo tale che sia chiaro per chi utilizza il dataset con quale licenza esso è distribuito.

Per quanto concerne l’attribuzione, il licenziatario dovrà provvedere ad una menzione adeguata, rispetto al mezzo di comunicazione o supporto utilizzato, di:

  • autore originale e/o titolare dei diritti;
  • terze parti designate, se esistenti;
  • la descrizione/titolo del documento o del dataset, se indicato dal licenziante;

nella misura in cui ciò sia ragionevolmente possibile, l’Uniform Resource Identifier (URI) che il Licenziante specifichi dover essere associato con il documento oggetto di riutilizzo.