Data scouting: cos’è e come si fa?

30 giugno 2020| Silvia Sanna
Data scouting: cos’è e come si fa?

L’attività di data scouting e la figura del data scouter rivestono un ruolo centrale all’interno di aziende che operano impiegando e sfruttando quotidianamente i dati.

L’impiego di tecnologie dell’informazione nello svolgimento di attività di business – come succede anche nell’assolvimento di funzioni istituzionali da parte delle Pubbliche Amministrazioni – determina sempre di più la generazione e l’impiego di grandi quantità di dati in formato digitale. In questo scenario, chi intende servirsi di dati messi a disposizione da soggetti terzi per le proprie finalità di business, si trova a dover affrontare spesso una serie di aspetti legati all’effettiva disponibilità del dato di interesse e alla sua qualità.

Come abbiamo già visto, la data quality è un fattore importante, per chi fa business con dati generati da altri soggetti ma anche per chi il dato lo genera. In questo contesto, il data scouter, è appunto la figura che all’interno dell’azienda si occupa di gestire i profili inerenti alla reperibilità dei dati: verificandone l’esistenza ed effettiva disponibilità, valutando le possibilità del loro riutilizzo e interagendo con il titolare del dato, quando necessario per ottenere l’accesso a questi ultimi.

Lavorando a stretto contatto con il personale tecnico che in azienda si occupa di data integration e data curation e assicurando il funzionamento e la qualità dei dati necessari al business aziendale, il data scouter interagisce con i titolari dei dati anche per sollecitare – laddove possibile – la messa a disposizione di dati o dataset di interesse in formati specifici e la correzione di errori o malfunzionamenti riscontrati in essi.

A Synapta svolgiamo quotidianamente attività di ricerca e integrazione di dati, e coinvolgere la figura di un data scouter in tali processi si è rivelato utile tanto a fini di gestione e incremento del patrimonio informativo aziendale, come pure in contesti a supporto di committenti esterni, utenti finali dei dati.

Abbiamo parlato a questo proposito con Claudio Artusio, Data Scouter di Synapta, per analizzare e capire assieme in cosa consistono le attività di questa figura professionale.

Quali sono le attività del data scouter?

Per svolgere la propria attività, il data scouter deve possedere alcune competenze strettamente connesse all’ambito primario del suo intervento, che è volto appunto a ottenere i dati di interesse per l’azienda.

Essenzialmente, si tratta di competenze giuridiche e tecnico-informatiche che gli consentiranno di impostare l’interazione in modo efficace ed efficiente; competenze necessarie per operare una serie di valutazioni rispetto alla natura del dato e del suo titolare, alla compatibilità delle finalità di riutilizzo e alle specifiche tecniche che il dato dovrebbe presentare per integrarsi con l’infrastruttura e i flussi dato dell’azienda.

L’oggetto del processo di data scouting sono i dati, le competenze tecniche-informatiche risultano quindi fondamentali per saper gestire file e formati con cui questi si presentano e, più in generale, per operare una valutazione sulla qualità del dato.

data scouting_pc image

I dati oggetto delle richieste di un data scouter possono essere sostanzialmente suddivisi in:

  • dati aperti, ossia quei dati che, secondo la definizione formulata dall’Open Knowledge Foundation, possono essere riutilizzati e redistribuiti da chiunque senza restrizioni, salvo al massimo il dovere di preservarne l’attribuzione e la natura aperta;  possono essere tali per esplicita volontà del titolare del dato (avendo questi provveduto ad esempio a metterli a disposizione con una licenza aperta di diritto d’autore) o per espressa previsione di legge, come nel caso dei dati pubblicati dalle Pubbliche Amministrazioni e liberamente riutilizzabili ai sensi della Direttiva PSI sull’informazione del settore pubblico e normative collegate;
  • dati proprietari, ossia dati detenuti da soggetti privati che, in virtù della normativa sul diritto d’autore e diritto sulle banche dati, si vedono riconosciuto il diritto esclusivo di sfruttamento economico dei dati, ma non li hanno resi disponibili in modalità aperta per scelta e, diversamente dagli enti pubblici, non sono tenuti per legge alla loro messa a disposizione in modalità aperta.

Un aspetto fondamentale da considerare è rappresentato dall’eventualità che i dati di interesse contengano informazioni relative a persone fisiche, poiché in tal caso l’effettiva possibilità di riutilizzo andrà valutata alla luce delle condizioni e dei limiti specificamente previsti dalla normativa a tutela dei dati personali (GDPR e Codice della Privacy).

Il data scouter deve poi anche essere in grado di valutare la natura del dato di interesse: se ad esempio si tratti di dati statici oppure di dati dinamici soggetti a frequenti o continui aggiornamenti, che suggeriscono un diverso approccio al titolare del dato.

In caso di dati statici, la richiesta di messa a disposizione di questi potrà essere effettuata sotto forma di singola estrazione una tantum perché i dati riguardano informazioni che non evolvono continuamente ma, al contrario, riguardano un’attività svolta e conclusa all’interno di uno preciso arco di tempo.

Se la nostra richiesta riguarda invece dati dinamici, soggetti a un aggiornamento continuo e il cui valore risiede nel poter disporre costantemente della loro versione più aggiornata, allora la richiesta dovrà essere formulata concordando con il titolare una fornitura periodica dei dati.

Chi è il titolare del dato?

Partendo dalla norme giuridiche, il data scouter inizia la sua attività ponendosi alcune domande: qual è la natura giuridica del titolare dei dati? Si tratta di un soggetto di diritto privato oppure di un ente pubblico? E se si tratta di un ente pubblico, di che ente pubblico si tratta? Di un ente inquadrabile nella definizione di pubblica amministrazione prevista dal D.Lgs 165/2001? Di un organismo di diritto pubblico? Oppure di una società partecipata in controllo pubblico?

La normativa che stabilisce la riutilizzabilità dei dati pubblici si applica infatti a categorie ben precise di soggetti e, salvo casi-limite espressamente individuati, non ricomprende enti di diritto privato.

Rispondendo alle suddette domande, il data scouter sarà quindi in grado di stabilire l’approccio con cui entrare in contatto con il titolare del dato e sottoporgli la sua richiesta; richiesta che, nei confronti di un soggetto privato dovrà anche considerare l’eventualità che questi acconsenta a rendere disponibili i dati esclusivamente a pagamento.

Quali sono gli strumenti normativi a supporto del data scouter?

Analizzata la natura del dato e del suo titolare, è quindi necessario selezionare lo strumento normativo più efficace a supporto della richiesta, che il data scouter formulerà per ottenere accesso al dato che si vuol fare oggetto di riutilizzo.

Come abbiamo già accennato, nel caso di dati aperti delle Pubbliche Amministrazioni, uno degli strumenti normativi a supporto dei data scouter è rappresentato dalla Direttiva PSI, recepita in Italia mediante D.lgs 36/2006, alla quale si aggiungono il Codice dell’Amministrazione Digitale e il Decreto Trasparenza.

Quest’ultimo consente di sottoporre alle PA le cosiddette richieste di accesso civico, che rappresentano lo strumento per garantire effettiva attuazione al principio generale di trasparenza amministrativa, intesa come “accessibilità totale ai dati e documenti detenuti dalle Pubbliche Amministrazioni” a tutela dei diritti dei cittadini (art. 1).

Secondo l’esperienza che abbiamo maturato a Synapta, il Decreto Trasparenza si rivela uno strumento eccellente soprattutto per incentivare la pubblicazione di dati la cui pubblicazione da parte delle PA sia obbligatoria per legge; impiegando quindi la procedura di accesso civico semplice e non quella di accesso civico generalizzato.

La differenza tra le due richieste sta nella tipologia del dato che si richiede. L’accesso civico semplice riguarda dati di pubblicazione obbligatoria ai sensi della normativa vigente mentre l’accesso civico generalizzato riguarda dati ulteriori rispetto a quelli che le PA sono obbligate a pubblicare.

In caso di dati di pubblicazione non obbligatoria per legge, risulta sovente più efficace richiederli ai sensi della Direttiva PSI; oppure sfruttare la “presunzione di open data” dell’art. 52.2 del CAD per ricevere conferma che i dati di interesse sono di tipo aperto.


analisi dati digitalizzazione giurisprudenza intervista

Condividi


AZIENDE

Ecco cosa puoi fare con ContrattiPubblici.org

  •  analisi di mercato
  • anticipare la scadenza di un contratto pubblico
  • monitorare le azioni dei tuoi competitor
  • trovare nuovi clienti

Scopri come