Machine learning: cos’è e quali sono i suoi vantaggi?

26 novembre 2020| Silvia Sanna
Machine learning: cos’è e quali sono i suoi vantaggi?

Machine Learning: cos’è, come funziona, quali sono le sue caratteristiche e come viene utilizzato su ContrattiPubblici.org.

Spesso si sente parlare di Machine Learning: si tratta di una tecnologia che insegna ai computer e ai robot a fare azioni ed attività in modo naturale grazie all’utilizzo di programmi di apprendimento automatico.

A questo proposito, abbiamo parlato con Giulio Carducci, R&D software engineer di Synapta, per capire insieme in cosa consiste questa tecnologia e come ha aiutato a migliorare l’arricchimento dei dati di ContrattiPubblici.org.

Machine learning: come funziona?

La prima domanda a cui vogliamo rispondere è: come fa un sistema informatico a imparare?

In questo caso, per spiegare al meglio il concetto del funzionamento del Machine Learning, è giusto partire dal concetto di apprendimento: in psicopedagogia, si tratta di un processo di acquisizione di nuovi modelli di comportamento, o di modificazione di quelli precedenti, per un migliore adattamento dell’individuo all’ambiente.

Tramite l’apprendimento, difatti, creiamo delle regole generali che sono assimilabili in modelli di apprendimento. Il Machine Learning è un metodo di analisi dati che automatizza la costruzione di modelli analitici.

Si tratta di una branca dell’Intelligenza Artificiale e si basa sull’idea che i sistemi possono imparare dai dati e prendere decisioni in modo autonomo, riducendo l’intervento umano al minimo. Attraverso i modelli di apprendimento siamo grado di sviluppare degli algoritmi in grado di risolvere un  problema specifico.

L’algoritmo indica al sistema le operazioni che può eseguire e che cosa può fare: ad esempio, come riconoscere una mail da inviare nella casella di spam o il viso di una persona in un’immagine.

Machine learning_light bulb img

Gli approcci del Machine Learning

In linea di principio, il Machine Learning funziona sulla base di due approcci diversi, che permettono di distinguere l’apprendimento automatico in due sottocategorie a seconda del fatto che si forniscano al computer esempi completi da utilizzare come indicazione per eseguire il compito richiesto (apprendimento supervisionato) oppure che si lasci lavorare il software senza alcun aiuto esterno (apprendimento non supervisionato).

Machine Learning con apprendimento supervisionato

In questa tipologia di apprendimento vengono dati al sistema dei set di dati come input e le informazioni relative ai risultati che ci si aspetta di ottenere.

Quest’attività viene fatta con l’obiettivo che il sistema identifichi una regola generale e colleghi, di conseguenza, i dati in ingresso e in uscita, in modo da poter riutilizzare poi in futuro la stessa regola per altri compiti simili.

Machine Learning con apprendimento non supervisionato

In questa seconda tipologia di apprendimento vengono forniti al sistema solo dei set di dati, senza aggiungere indicazioni sul risultato desiderato.

L’obiettivo dell’attività, in questo caso specifico, è quello di identificare negli input dati al sistema una struttura logica senza che questa sia stata preventivamente etichettata.

Machine learning_img

Gli approcci che vengono utilizzati nelle tipologie di apprendimento saranno fondamentali per capire poi quale sarà lo scopo dell’analisi.

  • Classificazione: è un tipo di apprendimento supervisionato dove l’algoritmo viene istruito dal supervisore a riconoscere un numero predefinito e limitato di categorie, o classi, tramite una serie di esempi pratici come, ad esempio, il riconoscimento di soggetti specifici all’interno di una foto
  • Regressione: è un tipo di apprendimento anche questo supervisionato, che a differenza della classificazione, non ha un numero predefinito di classi. L’algoritmo è infatti usato per determinare un risultato su una scala continua di valori come, ad esempio, il valore economico di una casa in base alle sue caratteristiche
  • Clustering: è un tipo di apprendimento non supervisionato in cui l’algoritmo va a raggruppare dati simili in gruppi, o cluster, sulla base delle loro caratteristiche. Un esempio di clustering applicato all’analisi di mercato è la categorizzazione dei clienti in diversi gruppi in base alle loro abitudini di acquisto

Machine Learning e ContrattiPubblici.org

Dei tre tipi di applicazioni che abbiamo già menzionato, il team di ContrattiPubblici.org si è concentrato principalmente sulla classificazione.

Le varie applicazioni del Machine Learning sono servite non solo a trovare dei dati che erano mancanti o incompleti all’interno dei contratti, ma anche ad ottenere nuove informazioni dal corpus dei dati a disposizione della piattaforma, e questo è stato fatto grazie ad algoritmi di apprendimento automatico.

Attraverso tecniche di Machine Learning e Information Extraction, il team è stato in grado di classificare le informazioni sui contratti pubblici e sui bandi pubblicati dalle pubbliche amministrazioni aggiungendo informazioni sulle certificazioni ISO 9001.

Con ISO 9001 ci riferiamo a un insieme di normative e linee guida che definiscono gli standard e le regole che le aziende devono seguire per avere un sistema di gestione della qualità al loro interno.

Machine learning_ContrattiPubblici.org

Questo lavoro è stato fatto grazie all’estrapolazione delle informazioni relative alle certificazione ISO 9001 dai testi degli allegati dei contratti e dei bandi in modo da aiutare da un lato i fornitori a cercare le gare a cui partecipare in base alle proprie esigenze, dall’altro aiutare gli acquirenti a individuare un’azienda già certificata.

Grazie a queste attività abbiamo potuto acquisire informazioni completamente nuove in modo del tutto automatico.

Altro esempio pratico che vede il Machine Learning protagonista è stata la classificazione dei codici CPV all’interno dei singoli contratti. Grazie alle attività di apprendimento automatico siamo stati in grado di calcolare il codice CPV a partire dalle parole utilizzate nell’oggetto del contratto, usando un modello addestrato sui contratti per cui il codice CPV era già noto.

Avere più dati a disposizione, oltre a consentire un maggiore controllo sulla ricerca e sui dati stessi, permette anche di calcolare delle statistiche più accurate. Maggiori sono i dati a disposizione, migliore è l’utilizzo che se ne può fare.

Grazie alle tecniche di Machine Learning e alle applicazioni abbiamo così ottenuto una maggiore qualità e copertura dei dati che popolano la piattaforma di ContrattiPubblici.org, utile a migliorare ogni giorno l’esperienza di navigazione dei nostri utenti.

 


analisi dati business intelligence dati digitalizzazione innovazione intervista mercato pubblica amministrazione

Condividi

AZIENDE

Ecco cosa puoi fare con ContrattiPubblici.org

  •  analisi di mercato
  • anticipare la scadenza di un contratto pubblico
  • monitorare le azioni dei tuoi competitor
  • trovare nuovi clienti

Scopri come