Industrial AI power team: chi ti serve per costruire soluzioni e non problemi

data science dream team

Il team di data science: un asset da valorizzare

In un futuro non molto lontano tutte le aziende avranno un team dedicato all’analisi dei dati e all’implementazione di soluzioni data-driven, un po’ come è successo per la gestione energetica. Che sia esternalizzato o internalizzato, qualcuno si occuperà di creare valore aggiuntivo dai dati disponibili.

Esploriamo dunque meglio quali sono le competenze da garantire (o verificare) per team di data science che vogliono implementare soluzioni industriali.

Power team

Abbiamo visto che le soluzioni industriali sono soluzioni pragmatiche, e orientate al risultato, che uniscono competenze, sensibilità e vocabolari diversi.

Il problema delle soluzioni di industrial AI è che bisogna trovare una quadra tra tutte queste sensibilità. Ecco perché i team che implementano soluzioni industrializzabili e scalabili devono essere contaminati e in grado di comunicare pur con background e mansioni molto differenti.

Costruire la soluzione: i passi e gli attori principali

Il processo per costruire una soluzione di AI industriale è abbastanza standard se guardata da molto in alto. Tutte le figure del nostro power team sono coinvolte a diverso titolo, in base alle loro competenze e obiettivi.

Easy peasy!

Eploriamo adesso i vari ruoi che concorrono allo sviluppo delle soluzioni, capendo meglio che tipo di competenze hanno.

Industrial AI engineer: la mente

L’industrial AI engineer è la mente: ha la visione per immaginarsi la soluzione migliore, e la pragmaticità per trasformarla in un progetto. Seleziona e quantifica l’indicatore di business su cui lavorare e progetta il sistema per generare un miglioramento nel’indicatore. Si occupa inoltre di dimensionare il saving ottenibile in base ad ipotesi e osservazioni sul processo.

📢 La figura deve possedere forti competenze legate a funzionamento e O&M dei principali asset e processi industriali, e deve conoscere in modo approfondito le tecniche statistiche, di machine learning e deep learning, e le modalità di implementazione di pipeline di data processing.
Il ruolo avrà forti competenze di comunicazione, team work e coordinamento di diverse figure, con una predisposizione alla creatività e alla progettazione di soluzioni data-driven hardware-software. 
Altre competenze utili sono la consocenza delle principali librerie di Python per la data analysis e per il modeling, e la conoscenza di base dei protocolli di comunicazione industriali e di interfaccia tra sistemi.

Questa è una figura molto eclettica, che sposa creatività e praticità e sa indirizzare il resto del team nello sviluppo.

Industrial data analyst: lo sguardo sulla fisica delle cose

Con un insieme di competenze simili all’industrial AI engineer per quanto riguarda matematica e processo, l’industrial data analyst è colui che esplora approfonditamente i dati selezionando la strategia algoritmica migliore in base all’obiettivo, in base alle indicazioni del progetto preliminare e con il supporto dell’indsutrial AI engineer. E’ in grado di sviluppare modelli semplici con sistemi code-less. Anche in questo caso, un ingegnere è una buona opzione.

📢 La figura deve possedere forti competenze legate a funzionamento e O&M dei principali asset e processi industriali, e deve conoscere e saper applicare i principali strumenti di analisi dati e di correlazione, validazione statistica, analisi di probabilità e distribuzione. Deve conoscere gli algoritmi di machine learning e deep learning, le modalità di allenamento e validazione, e le modalità per integrare i risultati dei modelli nelle procedure operative del business. Deve inoltre avere competenze nella progettazione qualitativa di sistemi di reportistica e allarmistica.

L’industrial data analyst è a contatto con il business ed è una figura molto operativa, che si confronta con gli esperti di dominio nella loro lingua e riesce a comprendere le risposte traducendole in step operativi di implementazione.

Data scientist: il modello e il preprocessing

Il termine generico data scientist potrebbe coincidere nei team reali con l’industrial data analyst o con il machine learning engineer. Essendo però ruoli con competenze lievemente diverse, li separiamo per completezza.

Il data scientist crea il modello: a partire dalla progettazione e dalle indicazioni dell’industrial data analyst (che garantiscono rappresentatività fisica), il data scientist apre Python o R e sviluppa il codice per il modello. Di solito lavora su jupyter notebook o simili. Di solito fa mille tentativi (chiamati iterazioni), e alla fine identifica il modo migliore per raggiungere il risultato.

📢 La figura conosce in modo approfondito le principali librerie di Python o R per la modellazione e l'analisi dei dati, quali ad esempio numpy, pandas, scikit learn, tensorflow, keras, xgboost, dplyr, mlr  e equivalenti. E' in grado di sviluppare cruscotti per l'eplorazione dei risultati tramite librerie dedicate come matplotlib, seaborn, ggplot2 o strumenti come Tableau, BI e equivalenti, e sa predisporre notebook interattivi per scalare le analisi su dataset più o meno ampi. 
La conoscenza di SQL rappresenta competenza preferenziale. 

Il data scientist si occupa di identificare quella che viene chiamata pipeline per il modello: l’insieme di azioni che trasformano il dato grezzo in conoscenza (tipo la predizione della probabilità di guasto).

Data engineer: garantire la base dati

Il data engineer prende in carico le azioni della prima parte della pipeline e le industrializza. In particolare si occupa della parte di pulizia dei dati da outlier e anomalie e la formattazione del dato, dalla fonte (sensore, PLC, database, datalake…) al luogo in cui il modello gira.

📢 La figura è in grado di gestire e interrogare database relazionali e non relazionali, ha competenze di programmazione in Python, Java e SQL, e conosce i sistemi per la gestione dei big data come Hadoop, Kafka e Spark. Ha conoscenze di base dei principali provider di infrastruttura (AWS, GCP, Azure) e sa progettare e predisporre API, connettori e ETL.

Ove necessario, è il data engineer che predispone filtri e processi per la gestione dei dati anomali.

Machine Learning engineer: mettere online il sistema

Il ML engineer, a partire dal lavoro del data scientist, sviluppa il sistema online in modo che sia facilmente manutenibile e scalabile nel tempo e in linea con i requisiti di progettazione.

📢 La figura conosce in modo approfondito le principali librerie di Python, Java, C# per la modellazione e l'analisi dei dati e lo sviluppo di soluzioni online. E' in grado di predisporre procedure per la gestione del ciclo vita dei modelli in modo efficace e scalabile. Conosce le regolamentazioni vigenti nel campo dell'AI e del deep learning e conosce le principali tecniche di eXplainable AI. 
La conoscenza di SQL e la capacità di sviluppare API e ETL rappresentano competenze preferenziali. 

Il ML engineer è colui che si occupa, in collaborazione con industrial ai analyst, di manutenere il modello nel tempo e scalare le soluzioni su use case simili.

Figure a supporto

Oltre al power team di data science, ci sono almeno altre due figure trasversali che devono supportare nell’implementazione:

  • Per fare sì che il team operativo adotti la soluzione, è necessario coinvolgerlo e fare sì che l’adozione sia semplice: per questo è utile coinvolger un change management expert o consultant. Insieme al business expert e il power team, si occuperà di formare le persone, ingaggiarle e supportarle nelle fasi di adozione.
  • In caso di integrazione con altri sistemi e comunque sempre necessario, l‘infrastructure expert / IT manager garantisce che il data e il ML engineer facciano le cose nei posti giusti: cloud, edge, ibrido… Se ci sono hardware da prevedere, supporta nella progettazione dell’architettura e nell’installazione.

Dove lavora il team?

Spesso, il core team di data science appartiene alla divisione IT o ad una divisione dedicata, mentre le figure trasversali appartengono alle loro business unit di riferimento.

In alcuni casi, l’industrial data analyst appartiene alla business unit di processo o BU collegate (energy, manutenzione…).

Le altre figure, soprattutto per le aziende medio-piccole, vengono spesso esternalizzate e assegnate a ditte specializzate esterne. In quei casi, il consiglio è verificare che il team abbia competenze di dominio e non solo legate a programmazione o matematica.

Un grafico di sintesi

Il team di data science completo, che coinvolge diversi attori e competenze, e i ruoli trasversali.

Riassumendo, le competenze che devono essere garantite in un team di data science sono competenze legate al dominio specifico, competenze matematico statistiche legate all’analisi dei dati e ai metodi di machine learning e deep learning, e competenze di programmazione per lo sviluppo e il mantenimento delle soluzioni.