Ma è tutto AI generativa? Facciamo ordine nell’AI industriale

Pasticciare con l’AI

Vi è mai capitato di cercare su internet Manutenzione predittiva AI oppure Ottimizzazione energetica data driven e trovarvi sommersi di risultati a metà tra l’articolo di giornale e la pagina pubblicitaria? Mettiamoci anche che, ora che Artificial Intelligence è diventata una buzz word, trovare informazioni che siano corrette e non contengano esagerazioni da marketing o pressapochismi è diventato ancora più difficile. Tutto è AI (lo era già prima), e le aspettative legate alla tecnologia si sono gonfiate più di prima.

E’ vero però che le tecniche di intelligenza artificiale sono di estremo valore, in industria e fuori, ed è un peccato fare confusione. Si rischia di alzare l’asticella delle aspettative così tanto che poi davanti all’operatività delle cose si rimane delusi.

Cerchiamo quindi di capire cosa vuol dire AI industriale, quali tecnologie possiamo contare nella grande famiglia dell’AI, e quali strumenti si possono costruire.

Uno strumento per ogni obiettivo

L’intelligenza artificiale è un insieme di tecnologie, il loro obiettivo è rendere la macchina capace di replicare capacità tipiche dell’intelletto umano. Intelligenza, ma artificiale. Una descrizione lapalissiana.

Nel grande cerchio dell’AI ricadono quindi anche tecnologie che non ci vengono in mente quando pensiamo all’AI, tipo la regressione lineare, o i sistemi esperti. Non è un caso se la storia dell’AI inizia nel lontano 1950, quando Alan Turing ipotizza per la prima volta la macchina pensante, e immagina il famoso test di Turing nel paper Computing machinery and Intelligence (il cui primo capitolo è proprio The Imitation Game).

La prima AI in effetti includeva solo i sistemi esperti e qualche metodo statistico, con i nuovi processori e i sistemi di calcolo più potenti la grande famiglia dell’AI ha accolto l’apprendimento automatico e tutti i suoi sotto insiemi. Tipo i Pokémon che evolvono e diventano sempre più grandi e complicati.

I sistemi di apprendimento automatico evolvono come i Pokémon. Quando pensavi che non potessero crescere più di dimensione e potenza, c’è un annuncio nuovo che alza l’asticella del potenziale.

La cassetta degli attrezzi

Ci sono una marea di modi per rappresentare la grande famiglia dell’AI, a seconda di dove si guarda se ne trova uno diverso. Nell’AI vengono sempre citati machine learning e deep learning, cognitive computing, natural language processing, image recognition, e a seconda delle fonti, si includono anche l’ottimizzazione e i sistemi esperti.

Vi propongo lo schema che tra i tanti mi piace di più, e che ho sintetizzato mantenendo gli strumenti ed escludendo le finalità. Quindi, qui ci sono gli approcci matematici dietro alle soluzioni. Ho escluso invece le soluzioni vere e proprie, come il natural language processing, che si può fare con un sistema esperto (ELIZA ne è un esempio) o con un sistema di AI generativa (come gli strumenti di OpenAI).

Una tecnologia per ogni obiettivo, anche per l’AI

Ognuna di queste sotto famiglie ha un’utilità in industria, e spesso cerchiamo soluzioni complicate a problemi semplici perché sottovalutiamo le tecnologie (ci dice niente regressione lineare?) o vogliamo seguire il trend del momento.

Cerchiamo quindi di approfondire i vari insiemi di interesse cercando di capire cosa potremmo farci in industria.

Sistemi esperti

I sistemi esperti sono algoritmi costruiti a partire da un approccio simbolico. Il sistema è costruito per replicare le modalità di decisione di un utente esperto o esperta, in base a regole esplicite scritte nero su bianco. Sistema. Esperto. Quello che ha scelto il nome si è parlato con quello del nome dell’AI (McCarthy, per la cronaca).

Esempi tipici in industria sono:

  • I digital twin: grazie a sistemi di equazioni ingegneristiche molto complesse, sono in grado di rappresentare con alta precisione il comportamento atteso di un sistema
  • I PID controller evoluti: seguendo regole di affinamento calibrate in base alla competenza di dominio, i sistemi di controllo sono a tutti gli effetti sistemi esperti
  • Allarmistica complessa: se la temperatura è superiore a 57°C e la pressione è inferiore a 0.4 bar e la macchina è accesa, e la condizione persiste per almeno 10 minuti, allora genera allarme. Questo è un esempio di sistema esperto.
  • Progettazione e design: i sistemi esperti sono strumenti fondamentali nella progettazione, in quanto sono il modo con cui si simulano i comportamenti dei componenti prima di averli sotto mano per poterli monitorare con sensori e hardware.

Ottimizzazione

I sistemi di ottimizzazione sono in grado di generare diversi scenari per identificare lo scenario che porta ad avere una funzione di costo al suo valore minimo (o ad un altro valore identificato). E’ grazie ad algoritmi di ottimizzazione come il gradient descent o l’adam optimizer che esiste il deep learning: i pesi delle reti neurali infatti sono affinati tramite sistemi di ottimizzazione.

Ovviamente, oltre che usarli per allenare splendide reti neurali, i sistemi di ottimizzazione sono molto utili in industria, perchè possono essere utilizzati per:

  • Ottimizzare i setpoint di processo per minimizzare gli scarti o massimizzare la qualità
  • Identificare la regolazione ottimale di un sistema di generazione energetica per minimizzare il consumo o massimizzare il profitto
  • Creare scenari di simulazione a differenti condizioni operative per identificare il design migliore dell’impianto (questa è stata la mia tesi!)
  • Ottimizzare la pianificazione dei team di manutenzione per minimizzare i costi o il tempo di lavoro
  • Selezionare l’ordine migliore di ricette per minimizzare il consumo o il consumo di materie prime
  • Ottimizzare i processi di settaggio per massimizzare l’OEE

La lista può essere molto lunga. L’ottimizzazione è in ultima analisi la cosa che tutti chiedono quando si parla di ridurre i costi diretti, perché suggerisce azioni concrete per modificare un processo o un sistema. Peccato che non sempre è semplice strutturarla.

Machine Learning

I sistemi di apprendimento automatico sono stati studiati approfonditamente a partire dai primi anni ’60. La vastità dei metodi e degli algoritmi esistenti è troppo ampia per un misero paragrafo, mi limiterò a segnalare qui e qui qualche fonte per approfondire, e qui per capire come l’apprendimento automatico apprende.

In industria il machine learning è molto utile per scoprire cose che ipotizzavamo e basta, e per automatizzare processi difficili da descrivere con un sistema esperto. Ecco qualche applicazione, con un minimo di contesto:

  • Manutenzione predittiva, tramite algoritmi di classificazione di vario tipo
  • Creazione di baseline energetiche, con algoritmi di regressione
  • Costruzione di sistemi di benchmarking energetico, sempre con algoritmi di regressione
  • Identificazione di pattern di comportamento non noti tipo curve di consumo o condizioni operative particolari, tramite sistemi di clustering
  • Anomaly detection tramite sistemi di unsupervised learning come l’isolation forest

Reti neurali

Le reti neurali che non fanno parte del deep learning sono tutte quelle reti a singolo strato, che quindi non sono profonde. Queste reti sono comunque molto potenti, e riescono a rappresentare senza grandi problemi qualsiasi relazione continua. Tipo la maggior parte delle relazioni tra parametri fisici.

La fiera delle cose scontate. Fonte

Rispetto ad altri metodi di machine learning, le reti neurali sono un po’ meno malvagie nell’estrapolazione, e sono più solide al rumore statistico. Quindi, bene se si devono usare in contesti in cui i dati non sempre sono puliti e qualche volta lavorano a range differenti rispetto al passato.

In industria quindi le reti neurali a singolo strato sono sufficienti per simulare con alta precisione diversi comportamenti e fenomeni fisici. Con le reti neurali semplici si possono quindi sviluppare soluzioni per:

  • Intercettazione in real time di inefficienze energetiche
  • Identificazione di anomalie di temperatura, pressione o altri parametri
  • Benchmarking energetico
  • Manutenzione predittiva – in questo caso le capacità di una rete neurale sono equivalenti ad un sistema di machine learning come l’extreme gradient boosting.

Deep Learning

Aggiungendo strati e complessità all’interno dei singoli neuroni, apriamo ci spostiamo da una stanza molto affollata (quella del machine learning) ad una stanza ancora più affollata (quella del deep learning).

Con i sistemi di apprendimento profondo sblocchiamo un livello superiore, e possiamo:

  • Prevedere nel futuro il trend di variabili come la curva di consumo o la producibilità, grazie a sistemi di forecasting (reti neurali ricorsive, LSTM o altro. Per onor di cronaca, uno dei tool più usati per il forecasting è l’ARIMA, che però è un metodo statistico. Le reti neurali profonde però ci danno la possibilità di fare previsioni utilizzando molti input diversi, tipo le previsioni meteo o i piani di produzione).
  • Fare ispezioni e controlli automatici grazie a sistemi di vision
  • Fare controllo qualità automatico, sempre con sistemi di image recognition
  • Esplorare muove molecole e ingredienti, grazie alla graph AI
  • Costruire sistemi di diagnostica, grazie ai sistemi di raccomandazione e alla graph AI
  • Costruire sistemi di troubleshooting e interfaccia in linguaggio naturale, grazie a reti neurali ricorsive e graph AI

Anche in questo caso, la lista potrebbe essere molto più lunga di così, e di solito è limitata solo dalla fantasia.

AI generativa

Siamo arrivati alla fine dei gironi dell’AI, con la nuova arrivata. L’AI generativa apre le porte a sistemi creativi, che sanno generare testo, immagini, video e suoni a partire da indicazioni chiare (prompt). Qualche volta soffrono di allucinazioni, ma per evitarle è possibile strutturare sistemi di Retrieval Augmented Generation (RAG). Questi sistemi sono in grado di interpretare il prompt, estrarre da un database di riferimento un contesto concreto e coerente con la realtà, e fornire il contesto insieme al prompt al sistema di AI generativa per generare risposte vere e verificate dai dati.

Retrieval Augmented Generation, schema del paper.

Questi sistemi da soli sono molto utili per generare brevi testi scritti, fare sintesi di appunti, o generare immagini per ispirazione, ma diventano ancora più interessanti in industria se accoppiati con i risultati dei sistemi mappati sopra. Qualche applicazione potrebbe essere:

  • Creazione automatica di report periodici a partire dai risultati degli indicatori
  • Smistamento e registrazione automatica dei ticket o delle chiamate ai call center
  • On-boarding facilitato per i nuovi assunti e le nuove assunte in base alle procedure tecniche di riferimento
  • Troubleshooting evoluto in base alla manualistica di riferimento
  • Co piloting nel setup delle macchine e nelle attività di manutenzione, ispezione e verifica

In questo caso la tecnologia è relativamente nuova, per cui si registrano ancora pochi casi industrializzati, ma il potenziale è ampio e l’interesse molto alto, per cui mi aspetto che nei prossimi 2-3 anni vedremo i risultati e l’impatto di questa nuova branca dell’AI.

Saper scegliere è un’arte

Le tecniche per generare valore in industria con l’AI sono tantissime, così come i metodi e le strategie per gestire al meglio i dati. La bravura dell’AI engineer è trovare la soluzione migliore da punto di vista tecno-economico per ogni obiettivo: non la più performante, ma quella che genera un maggior ritorno di investimento. Bisogna quindi sempre trovare l’equilibrio tra una soluzione tecnicamente perfetta e economicamente conveniente. In questo contesto conoscere il dominio è quindi fondamentale

  • per capire qual è l’indicatore business corretto per valutare l’impatto della soluzione
  • per mappare la situazione in essere e capire cosa tenere e cosa potenziare

Questo è l’unico modo per non perdersi nei meandri delle tecnologie, e riuscire a calibrare il colpo per raggiungere il risultato.