Perché non è sempre una buona idea che l’AI continui ad imparare

Robot learning

Il modello apprende e poi predice

In base ai dati dello storico, il modello di machine learning o deep learning è in grado di imparare. In particolare, impara a replicare le correlazioni tra i dati che ha osservato, o a replicare azioni che sono utili per raggiungere un obiettivo.

Dopo che il modello ha imparato, la sua struttura è definita, e viene usata per fare nuove predizioni.

E se decidessi che voglio aggiornare il modello sempre, qualsiasi nuovo dato arrivi? Certo, si può fare, e si chiama continual learning.

Ma siamo sicuri abbia senso?

Continual learning, quando ha senso e quando è una pessima idea

Il continual learning è il processo per cui il modello si aggiorna periodicamente e in autonomia man mano che arrivano nuovi dati .

Continual learning, pop style, secondo Midjourney

In generale, questo approccio è utile per garantire scalabilità e flessibilità delle soluzioni: il modello è in grado di adattarsi alla nuova situazione e imparare dai nuovi dati. Tuttavia, questo approccio si basa sull’assunzione che tutti i dati siano buoni, ma in industria questo non sempre è vero!

Il continual learning come risorsa: quando è bene utilizzarlo

Le ipotesi per cui il continual learning è vantaggioso si riassumono in 4 punti:

  • I dati dai sensori sono controllati e la loro qualità è garantita: i sensori starati o guasti vengono manutenuti e il database pulito, gli outlier vengono gestiti da modalità di controllo automatico
  • Nei casi di anomaly detection in cui esiste un feedback loop: quando succede qualcosa, l’utente ha un modo facile per segnalarlo e il sistema gestisce in autonomia questa informazione. Ad esempio, se c’è un guasto, l’utente lo segnala e il sistema utilizza questa informazione per riallenarsi.
  • Tutti i dati sono validi: va bene che il modello rincorra il degrado della macchina o del sensore. Ad esempio nei modelli in cui vogliamo prevedere il consumo delle successive 24 ore o la produzione della linea nella successiva ora. In questo caso l’importante è riuscire a prevedere in modo corretto il periodo successivo, senza preoccuparsi troppo della bontà del dato a meno di outliers importanti.

In questi casi, il modello può adattarsi periodicamente e senza supervisione, e non si rischia di perdere la capacità di predizione del modello rispetto all’obiettivo di business.

Il rischio del continual learning e come mitigarlo

Ci sono però almeno due casistiche in cui l’adattamento del modello in modo autonomo può essere un rischio:

  • In caso di modelli di manutenzione predittiva, il sistema intercetta la condizione di preguasto prima che l’utente possa confermare l’effettivo stato di guasto.
  • In caso di monitoraggio di performance, in cui non c’è modo di confermare l’inefficienza se non grazie al modello.

In entrambi questi casi, il continual learning spingerebbe il modello a rincorrere il degrado del sistema fisico, adattandosi di volta in volta alle nuove condizioni. Il risultato? Un modello che non predice guasti o inefficienze, con un sistema sull’orlo di un fermo macchina o molto inefficiente.

Il rischio del continuous learning nella manutenzione predittiva o monitoraggio delle performance: il modello rincorre il degrado!

In questi casi, l’aggiornamento del modello deve essere fatto sì sui nuovi dati, ma dopo una prima valutazione dal data scientist.

Concludendo

  • L’algoritmo, guardando dati storici, si allena in un’attività specifica
  • Una volta allenato, il modello è pronto per fare predizione
  • Il continual learning è una strategia per aggiornare il modello in modo che si adatti ai dati in arrivo continuo
  • In industria, non sempre il continual learning è una buona idea. Nei casi di manutenzione predittiva e monitoraggio delle performance il rischio è perdere la capacità di predire anomalie in quanto il modello rincorre il degrado della macchina.