Il modello apprende e poi predice
In base ai dati dello storico, il modello di machine learning o deep learning è in grado di imparare. In particolare, impara a replicare le correlazioni tra i dati che ha osservato, o a replicare azioni che sono utili per raggiungere un obiettivo.
Dopo che il modello ha imparato, la sua struttura è definita, e viene usata per fare nuove predizioni.
E se decidessi che voglio aggiornare il modello sempre, qualsiasi nuovo dato arrivi? Certo, si può fare, e si chiama continual learning.
Ma siamo sicuri abbia senso?
Continual learning, quando ha senso e quando è una pessima idea
Il continual learning è il processo per cui il modello si aggiorna periodicamente e in autonomia man mano che arrivano nuovi dati .
In generale, questo approccio è utile per garantire scalabilità e flessibilità delle soluzioni: il modello è in grado di adattarsi alla nuova situazione e imparare dai nuovi dati. Tuttavia, questo approccio si basa sull’assunzione che tutti i dati siano buoni, ma in industria questo non sempre è vero!
Il continual learning come risorsa: quando è bene utilizzarlo
Le ipotesi per cui il continual learning è vantaggioso si riassumono in 4 punti:
- I dati dai sensori sono controllati e la loro qualità è garantita: i sensori starati o guasti vengono manutenuti e il database pulito, gli outlier vengono gestiti da modalità di controllo automatico
- Nei casi di anomaly detection in cui esiste un feedback loop: quando succede qualcosa, l’utente ha un modo facile per segnalarlo e il sistema gestisce in autonomia questa informazione. Ad esempio, se c’è un guasto, l’utente lo segnala e il sistema utilizza questa informazione per riallenarsi.
- Tutti i dati sono validi: va bene che il modello rincorra il degrado della macchina o del sensore. Ad esempio nei modelli in cui vogliamo prevedere il consumo delle successive 24 ore o la produzione della linea nella successiva ora. In questo caso l’importante è riuscire a prevedere in modo corretto il periodo successivo, senza preoccuparsi troppo della bontà del dato a meno di outliers importanti.
In questi casi, il modello può adattarsi periodicamente e senza supervisione, e non si rischia di perdere la capacità di predizione del modello rispetto all’obiettivo di business.
Il rischio del continual learning e come mitigarlo
Ci sono però almeno due casistiche in cui l’adattamento del modello in modo autonomo può essere un rischio:
- In caso di modelli di manutenzione predittiva, il sistema intercetta la condizione di preguasto prima che l’utente possa confermare l’effettivo stato di guasto.
- In caso di monitoraggio di performance, in cui non c’è modo di confermare l’inefficienza se non grazie al modello.
In entrambi questi casi, il continual learning spingerebbe il modello a rincorrere il degrado del sistema fisico, adattandosi di volta in volta alle nuove condizioni. Il risultato? Un modello che non predice guasti o inefficienze, con un sistema sull’orlo di un fermo macchina o molto inefficiente.
Il rischio del continuous learning nella manutenzione predittiva o monitoraggio delle performance: il modello rincorre il degrado!
In questi casi, l’aggiornamento del modello deve essere fatto sì sui nuovi dati, ma dopo una prima valutazione dal data scientist.
Concludendo
- L’algoritmo, guardando dati storici, si allena in un’attività specifica
- Una volta allenato, il modello è pronto per fare predizione
- Il continual learning è una strategia per aggiornare il modello in modo che si adatti ai dati in arrivo continuo
- In industria, non sempre il continual learning è una buona idea. Nei casi di manutenzione predittiva e monitoraggio delle performance il rischio è perdere la capacità di predire anomalie in quanto il modello rincorre il degrado della macchina.