Piccola guida per comunicare con un data scientist

Data science vs business

Problemi di comunicazione

Una delle grandi sfide dell’implementazione di soluzioni di intelligenza artificiale industriale è farsi capire da chi deve sviluppare il modello.

L’aspettativa degli utenti infatti è raccontare il problema di business e aspettarsi che il data scientist trovi la soluzione. L’aspettativa dei data scientist è che gli utenti gli spieghino con precisione quale dato prevedere, utilizzando quali input e per produrre l’allarme in che modalità.

Trucchi per indirizzare il team di data science

L’intersezione tra le competenze del data scientist e il business user è lo spazio che serve ampliare.

Per rendere un po’ più semplice il compito del business user, listiamo quindi una serie di modi per farsi capire dai data scientist e rendere più facile il processo di creazione della soluzione. Nelle prossime riche parleremo di data scientist, intendendo il team completo di data science che sviluppa la soluzione.

1. A partire dal problema di business, che tipo di soluzione mi aiuterebbe?

Una dashboard in real time? Un report? Un’istruzione sul CMMS? Focalizzare che tipo di supporto operativo è utile facilita molto il design della soluzione. E’ bene soffermarsi non solo sulla forma, ma anche sulla periodicità (Una volta al giorno? A che ora?). E’ utile specificare anche i dettagli, ad esmepio: vorrei un ticket che mi segnali un’anomalia e la lista dei parametri che più probabilmente sono legati al guasto.

2. Quale indicatore ci interessa migliorare? Come si misura?

Che sia il saving energetico, il numero di guasti di una linea, o la percentuale di scarti, è bene formalizzare l’indicatore di riferimento. Una volta formalizzato, è necessario quantificarne il valore a partire dai dati che si possono raccogliere: il saving sarà il consumo di tutta la linea rispetto alla situazione precedente, o si vuole normalizzare rispetto ad altri fattori? Da dovve si recuperano i dati per questo calcolo?

3. Come tradurre le tag dei parametri?

Di solito i dati hanno dei nomi incomprensibili, tag, tipo L1_1287_TR001_56. E’ buona cosa indicare al data scientist che tipo di dati sta guardando, e soprattutto come interpretare la loro appartenenza a aree simili: parametri di una stessa linea saranno ragionevolmente più o meno correlati, valori di temperatura e pressione potrebbero essere confrontati negli stessi grafici.

4. Quali dati sono disponibili, e come si correlano nel dominio?

Indicare al data scientist correlazioni attese tra le variabili lo aiuta a costruire modelli che abbiano senso. Fargli presente che ad esempio questa linea potrebbe avere un comportamento stagionale o potrebbe essere influenzata da altri parametri che sono flussi a monte, oppure spiegargli cosa entra e cosa esce, fornisce un contesto più chiaro per le analisi.

5. Quali unità di misura?

Al data scientist non interessa nulla sapere qual è l’unità di misura di un dato, e se glielo chiedete non saprà dirvelo. Siate previdenti! Verificate che l’unità di misura dei parametri sia corretta, e magari anche che i valori medi per ogni parametro abbiano senso.

6. Come cambiano i parametri nel tempo?

Questa valvola si può solo aprire e chiudere, mentre questa temperatura varia moltissimo durante il giorno. Mappare in che modo ci aspettiamo che i dati varino nel tempo è utile per mettere il data scientist nelle condizioni di trovare dati che non fanno quello che dovrebbero.

7. Quale errore è il meno peggio?

Come abbiamo visto, l’AI non è infallibile. E’ molto utile quindi spiegare al data scientist qual è l’errore più facile da gestire nelle procedure operative. Ad esempio, potreste scegliere tra 4 segnalazioni di guasto che si rivelano false e 4 guasti che si presentano senza preavviso. Oppure tra un’anomalia segnalata con 4 mesi di anticipo ma difficile da individuare in campo o un’anomalia segnalata con 3 settimane di anticipo ma la cui diagnsotica è molto più semplice. Ovviamente il data scientist farà del suo meglio per creare il mdoello migliore, ma sempre meglio dargli indicazioni rispetto a cosa valorizzare di più.

8. Cosa potrebbe essere utile prevedere?

Abbiamo visto che l’AI impara in molti modi. Conoscerli e provare ad immaginare come costruire un modello in base ai dati disponibili, identificando l’output di riferimento, è estremamente utile per indirizzare tutte le analisi del data scientist.

9. Siate buoni

Voi conoscete quei dati a memoria, il data scientist li ha visti la prima volta l’altro ieri. Non accanitevi con lui se non ha notato quella correlaizone scontata o non ha interpretato correttamente quell’anomalia. Be kind!

Pronti? Via!

Scrivetevi questi 9 punti e teneteli a mente. Ora avete tutto quello che vi serve per farvi capire dai data scientist e garantire il successo della vostra idea!