COVID-19 Sounds è un progetto dell’Università di Cambridge che mira a fornire una prima diagnosi di Covid-19 partendo semplicemente dalla voce, dal respiro e dai colpi di tosse. Con una rete neurale così addestrata sarebbe in teoria possibile offrire agli utilizzatori con sintomi una prima indicazione direttamente dal proprio smartphone, indicazione diagnostica da confermare successivamente con un tampone.

Già così però sarebbe possibile attuare un primo screening fai-da-te alla portata di tutti, a patto però che il progetto – che è sostenuto dal Consiglio Europeo della Ricerca – abbia un numero sufficiente di campioni per addestrare l’intelligenza artificiale.

Fra i tre professori di Cambridge che curano il progetto abbiamo parlato con l’italiana Cecilia Mascolo.

Cos’è il progetto “COVID-19 Sounds App”?

COVID-19 Sounds App fa parte del progetto più generale EAR finanziato dall’European Research Council. Con il college Prof. Cicuta, biofisico, e Prof. Floto, pneumologo infettivo, abbiamo deciso che una raccolta dati relativa al COVID era necessaria. La raccolta richiede dati di storia medica pregressa e sintomi. Poi chiede all’utente di registrare alcuni colpi di tosse e respiro, nonché la voce mentre legge una frase. Chiede anche se l’utente è risultato positivo al COVID test di recente e l’ubicazione (un solo sample).

Ci potresti spiegare quali tecnologie di intelligenza artificiale usate per elaborare i dati?

Poiché miriamo e già abbiamo migliaia di dati penso utilizzeremo tecniche di elaborazione di segnale e reti neurali specializzate nell’audio. Ci sono già lavori che usano queste reti per analisi di voce e tosse in generale.

Quante persone hanno partecipato finora, e quante di queste hanno dichiarato nel questionario di essere positive al Covid-19?

Non ho le divisioni per paese ma i partecipanti sono più di 5000 al momento e speriamo aumentino ancora, in modo da aiutarci a fare analisi di tosse e voce per capire se sono diagnostiche.

Purtroppo i positivi testati con tampone (dichiarati) non sono più di 50 e stiamo cercando partecipanti di questo tipo.

Quante persone dovranno partecipare per addestrare adeguatamente la rete neurale?

Vorremmo più di 10.000 utenti, tra cui una buona proporzione positiva di recente.

Quali dati dell’utente vengono forniti e come sono protetti?

I dati più sensibili sono quelli della voce e dell’ubicazione. Per ora i dati raggiungono criptati i server dell’università e sono elaborati solo dal gruppo di Cambridge. Speriamo però di trovare meccanismi legali per permettere la condivisione per scopi di ricerca con altri gruppi.

Stiamo anche cercando di capire come rilasciare parti meno sensibili dei dati (tipo la tosse) più pubblicamente.

In caso di sospetta positività, cosa farà l’app?

Al momento l’app funziona solo per la raccolta dei dati. La speranza è di sviluppare metodologie che permettano in futuro all’app di diventare uno strumento di screening diagnostico. Ad esempio per capire se un individuo stia sviluppando sintomi pericolosi e necessiti di ospedalizzazione.

Quali sono gli ostacoli maggiori che avete incontrato – o che state incontrando – nella realizzazione e nella gestione di questo progetto. E come li avete affrontati?
  1. Trovare utenti positivi: penso faremo un mini studio in qualche ospedale per ottenere ulteriori dati da pazienti positivi. Questo richiede processi etici più complicati ma avremo riscontri sicuri su tamponi e sintomi medici.
  2. I dati sono molto noisy e dovremo applicare tecniche di machine learning e signal processing avanzate.
  3. Una volta trovata la “correlazione”, e se l’algoritmo è predittivo, sarà una questione di capire cosa dire all’utente (forse usare la probabilità, oppure decidere con i medici quale possa essere la frazione di falsi positivi accettabile).
Come fate per capire se i responsi dell’algoritmo sono corretti? Come verificate se la sospetta positività dichiarata dall’AI sia effettivamente tale?

Proprio per questo vorremmo fare un mini trial negli ospedali dove i medici ci possano confermare i risultati dei tamponi dei pazienti. Questo ci aiuterebbe anche ad avere più dati di individui positivi, visto che al momento ne abbiamo pochi.

Potresti raccontarci brevemente la tua esperienza e come sei arrivata a fare ricerca in ambito AI?

Il mio lavoro è relativo a creare software efficiente per cellulari e wearable con applicazioni di medicina. L’audio è uno dei dati che studio da tempo. Già nel 2010 ho fatto lavori in cui i telefoni raccoglievano audio sul cellulare (senza mai lasciarlo) con modelli di identificazione di emozioni basati su Gaussian Mixture models. L’intelligenza artificiale quindi è sempre stata nel contesto generale del mio lavoro in quanto una qualsiasi logica di analisi sia su dispositivo o remota necessita di algoritmi intelligenti.

Ringraziando la Prof.ssa Mascolo, ricordo che presso il sito https://covid-19-sounds.org/it/ è possibile scaricare l’app per Android o fornire direttamente sul sito i propri campioni vocali. Al gruppo di ricerca servono campioni audio di individui sani ma anche di individui con una diagnosi di Covid-19, campioni che i ricercatori gestiranno in forma anonima.