COVID-19 Machine Learning Tool Assimila i documenti di ricerca

Aggiungi ai preferiti

Vedi traduzione automatica

#News

{{{sourceTextContent.title}}}

{{{sourceTextContent.subTitle}}}

{{{sourceTextContent.description}}}

Un gruppo di scienziati dei materiali del Lawrence Berkeley National Laboratory (Berkeley Lab), che di solito dedicano il loro tempo alla ricerca di materiali ad alte prestazioni per termoelettrici o catodi di batterie, ha costruito lo strumento di estrazione del testo. La loro ricerca per sviluppare tecniche di text mining e data mining che possano aiutare a rispondere alle domande ad alta priorità relative a COVID-19 nasce dalla chiamata all'azione della Casa Bianca del 16 marzo.

Una volta che il team del Berkeley Lab si è messo al lavoro, il suo prototipo è stato messo in funzione nel giro di una settimana; dopo un mese lo strumento aveva raccolto più di 61.000 documenti di ricerca. Circa 8.000 riguardavano specificamente COVID-19 e il resto riguardava argomenti correlati, come altri virus e pandemie in generale. Si stima che ogni giorno vengano pubblicati 200 nuovi articoli sul coronavirus. "Entro 15 minuti dalla comparsa del documento online, sarà sul nostro sito web", ha detto Amalie Trewartha, una postdoctoral fellow che è uno degli sviluppatori principali.

Lo strumento è entrato in funzione questa settimana quando il team del Berkeley Lab ha rilasciato una versione aggiornata che consente all'utente di cercare "documenti correlati" e ordinare gli articoli utilizzando la regolazione della rilevanza basata sull'apprendimento automatico. COVIDScholar raccomanderà anche abstract simili e ordinerà automaticamente i documenti in sottocategorie, come i test o le dinamiche di trasmissione, permettendo agli utenti di fare ricerche specializzate.

Gli sviluppatori hanno costruito script automatizzati per prendere nuove carte (incluse quelle prestampate), ripulirle e renderle ricercabili. Al livello più elementare, COVIDScholar agisce come un semplice motore di ricerca, come un motore di ricerca altamente specializzato che, secondo gli sviluppatori, è la più grande raccolta di letteratura a tema singolo su COVID-19.

Il team di esperti di intelligenza artificiale addestrerà ora i suoi algoritmi per cercare connessioni inosservate tra i concetti. "È possibile utilizzare le rappresentazioni generate per i concetti dei modelli di apprendimento automatico per trovare somiglianze tra cose che in realtà non si verificano insieme nella letteratura, in modo da poter trovare cose che dovrebbero essere collegate ma che non lo sono ancora state", ha detto John Dagdelen, uno studente laureato della UC Berkeley e ricercatore del Berkeley Lab che è uno degli sviluppatori principali.

Inoltre, il team prevede di lavorare con i ricercatori della Divisione di Genomica Ambientale e Biologia dei Sistemi del Berkeley Lab e dell'Innovative Genomics Institute della UC Berkeley per migliorare gli algoritmi di COVIDScholar. L'idea è quella di sintetizzare i sistemi in modo da permettere ai ricercatori di scoprire nuove connessioni all'interno dei loro dati, ha detto Dagdelen.

Aumenta la velocità con cui la squadra è stata in grado di iterare le idee da sperimentare. Il gruppo ha dedicato tre anni alla lavorazione del linguaggio naturale per la scienza dei materiali e ha costruito uno strumento simile, chiamato MatScholar, un progetto sostenuto dal Toyota Research Institute e dalla Shell.