Vedi traduzione automatica
Questa è una traduzione automatica. Per vedere il testo originale in inglese cliccare qui
#News
{{{sourceTextContent.title}}}
COVID-19 Machine Learning Tool Assimila i documenti di ricerca
{{{sourceTextContent.subTitle}}}
Lo strumento di IA online utilizza algoritmi di text mining per scansionare e dare un senso a centinaia di nuovi documenti ogni giorno.
{{{sourceTextContent.description}}}
Il volume della letteratura prodotta sul tema di COVID-19 è scoraggiante. Tanto che gli scienziati non riescono a stare al passo e hanno bisogno di aiuto per trovare documenti rilevanti e correlazioni costruttive.
Entra in COVIDScholar.com. Il motore di ricerca utilizza tecniche di elaborazione del linguaggio naturale per scansionare, cercare, sintetizzare, disegnare intuizioni e creare connessioni.
Un gruppo di scienziati dei materiali del Lawrence Berkeley National Laboratory (Berkeley Lab), che di solito dedicano il loro tempo alla ricerca di materiali ad alte prestazioni per termoelettrici o catodi di batterie, ha costruito lo strumento di estrazione del testo. La loro ricerca per sviluppare tecniche di text mining e data mining che possano aiutare a rispondere alle domande ad alta priorità relative a COVID-19 nasce dalla chiamata all'azione della Casa Bianca del 16 marzo.
All'epoca, il COVID-19 Open Research Dataset (CORD-19) della letteratura scientifica su COVID-19, SARS-CoV-2 e il gruppo Coronavirus aveva la più ampia raccolta di letteratura coronavirale leggibile a macchina disponibile per l'estrazione di dati e testi, con più di 29.000 articoli.
Una volta che il team del Berkeley Lab si è messo al lavoro, il suo prototipo è stato messo in funzione nel giro di una settimana; dopo un mese lo strumento aveva raccolto più di 61.000 documenti di ricerca. Circa 8.000 riguardavano specificamente COVID-19 e il resto riguardava argomenti correlati, come altri virus e pandemie in generale. Si stima che ogni giorno vengano pubblicati 200 nuovi articoli sul coronavirus. "Entro 15 minuti dalla comparsa del documento online, sarà sul nostro sito web", ha detto Amalie Trewartha, una postdoctoral fellow che è uno degli sviluppatori principali.
Pronto per l'uso pubblico
Lo strumento è entrato in funzione questa settimana quando il team del Berkeley Lab ha rilasciato una versione aggiornata che consente all'utente di cercare "documenti correlati" e ordinare gli articoli utilizzando la regolazione della rilevanza basata sull'apprendimento automatico. COVIDScholar raccomanderà anche abstract simili e ordinerà automaticamente i documenti in sottocategorie, come i test o le dinamiche di trasmissione, permettendo agli utenti di fare ricerche specializzate.
Gli sviluppatori hanno costruito script automatizzati per prendere nuove carte (incluse quelle prestampate), ripulirle e renderle ricercabili. Al livello più elementare, COVIDScholar agisce come un semplice motore di ricerca, come un motore di ricerca altamente specializzato che, secondo gli sviluppatori, è la più grande raccolta di letteratura a tema singolo su COVID-19.
Passi successivi
Il team di esperti di intelligenza artificiale addestrerà ora i suoi algoritmi per cercare connessioni inosservate tra i concetti. "È possibile utilizzare le rappresentazioni generate per i concetti dei modelli di apprendimento automatico per trovare somiglianze tra cose che in realtà non si verificano insieme nella letteratura, in modo da poter trovare cose che dovrebbero essere collegate ma che non lo sono ancora state", ha detto John Dagdelen, uno studente laureato della UC Berkeley e ricercatore del Berkeley Lab che è uno degli sviluppatori principali.
Inoltre, il team prevede di lavorare con i ricercatori della Divisione di Genomica Ambientale e Biologia dei Sistemi del Berkeley Lab e dell'Innovative Genomics Institute della UC Berkeley per migliorare gli algoritmi di COVIDScholar. L'idea è quella di sintetizzare i sistemi in modo da permettere ai ricercatori di scoprire nuove connessioni all'interno dei loro dati, ha detto Dagdelen.
Non dal campo a sinistra
L'intero strumento funziona sui supercomputer del National Energy Research Scientific Computing Center (NERSC), una struttura per gli utenti del DOE Office of Science che si trova a Berkeley Lab. Il motore di ricerca online e il portale sono alimentati dalla piattaforma Spin cloud del NERSC.
Aumenta la velocità con cui la squadra è stata in grado di iterare le idee da sperimentare. Il gruppo ha dedicato tre anni alla lavorazione del linguaggio naturale per la scienza dei materiali e ha costruito uno strumento simile, chiamato MatScholar, un progetto sostenuto dal Toyota Research Institute e dalla Shell.
L'anno scorso il team ha pubblicato un articolo su Nature che ha mostrato come un algoritmo senza alcuna formazione in scienza dei materiali possa raccomandare i materiali per applicazioni funzionali diversi anni prima della loro scoperta.
{{medias[136607].description}}