Su suggerimento di @Fhtagn!
Un articolo uscito nell’ultimo numero di Nature fa il punto della situazione per quanto riguarda l’utilizzo dei cosiddetti “big data” nella ricerca sul cancro; pioniere nel campo è stato il progetto TCGA (The Cancer Genome Atlas), che raccoglie circa 2.5 milioni di GB di dati da pazienti il cui genoma e trascrittoma del cancro sono stati sequenziati, e li fornisce pubblicamente. Il grosso problema con il TCGA è che vi sono poche informazioni sulla storia clinica dei pazienti, e sulla loro esperienza clinica. I dati di cui vi sarebbe bisogno per studiare meglio i diversi tipi di cancro sono al momento dispersi nei database di singoli ospedali, senza una vera e propria raccolta sistematica.
Il grande obiettivo per il futuro dei big data è di unire le conoscenze che emergono da ricerca, cura dei pazienti e trial clinici, in modo da incrociare meglio i dati. Ovviamente, anche la migliore raccolta dati del mondo deve poter essere fruibile direttamente dagli scienziati, rischiando altrimenti di perdere preziose informazioni per incapacità di gestire grandi moli di dati. Inoltre, nell’utilizzare i big data bisogna tener conto dei problemi riguardanti la privacy dei pazienti e la proprietà dei dati.
Per affrontare la sfida dei big data sono nate diverse organizzazioni, di cui Nature ci racconta.
La Foundation Medicine è orientata al paziente. Sequenzia campioni di pazienti e conduce screening sui genomi per trovare geni le cui mutazioni sono cancerogene, ed è finanziata dalle compagnie di assicurazione. Si basa sul fatto che gli oncologi non hanno un modo semplice per confrontare i genomi dei propri pazienti con i data base pubblici, e occupa questa nicchia fornendo risposte sulle terapie disponibili nei diversi casi.
CancerLinQ è un database che può essere utilizzato per capire gli effetti di specifici trattamenti in determinati pazienti, in maniera da poter decidere il miglior approccio terapeutico. Questo database ha l’ambizione di imparare qualcosa dai casi di quel 97% di pazienti che non partecipano ai clinical trials.
IBM Watson Health sta sviluppando Watson, una intelligenza artificiale che dovrebbe combinare apprendimento e comprensione del linguaggio naturale. Il suo database include, fra gli altri, ogni abstract disponibile su Pubmed, il dizionario dei farmaci del US Nationl Cancer Institute e il catalogo delle mutazioni somatiche nel cancro (COSMIC), oltre all’accesso a dati anonimizzati di pazienti. L’idea è che Watson possa essere in grado di apprendere da tutte queste fonti, e messo di fronte ad un caso specifico estrapolare il trattamento migliore. Uno dei punti sollevati è comunque il bisogno di trrasparenza nei processi decisionali di Watson, in maniera tale che all’occorrenza essi possano essere confutati dal medico. Una delle limitazioni, ad oggi, è che ancora Watson non è in grado di comprendere il linguaggio naturale, obbligando gli scienziati ad introdurre manualmente i dati.
(Dai commenti, @Humu suggerisce questo articolo del Washington Post su Watson.)
ORIEN, l’Oncology Research Information Exchange Network, comprende 9 centri accademici per la cura del cancro, e i pazienti che vengono reclutati acconsentono ad un follow-up a vita.
Il grande fattore limitante di tutto questo è il denaro che occorre: per fare le dovute proporzioni, basti pensare che per un singolo sequenziamento Foundation Medicine richiede dai 6000 ai 7000 dollari, e i nuovi farmaci oncologici arrivano a costare fino a 100.000 dollari all’anno per trattamento per paziente.
Immagine da “Viegas-UserActivityonWikipedia” by Fernanda B. Viégas – User activity on Wikipedia. Licensed under CC BY 2.0 via Commons –
Commenta qui sotto e segui le linee guida del sito.