Bioinformatica e Web 2.0

Inside Bioinfo

13 febbraio 2008 - 11:45

Una biblioteca di PDF scientifici (per Mac ma non solo)

Fabrizio Capuani mi segnala Papers, interessante software, per mantenere e gestire le proprie collezioni di articoli.

Essendo solo disponibile per Mekentosjani, non l’ho potuto testare, quindi spero in qualche altra opinione. Personalmente, come fervente utilizzatore di Windows, ho sempre fatto ricorso ad Endnote. Endnote si differenzia da Papers per la capacità di integrarsi con Word e facilita non poco la scrittura delle citazioni bibliografiche. Però non è pensato per gestire una collezione di pdf, ma solo per collezionare i metadati necessari per creare un database bibliografico.
Naturalmente è possibile inserire il pdf stesso dell’articolo in un folder e linkarlo adeguatamente in Endnote, ma non è un’operazione così immediata, e questo non permette comunque di fare ricerche nei contenuti dei file.

Paper, anch’esso si connette al web e scarica le reference (autore, titolo, giornale, anno di pubblicazione), ma li associa allo stesso pdf. Citando la descrizione originale del software:

Papers contains everything you need to get your favorite articles in your personal library. Importing PDFs that you already downloaded before is easy, you match them using your favorite online article repository like PubMed, Google Scholar, Web of Science, etc. and all the metadata is automatically added. You might as well skip this altogether and start from scratch, the completely integrated search engines is the number one thing you are really going to like. Three clicks is all you need to find a paper and add it to your library.

Fabrizio sintetizza la cosa in “Praticamente e’ iTunes per articoli scientifici. Unico neo e’ che non e’ gratis… si puo’ pero’ provare per 30 giorni“. Paper puo’ esportare una collezione (tipo playlist) in formato Endnote, ma anche in formato bibtex!

L’alternativa è quella di sfruttare l’opzione “Adobe Catalog“. Con esso è possibile indicizzare TUTTO il documento pdf e creare quindi un database cercabile per qualsiasi parola anche nel testo o nei materiali e metodi. E’ possibile inoltre fare
diversi database di articoli per argomenti o gruppi.

Tags: Bibliografia, bioinformatica, Letteratura scientifica, Mac, Pdf
9 febbraio 2008 - 13:06

Gioco di ruolo per bioinformatici

Su bioinformaticszen é apparso un posto molto spiritoso che equipara la scelta della propria carriera come bioinformatico alla creazione di un personaggio in un gioco di ruolo. Che tipo di personaggio/giocatore siete?

Ecco il link originale all’articolo:

Per fare qualche esempio, provo a tradurre i principali ‘archetipi’ di bioinformatico che vi potete creare:

  • Virtuoso di Linux (LV): il percorso del Virtuoso di Linux si specializza nell’uso di software e tool opensource , ma ottiene vantaggio anche dalla potenza del sistema operativo Linux.
    Utilizzando kernel compilati e ottimizzati per i loro computer a 8 core e 4 schermi, i LV hanno sempre installato in locale la ultima versione di qualsiasi database biologico, e la versione più recente di qualsiasi tool.
    Il LV conduce la propria ricerca dalla linea di comando: script di bash scritti con vim e concatenati insieme da pipes di shell.

  • Early Adopter (EA): questo personaggio lavora sempre nell’area di ricerca più recente, systems biology, synthetic biology, personal genomics, e cavalca sempre l’onda degli argomenti scientifici più recenti.
    Tutti i suoi script sono accessibili come servizi web, cosa necessaria dato che l’EA ha cambiato linguaggio di programmazione per 4 volte negli ultimi 3 anni.
    E i suoi dati? Sono tutti disponibili in formato OWL RDF sul suo sito web 2.0 programmato in ruby on rails.

  • Old School (OS): per qualche aspetto il contrario dell’EA, il bioinformatico vecchia scuola ha una grande determinazione nel porre quesiti, e quindi trovare risposte a importanti quesiti di ricerca. Accecato dal cambiamento di tool e tecnologie, il OS porta avanti le sue ricerche in Fortran sul suo Pentium II con Windows 95. In ogni caso questo bioinformatico non deve essere sottovalutato, visto che la mancanza di distrazione significa che egli é completamente concentrato sulla ricerca, cosa che viene riflessa nella sua grossa lista di pubblicazioni.

  • Data Miner (DM): il più misterioso di tutti i percorsi di carriera per bioinformatici, il DM é maestro di tutte le cose numeriche e statistiche. I tool che utilizza nella vita quotidiana sono effetti di regressione, modelli nascosti di Markov, e il temibile algoritmo della crescita neurale del gas. Essendo capace di trovare un risultato significativo da una distribuzione normale casuale di 1000 numeri, il DM ha molti collaboratori. In ogni caso, se un DM si trova nel pubblico durante un tuo seminario devi stare attento, visto che maledicono le tue scoperte con parole strane.

  • Perfect Coder (PC): Il PC fa esattamente quello che implica il suo nome: produce programmi perfetti, senza bug. Il loro uso edemplare di nomi di variabili, commenti, e indentanzione produce codice che sembra poesia, e che anche il tuo cane potrebbe comprendere dopo uno sguardo di 5 secondi. Inoltre, pattern di design, librerie di terze parti, sviluppo portato avanti dal comportamento e logging significano che il PC non sa nemmeno cosa la parola ‘bug’ significhi. In parole povere, il codice scritto da un PC ti fa sentire felice come il giorno del tuo matrimonio e la nascita del tuo primo figlio messi assieme.

  • Wet Lab Bioinformatician (WB): uno scienziato di laboratorio, che lavora in un laboratorio di biologia classica, il WB é il supporto per tutti i problemi di biologia computazionale del laboratorio. E’ abbastanza famigliare con il perl per scrivere dei semplici script, ma la vera forza del WB non sta nello scrivere codice, ma nell’utilizzare tool. Mentre gli altri bioinformatici sono più o meno al corrente di come trovare un gene di interesse, il WB utilizza questi tool quotidianamente, e induce molti a vergognarsi sulle proprie conoscenze di bioinformatica di base. Mentre gli altri hanno la loro testa tra le nuvole di teorie e algoritmi, il WB si sporca le mani con dati reali mentre questi stanno ancora venendo prodotti.

8 febbraio 2008 - 14:59

Il pessimismo cosmico del bioinformatico (just for fun)

Visto chi mi si accusa ingiustamente di essere una persona molto competente e sicuramente seria, oggi, in attesa di postarvi qualcosa di dirompente e innovativo, volevo farvi partecipi dell’opinione che, sotto gli effetti di una stretta dieta a base di statistiche errate, un noto ricercatore dell’Ifom, Giovanni D’ario mi disse nel tentativo di definire cosa fosse un bioinformatico: “e’ qualcuno che a forza di cercar di curare il cancro, gli viene il cancro (o alle volte il mal di denti)”. Tra parentesi la variante di Barbara Felice. :-)

Mi raccomando, non prendete la scienza seriamente!

Tags: bioinformatica, Fun, pessimismo
30 gennaio 2008 - 17:37

La proprietà transitiva della Bioinformatica

La bioinformatica ha speso negli anni molti sforzi intorno il pattern detection, per ovvii motivi. Il pattern matching è infatti una delle grandi anime della bioinformatica; è usato, dove più dove meno, ovunque, negli allineamenti multipli, nel homology modeling, per classificazioni e per predizioni, in proteomica come in genomica.
Non è una notizia nuova che IBM stia applicando con successo alcune tecniche usate in bioinformatica per la ricerca di pattern nel DNA nel campo dell’identificazione dello spam (l’algoritmo Teiresias sviluppato da Chung-Kwei). Daltronde lo stesso George Harik, uno dei primi dieci ingegneri di Google, e che collabora a sistemi “intelligenti” come Adsense e Gmail anti-spam, ha un background che coinvolge algoritmi genetici.

Tutto questo per dimostrare come grandi vantaggi possono venirne dal sapere far tesoro dell’interazione di settori scientifici anche distanti (apparentemente). Naturalmente sarebbe auspicabile una relatione tra bioinformatica e altre scienze che non sia intransitiva.
Un interessante articolo su openHelix circa le difficoltà di navigare, attraverso metodi intelligenti, nel mare magnum
della letteratura scientifica
, mette l’accento (anche) su questo aspetto:

we pointed out that all or most of the demonstrably useful biomedical text mining systemshave been built not by text mining specialists, but by computational biologists. Why might this be? Although this has not been systematically investigated, we speculate that it is related to cultural differences between the two groups.
[...] a combination of computational biologists and text mining specialists will be optimum.
Text mining specialists continue to excel at building system components and designing datasets for evaluation; computational biologists currently appear to be much better at producing useful task definitions. Perhaps the most fruitful approaches are characterized by combined efforts that leverage the abilities of each type of scientist.

Vi consiglio l’articolo da cui partono, o almeno leggere il post su openHelix; tra le altre cose fa il punto sulle risorse web disponibili al momento per “navigare la letteratura”. Devo ammettere che il grafico che disegna il tasso di crescita del numero di abstract è spaventevole, più ancora della crescita del numero di database catalogati nelle tabelle dell’ultimo NAR.

Tags: bioinformatica, Data-mining, Letteratura scientifica, Scienza
25 gennaio 2008 - 11:50

Mille e piu’ genomi (o della poca fantasia dei mega consorzi scientifici)

Leggo or ora su Cordis la notizia della partenza di un nuovo progetto chiamato “1000 Genomes”, e mi chiedo se ce ne fosse veramente bisogno. ;-)
Non metto in dubbio la validità scientifica del progetto in se’; il suo scopo è la compilazione di un catalogo di varianti presenti per lo meno nell’1% della popolazione umana.
Mi lascia pero’ un po’ perplesso lo scollamento che percepisco tra possibilità tecnologiche che si hanno oggi (e che vengono pienamente sfruttate, forse anche per motivazioni prettamente commerciali), e l’utilità pratica dell’operazione.
L’articolo è interessante, ma voglio citarvi solo una frase:

«Con seimila miliardi di banche dati di DNA, nel corso del triennio della sua durata il progetto 1000 Genomes genererà una quantità di dati di sequenziamento pari a 60 volte quelli depositati nelle banche dati pubbliche del DNA negli ultimi 25 anni.»

Wow! A parte il fatto che sequenziare almeno 1000 genomi ormai non pare un obiettivo cosi’ scientificamente intenso, tenendo in conto quanto si è detto ultimamente riguardo progetti come Genomecommons e 23andme, quel che mi domando è se la creazione di tale banca dati possa fornire un effettivo beneficio, o se rimarrà solo un’immensa mole di dati senza valore interpretativo. Catalogare varianti geniche con un ordine di grandezza superiore, in effetti POTREBBE cambiare il modo in cui si effettueranno gli studi delle malattie genetiche, ma lo farà veramente? Lo sforzo interpretativo necessario, quando compiuto, avrà veramente un effetto sensibile in ambito clinico?

(sicuramente lo avrà sui bioinformatici che dovranno analizzare i dati :-| )


Tags: 1000 Genomes, genoma, Sequenziamento
24 gennaio 2008 - 18:48

Linkedin e il futuro della bioinformatica

Correndo up and down per il mio network preferito del momento, Linkedin , ho scoperto che oltre alle classiche opzioni di ricerca lavoro e di ricerca persone (per incrementare il tuo network di conoscenze), vi è anche un’opzione ANSWER. Ovvero vi è la possibilità di porre domande e ricercare risposte postate da altri utenti registrati.

Questo ha l’enorme vantaggio di ottenere spesso risposte estremamente competenti (proprio per la natura stessa su cui è costruito Linkedin). Si possono infatti mappare in questo modo le opinioni di altri esperti appartenti al proprio campo di competenza. Naturalmente ho testato questa opzione con la parola chiave BIOINFORMATICS.

Ovviamente, non tutte le domande sottoposte hanno un carattere generale, che possano essere di interesse comune.
Una discussione però è meritevole d’essere letta: Is bioinformatics still a viable career choice or a business model?
Per quanti non hanno un’utenza Linkedin (affrettatevi! Che aspettate!) vi riporto qui la questione sollevata da Jake Chen (Informatics/Computer Science Professor and Entrepreneur di Indianapolis):

Bioinformatics was pretty hot in the mid- to late- ’90s, when biological data management and data integration was largely a new topic for most Academic institutions, biotech companies, and Pharma. Similar to the IT and financial service industries, bioinformatics was also initially perceived as a “good business model” to serve the biotech/pharma industry by providing discovery-oriented services. However, with the open-source “free software” spirits in the field, the complex scientific marketing challenges, the long discovery process, the generally high-risk nature of biotech, the booming of bioinformatics seemed to be “short-lived” as a business practice or an independent practice in the industry, except for in the Academia (correct me if this is not the case in your company). As an educator, technologist, and an entrepreneur, I’d like to poll expert opinions on the future of this field. Is Bioinformatics still a viable career choice for many aspiring students who expect a rewarding career returns after BS/MS/PhD trainings?
Would the future of bioinformatics exist only as a service to the biotech/pharma industry where continued integration of biological sciences/applications may take place, or as a brand-new industry (e.g., Bloomberg/morningstar in financial services) to be developed in the future era of “personalized medicine”?”

Mi piacerebbe sentire qualche opinione italiana. A margine vi consiglio di dare un’occhiata anche ad un’altra opinione presente nella blogsfera a riguardo, che faccio per lo più mia: sul blog microarray.

The future is there [...] There are a wide variety of companies trying to commercialize bioinformatics.
Some of these businesses have been around for many years, but a lot of them are just jumping in with nothing but hype to sell, trying and gain some market share and position themselves as “leaders” in the new area of genomics, hoping to become profitable or get bought out before the venture capital funds dry up (fonte della citazione).


Tags: bioinformatica, Linkedin, Network, Prospettive future
22 gennaio 2008 - 13:02

23andMe sbarca in Europa (Il mio genoma e’ più bello del tuo!)

Avevo già parlato (qui) di come sia ormai alla portata di tutti ottenere il proprio genoma sequenziato. Pare che questa possibilità attraversi l’oceano per sbarcare in 49 paesi europei. BusinessWire pubblica la notizia.

La società che fornisce questo servizio è la 23andme(TM) .

Citando il loro website:

Welcome to 23andMe, a web-based service that helps you read and understand your DNA. After providing a saliva sample using an at-home kit, you can use our interactive tools to shed new light on your distant ancestors, your close family and most of all, yourself.

Personalmente sono affascinato dalla semplicità con cui fanno questo miracolo. E’ veramente il sogno proibito di Watson e Crick quando pensarono alla doppia elica!

Pensate un po’:

  • ricercare ed esplorare i geni che contribuiscono alle loro caratteristiche personali, per esempio intolleranza al lattosio, capacità atletiche e preferenze alimentari;
  • scoprire come le ultime ricerche sono collegate al loro genoma;
  • raffrontare il proprio profilo con quello di parenti e amici che partecipano all’iniziativa di 23andMe e scoprire il percorso ereditario dei geni associati a tratti specifici;
  • scoprire le proprie radici genetiche, conoscere come e quando hanno vissuto i loro antenati, e gli eventi preistorici cui hanno preso parte;
  • partecipare attivamente a una nuova tecnica di ricerca e contribuire al progresso della genetica.

Ogni bioinformatico, non può non voler far parte di questa selezionata elite di essere umani! Immaginatelo: fornire il materiale il biologico, produrre i dati genomici, analizzarsi, interpretarsi e pure pubblicarsi! All by yourself! :-)

Per una sbirciatina veloce a come funzionano i loro servizi vi rimando all’articolo di Businesswire e agli altri articoli relativi che potete trovare su google news.

Tags: Bioiniformatica, genoma, Società
22 gennaio 2008 - 11:56

Openhelix (una risorsa importante per il bioinformatico)

La Newsletter del Bioforum mi fa notare l’apertura di un nuovo blog : OPENHELIX focalizzato su genomica e risorse bioinformatiche.
Secondo le intenzioni degli autori il blog dovrebbe essere uno strumento per rimanere aggiornati riguardo i cambiamenti delle risorse presenti in rete e i vari database genomici. MA NON SOLO. Il blog è strutturato in modo che, insieme ai post quotidiani, viene messo a disposizione, di solito al mercoledì, un “TIP of the WEEK“, ovvero un breve video di circa 4 minuti che descriva, all’uso pratico, come ottenere il meglio dai database disponibili, sottolineando nuove funzioni, o metodologie per estrarre informazioni “nascoste“.

Certo è che, nei Tips vi sono dei tutorial ottimamente fatti. La qualità è veramente elevata!
Ma non è tutto: insieme ai Tips, settimanalmente verra’ proposto un’area “What’s Your Problem?”, dove il lettore potrà proporre quesiti e aspettarsi quindi risposte competenti riguardo per esempio come poter estrarre le informazioni che gli servono da una specifica risorsa. Una specie di help desk personalizzato.
Vi lascio infine immaginare il contenuto di un’ultima sessione, chiamata “Guest Post:-)

Personalmente seguo con avidità questa nuova risorsa, e non mancherò di sottoporvi alcuni loro Tips che reputo di particolare interesse. Eccovi intanto il loro feed principale. Sono sicuro che questo nuovo blog – se mantiene le promesse – diventerà sempre più una risorsa indispensabile!

Tags: bioinformatica, Blog, Database, Genomica, Openhelix
17 gennaio 2008 - 11:55

PCR song (La ricerca va a braccetto con la musica)

Ormai esiste una certa tradizione per cui su YouTube non si trovano solo bellissimi video che raccontano le meravigliose minuzie del mondo biologico, ma pare che i ricercatori abbiano anche uno spiccato senso del ritmo (oppure potrebbe essere che hanno un sacco di tempo libero tra uno split di cellule e l’altro :-) ).

Certo è che una mente creativa ama esprimersi in mille modi diversi, e anche quando la scienza assume un aspetto goliardico i risultati sono spesso incredibili! Mi è capitato sotto gli occhi questo piccola chicca.
Have fun!

Immagine anteprima YouTube

 

 

Tags: Musica, Scienza, video, Youtube
14 gennaio 2008 - 18:41

Blog di bioingegneria

Sebbene non sia prettamente di argomento bioinformatico, volevo consigliare a tutti di seguire ogni tanto un blog che reputo molto interessante. E’ da qualche tempo che sbircio le chicche che vengono postate sul blog del dipartimento di bioingegneria del Politecnico di Milano.
Giuro, non è perchè in quei dolci lidi vi ho passato gli anni della specializzazione. :-)

Gli argomenti sono di vario genere, spesso di utilità pratica, che semplicemente vi indicano -con brevi commenti- link a strumenti on line che potrebbero esservi sfuggiti!

Trovo estremamente stimolante la capacità di sintesi che gli autori possiedono, il tutto completato da una serie di guide di sicuro interesse. Per maggiori dettagli circa il loro progetto potete fare riferimento a questa intervista.

Tags: Bioingegneria, Blog, Milano