Bioinformatica e Web 2.0

Inside Bioinfo

15 febbraio 2008 - 11:09

Gene Characterization Index (CGI? what’s up!)

“Uno score per indicizzare il livello di caratterizzazione dei geni”

Prima o poi chi gioca al Bioinformatico si ritrova ad affrontare la sfida di progettare un sistema di indicizzazioine e scoring.
Ce ne sono di ogni tipo, possono esserci score statistici, algoritmici, induttivi, euristici, gerarchici… ci si perde facilmente tra curve poissoniane del rumore, condizioni di Kolmogorov-Smirnov, normalizzazioni, teorie dei grandi numeri…
Uno score e’ comunque una sorta di coltello che frange dati significativi, dallo schifo intorno.

Tra gli score euristici mi affascinano quelli che fanno parte della categoria score qualitativi, che trattano proprio clasterizzazioni di paper, che costruiscono network sulla base di parole chiavi. L’incremento del numero di pubblicazioni ha reso necessario lo sviluppo di strumenti sempre più raffinati per identificare reference incrociate, analisi degli abstract e via dicendo. Se ne parla su Openhelix.
Ebbene, UN INTERESSANTE LAVORO e’ stato sviluppato e pubblicato nel tentativo di rispondere alla domanda “quanto uno specifico gene è stato funzionalmente caratterizzato?“. Lo score e’ basato su criteri che scansionano risorse quali le sequenze presenti in GenBank, domini InterPro, pathway in KEGG, reference Medline, OMIM e Swiss-Prot. Su questa base vengono assegnati degli score da 1 a 10 (great!).

By evaluating the survey as training data, we developed a bioinformatics procedure to assign gene characterization scores to all genes in the human genome. We analyzed snapshots of functional genome annotation over a period of 6 years to assess temporal changes reflected by the increase of the average Gene Characterization Index.

Il sistema, è più complesso di quanto ho detto (naturalmente!) ed è stato validato su classi di geni di rilevanza farmacologica. Il sistema dimostra di essere in grado di generare un ottimo posizionamento per geni target ben noti, e di individuare nuovi target gene potenzialmente interessanti. Un suo uso base può facilmente dare un’idea di quanto è studiato un gene, quanto materiale posso aspettarmi di trovare a riguardo, e se magari vale la pena focalizzare su di esso i nostri sforzi bioinformatici!

Tags: bioinformatica, CGI, Letteratura scientifica, Network
24 gennaio 2008 - 18:48

Linkedin e il futuro della bioinformatica

Correndo up and down per il mio network preferito del momento, Linkedin , ho scoperto che oltre alle classiche opzioni di ricerca lavoro e di ricerca persone (per incrementare il tuo network di conoscenze), vi è anche un’opzione ANSWER. Ovvero vi è la possibilità di porre domande e ricercare risposte postate da altri utenti registrati.

Questo ha l’enorme vantaggio di ottenere spesso risposte estremamente competenti (proprio per la natura stessa su cui è costruito Linkedin). Si possono infatti mappare in questo modo le opinioni di altri esperti appartenti al proprio campo di competenza. Naturalmente ho testato questa opzione con la parola chiave BIOINFORMATICS.

Ovviamente, non tutte le domande sottoposte hanno un carattere generale, che possano essere di interesse comune.
Una discussione però è meritevole d’essere letta: Is bioinformatics still a viable career choice or a business model?
Per quanti non hanno un’utenza Linkedin (affrettatevi! Che aspettate!) vi riporto qui la questione sollevata da Jake Chen (Informatics/Computer Science Professor and Entrepreneur di Indianapolis):

Bioinformatics was pretty hot in the mid- to late- ’90s, when biological data management and data integration was largely a new topic for most Academic institutions, biotech companies, and Pharma. Similar to the IT and financial service industries, bioinformatics was also initially perceived as a “good business model” to serve the biotech/pharma industry by providing discovery-oriented services. However, with the open-source “free software” spirits in the field, the complex scientific marketing challenges, the long discovery process, the generally high-risk nature of biotech, the booming of bioinformatics seemed to be “short-lived” as a business practice or an independent practice in the industry, except for in the Academia (correct me if this is not the case in your company). As an educator, technologist, and an entrepreneur, I’d like to poll expert opinions on the future of this field. Is Bioinformatics still a viable career choice for many aspiring students who expect a rewarding career returns after BS/MS/PhD trainings?
Would the future of bioinformatics exist only as a service to the biotech/pharma industry where continued integration of biological sciences/applications may take place, or as a brand-new industry (e.g., Bloomberg/morningstar in financial services) to be developed in the future era of “personalized medicine”?”

Mi piacerebbe sentire qualche opinione italiana. A margine vi consiglio di dare un’occhiata anche ad un’altra opinione presente nella blogsfera a riguardo, che faccio per lo più mia: sul blog microarray.

The future is there [...] There are a wide variety of companies trying to commercialize bioinformatics.
Some of these businesses have been around for many years, but a lot of them are just jumping in with nothing but hype to sell, trying and gain some market share and position themselves as “leaders” in the new area of genomics, hoping to become profitable or get bought out before the venture capital funds dry up (fonte della citazione).


Tags: bioinformatica, Linkedin, Network, Prospettive future