Bioinformatica e Web 2.0

Inside Bioinfo

25 marzo 2009 - 10:57

Database Vettori

Dove cercate le mappe dei vostri vettori? Su Google? Su Pubmed?

Io mi sono trovato molto bene con questo Database di Vettori gestito da AddGene.

Fornisce molte informazioni sui plasmidi: sequenza, mappa, enzimi di restizione, proteine trascritte e tradotte. Si possono depositare (gratuitamente) i plasmidi che sono stati utilizzati (ad esempio) in un lavoro, e questi possono essere acquistati da altri ricercatori.

Addgene è un organizzazione no profit, ovviamente i guadagni vengono usati per mantenere il servizio. Insomma…è una sorta di banca/database di vettori per aiutare i Ricercatori….

Link: MyBioinformatica

Tags: bioinformatica, Database
18 settembre 2008 - 09:00

Banche Dati

Esistono 2 grandi laboratori internazionali di bioinformatica l’EMBL-EBI (Europeo) e l’NCBI (Americano). Questi due centri hanno dato vita a vari progetti e banche dati (database). Dalloliogm mi segnala (grazie!) anche Genome.jp, un altro laboratorio internazionale di bioinformatica (Giapponese), che fornisce database interessanti.

Le banche dati sono dei grandi archivi riguardanti un determinato argomento, ovviamente nel nostro caso riguardano argomenti biologici. Le banche dati oggi esistenti (in campo biologico) saranno un migliaio, e viene catalogato praticamente di tutto, dal genoma umano alle malattie, passando per geni, Rna, polimorfismi e chi più ne ha più ne metta.

Alcune di queste banche dati sono state sviluppate dall’EMBL-EBI, altre dall’NCBI, contengono milioni di voci, e sono utilissime. Le banche dati possono essere mantenute e controllate da persone, queste di solito risultano molto ben curate e poco ridondanti. Altre invece possono essere mantenute da software, quindi sono aggiornate molto velocemente ma molto ridondanti (per ridondante si intende che la stessa informazione è contenuta più volte)

Esistono 3 banche dati che sono dette primarie, poichè contengono le informazioni riguardanti il Dna. Tutte le altre banche dati (proteiche, di polimorfismi, di malattie) sono collegate a queste. Due di queste sono EMBL datalibrary e la GenBank. Fra queste due banche dati c’è un continuo scambio di dati, per cui tutte le informazioni che potete trovare su una, le trovate anche sull’altra.

Esistono poi database secondari, che contengono sequenze proteiche: Swiss-prot, TrEMBL e PIR. Swiss-prot è curata manualmente, per cui è poco ridondante ed è ricca di informazioni (ed è un database che adoro!!! :D ). TrEMBL nasce grazie alla traduzione automatica dei geni presenti in EMBL datalibrary, per cui alcune delle proteine predette possono non esistere nella realtà. PIR è l’equivalente nato dal laboratorio americano. Nel 2002 nasce un database integrato fra Swiss-prot, TrEMBL e PIR chiamato UniProt.

Allo stesso di UniProt, varie banche dati riguardanti famiglie proteiche, domini proteici, motivi sono state raccolte in InterPro. In particolare Pfam (famiglie e domini proteici), PRINTS (motivi proteici), PROSITE (famiglie, domini e motivi proteici curati dagli stessi di Swiss-prot).

Infine esistono banche dati delle strutture tridimensionali delle proteine come PDB, le cui coordinate di tutti gli atomi di una proteina sono ricavate sperimentalmente, oppure come ModBase invece, le cui strutture tridimensionali sono solo previsioni…ma possono essere utili lo stesso…

Fra i progetti avviati da Genome.jp c’è KEGG, un insieme di Database riguardanti genomi e pathway enzimatici. Fra questi database indico appunto KEGG Pathway, un database di tutte le vie metaboliche della cellula.

Spero di riuscire ad entrare nel dettaglio di tutti questi database

Infine ho per voi un’immagine riassuntiva di tutti i database:

Alla prossima…

Tags: bioinformatica, Database
22 gennaio 2008 - 11:56

Openhelix (una risorsa importante per il bioinformatico)

La Newsletter del Bioforum mi fa notare l’apertura di un nuovo blog : OPENHELIX focalizzato su genomica e risorse bioinformatiche.
Secondo le intenzioni degli autori il blog dovrebbe essere uno strumento per rimanere aggiornati riguardo i cambiamenti delle risorse presenti in rete e i vari database genomici. MA NON SOLO. Il blog è strutturato in modo che, insieme ai post quotidiani, viene messo a disposizione, di solito al mercoledì, un “TIP of the WEEK“, ovvero un breve video di circa 4 minuti che descriva, all’uso pratico, come ottenere il meglio dai database disponibili, sottolineando nuove funzioni, o metodologie per estrarre informazioni “nascoste“.

Certo è che, nei Tips vi sono dei tutorial ottimamente fatti. La qualità è veramente elevata!
Ma non è tutto: insieme ai Tips, settimanalmente verra’ proposto un’area “What’s Your Problem?”, dove il lettore potrà proporre quesiti e aspettarsi quindi risposte competenti riguardo per esempio come poter estrarre le informazioni che gli servono da una specifica risorsa. Una specie di help desk personalizzato.
Vi lascio infine immaginare il contenuto di un’ultima sessione, chiamata “Guest Post:-)

Personalmente seguo con avidità questa nuova risorsa, e non mancherò di sottoporvi alcuni loro Tips che reputo di particolare interesse. Eccovi intanto il loro feed principale. Sono sicuro che questo nuovo blog – se mantiene le promesse – diventerà sempre più una risorsa indispensabile!

Tags: bioinformatica, Blog, Database, Genomica, Openhelix