Bioinformatica e Web 2.0

Inside Bioinfo

25 marzo 2009 - 10:57

Database Vettori

Dove cercate le mappe dei vostri vettori? Su Google? Su Pubmed?

Io mi sono trovato molto bene con questo Database di Vettori gestito da AddGene.

Fornisce molte informazioni sui plasmidi: sequenza, mappa, enzimi di restizione, proteine trascritte e tradotte. Si possono depositare (gratuitamente) i plasmidi che sono stati utilizzati (ad esempio) in un lavoro, e questi possono essere acquistati da altri ricercatori.

Addgene è un organizzazione no profit, ovviamente i guadagni vengono usati per mantenere il servizio. Insomma…è una sorta di banca/database di vettori per aiutare i Ricercatori….

Link: MyBioinformatica

Tags: bioinformatica, Database
24 marzo 2009 - 19:59

Disegnare velocemente Primer con CLC…

A seconda del tipo di PCR che si deve fare (Real Time Pcr o no, da genomico o da plasmide) si devono costruire primer più o meno “accurati”. Se si deve fare una Pcr da genomico ad esempio bisogna stare attenti che i primer non vadano anche ad annilare in altri punti del genoma, oltre a quello di interesse…

Nel mio caso faccio molte PCR da plasmidi. In questo caso le coppie di basi non sono molte, quindi è altamente improbabile che primer lunghi 15-20 nucleotidi vadano ad annilare in più punti.

In questo caso disegnare dei primer è molto semplice…Ma troppe volte vedo persone che disegnano su carta i primer, sia forward che reverse (perdendo tempo e rischiando di fare errori).

La cosa è molto più semplice con CLC Sequence Viewer:

  • (Ovviamente) Importare la sequenza del gene su cui fare la PCR in CLC Sequence Viewer
  • Selezionare lo spaziamento ogni 3 nucleotidi scegliendo il frame appropiato (Potete anche salvare questa opzione in modo da non selezionarla ogni volta).

schermata-clc-sequence-viewer-save-setting1

  • Selezionare i 15-20 nucleotidi che formeranno il primer FW (tenendo conto del frame e che devono terminare con una C o G), poi tasto dx -> Open Selection in new view
  • Tasto dx sul primer appena creato -> Select Sequence, di nuovo tasto dx -> Edit. In questo modo potete modificare la sequenza, aggiungere codoni di start, enzimi di restrizione.
  • Tornando sulla sequenza del gene selezionate il segmento che andrà a formare il primer Reverse. In questo caso non c’è bisogno di tenere conto del frame. Fate in modo che cominci con una G o una C (l’inizio che selezionate diventerà il 3?, quindi rappresenta la fine del primer). Al solito, fate tasto dx -> Open Selection in new view. Poi modificate il primer a vostro piacere aggiungendo codone di STOP o siti di restrizione.
  • A questo punto nella toolbox “Reverse Complemente Sequence” e avrete il vostro primer Reverse pronto.

schermata-clc-sequence-viewer-toolbox

I primer possono essere copiati-incollati sul sito dove ordinate i primer (evitate errori di battitura), possono essere stampati o salvati in una cartella. Vi ricordo che se si deve fare una Pcr da genomico bisogna stare attenti che i primer non vadano anche ad annilare in altri punti del genoma, quindi questo metodo non va bene (in questo caso c’è il sistema descritto da Nico).

Spero però sia utile a qualcuno!!

Alla prossima…

Link: MyBioinformatica

Tags: bioinformatica, how-to
16 dicembre 2008 - 20:04

Editor di sequenze: CLC Sequence Viewer

Un editor di sequenze è un programma in grado di manipolare con facilità sequenze nucleotidiche e proteiche. Il primo dei programmi che ho intenzione di presentarvi è CLC Sequence Viewer che è arrivato alla versione 5.1.1

Il programma è creato dalla CLC bio, che permette il download e l’utilizzo gratis, indubbiamente presenta una grafica molto curata, ed una facilità d’uso impressionante, adatto anche a chi non sa bene usare il computer.
Questo programma presenta tante limitazioni rispetto agli altri programmi (a pagamento) della CLC bio.
Le operazioni possibili sono (e le limitazioni relative sono):

  • effettuare ricerche direttamente su NCBI, anche se a causa delle limitazioni non è possibile effettuare ricerche su altri database, bisogna comprare le altre versioni.
  • creare allineamenti multipli e relativi alberi, con vari algoritmi: Clustal, T-coffe, ecc…
  • varie operazioni con i nucleotidi: convertire Dna <-> Rna, vedere filamento complementare di una sequenza, tradurla in proteina, Cercare ORF, ecc…
  • Cercare enzimi di restrizione presenti in una sequenza ed elencarli in una lista.

Quando si effettua una ricerca su NCBI, o si importa una sequenza, CLC Sequence Viewer è in grado di leggere le annotazioni e visualizzarle graficamente, indicando ad esempio promotori, la sequenza codificante in un cDna, domini e così via…Una grossa limitazione che ho trovato è non poter modificare le annotazioni riguardanti le sequenze. Quindi non è possibile selezionare una serie di nucleotidi/amminoacidi e aggiungere un’annotazione ad esse (ad es. questo è un promotore, qui c’è un sito di fosforilazione, ecc). Questa forte limitazione (e il fatto che secondo me i programmi dovrebbero essere liberi) mi ha spinto a cercare un altro editor di testo.

Qui è presente l’elenco completo delle limitazioni, paragonate ai relativi software a pagamento.

Il programma è disponibile per Windows, Mac, Linux (sia file .rpm che .sh), ed è molto semplice da installare.

9 dicembre 2008 - 09:00

Scaricare articoli da casa

Capita di stare a casa, e di dover scaricare un articolo da PubMed…spessissimo però c’è bisogno di un abbonamento alla rivista per poter scaricare il giornale. Le università hanno questi abbonamenti, per cui l’articolo può essere scaricato da un computer dell’università…ma non da casa.

Molte università danno la possibilità di scaricare gli articoli da casa utilizzando un programma proxy. Senza entrare in inutili termini informatici…il proxy è un programma che (nel nostro caso) fa sembrare il pc di casa un pc dell’università.

Vediamo un po’ come fare:

Per prima cosa dovete controllare se la vostra università vi permette di accedere via proxy (altrimenti inutile continuare), per controllare cercate sul sito della vostra università, o chiedete a San Google :D . L’università che frequento io (Federico II di Napoli) ha introdotto questa possibilità nel 2004. Dovreste trovare anche le informazioni per usare il proxy, cioè l’indirizzo e la porta del proxy, l’username e la password (di solito si richiede la registrazione ad un servizio/mail della facoltà). Ora, se non l’avete ancora fatto, scaricate Firefox, che è un programma per navigare su internet…simile a Internet Explorer…ma molto meglio :D . Firefox permette di essere personalizzato grazie a tanti piccoli programmi aggiuntivi, chiamati “componenti aggiuntivi”, “estensioni” o “add-on”. Nel nostro caso è molto utile un’estensione chiamata FoxyProxy, che permette velocemente di impostare, attivare e disattivare il Proxy. Installatela.

Al primo avvio vi verrà chiesto se volete usare un proxy Tor. A noi non interessa, quindi cliccate no.

Ora andate in Strumenti -> FoxyProxy -> Generali. Cliccate su nuovo proxy, inserite un nome e una eventuale nota. Andate sulla scheda dettagli dei proxy

schermata-foxyproxy-impostazioni-dei-proxy

Inserite come nome del server l’indirizzo del proxy della vostra università (nel mio caso proxy.unina.it), il numero della porta (nel mio caso 3128) e date ok. Ora, andando di nuovo su Strumenti -> FoxyProxy potrete scegliere il Proxy della vostra università. A questo punto potete inserire username e password (nel caso della mia università, compreso di @studenti.unina.it). Ora potete andare su PubMed e scaricare tutti gli articoli che volete (ammesso che la vostra università abbia i rispettivi abbonamenti).

Se volete potete aggiungere nei commenti un link alla pagina con le istruzioni del proxy della vostra università in modo da avere tutte le informazioni raccolte in un unico sito.

Un’ultima cosa: usare un programma Proxy rallenta di molto la velocità di navigazione sul web, per cui usate il proxy solo quando serve.

Alla prossima…

Tags: bioinformatica, how-to
18 settembre 2008 - 09:00

Banche Dati

Esistono 2 grandi laboratori internazionali di bioinformatica l’EMBL-EBI (Europeo) e l’NCBI (Americano). Questi due centri hanno dato vita a vari progetti e banche dati (database). Dalloliogm mi segnala (grazie!) anche Genome.jp, un altro laboratorio internazionale di bioinformatica (Giapponese), che fornisce database interessanti.

Le banche dati sono dei grandi archivi riguardanti un determinato argomento, ovviamente nel nostro caso riguardano argomenti biologici. Le banche dati oggi esistenti (in campo biologico) saranno un migliaio, e viene catalogato praticamente di tutto, dal genoma umano alle malattie, passando per geni, Rna, polimorfismi e chi più ne ha più ne metta.

Alcune di queste banche dati sono state sviluppate dall’EMBL-EBI, altre dall’NCBI, contengono milioni di voci, e sono utilissime. Le banche dati possono essere mantenute e controllate da persone, queste di solito risultano molto ben curate e poco ridondanti. Altre invece possono essere mantenute da software, quindi sono aggiornate molto velocemente ma molto ridondanti (per ridondante si intende che la stessa informazione è contenuta più volte)

Esistono 3 banche dati che sono dette primarie, poichè contengono le informazioni riguardanti il Dna. Tutte le altre banche dati (proteiche, di polimorfismi, di malattie) sono collegate a queste. Due di queste sono EMBL datalibrary e la GenBank. Fra queste due banche dati c’è un continuo scambio di dati, per cui tutte le informazioni che potete trovare su una, le trovate anche sull’altra.

Esistono poi database secondari, che contengono sequenze proteiche: Swiss-prot, TrEMBL e PIR. Swiss-prot è curata manualmente, per cui è poco ridondante ed è ricca di informazioni (ed è un database che adoro!!! :D ). TrEMBL nasce grazie alla traduzione automatica dei geni presenti in EMBL datalibrary, per cui alcune delle proteine predette possono non esistere nella realtà. PIR è l’equivalente nato dal laboratorio americano. Nel 2002 nasce un database integrato fra Swiss-prot, TrEMBL e PIR chiamato UniProt.

Allo stesso di UniProt, varie banche dati riguardanti famiglie proteiche, domini proteici, motivi sono state raccolte in InterPro. In particolare Pfam (famiglie e domini proteici), PRINTS (motivi proteici), PROSITE (famiglie, domini e motivi proteici curati dagli stessi di Swiss-prot).

Infine esistono banche dati delle strutture tridimensionali delle proteine come PDB, le cui coordinate di tutti gli atomi di una proteina sono ricavate sperimentalmente, oppure come ModBase invece, le cui strutture tridimensionali sono solo previsioni…ma possono essere utili lo stesso…

Fra i progetti avviati da Genome.jp c’è KEGG, un insieme di Database riguardanti genomi e pathway enzimatici. Fra questi database indico appunto KEGG Pathway, un database di tutte le vie metaboliche della cellula.

Spero di riuscire ad entrare nel dettaglio di tutti questi database

Infine ho per voi un’immagine riassuntiva di tutti i database:

Alla prossima…

Tags: bioinformatica, Database
17 settembre 2008 - 19:13

Nuovo autore in InsideBioinfo…

Ciao a tutti,

da oggi InsideBioinfo ha un nuovo autore…me :D

Sono Domenico, sto frequentando la Specialistica in Biotecnologie Mediche, e ho una passione per l’informatica e (ovviamente) per la Biologia…inutile dire quindi della mia passione per la BioInformatica, alla quale però mi sono avvicinato relativamente da poco. Devo dire che sono un po’ emozionato a scrivere su un blog di questa portata…

Gli argomenti di cui scriverò sono cose scontante per ogni bioinformatico…ma possono essere utili a tutti quelli che lavorano in un laboratorio, e vogliono risparmiare un po’ di lavoro al banco.

Bè…cominciamo… :D

Tags: Bibliografia, bioinformatica