Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 Laboratorio
 Bioinformatica e Biostatistica
 leggere csv con R [era: Statistica con R]
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

giulia84
Nuovo Arrivato



1 Messaggi

Inserito il - 05 ottobre 2010 : 11:43:34  Mostra Profilo  Visita l'Homepage di giulia84 Invia a giulia84 un Messaggio Privato  Rispondi Quotando
ciao, sto utilizzando per la prima volta il software R per la mia tesi, devo inserire un database Excel che ho già modificato in formato .csv. Il problema è che quando do il comando

data = read.table("nomefile.csv", header=1)
mi dice
Errore in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
la riga 2 non ha 24 elementi

Il mio database ha 17 colonne e più di 3000 righe, le variabili non sono solo numeri, ma anche parole ( sia maiuscole, che minuscole, ci sono punti interrogativi, punti e virgola ecc) Non riesco a capire se R non riconosce le parole e quindi devo convertire il database tutto in numeri, ad esempio assegnando ad ogni variabile in lettere un numero.

Grazie

Glubus
Utente Junior

pinolo



156 Messaggi

Inserito il - 05 ottobre 2010 : 12:43:18  Mostra Profilo  Visita l'Homepage di Glubus Invia a Glubus un Messaggio Privato  Rispondi Quotando
intanto guarda che l'argomento "header=1" è poco "ortodosso", nel senso che l'argomento accetterebbe un valore logico (TRUE o FALSE), anche se poi 1 viene coercito a T da R, e quindi senza nessuna conseguenza.
R prova a leggere il tuo file di testo e determina il numero di colonne dal numero delle "parole" che trova nella prima riga:
Qui ne trova 24, mentre nella seconda riga ne trova 17.
Prova ad aprire con un editore di testo il file e prova a farci vedere come sono fatte le prime due righe, ...

Citazione:
Messaggio inserito da giulia84

ciao, sto utilizzando per la prima volta il software R per la mia tesi, devo inserire un database Excel che ho già modificato in formato .csv. Il problema è che quando do il comando

data = read.table("nomefile.csv", header=1)
mi dice
Errore in scan(file, what, nmax, sep, dec, quote, skip, nlines, na.strings, :
la riga 2 non ha 24 elementi

Il mio database ha 17 colonne e più di 3000 righe, le variabili non sono solo numeri, ma anche parole ( sia maiuscole, che minuscole, ci sono punti interrogativi, punti e virgola ecc) Non riesco a capire se R non riconosce le parole e quindi devo convertire il database tutto in numeri, ad esempio assegnando ad ogni variabile in lettere un numero.

Grazie

Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 05 ottobre 2010 : 12:55:37  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Probabilmente devi semplicemente specificare il separatore

ad es:


data <- read.table("nomefile.csv", header=TRUE, sep=",") 


PS: Giovanni, riesci a splittare la discussione?

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 05 ottobre 2010 : 13:02:36  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
Credo che l'errore stia nel modo in cui hai formattato il file CSV. Prima di completare l'esportazione assicurati che il carattere che identifica la separazione delle colonne non sia gia' contenuto nelle celle di testo. Tipicamente in un file CSV le colonne sono distinte dal punto e virgola ';'. Infine sarebbe buona norma nel file CSV le celle contenenti testo siano racchiusi dalle virgolette "". Per ultimo, non ricordo bene se R sia sufficientemente "intelligente", ma ragiona usando il punto come separatore decimale (mentre nelle versioni italiche di Office viene usata la virgola come separatore decimale)

http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

chick80
Moderatore

DNA

Città: Edinburgh


11491 Messaggi

Inserito il - 05 ottobre 2010 : 13:28:25  Mostra Profilo  Visita l'Homepage di chick80 Invia a chick80 un Messaggio Privato  Rispondi Quotando
Citazione:
Per ultimo, non ricordo bene se R sia sufficientemente "intelligente", ma ragiona usando il punto come separatore decimale (mentre nelle versioni italiche di Office viene usata la virgola come separatore decimale)


Di default usa il punto, ma puoi specificare un altro separatore usando il parametro "sep".

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)
Torna all'inizio della Pagina

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 05 ottobre 2010 : 14:03:12  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
Per favore, un po' di attenzione alle regole del forum. Per un nuovo argomento, aprire una nuova discussione.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina