Normality Test

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Chimica e propedeutica biochimica. Con CD-ROM
Luciano Binaglia, Bruno Giardina

Dizionario di biologia
Autori Vari

Genetica molecolare
Rolf Knippers

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

MolecularLab

Bioinformatica

Normality Test

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica:

Guide tools online

Blog InsideBioinfo

Siti di Bioinformatica

Protocolli

Ultime notizie

Aggiungi i tag

Quanto � utile/interessante questa discussione:

Autore

Discussione

_Gabriele_
Nuovo Arrivato

13 Messaggi

Inserito il - 20 marzo 2013 : 10:17:39

Salve,
come sempre l'analisi statistica mi fa impazzire. Il dilemma � questo ho una serie di dati (ppm di elementi in tracce) e molti hanno una distribuzione normale. Per curiosit� ho per� ho voluto applicare 2 test di normalit� Anderson-Darling e Shapiro-Wilk. Ora spesso Anderson mi segnala la normalit�, mentre shapiro no evento che mi aspettavo visto che il secondo � spesso dato come pi� potente. In alcuni campioni, per�, succedete l'inverso!?!? �.
Domanda:
Se shapiro � pi� potente perch� alcune volte, anche se poche, risulta un dato normale in tale test e non in quello di Anderson?
Per i campioni non normali ho provato ad applicare un Log10 per vedere se riuscivo a normalizzarli, ma non ci sono riuscito.
Domanda:
Devo rinunciare ad una analisi Parametrica?

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 20 marzo 2013 : 16:27:33

Le risposte in questa pagina ti saranno utili

http://stats.stackexchange.com/questions/2492/is-normality-testing-essentially-useless

Sinceramente io lascerei perdere i test di normalit� e farei piuttosto un'analisi esploratoria guardando l'istogramma dei valori o il loro Q-Q plot.

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

TMax
Utente Junior

Prov.: BG
Citt�: Capriate

270 Messaggi

Inserito il - 21 marzo 2013 : 11:31:14

E' gi� stato sollevato in passato questa problematica relativa alla normalit� dei dati.
In realt� non sono i dati che devono essere normali, ma le popolazioni da cui provengono.
E 'normale' deve essere l'errore casuale del modello adottato.
Quindi oltre al suggerimento di chick 80, a mio parere se ci sono plausibili motivi per pensare che le popolazioni da cui originano i tuoi dati sono 'normali' vale la pena fare un modello e valutare la distribuzione dei residui. Se sono normali vai avanti, al contrario dovrai scegliere se fare trasformazioni dei dati o usare modelli non parametrici.

Max

_Gabriele_
Nuovo Arrivato

13 Messaggi

Inserito il - 21 marzo 2013 : 12:53:43

Intanto grazie per le risposte illuminanti, inoltre, chiedo scusa per la domanda gi� sollevata da ora far� pi� attenzione nella ricerca dei topic gi� discussi.
Ancora grazie.

P.S. Hai ragione TMax ma si presume, forse erroneamente, che se i dati sono normali lo sono anche quelli della popolazione di derivazione, almeno cos� mi � stato spiegato.

TMax
Utente Junior

Prov.: BG
Citt�: Capriate

270 Messaggi

Inserito il - 21 marzo 2013 : 13:27:48

Se consideri che, � difficile dimostrare che i dati osservati hanno una distribuzione normale
diventa difficile quindi affermare che la popolazione di provenienza sia normale.
Si deve quindi ragionare in termini di plausibilit� (nel nostro caso, biologica) se la popolazione di origine dei dati � o non � normale.
Se non ricordo male Alvan R. Feinstein, nel suo libro Elementi di Statistica Medica, afferma che non ci sono valide ragioni per affermare che i fenomeni biologici seguono una distribuzione normale.
Per capire questa affermazione bisogna ricordare che la distribuzione normale � una distribuzione di errori di misura, cio� la distribuzione dei valori ottenuti misurando molte volte lo stesso misurando con lo stesso strumento di misura. Questa procedura sperimentale, genera stocasticamente dei risultati che Gauss descrisse con la funzione nota a tutti della distribuzione 'normale' degli errori.
Misurare un particolare misurando in soggetti differenti non � analogo a misurare il misurando nello stesso soggetto infinite volte. Che poi la distribuzione di fenomeni biologici, abbia una forma che ricorda una campana, � solo una coincidenza. La forma a campana � comune a molte distribuzioni, in specifiche condizioni, che non sono affatto 'normali'. La stessa distribuzione di Poisson con ad esempio lambda=10 ha una forma a campana che pu� essere confusa con una distribuzione normale, ma � una distribuzione generata da un processo stocastico differente da quello che genera la distribuzione di Gauss.

L'analisi dei residui di un modello invece � trattabile opportunamente come una distribuzione gaussiana perch� difatti descrive l'errore di misura compiuto dal modello adattatato nel stimare il valore atteso. E' quindi una vera distribuzione gaussiana, ecco perch� ha senso verificare in quel caso l'aderenza o meno alla distribuzione di Gauss, sempre considerando i limiti dei test di normalit�, ma almeno in quel caso abbiamo la certezza che siamo di fronte a dati generati da un processo probabilistico del tipo gaussiano.

Max

Discussione

Quanto � utile/interessante questa discussione:

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Vai a:

MolecularLab.it

Android e Mobile



Scarica le app! Ora anche sul tuo smartphone!

Ciao Login - Iscriviti



Visitatori: 278

Newsletter
Iscriviti alla newsletter: ogni settimana notizie e fatti dal mondo biotech