Salve, spero non risulti una domanda sciocca ma sto impazzendo. Ho un dataset rxc: 98 probeset x 42 tessuti i tessuti si dividono in 18 di un tipo, 18 di un altro e 6 di un altro tipo ancora. Dovendo operare un'analsi di classificazione, cosa devo clusterizzare?? lascio la matrice così come è, raggruppando i probesets oppure la traslo facendo così un raggruppamento sui tessuti dei pazienti? La mia intenzione è quella di valutare i profili genetici e trarre qualche conclusione in merito alle differenze tra tessuti...
Se qualcuno volesse aiutarmi, gliene sarei immensamente grata!
Io farei un clustering della matrice così com'è, SENZA usare il tessuto come classificatore. A posteriori potrai vedere se effettivamente il clustering ti fa uscire i 3 gruppi di tessuti.
Ricorda sempre che il clustering è un metodo esplorativo, che ti permette di analizzare relazioni fra i tuoi dati: non esiste tuttavia IL clustering corretto.