作者agomi (萊姆酒)
看板bioinfo_lab
標題[問題] To JosephX
時間Sat Apr 15 13:52:13 2006
ㄜ... 我終於開始打算做我的R作業了 XD
可是我發現我還是沒辦法想像我到底應該做些什麼 @@
在這邊問好了 有文字可以看我比較會有想像力 =.=
我的第一個問題....
我有38個病人 七千個gene
上個作業中我們把.tsv的檔案匯入R中
然後存到一個陣列裡面
之後我們做了一個scale的動作
我的問題是... 七千個gene有七千的分數 有38個病人
在做scale的時候 那個mean是38個mean sd也是38個sd嗎 ?
如果是這樣 那做完scale之後也是得到38組normalized的分數嚕 @@?
我的第二個問題就是....
Golub的paper裡面的公式寫著P(g,c)=mean1(g)-mean2(g)/sd1(g)+sd2(g)
那mean和sd是誰的 @@?
mean1應該是誰 mean2應該是誰 @@?
paper裡面說class1和class2
是不是我們已經知道分類怎麼分了? 才直接拿資料來計算mean和sd ?
mean1(g)如果是class1中g的mean 那是哪些東西的平均 @@?
如果要算mean應該是某些東西全部加起來然後除以某個東西
可是這些東西是什麼呢 ??
第三個問題是.....
hcluster(method= , link= )
這樣是一個依照method方法做的cluster
所以如果我想換個cluster演算法 只要改method = XX就好了是吧 ?
那如果hcluster的method裡面沒有kmeans
我是不是應該去找個kmeans方法
然後寫成hcluster(method=kmeans(), link = ) ?
所以我如果想做PAM和CLARANS等等的演算法
就得自己去找函式 ?
問得很亂(泣)
因為我實在沒辦法figure out >"<
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 61.62.170.39
推 JosephX:糗了~~ 我現在才看到這篇:P 04/17 13:57
推 agomi:沒差 反正已經遲交了 XD 慢慢來 XDD 04/17 14:38