→ xxtomnyxx: 你這個是 microarray 還是 seq 的資料?如果是 micro, 02/18 02:53
→ xxtomnyxx: 那就已經 normalized 過了,如果是 seq,我還真沒看過 02/18 02:53
→ xxtomnyxx: 基因表現量會出現負值的 seq data 02/18 02:54
→ xxtomnyxx: seq 的 data 基因表現量會用 RPKM 或 FPKM,這只會是 02/18 02:56
→ xxtomnyxx: 正值,所以我假設你那個是 microarray,基於 micro 的 02/18 02:56
→ xxtomnyxx: 原理,表現量一定是 sample 和另外一個基準樣品比較得 02/18 02:57
→ xxtomnyxx: 到的結果,可能要找找 database 資料提供者的論文看他 02/18 02:58
→ xxtomnyxx: 當時是拿什麼樣本當基準 02/18 02:58
推 egoweaver: log(patient) - log(normal) = log(patient/normal) 02/18 03:01
→ egoweaver: 不過要注意 normalize 的方式跟 transform 的方式必須 02/18 03:01
→ egoweaver: 一致。直接 log tranform expression value 的狀況要 02/18 03:02
→ egoweaver: 確認底數是否相同。 02/18 03:02
→ egoweaver: 可以拿同一個 batch/study 的 data 就盡量拿同一個,因 02/18 03:02
→ egoweaver: 為 batch effect 很難校正。 02/18 03:03
→ egoweaver: 如果是 seq 的話注意是 log FC 還是 logTPM/RPKM/FPKM 02/18 03:04
→ premire: 謝謝兩位, 目前我查到作者對於data的描述為:Data were 02/18 20:16
→ premire: acquired using the Agilent G2565BA Microarray Scanner 02/18 20:16
→ premire: Probe intensities were normalized using GeneSpring GX 02/18 20:17
→ premire: 應該是將tumor sample的mRNA測量值以probe測定, 再和 02/18 20:18
→ premire: reference gene相除得到ratio再取log2值, 負值代表下調, 02/18 20:19
→ premire: 正值代表上調。以上是我的理解不知觀念正不正確。 02/18 20:19
→ premire: 但因為data並無normal brain組(無control),故即使知道 02/18 20:20
→ premire: A gene上調, 但沒有control可以計算fold change,這樣講對 02/18 20:21
→ premire: 嗎? 02/18 20:21
推 lelojack: 可以提供GSE的連結嗎? 我以前有那過這樣的資料分析。 02/21 08:59
→ lelojack: 當時會有區分adjencent and tumor樣本。不過極少,大部 02/21 08:59
→ lelojack: 分可行的是在來源網站中提供生存分析或Grade樣本 02/21 08:59
→ lelojack: 你可以這樣理解,臨床樣本原則上不會有正常人組織,因 02/21 09:00
→ lelojack: 為沒有取樣理由 02/21 09:00