看板 Biotech 關於我們 聯絡資訊
各位好 因最近利用public mRNA microarray 和 sequencing進行 gene expression分析 如fold change 下載 後打開檔案發現均為patient sample, 並無normal group 基因表現為: 樣本一 gene 0.5 樣本二 -0.2 之類 (有300多個樣本) 查了一下應該由log2轉換 想請問如果要計算gene 在tumor 和 normal的 fold change 是不是無法透過log2 轉換後的數值計算出來呢? 還是必須要有normal data才可計算 謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.120.133 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1581955583.A.ED8.html
xxtomnyxx: 你這個是 microarray 還是 seq 的資料?如果是 micro, 02/18 02:53
xxtomnyxx: 那就已經 normalized 過了,如果是 seq,我還真沒看過 02/18 02:53
xxtomnyxx: 基因表現量會出現負值的 seq data 02/18 02:54
xxtomnyxx: seq 的 data 基因表現量會用 RPKM 或 FPKM,這只會是 02/18 02:56
xxtomnyxx: 正值,所以我假設你那個是 microarray,基於 micro 的 02/18 02:56
xxtomnyxx: 原理,表現量一定是 sample 和另外一個基準樣品比較得 02/18 02:57
xxtomnyxx: 到的結果,可能要找找 database 資料提供者的論文看他 02/18 02:58
xxtomnyxx: 當時是拿什麼樣本當基準 02/18 02:58
egoweaver: log(patient) - log(normal) = log(patient/normal) 02/18 03:01
egoweaver: 不過要注意 normalize 的方式跟 transform 的方式必須 02/18 03:01
egoweaver: 一致。直接 log tranform expression value 的狀況要 02/18 03:02
egoweaver: 確認底數是否相同。 02/18 03:02
egoweaver: 可以拿同一個 batch/study 的 data 就盡量拿同一個,因 02/18 03:02
egoweaver: 為 batch effect 很難校正。 02/18 03:03
egoweaver: 如果是 seq 的話注意是 log FC 還是 logTPM/RPKM/FPKM 02/18 03:04
premire: 謝謝兩位, 目前我查到作者對於data的描述為:Data were 02/18 20:16
premire: acquired using the Agilent G2565BA Microarray Scanner 02/18 20:16
premire: Probe intensities were normalized using GeneSpring GX 02/18 20:17
premire: 應該是將tumor sample的mRNA測量值以probe測定, 再和 02/18 20:18
premire: reference gene相除得到ratio再取log2值, 負值代表下調, 02/18 20:19
premire: 正值代表上調。以上是我的理解不知觀念正不正確。 02/18 20:19
premire: 但因為data並無normal brain組(無control),故即使知道 02/18 20:20
premire: A gene上調, 但沒有control可以計算fold change,這樣講對 02/18 20:21
premire: 嗎? 02/18 20:21
lelojack: 可以提供GSE的連結嗎? 我以前有那過這樣的資料分析。 02/21 08:59
lelojack: 當時會有區分adjencent and tumor樣本。不過極少,大部 02/21 08:59
lelojack: 分可行的是在來源網站中提供生存分析或Grade樣本 02/21 08:59
lelojack: 你可以這樣理解,臨床樣本原則上不會有正常人組織,因 02/21 09:00
lelojack: 為沒有取樣理由 02/21 09:00