[求救] 有關public mRNA data數值表示和FC計算

作者premire (熱騰騰的泡麵)

看板Biotech

標題[求救] 有關public mRNA data數值表示和FC計算

時間Tue Feb 18 00:06:21 2020

各位好因最近利用public mRNA microarray 和 sequencing進行 gene expression分析如fold change 下載後打開檔案發現均為patient sample, 並無normal group 基因表現為: 樣本一 gene 0.5 樣本二 -0.2 之類 (有300多個樣本) 查了一下應該由log2轉換想請問如果要計算gene 在tumor 和 normal的 fold change 是不是無法透過log2 轉換後的數值計算出來呢? 還是必須要有normal data才可計算謝謝! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.230.120.133 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Biotech/M.1581955583.A.ED8.html

→ xxtomnyxx: 你這個是 microarray 還是 seq 的資料？如果是 micro， 02/18 02:53

→ xxtomnyxx: 那就已經 normalized 過了，如果是 seq，我還真沒看過 02/18 02:53

→ xxtomnyxx: 基因表現量會出現負值的 seq data 02/18 02:54

→ xxtomnyxx: seq 的 data 基因表現量會用 RPKM 或 FPKM，這只會是 02/18 02:56

→ xxtomnyxx: 正值，所以我假設你那個是 microarray，基於 micro 的 02/18 02:56

→ xxtomnyxx: 原理，表現量一定是 sample 和另外一個基準樣品比較得 02/18 02:57

→ xxtomnyxx: 到的結果，可能要找找 database 資料提供者的論文看他 02/18 02:58

→ xxtomnyxx: 當時是拿什麼樣本當基準 02/18 02:58

推 egoweaver: log(patient) - log(normal) = log(patient/normal) 02/18 03:01

→ egoweaver: 不過要注意 normalize 的方式跟 transform 的方式必須 02/18 03:01

→ egoweaver: 一致。直接 log tranform expression value 的狀況要 02/18 03:02

→ egoweaver: 確認底數是否相同。 02/18 03:02

→ egoweaver: 可以拿同一個 batch/study 的 data 就盡量拿同一個，因 02/18 03:02

→ egoweaver: 為 batch effect 很難校正。 02/18 03:03

→ egoweaver: 如果是 seq 的話注意是 log FC 還是 logTPM/RPKM/FPKM 02/18 03:04

→ premire: 謝謝兩位, 目前我查到作者對於data的描述為:Data were 02/18 20:16

→ premire: acquired using the Agilent G2565BA Microarray Scanner 02/18 20:16

→ premire: Probe intensities were normalized using GeneSpring GX 02/18 20:17

→ premire: 應該是將tumor sample的mRNA測量值以probe測定, 再和 02/18 20:18

→ premire: reference gene相除得到ratio再取log2值, 負值代表下調, 02/18 20:19

→ premire: 正值代表上調。以上是我的理解不知觀念正不正確。 02/18 20:19

→ premire: 但因為data並無normal brain組(無control),故即使知道 02/18 20:20

→ premire: A gene上調, 但沒有control可以計算fold change,這樣講對 02/18 20:21

→ premire: 嗎? 02/18 20:21

推 lelojack: 可以提供GSE的連結嗎？我以前有那過這樣的資料分析。 02/21 08:59

→ lelojack: 當時會有區分adjencent and tumor樣本。不過極少，大部 02/21 08:59

→ lelojack: 分可行的是在來源網站中提供生存分析或Grade樣本 02/21 08:59

→ lelojack: 你可以這樣理解，臨床樣本原則上不會有正常人組織，因 02/21 09:00

→ lelojack: 為沒有取樣理由 02/21 09:00