作者eegame (yu)
看板R_Language
標題[問題] 想用R寫一個統計回歸分析的程式
時間Fri Nov 20 14:24:02 2015
初學者(兩個月) R是第一個程式語言
不知道各位前輩有沒做過類似的程式
!!!假設!!!
想用R統計10條繩子的長度
再根據統計特性的率隨機產生10組數據
程式如下
G <- 10 #10組數據
rowname <- c(1:G) #Y軸名稱
colname <- c("c1","c2","c3","c4") #X軸名稱
F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))?
#開一個10*4的矩陣並以rowname和colname
F[1,"c1"] <- 19
F[2,"c1"] <- 59
F[3,"c1"] <- 48
F[4,"c1"] <- 23
F[5,"c1"] <- 31
F[6,"c1"] <- 48
F[7,"c1"] <- 56
F[8,"c1"] <- 60
F[9,"c1"] <- 74
F[10,"c1"] <- 83
#在矩陣c1的位置放入這10條繩子的調查數據
#假設1符合常態分布
F[,"c2"] <- rnorm(10,10,90)?
#在矩陣c2的位置放入根據常態分佈的機率隨機產生一組新的數據介於10~90之間的10筆數
據
#假設2符合均勻分布
F[,"c3"] <- dunif(10,10,90)
#在矩陣c3的位置放入根據均勻分佈的機率隨機產生一組新的數據介於10~90之間的10筆數
據
#假設3符合Poisson distribution分布
F[,"c4"] <- dpois(10, lambda=1)
#在矩陣c4的位置放入根據Poisson distribution分布的機率隨機產生一組新的數據介於1
0~90之間的10筆數據
#結果如下
F
c1 c2 c3 c4
1? 19 -70.255568 0.0125 1.013777e-07
2? 59 9.346476 0.0125 1.013777e-07
3? 48? -2.139539 0.0125 1.013777e-07
4? 23 -33.231206 0.0125 1.013777e-07
5? 31? 72.630937 0.0125 1.013777e-07
6? 48? -6.032507 0.0125 1.013777e-07
7? 56? -8.420308 0.0125 1.013777e-07
8? 60 -69.542557 0.0125 1.013777e-07
9? 74? 12.044775 0.0125 1.013777e-07
10 83 -13.474063 0.0125 1.013777e-07
問題1.我函數的指令是不是給的不對導致c2 c3 c4的結果錯誤?
問題2.關於隨機分布的應用 如何做到根據統計特性產生結果?
問題3.關於數據統計特性如何檢定比較符合 常態分布 均勻分布 負指數分布等等的分布
特性? 是用卡方檢定 T-test檢定? 還是用數值回歸???
這兩個月沒有看到類似的文章
麻煩各位前輩指點迷津
拜託 拜託
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.208.20
※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1448000644.A.095.html
→ celestialgod: 1. 你知道各分配參數意義嗎?11/20 14:28
→ celestialgod: 2. 你知道第一個問題就知道怎樣根據你觀察的資料11/20 14:28
→ celestialgod: 去產生適當的隨機數11/20 14:28
→ celestialgod: 3. 你的目標是檢定什麼?十條繩子長度符合某分配?11/20 14:29
→ celestialgod: 4. 你學過適合度檢定嗎?11/20 14:30
→ celestialgod: 另外,我很好奇這跟回歸(標題)有什麼關係啊?11/20 14:36
→ celestialgod: 5. 你產生隨機數的目的是什麼?11/20 14:36
→ celestialgod: 6. 會不會你等一下又要刪文啦?11/20 14:39
不好意思我疑惑了 主要的目的是根據數據的分佈特性 找出最適合的特性(常態 均勻 指
數 負指數)分佈 接下來以最適合的特性分佈 隨機產生一組新的數據 目前知道要開矩陣
存數據 然後繪製直方圖做各區間數量統計 根據數據的分佈特性 找出最符合的特性分佈
並以特性分佈在每個區間的機率隨機產生新的數據
※ 編輯: eegame (114.136.66.137), 11/20/2015 21:51:19
→ allen1985: 所以你的問題跟迴歸沒有關係?11/21 17:03
找出最合適的分佈特性 我不知如何下手 因為邏輯判斷好像沒辦法 感覺用回歸曲線對找
各特性分佈曲線 找最小平方差來決定出最合適的特性
這個想法不知道對不對
有沒有辦法寫出來
※ 編輯: eegame (114.136.88.76), 11/21/2015 21:59:00
→ allen1985: 最合適的分佈特性? 你是說資料最符合哪種分配嗎?11/22 09:36
→ allen1985: 你問題中的自變數 應變數 是? 11/22 09:37
→ allen1985: 建議你簡化一下你的題目 一步一步問 從頭開始 11/22 09:37
→ allen1985: 大概知道你的問題是什麼了 你有聽過qq-plot嗎 11/22 09:39
是的 資料最符合的分配
之前有用ggplot2來試畫極座標投影圖
可是資料分布不是用直方圖來畫就可以了嗎? qq-plot是要用在畫圖嗎?還是有其他隱藏
版的功能???
※ 編輯: eegame (223.140.231.38), 11/22/2015 12:09:38
→ allen1985: 對我來說 你用ggplot2 還是什麼function畫圖 不重要 11/22 12:12
→ allen1985: 重要的是你想要畫什麼圖 你的圖想表達什麼 11/22 12:13
→ allen1985: qq-plot 是用來檢測資料是否為常態分配的一種方法 11/22 12:13
→ allen1985: 而你現在最欠缺的是 你得先把統計方法學好 11/22 12:13
→ allen1985: 其次才是用R把結果寫出來 11/22 12:14
→ celestialgod: 推樓上,重點不是R,他只是工具,你怎麼呈現你的想 11/22 14:25
→ celestialgod: 法才是重點 11/22 14:25