看板 R_Language 關於我們 聯絡資訊
初學者(兩個月) R是第一個程式語言 不知道各位前輩有沒做過類似的程式 !!!假設!!! 想用R統計10條繩子的長度 再根據統計特性的率隨機產生10組數據 程式如下 G <- 10 #10組數據 rowname <- c(1:G) #Y軸名稱 colname <- c("c1","c2","c3","c4") #X軸名稱 F <- matrix(,nrow=G,ncol=4,dimnames=list(rowname,colname))? #開一個10*4的矩陣並以rowname和colname F[1,"c1"] <- 19 F[2,"c1"] <- 59 F[3,"c1"] <- 48 F[4,"c1"] <- 23 F[5,"c1"] <- 31 F[6,"c1"] <- 48 F[7,"c1"] <- 56 F[8,"c1"] <- 60 F[9,"c1"] <- 74 F[10,"c1"] <- 83 #在矩陣c1的位置放入這10條繩子的調查數據 #假設1符合常態分布 F[,"c2"] <- rnorm(10,10,90)? #在矩陣c2的位置放入根據常態分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 據 #假設2符合均勻分布 F[,"c3"] <- dunif(10,10,90) #在矩陣c3的位置放入根據均勻分佈的機率隨機產生一組新的數據介於10~90之間的10筆數 據 #假設3符合Poisson distribution分布 F[,"c4"] <- dpois(10, lambda=1) #在矩陣c4的位置放入根據Poisson distribution分布的機率隨機產生一組新的數據介於1 0~90之間的10筆數據 #結果如下 F c1 c2 c3 c4 1? 19 -70.255568 0.0125 1.013777e-07 2? 59 9.346476 0.0125 1.013777e-07 3? 48? -2.139539 0.0125 1.013777e-07 4? 23 -33.231206 0.0125 1.013777e-07 5? 31? 72.630937 0.0125 1.013777e-07 6? 48? -6.032507 0.0125 1.013777e-07 7? 56? -8.420308 0.0125 1.013777e-07 8? 60 -69.542557 0.0125 1.013777e-07 9? 74? 12.044775 0.0125 1.013777e-07 10 83 -13.474063 0.0125 1.013777e-07 問題1.我函數的指令是不是給的不對導致c2 c3 c4的結果錯誤? 問題2.關於隨機分布的應用 如何做到根據統計特性產生結果? 問題3.關於數據統計特性如何檢定比較符合 常態分布 均勻分布 負指數分布等等的分布 特性? 是用卡方檢定 T-test檢定? 還是用數值回歸??? 這兩個月沒有看到類似的文章 麻煩各位前輩指點迷津 拜託 拜託 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.136.208.20 ※ 文章網址: https://www.ptt.cc/bbs/R_Language/M.1448000644.A.095.html
celestialgod: 1. 你知道各分配參數意義嗎?11/20 14:28
celestialgod: 2. 你知道第一個問題就知道怎樣根據你觀察的資料11/20 14:28
celestialgod: 去產生適當的隨機數11/20 14:28
celestialgod: 3. 你的目標是檢定什麼?十條繩子長度符合某分配?11/20 14:29
celestialgod: 4. 你學過適合度檢定嗎?11/20 14:30
celestialgod: 另外,我很好奇這跟回歸(標題)有什麼關係啊?11/20 14:36
celestialgod: 5. 你產生隨機數的目的是什麼?11/20 14:36
celestialgod: 6. 會不會你等一下又要刪文啦?11/20 14:39
不好意思我疑惑了 主要的目的是根據數據的分佈特性 找出最適合的特性(常態 均勻 指 數 負指數)分佈 接下來以最適合的特性分佈 隨機產生一組新的數據 目前知道要開矩陣 存數據 然後繪製直方圖做各區間數量統計 根據數據的分佈特性 找出最符合的特性分佈 並以特性分佈在每個區間的機率隨機產生新的數據 ※ 編輯: eegame (114.136.66.137), 11/20/2015 21:51:19
allen1985: 所以你的問題跟迴歸沒有關係?11/21 17:03
找出最合適的分佈特性 我不知如何下手 因為邏輯判斷好像沒辦法 感覺用回歸曲線對找 各特性分佈曲線 找最小平方差來決定出最合適的特性 這個想法不知道對不對 有沒有辦法寫出來 ※ 編輯: eegame (114.136.88.76), 11/21/2015 21:59:00
allen1985: 最合適的分佈特性? 你是說資料最符合哪種分配嗎?11/22 09:36
allen1985: 你問題中的自變數 應變數 是? 11/22 09:37
allen1985: 建議你簡化一下你的題目 一步一步問 從頭開始 11/22 09:37
allen1985: 大概知道你的問題是什麼了 你有聽過qq-plot嗎 11/22 09:39
是的 資料最符合的分配 之前有用ggplot2來試畫極座標投影圖 可是資料分布不是用直方圖來畫就可以了嗎? qq-plot是要用在畫圖嗎?還是有其他隱藏 版的功能??? ※ 編輯: eegame (223.140.231.38), 11/22/2015 12:09:38
allen1985: 對我來說 你用ggplot2 還是什麼function畫圖 不重要 11/22 12:12
allen1985: 重要的是你想要畫什麼圖 你的圖想表達什麼 11/22 12:13
allen1985: qq-plot 是用來檢測資料是否為常態分配的一種方法 11/22 12:13
allen1985: 而你現在最欠缺的是 你得先把統計方法學好 11/22 12:13
allen1985: 其次才是用R把結果寫出來 11/22 12:14
celestialgod: 推樓上,重點不是R,他只是工具,你怎麼呈現你的想 11/22 14:25
celestialgod: 法才是重點 11/22 14:25