看板 Soft_Job 關於我們 聯絡資訊
板上有好多會大數據的高手啊 搭一下順風車,問一個問題 小的最近公司需要所以在鑽研Spark 然後在玩Spark SQL裡面的 DataFrame,他很像Python裡面的Pandas 應該會很好用才對 請問一下各位大大,除了官網上的lib介紹 這有比較完整的教學文件(或是書)可以看嗎? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 61.220.35.20 ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1467858134.A.8F5.html
minikai: Gitbook有人分享基礎教學手冊,不過我大多是看官網的手冊 07/07 10:44
minikai: 。 07/07 10:44
coronach: 這東西太新改太快還是要靠官網,不過官網文件真的不是 07/07 10:47
coronach: 很清楚... 07/07 10:47
leafwind: 官網吧,然後不要完全相信他的 Dataframe API,自己試過 07/07 11:02
leafwind: 確定是對的再說(切身之痛) 07/07 11:02
dreamnook: ^^^^^^^^ 可以在不被告前提舉例嗎XD 07/07 11:22
popcorny: 偷偷偷渡最近我會release的dataframe opensource lib 07/07 11:25
popcorny: http://tenmax.github.io/poppy/ 07/07 11:25
leafwind: 我被搞過 isnull 不是真的 isnull,最後自己寫判斷式, 07/07 18:44
leafwind: 但版本改這麼快沒有太多參考價值就是了 07/07 18:44
leafwind: 當時 dataframe api doc 有些地方寫得模糊,加上抄了未 07/07 18:50
leafwind: 必會動,動了不一定會對,都要自己 try 過我才敢用,現 07/07 18:50
leafwind: 在可能有改善(?) 07/07 18:50
ripple0129: 假的isnull應該浪費不少時間debug XD 07/08 00:30
leafwind: 別說了…QQ 07/08 07:51