推 niobafrog: 該不會是DeepMind吧 11/12 06:11
→ niobafrog: ...跪 11/12 06:11
推 empliu: 感覺原po隱藏蠻多重要訊息的 11/12 07:18
→ empliu: 原po的高中是建中 ... 11/12 07:18
→ empliu: 大學是台大 然後有 PhD 學位 = = 11/12 07:18
→ empliu: 這種重要背景資訊還是留一下 不然會誤導人 .. 11/12 07:20
→ alden: 是建中,但不是台大。有PhD,但不是數學物理或CS... :p 11/12 07:33
推 drajan: 數學不好真痛 小弟也是在英國FANG但不是直接做 modeling 11/12 07:57
→ drajan: 雖然 engineering這種工作也很重要 但就是感覺沒有 resear 11/12 07:57
→ drajan: ch scientist或ML engineer這種雙修的來得厲害 11/12 07:57
→ drajan: 如果「只是」engineering 的職位確實leetcode重要性要大於 11/12 07:59
→ drajan: 數學多的多了 畢竟能改變世界的模型就那些人在搞 基礎的工 11/12 07:59
→ drajan: 程還是需要有人做 11/12 07:59
推 KingSteven: DeepMind先跪……管他賠不賠錢,有神先跪再說…… 11/12 09:18
推 fr75: 原po有Phd 應該是國外大學的 不能這樣推薦人 國外公司最愛 11/12 09:54
→ fr75: 找Phd的 尤其是研發類 人家看到一個phd想做水管工當然巴不 11/12 09:54
→ fr75: 得你進啊 11/12 09:54
PhD真的沒有比較厲害啦。我們公司很多Master degree的也很強。
而且還不是一樣要刷leetcode, 公平啦 XD
噓 BigHeadDoggy: 會接基本的DL model. 有高中程度的機率,統計. 11/12 10:22
→ BigHeadDoggy: 再刷一下Leetcode. 你也可以apply FANG 的MLE哦 XD 11/12 10:22
→ BigHeadDoggy: 你知道自己在說什麼嗎 11/12 10:22
我可能寫得比較誇張啦,但我要表達的是code寫好真得比較重要。
推 stmilk: 我沒在那個世界待過我實在也不知道數學到底重不重要。“ 11/12 10:52
→ stmilk: 上帝關一扇門會開另一扇窗“,這句話不管是心靈層面還是 11/12 10:52
→ stmilk: 實務層面都很實在,而且我不喜歡怨天尤人,所以我現在也 11/12 10:52
→ stmilk: 是乖乖刷leetcode和補充現在一堆公司要求的distribution 11/12 10:52
→ stmilk: system的底,好險之前資料結構和演算法其實讀很多遍刷起 11/12 10:52
→ stmilk: 來挺快樂的,不確定這條路是不是相對好的選擇,但試試沒 11/12 10:52
→ stmilk: 損失。 11/12 10:52
其實我就是看到你的文章才想po這篇的。
補好leetcode 和 distributed system design確實對MLE interview比較有用
DS的話,可能數學和統計還是比較重要一點。
※ 編輯: alden (94.15.237.14 英國), 11/12/2021 11:24:44
※ 編輯: alden (94.15.237.14 英國), 11/12/2021 11:25:57
推 everglow: 這篇太樂觀了 這正向到有點偏離現實太遠了 11/12 11:31
→ everglow: 國外FANNG本來就很愛找phd不管有無跟AI相關的人來做ML 11/12 11:32
→ everglow: 而且你應該又是很早進入這個領域的 這樣比較不太公平 11/12 11:33
→ everglow: 事實上 數學重要嗎 很重要 但實務上要大量用到數學的缺 11/12 11:34
→ everglow: 根本少到可以 11/12 11:34
→ alden: 嗯。早個5年的bar真的低很多。 11/12 11:40
→ alden: 而且台灣這個領域的求職看起來比國外競爭多了! 11/12 11:42
推 everglow: 台灣是產業問題 ai無法做大 缺太少了 11/12 11:53
→ everglow: 不過我相信原po這麼優秀 哪個時間點都可以相對容易找 11/12 11:54
→ everglow: 現在一堆都要leetcode 連DS考online assessment成常態了 11/12 11:56
→ everglow: 某方面來說 也是要刷leetcode ... 11/12 11:56
→ DrTech: 連Google 在發很多重要論文,都沒在用數學,還很多人一直 11/12 12:34
→ DrTech: 把數學推導神話,沒必要。做出效果來最重要啦,慢慢推什麼 11/12 12:34
→ DrTech: 數學。 11/12 12:34
→ DrTech: 搞不好我甚至覺得,大家都是沒靠數學做出效果,再來為了投 11/12 12:36
→ DrTech: 稿堆出數學的。 11/12 12:36
聽起來很有道理。idea再好,沒有SOTA也很難發paper
→ DrTech: 數學好不好,會不會推導,在業界真的是很微乎其微的重要。 11/12 12:37
→ DrTech: 效果無法證實,在哪慢慢推數學理論,根本上不了檯面。 11/12 12:38
→ DrTech: 去搞傳統BI,做統計都比做AI還更需要數學。 11/12 12:39
→ DrTech: 工程師這三個字,就代表了,工程結果最重要了。要算數學可 11/12 12:42
→ DrTech: 以去找科學家,研究員職缺。 11/12 12:42
→ DrTech: 在哪慢慢推數學根本推不出來 BERT, Transformer之流的方法 11/12 12:46
→ DrTech: 才是真的。 11/12 12:46
→ DrTech: Transformer模型架構為什麼大放異彩,數學也證實不出來。 11/12 13:07
好問題。為什麼Transformer這麼有效?
→ DrTech: 這也是現況。實務結果證實後,發表時才會回去推數學。 11/12 13:07
→ DrTech: 一般正常工程師,根本做不到這塊。 11/12 13:08
推 everglow: 很認同 所以面試在那邊考推導準備證明根本有事嗎 11/12 13:19
真的有人面試考證明?
推 kiwi946946: 會考大概是面試者沒有能呈現的做品經歷,那面試官也只 11/12 13:35
→ kiwi946946: 能考這個了 11/12 13:35
→ recorriendo: Google是Google啊 它甚至發ethics論文大家也都搶著 11/12 13:38
→ recorriendo: 引用 用這個當判準很奇怪 11/12 13:38
→ recorriendo: Transformer就是需要一點矩陣數學推導才能把self a 11/12 13:47
→ recorriendo: ttention這個idea變成code啊 (不然就會變成很醜的n 11/12 13:47
→ recorriendo: ested for loop) 11/12 13:47
→ recorriendo: 當然接水管的是沒差 不過說不懂數學就可以發明LSTM 11/12 13:49
→ recorriendo: 、Transformer太誇張了 11/12 13:49
You got me wrong there.
我說99.9%的人是用transformer. 不是發明transformer.
推 recorriendo: 這串我覺得很多是talking past each other 大多數人 11/12 13:55
→ recorriendo: 提數學是這個層級的推導 可能這些對有PhD的大大們真 11/12 13:55
→ recorriendo: 的是像加減乘除一樣簡單 所以才會說不需要很多數學 11/12 13:55
→ recorriendo: 實際上相對普通SWE這確實是"很多"了 11/12 13:55
高中數學是誇張了點。但如果念CS大學科系,機率,線代,微積分是基本吧?
推 empliu: 直接來看 Deepmind 的 publications 列表吧 11/12 14:17
→ empliu: 這裡說的數學也不是說你數學要多強 11/12 14:17
對啦。我們要先講好數學強到底是多強?
這些數學對數學系的來說只是加減法吧...
→ empliu: 不過至少要不討厭數學 而且最基本的那幾科有學好 11/12 14:17
→ empliu: 不然 Scientist 給的東西你都看不懂 要怎麼轉成工程模型 11/12 14:18
→ empliu: 這是Google研究單位今年投給ICLR被拒轉頭NIPS被接受的論文 11/12 14:23
→ empliu: 就我所知光這樣的數學 很多搞前後端的人都沒辦法應付 11/12 14:24
推 empliu: 很多搞系統很牛逼的人是很排斥哪怕很基礎的數學 11/12 14:27
→ empliu: (不是說加減乘除多項式那種) 11/12 14:27
推 humanfly: 感謝大大的勵志文 11/12 14:36
希望這篇有推坑到。不要被說AI/ML一定要數學超強 XD
※ 編輯: alden (94.15.237.14 英國), 11/12/2021 15:40:46
→ DrTech: 所以到底你們版上誰的工作有在投論文的?比例是多少? 只 11/12 15:36
→ DrTech: 會講,拿出證據吧。 11/12 15:36
→ DrTech: 誰在用 transformer時,會需要去推導數學,或推導了數學對 11/12 15:37
→ DrTech: 工作實務有什麼幫助? 11/12 15:37
→ DrTech: 拿別人少數研究員的工作在說 個,AI工程師的工作需要數學 11/12 15:39
→ DrTech: ,數學推導,有夠奇怪。 11/12 15:39
→ DrTech: 人家是要轉行當 AI工程師,不是要轉行當 AI科學家,AI界 11/12 15:42
→ DrTech: 大牛耶。 11/12 15:42
→ DrTech: 別人要當個普通 AI工程師,你們拿科學家的標準來強調:不 11/12 15:44
→ DrTech: 要當科學家。跳針跳得太誇張。 11/12 15:44
→ alden: 推DrTech 重點還是工程師三個字 11/12 15:45
→ DrTech: 如果今天標題是:如何轉行當研究員,科學家。你們這些天天 11/12 15:46
→ DrTech: 在強調數學的人才合理吧。 11/12 15:46
推 stmilk: google那篇我是不知道正常工程師會理解到哪啦,我稍微看 11/12 15:53
→ stmilk: 一下在有時間壓力的情況下應該會先簡單理解說:這個訓練 11/12 15:53
→ stmilk: 可以逼近他們那個定義的應該算可以接受的bias區間,然後 11/12 15:53
→ stmilk: 定理一就是說這個演算法得出來的東西就是會滿足他們那個 11/12 15:53
→ stmilk: 定義,定理二在說這個玩意兒還超屌的訓練時還會有一個上 11/12 15:53
→ stmilk: 界不會飄的太嚴重,雖然他們沒有討論這個上界夠不夠緊XD 11/12 15:53
→ stmilk: ,所以應該還是有個前提是訓練的模型存在。然後就實作了 11/12 15:53
→ stmilk: 因為也不難XD這篇論文真的有夠學術的,的確工程界根本不 11/12 15:53
→ stmilk: 屌什麼bias什麼的,能上就好。工程界真的要討論的話統計 11/12 15:53
→ stmilk: 的bias定義又根本不能用,因為只有上帝才知道他們要找的 11/12 15:53
→ stmilk: pattern長什麼樣子哈哈哈 11/12 15:53
推 stmilk: 這個在台灣要被實作出來應該還是要等某些英文很好的中國 11/12 15:56
→ stmilk: 人(因為我看網路上好像中國人很熱衷翻譯這些東西)把它 11/12 15:56
→ stmilk: 的步驟寫出來,然後說一下心得才會有台灣人開始實作吧哈 11/12 15:56
→ stmilk: 哈哈 11/12 15:56
推 stmilk: 阿上面說的”訓練模型存在”不太精確,精確地說是這個要 11/12 16:00
→ stmilk: 找的問題的解存在,因為現實應用這個假設不一定成立XD解 11/12 16:00
→ stmilk: 不存在那訓練時就是放飛自我哪裡都有可能跑了哈哈哈 11/12 16:00
→ stmilk: 最後是可以理解這個在工程界應該應用不大因為一般的bias 11/12 16:02
→ stmilk: 影響不會太嚴重,但對精度要求很重的工業(台積電?)可 11/12 16:02
→ stmilk: 能就會需要了 11/12 16:02
→ stmilk: 而這個訓練除了剃度下降還要更新那兩個我的理解應該可以 11/12 16:04
→ stmilk: 算是限制函數的東西,這就是成本XD 11/12 16:04
推 libitum: 在講什麼東西啊 工程師=工程界? 工程界是什麼?? 11/12 16:05
→ libitum: 最好是一個AI engineer完全不考慮bias啦... 11/12 16:05
→ libitum: 台灣業界要不要實作為什麼要等到中國人有人翻譯跟心得啊 11/12 16:06
→ libitum: 有需求就會去做啊 心得國外一堆 英文又沒那麼難 11/12 16:07
→ recorriendo: 隨便舉個例子啦 pytorch要選optimizer 當然要懂點數 11/12 16:08
→ recorriendo: 學才能知道adam是在幹嘛吧 除非你真的土法煉鋼把所 11/12 16:08
→ recorriendo: 有選項都試一遍 那如果需要選擇的地方有很多個 你的 11/12 16:08
→ recorriendo: 選項組合就指數級爆炸了 根本不可能一個一個試 11/12 16:08
推 stmilk: 好吧我道歉那樣說不對,對不起。然後我也不要代表工程界 11/12 16:08
→ stmilk: 好了至少我之前工作的地方不在乎。 11/12 16:08
推 libitum: 不在乎bias? 那你前公司拿什麼來當evaluation metrics 11/12 16:12
→ recorriendo: 不然去stackoverflow去查哪個選項比較好 把答案背起 11/12 16:12
→ recorriendo: 來 解釋都不管 (因為解釋至少都牽扯一些數學) 是這 11/12 16:12
→ recorriendo: 樣嗎?? 11/12 16:12
推 stmilk: 痾....你先去看論文我們再來討論= = 11/12 16:14
→ recorriendo: 事實就是 就算只是AI engineer 工作上會碰到的數學 11/12 16:15
→ recorriendo: 一定比普通SWE多很多 這到底有什麼好反駁的 11/12 16:15
推 stmilk: 樓上這不就長久以來要數學不要數學的大戰嗎XD 11/12 16:18
噓 Murasaki0110: 我也在FANG, 最賭爛的就是沒ML背景的MLE 11/12 16:20
→ Murasaki0110: 跑來問model為什麼要吐array 不能吐dict嗎 11/12 16:21
有這麼嚴重嗎?包一個wrapper給他不就好了 XD
推 Zoanthropy: 有拿來預測股價嗎? 11/12 16:21
推 stmilk: 乾樓上XDDDDDDD 11/12 16:22
→ Murasaki0110: 沒人要你做research, 但這些基礎都沒有是要做啥 11/12 16:22
→ stmilk: 問不能吐dict也太好笑XDDD 11/12 16:22
→ recorriendo: 原PO 我不是回你喔 你原文根本沒提到Transformer、 11/12 16:22
→ recorriendo: 發paper 11/12 16:22
其實我有提到transfomrer 的作者 :p
推 pttano: 說得好,原原po去巨匠過過水也穩領五六萬起薪,哈哈 11/12 16:38
→ recorriendo: 原原PO問"從零開始"喔 確定機率、微積分、線代對他 11/12 16:43
→ recorriendo: 來說是基本嗎?? 11/12 16:43
→ recorriendo: 確實不知原原PO的背景 不過某Dr講的好像就算文組轉 11/12 16:46
→ recorriendo: 職AI都不用唸一點數學一樣 11/12 16:46
文組可能轉前堆比較適合 XD
念數學,物理,經濟的改做AI應該就不會太難
推 ohmylove347: Deepmind真的要跪了…可是這樂觀的講法不就像愛因斯 11/12 17:17
→ ohmylove347: 坦說微積分考前翻一下就好了嗎XD 11/12 17:17
修正修正
微積分,線代,機率還是要好好學
※ 編輯: alden (104.132.45.79 英國), 11/12/2021 18:28:18
→ final01: deepmind還有其他台灣人?? 11/12 18:43
→ fallcolor: transformer裡的核心self-attention的數學特性很多pape 11/12 18:48
→ fallcolor: r分析過了吧 11/12 18:48
推 niobafrog: 有點好奇原Po的實際工作內容,畢竟大家都知道DeepMin 11/12 19:05
→ niobafrog: d做為全世界頂尖的AI Company,工作內容是在focus的研 11/12 19:05
→ niobafrog: 究新領域並且發Top conference的論文嗎? 還少那部分是 11/12 19:05
→ niobafrog: 只有特定的Researcher在進行呢? 謝謝
11/12 19:05
想idea -> 接model ->調hyperparams -> 跑exp ---> rinse & repeat
有空我再認真寫的自介好了
推 niobafrog: 抱歉 手機打字排版有問題,不好閱讀 11/12 19:06
推 aiueokaki: 這系列真的釣到神人了XD 11/12 19:12
→ soccer103: 神人推 但太過倖存者症候群給箭頭 11/12 20:19
我覺我只有imposter syndrome (冒名頂替症) ....
→ newhandfun: 太樂觀 11/12 20:27
推 KingSteven: 推文有些不是很認同。在AI領域,工程師跟科學家的界線 11/12 21:47
→ KingSteven: 有時候不該分這麼開。工程師就不用懂AI的數學也是蠻 11/12 21:47
→ KingSteven: 不好的,有些數學你不懂,就等於是限制自己的天花板, 11/12 21:47
→ KingSteven: 更別提ICLR、NeurIPS也是很多數學推導的paper啊,這 11/12 21:47
→ KingSteven: 些都是對整體AI的演進是有幫助的,但寫這些paper就只 11/12 21:47
→ KingSteven: 能是科學家?不一定吧…至少tier-1公司不會這樣限制 11/12 21:47
推 KingSteven: 之前面西雅圖微軟的一個engineer職位,面試官也是要 11/12 21:50
→ KingSteven: 我當場推導softmax和cross-entropy的back propagation 11/12 21:50
→ KingSteven: 啊…… 11/12 21:50
→ Morphee: 這種大學等級的推導到底算啥麼數學阿 笑死 11/12 22:04
→ Morphee: 機率、微積分、線代不是都大一的東東 扯一堆幹嘛 11/12 22:05
我覺得問題是大家對數學夠好的定義不太一樣XD
※ 編輯: alden (104.132.45.79 英國), 11/12/2021 22:09:42
推 mmonkeyboyy: 沒有人說不用數學啊....只是數學拿來幹嘛用而已 11/12 22:07
→ mmonkeyboyy: 你要拿來看懂別寫的東西就很夠 11/12 22:07
→ mmonkeyboyy: 要強到拿來開發新東西那是另一回事 11/12 22:08
→ mmonkeyboyy: 最近美國太多ml人 所以就只好用考的來去掉一些啊 11/12 22:08
推 mmonkeyboyy: 對啊= =" 不過說什麼數學的 要能用數學解決新東西 11/12 22:12
→ mmonkeyboyy: 不是總在那賣弄我看得懂我會算....(很多人都會懂啊) 11/12 22:13
→ mmonkeyboyy: 懶得在那裡扯而已 11/12 22:13
推 Morphee: 如果你要做的題目 建中生也拿得到資料 你真的做得贏他嗎? 11/12 22:16
→ Morphee: 我覺得先問這個就夠了 如果有信心就做 沒信心至少換個 11/12 22:17
→ Morphee: domain 資料是建中生拿不到的 不然穩死阿 還沒提市場勒 11/12 22:17
→ Morphee: 弄出來了 結果不好意思商湯也有賣算法 比養你便宜 11/12 22:18
→ Morphee: 老闆手指算一算 哪天沒錢買跑車了 把算法組全改去做別的 11/12 22:19
推 mmonkeyboyy: 說到中國....這行業更是結合人多的優勢 11/12 22:20
推 johnboygo: 我也覺得這系列討論是大家對數學好的定義不一樣XD 11/13 01:02
→ johnboygo: 對理科背景的人來說微積分、線性代數叫常識不算會數學 11/13 01:03
→ johnboygo: 對轉職的人來講可能微積分跟線性代數就是難的數學了 11/13 01:04
推 j0958322080: 真的,要考也考個四為 Stoke's thm 11/13 01:18
推 johnboygo: 懂數學至少要會Lebesgue Integral吧 11/13 01:48
推 yyhsiu: 推樓上 數學好的定義沒講清楚就先戰成一團了 11/13 04:32
→ yyhsiu: 原po覺得都沒在用數學 (我會相信),但對某些人來說 11/13 04:33
→ yyhsiu: 可能一直都在用了 11/13 04:33
→ mao9201: 項目換成更進階的real analysis, commutative algebra也 11/13 10:15
→ mao9201: 不過是數學研究的入門磚而已...真的不要輕易說自己數學 11/13 10:15
→ mao9201: 程度很好 11/13 10:15
→ kevin820308: 不推XD 有點像我學醫朋友說雅思7.5 不是大學水準嗎 11/13 13:31
推 asleisureto: 原po講的好像高中畢業刷個幾題就能進faang一樣 11/13 16:03
→ asleisureto: 那我也可以說高中補個習考上醫牙,也沒很難呀 11/13 16:05
嗯。你講的有道理。努力把該學的東西學好還是很重要的
所謂的高中程度,是聯考數學可以考到100分...
→ RumiManiac: 終於有人講到了,數學好都沒定義清楚也能戰成一團... 11/14 13:22
推 bowin: 推Alden好文分享!
:) 11/16 06:54
→ alksjdf: 感謝分享 感覺FANG不管什麼缺都可以用SWE去準備... 11/16 20:29
→ alksjdf: 只要leetcode刷好刷滿 他甚至不會考你其他專業問題? 11/16 20:30
我覺得FANG的new grad level 還是coding為主吧
還是要準備一些system design. (distributed system, ML system. depends)
還有一個方法就是先走general hire, 進大公司以後再換team做AI/ML
※ 編輯: alden (104.132.45.79 英國), 11/16/2021 21:52:31