→ haha98: 這個現在小學生就懂了 很多科展都做這個223.136.83.223 09/08 20:30
我兒子說他不會 還被我罵一頓
推 zuiko: 正常114.37.202.164 09/08 20:30
推 goodland: 去看李宏毅老師的課223.136.208.30 09/08 20:30
我看吳恩達 難怪看不懂
推 paul26277: 不同科系不懂正常42.75.198.244 09/08 20:30
資管的也不懂正常嗎
→ angst: 連token都聽不懂就從nlp開始看ㄅ114.33.233.161 09/08 20:31
Tokenizer strategy 不理解 好多做法
→ qwerapple: 聯考....不是你聽不懂 是因為你老了49.218.138.250 09/08 20:31
→ StarTouching: 你可以直接請AI教你211.72.117.63 09/08 20:31
AI不是都胡說八道 他看得懂all you need is attention嗎
→ Mei5566: 超easy223.138.159.120 09/08 20:32
→ tm731531: 聯考考的是算數 跟數學無關203.121.248.44 09/08 20:34
推 lastphil: 聯考又沒有多少數學矩陣59.115.169.49 09/08 20:34
好像也是 只有二維 跟辦家家酒一樣
※ 編輯: Supasizeit (203.204.195.174 臺灣), 09/08/2025 20:37:57
推 Tenging: 別人國高中就在學的東西 114.136.206.83 09/08 20:42
推 chrischiu: 有ai不用親自理解這個 60.248.184.141 09/08 20:42
推 oldntu: 叫LLM教你LLM 114.34.62.92 09/08 20:46
推 stanly3092: 我都看LLP 42.74.33.67 09/08 20:51
推 taylor0607: 他可以把他的架構想成很多模組 每個 220.136.148.7 09/08 20:58
→ taylor0607: 模組是為了解決舊方法做不到的問題才 220.136.148.7 09/08 20:58
→ taylor0607: 設計的 像是embedding是為了把token 220.136.148.7 09/08 20:59
→ taylor0607: (文字)變詞向量Attention是讓模型 220.136.148.7 09/08 20:59
→ taylor0607: 從多個角度來學習等等 220.136.148.7 09/08 20:59
推 jhjhs33504: 矩陣運算本來就高效 只是要有辦法轉換 1.162.125.100 09/08 21:03
推 DarkerDuck: 你在見山不是山的階段很OK 1.172.73.25 09/08 21:05
→ DarkerDuck: 一堆聽一下見山是山會呼叫API就以為 1.172.73.25 09/08 21:06
→ DarkerDuck: 自己懂了 1.172.73.25 09/08 21:06
→ DarkerDuck: 不就文字接龍,有啥難的 1.172.73.25 09/08 21:06
推 saiboos: 高中科展就有的東西 39.15.49.101 09/08 21:07
推 abc9bitedi: 還有什麼causal padding 馬的一頭霧 42.71.253.135 09/08 21:10
→ abc9bitedi: 水 42.71.253.135 09/08 21:10
→ gowaa: 聯考又沒考這個 有些人高中就只會那些 114.26.195.199 09/08 21:30
推 jhjhs33504: 把語料重組訓練答題較高分部分存起來 1.162.125.100 09/08 21:33
推 gk1329: 實際去寫寫看就懂惹 27.51.152.118 09/08 21:33
推 e34l892: 台大資管哄 110.79.242.41 09/08 21:34
→ jhjhs33504: 當經驗 跟組魔方的手順一樣再問就快了 1.162.125.100 09/08 21:34
推 jhjhs33504: 還是很難解的話 那就算是架構問題了 1.162.125.100 09/08 21:37
推 Aucy: 先把DNN RNN Seq2seq 看懂 應該會了解Transf 111.242.100.21 09/08 22:02
→ Aucy: ormer 111.242.100.21 09/08 22:02
推 b93510015: Lala move 39.12.113.100 09/09 08:20
→ tomlin121283: 我連gradient descent怎麼推都不會 36.228.210.185 09/12 08:17
推 Informatik: 就一坨QKV爆算一發 -> 好棒棒 110.28.74.248 09/12 08:18
推 lukelove: 因為你老了 118.169.85.183 09/12 09:14
推 bluu: 如果LLM不好懂可以在他的權重參數上加上微 42.73.12.213 09/12 09:16
→ bluu: 分變成DLLM 42.73.12.213 09/12 09:17
推 aasssdddd: 老師把沒把基本概念講清楚就跳過去而已 49.218.98.165 09/12 10:37
噓 k798976869: 現在中國家長讓小孩6歲就學AI惹 123.110.50.249 09/12 11:07