看板 Gossiping 關於我們 聯絡資訊
阿北當年聯考數學95 可是沒有念資工 今天心血來潮 嘗試理解LLM transformer 原理 可是講到token就聽不懂了 然後又變成embedding 弄一弄變成weights 怎麼突然就變成attention block 這不是大學生每個都懂的東西嗎 我是不是失智了 -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 203.204.195.174 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1757334565.A.2AA.html
haha98: 這個現在小學生就懂了 很多科展都做這個223.136.83.223 09/08 20:30
我兒子說他不會 還被我罵一頓
zuiko: 正常114.37.202.164 09/08 20:30
goodland: 去看李宏毅老師的課223.136.208.30 09/08 20:30
我看吳恩達 難怪看不懂
paul26277: 不同科系不懂正常42.75.198.244 09/08 20:30
資管的也不懂正常嗎
angst: 連token都聽不懂就從nlp開始看ㄅ114.33.233.161 09/08 20:31
Tokenizer strategy 不理解 好多做法
qwerapple: 聯考....不是你聽不懂 是因為你老了49.218.138.250 09/08 20:31
StarTouching: 你可以直接請AI教你211.72.117.63 09/08 20:31
AI不是都胡說八道 他看得懂all you need is attention嗎
Mei5566: 超easy223.138.159.120 09/08 20:32
tm731531: 聯考考的是算數 跟數學無關203.121.248.44 09/08 20:34
lastphil: 聯考又沒有多少數學矩陣59.115.169.49 09/08 20:34
好像也是 只有二維 跟辦家家酒一樣 ※ 編輯: Supasizeit (203.204.195.174 臺灣), 09/08/2025 20:37:57
Tenging: 別人國高中就在學的東西 114.136.206.83 09/08 20:42
chrischiu: 有ai不用親自理解這個 60.248.184.141 09/08 20:42
oldntu: 叫LLM教你LLM 114.34.62.92 09/08 20:46
stanly3092: 我都看LLP 42.74.33.67 09/08 20:51
taylor0607: 他可以把他的架構想成很多模組 每個 220.136.148.7 09/08 20:58
taylor0607: 模組是為了解決舊方法做不到的問題才 220.136.148.7 09/08 20:58
taylor0607: 設計的 像是embedding是為了把token 220.136.148.7 09/08 20:59
taylor0607: (文字)變詞向量Attention是讓模型 220.136.148.7 09/08 20:59
taylor0607: 從多個角度來學習等等 220.136.148.7 09/08 20:59
jhjhs33504: 矩陣運算本來就高效 只是要有辦法轉換 1.162.125.100 09/08 21:03
DarkerDuck: 你在見山不是山的階段很OK 1.172.73.25 09/08 21:05
DarkerDuck: 一堆聽一下見山是山會呼叫API就以為 1.172.73.25 09/08 21:06
DarkerDuck: 自己懂了 1.172.73.25 09/08 21:06
DarkerDuck: 不就文字接龍,有啥難的 1.172.73.25 09/08 21:06
saiboos: 高中科展就有的東西 39.15.49.101 09/08 21:07
abc9bitedi: 還有什麼causal padding 馬的一頭霧 42.71.253.135 09/08 21:10
abc9bitedi: 水 42.71.253.135 09/08 21:10
gowaa: 聯考又沒考這個 有些人高中就只會那些 114.26.195.199 09/08 21:30
jhjhs33504: 把語料重組訓練答題較高分部分存起來 1.162.125.100 09/08 21:33
gk1329: 實際去寫寫看就懂惹 27.51.152.118 09/08 21:33
e34l892: 台大資管哄 110.79.242.41 09/08 21:34
jhjhs33504: 當經驗 跟組魔方的手順一樣再問就快了 1.162.125.100 09/08 21:34
jhjhs33504: 還是很難解的話 那就算是架構問題了 1.162.125.100 09/08 21:37
Aucy: 先把DNN RNN Seq2seq 看懂 應該會了解Transf 111.242.100.21 09/08 22:02
Aucy: ormer 111.242.100.21 09/08 22:02
b93510015: Lala move 39.12.113.100 09/09 08:20
tomlin121283: 我連gradient descent怎麼推都不會 36.228.210.185 09/12 08:17
Informatik: 就一坨QKV爆算一發 -> 好棒棒 110.28.74.248 09/12 08:18
lukelove: 因為你老了 118.169.85.183 09/12 09:14
bluu: 如果LLM不好懂可以在他的權重參數上加上微 42.73.12.213 09/12 09:16
bluu: 分變成DLLM 42.73.12.213 09/12 09:17
aasssdddd: 老師把沒把基本概念講清楚就跳過去而已 49.218.98.165 09/12 10:37
k798976869: 現在中國家長讓小孩6歲就學AI惹 123.110.50.249 09/12 11:07