Re: [請益] Deepseek v3 對台積電有影響嗎

作者macbook12 (12吋蘋果)

看板Stock

標題Re: [請益] Deepseek v3 對台積電有影響嗎

時間Mon Dec 30 00:32:36 2024

我覺得評比指標什麼都是後話使用體驗太差 https://i.meee.com.tw/CafPIov.png

你看看這樣怎麼稱霸世界呢？你的進線參數與資料量就比別人少了，雖然不是一個主要因素，就deepseek就是在數據上有篩選過，你要跟人比，好歹訓練資料要在同一起跑點上吧。不過中國人常作弊，可能搞不懂什麼叫做同一起跑點。更何況deepseek使用MoE的模型 MoE稀疏模型成本本來就比一般模型密度低這邊怕你看不懂，就是一個禿頭的人跟髮量正常的人說，嘿嘿我們都有頭髮耶，你懂這個意思嗎？股點就是，如果美國未來持續加嚴對中國的科技限制，不要以為拿RTX 顯卡來訓練Model這件事不會發生，大膽一點想，會不會又爆發缺卡潮？ ※ 引述《icrose (人本良心)》之銘言： : deepseek在多語言編程指標中有自己的優異表現，很多指標優於chatgpt，最好是偷偷調用別人的API啦 : Codeforce領先所有模型，思維鏈的應用上，諸如數學能力的 AIME 2024 CNMO 2024測試也是領先全球的 : 而且已經可以本地部署測試，成本降低是可見的，原理也是業界認可的 : 你以爲這兩個小例子能推翻什麽嗎XD : 由於低成本和硬件限制，有缺陷是非常有可能的，但是只要原理通，未來非常可期。 : ※ 引述《jackliao1990 (j)》之銘言： : : 沒想到吹沒多久 : : 當問DeepSeek-V3:"你是什麼模型" : : DeepSeek-V3竟然回答:"我是chatgpt" : : https://imgur.com/wcgo1TC : : 叫它講個笑話 : : 它講的笑話也跟ChatGPT一樣: : : https://imgur.com/Zo1PKXw : : 難道DeepSeek-V3訓練成本這麼低是因為用chatgpt訓練的?? : : Sam altman迅速發推嘲諷: : : https://x.com/sama/status/1872664379608727589 : : "複製你知道有效的東西是（相對）容易的。" -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 123.204.6.114 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Stock/M.1735489958.A.23D.html

→ materu : moe類似姆斯，訂製賽道之神 12/30 01:01

→ materu : 做不到通用，誰管你ai星海多強圍棋多厲害 12/30 01:03

推 richaad : https://i.imgur.com/1cSUzpI.jpeg 12/30 01:32

→ richaad : https://i.imgur.com/k3RFqmj.jpeg 12/30 01:32

→ richaad : https://i.imgur.com/Cs1rYAv.jpeg 12/30 01:32

推 stosto : 他們會串mac mini 12/30 01:49

推 yc0304 : 它應該不是篩選輸入資料，而是針對輸出過濾 12/30 05:02

噓 capssan : 你這問題問的有夠政治 12/30 07:22

推 lifeowner : 等別人都做出來，轟動世界。再說這個我也會，早就會 12/30 08:11

→ lifeowner : 。 12/30 08:11

推 Diver123 : 你這問題太粗暴了 12/30 09:39

推 mainsa : 噓問題問的政治但這模型受限於政治因素導致輸入輸 12/30 09:58

→ mainsa : 出的資料被篩選過這種模型訓練出來就只會是垃圾而 12/30 09:58

→ mainsa : 已啊 12/30 09:58

推 mystylezack : https://i.imgur.com/STuqOSM.jpeg 12/30 11:26

噓 howzming : 它可能知道答案，但被屏蔽關鍵字阿.這不代表它差. 12/30 11:29

→ macbook12 : https://i.meee.com.tw/qB80nyY.png 12/30 12:14

推 ariadne : GIGO其他不用多說 12/31 01:14