噓 bluebluelan: 這篇是AI寫出來的吧 73.202.165.104 01/31 14:57
推 pupudice: 推 祖國要走10大運年了 2035一統天下222.155.102.216 01/31 14:59
推 StylishTrade: 用AI寫模型 真假? 111.250.156.60 01/31 15:01
→ StylishTrade: 完蛋了 天網真的要來了 111.250.156.60 01/31 15:01
→ StylishTrade: AI會自我進化了 111.250.156.60 01/31 15:01
推 StylishTrade: CUDA是人類寫的 輸給AI寫的了 111.250.156.60 01/31 15:04
噓 mfhsieh2: PTX是 CUDA的一部分。一句話結案。 1.200.29.45 01/31 15:05
→ suijojo: 講解的很清楚,謝謝。 1.175.153.230 01/31 15:07
推 kingstongyu: 所以deepseek可以繞開微軟還有瀏覽器 36.233.21.49 01/31 15:09
→ sky777: 講半天結論還是繞不開輝達硬體.... 111.71.215.91 01/31 15:09
→ sky777: . 111.71.215.91 01/31 15:10
→ kingstongyu: 當初微軟開發簡體的WIN95是不是真有 36.233.21.49 01/31 15:11
→ kingstongyu: 必要?! 36.233.21.49 01/31 15:12
→ kingstongyu: 輝達的顯卡還是要插在裝有X86架構的 36.233.21.49 01/31 15:13
→ kingstongyu: 主板上,請問DEEPSEEK能繞開LINUX嗎?! 36.233.21.49 01/31 15:14
推 enunion: 推223.139.151.244 01/31 15:14
→ vn509942: CUDA C/C++ → PTX → SASS(機器碼)218.166.140.200 01/31 15:17
→ vn509942: PTX是CUDA Compilation Toolchain之環節218.166.140.200 01/31 15:20
噓 shadow0326: 蛤 36.237.160.177 01/31 15:22
→ kingstongyu: 所以deepseek能繞開IEEE的標準?! 36.233.21.49 01/31 15:23
→ tinlans: 就是 20 年前手刻 JVM byte code 同概念 114.34.189.30 01/31 15:26
→ tinlans: 能手寫 invokevirtual、fmul 那些而已 114.34.189.30 01/31 15:27
→ shadow0326: 是在供殺毀 PTX還不一樣是輝達的指令 36.237.160.177 01/31 15:28
→ shadow0326: 集 36.237.160.177 01/31 15:28
推 bitcch: 一直都是在輝達的硬體上跑 只是用不同軟體 49.216.220.59 01/31 15:30
→ gueswmi: ptx指令更方便 細調用控制gpu與記憶體 36.232.141.218 01/31 15:32
→ gueswmi: 繞個甚麼咚咚 36.232.141.218 01/31 15:33
→ gueswmi: 用遊戲理解 捏臉原本可調1-255, 36.232.141.218 01/31 15:34
→ gueswmi: 用ptx 參數可調1-65535 36.232.141.218 01/31 15:35
推 kingstongyu: 輝達設計的指令集架構,還有編譯器 36.233.21.49 01/31 15:35
→ kingstongyu: 所以輝達不需將資訊顯示在電腦上,人 36.233.21.49 01/31 15:37
→ kingstongyu: 與人都是靠機器語言翻譯成腦電波及天 36.233.21.49 01/31 15:38
→ kingstongyu: 線在溝通的?! 36.233.21.49 01/31 15:38
→ kingstongyu: 任天堂紅白機都是靠組合語言將遊戲寫 36.233.21.49 01/31 15:40
→ kingstongyu: 入卡帶裡,PS1並未替自家設計的圖形處 36.233.21.49 01/31 15:43
→ kingstongyu: 理器命名 36.233.21.49 01/31 15:43
推 newbrain: 賣鏟子的剩台積電 101.10.108.225 01/31 15:44
→ kingstongyu: 圖形處理器就是GPU 36.233.21.49 01/31 15:44
推 PRME: cuda就是原來cpu幹的,把他給gpu平行運算, 1.200.241.90 01/31 15:52
→ PRME: 在丟回去,本質還是c 1.200.241.90 01/31 15:52
→ PRME: 因為ai用cpu太慢了 1.200.241.90 01/31 15:54
推 qxpbyd: 就原本用高階語言寫 發現速度太慢就用組語 61.230.237.127 01/31 15:59
→ gueswmi: deepseek 在華爾街眼裡 更少的計算 更少 36.232.141.218 01/31 16:01
→ gueswmi: 的記憶體。 36.232.141.218 01/31 16:02
推 set852064: 推這篇220.135.221.137 01/31 16:13
推 neo5277: ptx這段跟非算力富翁這段是很確實的 36.239.228.170 01/31 16:13
推 goodhike: 還不是要買nv的卡 而且發展更快 需求只 42.70.201.1 01/31 16:19
→ goodhike: 會更多 42.70.201.1 01/31 16:19
推 ChenDotQ: 這篇會引來支語警察 49.215.96.137 01/31 16:27
推 dixsion: 推 36.224.142.98 01/31 16:42
推 newyorker54: google的tensor flow架構就沒有用cud 36.237.159.74 01/31 17:05
→ newyorker54: a輝達有崩壞嗎?也沒有。 36.237.159.74 01/31 17:05
→ newyorker54: deepseek 只是用一部份的ptx, 其他還 36.237.159.74 01/31 17:07
→ newyorker54: 是用H800跑,還是用cuda的指令集啊 36.237.159.74 01/31 17:07
噓 azaz12345: 其實就只是有沒有最佳化而已,總之NV 42.77.23.238 01/31 17:20
→ azaz12345: 對他的cuda工具還有最佳化的成長空間 42.77.23.238 01/31 17:20
→ azaz12345: ,還是掌握在NV手上啊 42.77.23.238 01/31 17:20
推 JasonKOU: 意思是可以繞開cuda conpiler的某些限 223.140.83.79 01/31 18:10
噓 Siu: 不完美同意 發現一顆燈泡當十顆用的方法 180.94.164.107 01/31 19:19
→ Siu: 美國也可以十顆燈泡當一百顆用 180.94.164.107 01/31 19:20
→ Siu: 我覺得以後可能不準越獄了 還不快買 180.94.164.107 01/31 19:21
推 lockeyman: 有沒有能證明這篇的專業解說 101.12.149.225 01/31 19:51
推 genaro: 推 203.204.61.126 01/31 19:52
→ wowtaiwanese: 文章很好,但是你轉載不附上來源? 1.147.119.114 01/31 20:27
→ s213092921: FB看到的 1.172.7.34 01/31 21:36
推 previa: 這篇正解,哥2008年就在用CUDA最早期版本 114.32.198.13 02/03 07:56
→ previa: 當時還要學怎麼利用記憶體延遲交錯load 114.32.198.13 02/03 07:56
→ previa: 資料優化效率,後來這都compiler做掉 114.32.198.13 02/03 07:56
→ previa: 用AI大規模針對不同硬體改底層語言可行啊 114.32.198.13 02/03 07:57
→ previa: 未來很有機會換一個底層就用AI改底層bind 114.32.198.13 02/03 07:58
→ previa: binding跟linking的底層物件 114.32.198.13 02/03 07:58
推 yoshilin: 所以有沒有可能是NVIDIA故意讓CUDA的 223.23.88.164 04/05 18:39
→ yoshilin: 效率差,所以大家才需要買更大的算力? 223.23.88.164 04/05 18:39
→ yoshilin: 這很美式風格。 223.23.88.164 04/05 18:39