Re: [討論] NV發布完全不用人類審查代碼的專案

作者oopFoo (3d)

看板Soft_Job

標題Re: [討論] NV發布完全不用人類審查代碼的專案

時間Tue Feb 17 07:37:06 2026

我以為你是收錢辦事的網軍，但現在知道你是帶來歡樂的小丑。現在ai公司在系統灑了太多錢在宣傳 vibetensor有論文 https://arxiv.org/abs/2601.16238 後面有講到問題，我稍微節錄一下 "The “Frankenstein” composition effect. A recurring failure mode in generated systems is that individually reasonable components can compose into a globally suboptimal design." 就是架構有問題。 "Incomplete API surface and performance. VibeTensor intentionally does not aim for full PyTorch compatibility. Many operators, datatypes, and distributed features are missing or incomplete, and performance has not been tuned to match production frameworks." 功能有限，性能有問題。就是toy. "Validation gaps unique to generated code. Agent-generated code can pass local unit tests while failing under repeated composition (e.g., multi-step training loops) due to stateful interactions, uninitialized buffers, or accidental global synchronization." bugs很多，無法解決，小玩一下ok，真跑起來會當機。 "Maintenance, safety, and security. Machine-generated code can include inconsistent conventions, redundant abstractions, and subtle correctness or security issues. We therefore caution against production use and position VibeTensor primarily as a research and educational artifact." 程式碼問題很多，當研究課題ok，但不要當真。最近很多這類東東，但出來的結果都跟這篇差不多。哪天心情比較好，比較有空再閒聊目前ai寫程式的問題與應用。 ※ 引述《yamakazi (大安吳彥祖)》之銘言： : https://github.com/NVlabs/vibetensor : 詳細內容可以問AI : NVDA 發表了一個完全由AI寫的專案 : 人類只給高階提示詞 : 完全不寫一行代碼 : 不審核一行代碼 : 當然跟原本PyTorch 比效能差了一些 : 不過只花了兩個月完成 : ----- : Sent from JPTT on my iPhone -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 58.114.66.74 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Soft_Job/M.1771285031.A.C51.html

推 dream1124: 做得不好是一回事，重點是幹麻叫它吐出暨有的東西？ 02/17 09:31

其實這是有原因的，因為llms沒有"world model"，所以需要有Source of Truth. 普通來講，是人類，compiler來告訴ai錯誤，然後ai繼續修改。但如果你要完全agent化，那你需要完整的test suite或者program output來比對。所以這些論文就只好找現有的專案，有程式output做比對或很完整的test suite。當然這些就會有暨有程式就在訓練資料裡面的問題。但就目前看到的，再完整的test suite都不夠，沒有"world model"是llms的x致命傷。

→ dream1124: 若一個花了數萬年的時間翻讀人類經典的服務完全背不出 02/17 09:31

→ dream1124: 暨有的東西，那才算失敗吧？因此生得出來根本就不奇怪 02/17 09:32

→ dream1124: 但如果從使用者立場看，我要它背暨有東西給我幹麻啊？ 02/17 09:33

→ dream1124: 要那些東西我直接用最傳統的儲存備援方案就好了啊~ 02/17 09:34

→ dream1124: 要實驗應該做那些從未出現且沒太多相似物可模仿的東西 02/17 09:37

→ dream1124: 到時它無人介入就生得出來又沒有大小問題再來吹也不遲 02/17 09:38

→ hidog: 原本轉貼的那位只是在吹AI，搞不懂他跑來這邊吹幹嘛，去騙 02/17 09:45

→ hidog: 不懂的還行 02/17 09:45

推 WTS2accuracy: 就說這些無腦吹每個言論都菜到不行拉幫結派找一堆 02/17 12:58

→ WTS2accuracy: 名人言論背書也蓋不過的菜味 AI明明很好用但在這些 02/17 12:58

→ WTS2accuracy: 無腦吹描述後都覺得不香了哈 02/17 12:58

推 lturtsamuel: 這樣看起來最適合ai的語言搞不好是純函數式摒棄內 02/17 13:22

→ lturtsamuel: 部狀態 02/17 13:22

→ lturtsamuel: 反正寫函數式是寫的時候痛苦維護的時候爽 02/17 13:22

推 yamakazi: 你知道你的大神已經已經開始從不用AI寫扣到變成八成用cl 02/17 13:58

→ yamakazi: aude code嗎 02/17 13:58

推 nckuff: 別人在講AI不能沒有人類維護你在講八成AI生 02/17 14:29

→ nckuff: 可以滑坡成這樣蠻厲害的 02/17 14:29

推 dream1124: 八成程式碼都抄前人寫的或軟體產生的很稀罕嗎？ 02/17 14:40

→ dream1124: 別講得像你從沒用過生成工具或去StackOverflow抄好嗎？ 02/17 14:41

→ dream1124: 根本大驚小怪，一本正經講幹話，笑死人了 02/17 14:43

推 viper9709: 推分享 02/17 16:50

推 Romulus: 怎麼可能是網軍哪個zz公司會出錢請他 02/17 18:47

※ 編輯: oopFoo (58.114.66.74 臺灣), 02/18/2026 10:27:28

推 dream1124: 原PO 我了解他們選擇叫AI重新造輪子的考量，但這是實驗 02/18 14:29

→ dream1124: 這實驗的方法顯然不夠完善。與其說這在測AI的潛力， 02/18 14:30

→ dream1124: 不如說這是背書考試，測它能否默寫出內容夠長的經典 02/18 14:31