看板 Gossiping 關於我們 聯絡資訊
※ 引述《Bupolo (不鋪羅)》之銘言 : ※ 引述《realtw (realtw良心說 不比臺灣女)》之銘言: : : : : 別的我不知道 美國幾個AI真的很智障 : : 我是一個歌曲愛好者 : : 我就讓我美國的幾個ai 分析一下 我喜歡的中文歌曲 所要表述的含義 : : 和歌曲的歌詞和它的整個編曲 分析一下這首歌 : : 結果完蛋了 : : 美國幾個AI got. Gemini : : 完全在胡說八道 : : 歌詞都不是這首歌的歌詞 : : 然後我又叫他們寫詩 : : 美國AI寫的是完全不押韻 內容又沒有任何的文學功底 : : 你說一般的普通人寫個打油詩 起碼最後一個字要押韻 : : 美國幾個AI妥妥的 連打油詩都都寫不出來 : : 我讓美國AI寫紅樓夢 裡面的女兒開頭的酒令 : : 很經典的一個酒令 : : 女兒悲 女兒喜 女兒愁 女兒樂 仿寫這四句開頭的句子 : : 結果美國的AI連字數都對不上 : : 紅樓夢裡面原句每一句都是 後面接7個字 : : 有女兒悲 青春已大守空歸 : : 美國幾個ai不管你怎麼問他 他後面寫的字數都是亂七八糟的 每一句長度都不一樣 : : 內容更是 寫的連國小生都比不上 : : 你要說美國AI有優勢的地方是可以 把牠吹到什麼都厲害 就有點扯了 : : 在中文和文學這方面 美國AI就是一坨屎 為什麼要逼我說實話 : 我剛剛直接問Grok: : 女兒悲 女兒喜 女兒愁 女兒樂 仿寫這四句開頭的句子 : 以下是仿照《紅樓夢》中「女兒悲」「女兒喜」「女兒愁」「女兒樂」四句開頭的詩句, : 保留其抒情風格與結構,並融入《紅樓夢》的意境: : 女兒悲,黛玉淚灑湘江水, : 女兒喜,寶釵笑對金釵輝, : 女兒愁,湘雲醉臥芍藥叢, : 女兒樂,探春琴韻繞畫屏。 : 這四句以大觀園中幾位主要女角色的情感為靈感,試圖捕捉她 : 們的悲歡離合。如果您想要更長的詩篇、特定的角色或不同的情緒主題,請告訴我! : 寫得好不好再說,你說連字數都不對,你用的是哪國的Grok? 我的天 grok寫的這麼爛 你還覺得寫的可以啊 你看看紅樓夢原文 女兒悲 青春已大守空閨 女兒愁 悔教夫婿覓封侯 女兒喜 洞房花燭朝慵起 女兒樂 秋千架上春衫薄 可以看看每一個字和後面接的7個字的最後一個字 不僅韻腳押韻 連聲調都一樣 悲 對 閨(陰平) 愁 對 侯(陽平) 喜 對 起(去聲) 樂 對 薄(仄聲 薄在古代是仄聲) 全部都最後一個字押韻 而且聲調一樣 再看看你那個什麼grok AI寫的 女兒悲,黛玉淚灑湘江水, 女兒喜,寶釵笑對金釵輝, 女兒愁,湘雲醉臥芍藥叢, 女兒樂,探春琴韻繞畫屏 除了第一句韻腳勉強壓上 但是聲調不對 後面三句連押韻都做不上 打油詩的水平都不具備 都說薛蟠是個草包 哪怕人家隨便說一句 女兒愁 繡房裡鑽出個大馬猴 雖然這句話說的很粗俗 那也是押韻了 聲調也對的 你崇拜的美國ai連給薛蟠都比不上 還有什麼好吹的 老老實實承認 美國AI碰上中文藝術這塊就是智障 到底有多難? -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 182.91.103.224 (中國) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1756479085.A.FB5.html
Warnerting: 中肯1.171.198.98 08/29 22:55
holmoak: 紅的明顯 我想知道 喜和起怎麼變平聲106.1.230.24 08/29 22:59
※ 編輯: realtw (182.91.103.224 中國), 08/29/2025 23:00:14
realtw: 打錯字 這個是去聲182.91.103.224 08/29 23:00
realtw: 喜 起都是去聲 都是一一對應的182.91.103.224 08/29 23:01
holmoak: 上聲四紙韻106.1.230.24 08/29 23:02
erisiss0: 和你說一個就是生成ai本來就超級不擅長 27.242.37.58 08/29 23:05
※ 編輯: realtw (182.91.103.224 中國), 08/29/2025 23:06:31
erisiss0: 詩詞的,因為這是機率問題 27.242.37.58 08/29 23:05
erisiss0: ai本身並不懂這啥音樂規則,他只是從資 27.242.37.58 08/29 23:05
erisiss0: 料庫裡面預測一個機率最高,符合條件的 27.242.37.58 08/29 23:05
erisiss0: 東西 27.242.37.58 08/29 23:05
potionx: ds能教教廣西柳州債務怎麼解嗎? 111.240.67.93 08/29 23:07
jeffguoft: 現在ai沒那麼膚淺,不懂規則怎從知識篩 203.77.42.214 08/29 23:07
erisiss0: 所以不管是grok還是ds還是gemini其實創 27.242.37.58 08/29 23:07
erisiss0: 造詩詞都很菜。詩詞又不像散文可以檢查 27.242.37.58 08/29 23:07
erisiss0: 上下token的關聯性,中文詩詞這種超高 27.242.37.58 08/29 23:07
jeffguoft: 符合條件的字?條件限制就是理解的證據 203.77.42.214 08/29 23:08
erisiss0: 度壓縮的東西對ai來說難以判斷可靠性 27.242.37.58 08/29 23:08
erisiss0: ai懂規則,但是它無法識別字啊… 27.242.37.58 08/29 23:08
erisiss0: 對ai來說最低單位不是字,而是token,t 27.242.37.58 08/29 23:09
erisiss0: oken可不是用字為單位拆解的 27.242.37.58 08/29 23:09
realtw: 作為使用者 我不管你什麼構建規則 你ai出 182.91.103.224 08/29 23:10
realtw: 來的結果 垃圾就是垃圾 182.91.103.224 08/29 23:10
erisiss0: 你好嗎,我很好在中文都是三個字。但是 27.242.37.58 08/29 23:10
erisiss0: 拆token的一個是7一個是6。所以這就是 27.242.37.58 08/29 23:11
erisiss0: 詩詞爛的原因,因為ai和人類用的根本都 27.242.37.58 08/29 23:11
erisiss0: 不是一個東西 27.242.37.58 08/29 23:11
erisiss0: 阿你使用者不懂就把ai當作外國人就好, 27.242.37.58 08/29 23:12
erisiss0: 他寫的詩詞全靠矇這樣 27.242.37.58 08/29 23:12
jeffguoft: 我覺得你說的token問題,可以用prompt 203.77.42.214 08/29 23:13
realtw: AI是為人類服務的 AI應該 更善於分析和理 182.91.103.224 08/29 23:13
realtw: 解人類思維 而不是人類去適應AI 182.91.103.224 08/29 23:13
jeffguoft: 來改善,這種文字遊戲本來就是LLM的拿 203.77.42.214 08/29 23:13
jeffguoft: 手好戲,不太可能造不好 203.77.42.214 08/29 23:13
jeffguoft: 不過我古文程度沒那麼好,沒這麼玩過, 203.77.42.214 08/29 23:14
jeffguoft: 留待懂的人來測 203.77.42.214 08/29 23:14
erisiss0: 就沒辦法,你這要求對ai就不可理喻啊… 27.242.37.58 08/29 23:16
erisiss0: 造不好,這對LLM超級難的 27.242.37.58 08/29 23:16
potionx: 要練也可以啦 用人工點讚倒讚 做多遲早會 111.240.67.93 08/29 23:18
potionx: 資料夠多 練夠多次 就會練得出來 111.240.67.93 08/29 23:18
erisiss0: 你先理解ai在生成文章的時候是以token 27.242.37.58 08/29 23:18
erisiss0: 為單位預測的,但是詩詞的每一個字對ai 27.242.37.58 08/29 23:18
potionx: 只是練這個能不能賺錢又是另一回事了 111.240.67.93 08/29 23:18
erisiss0: 來說都不是常見token。ai的處理方案就 27.242.37.58 08/29 23:19
erisiss0: 是先組成合適的意義,然後從機率篩選中 27.242.37.58 08/29 23:19
erisiss0: 選擇符合規則的情況(字數) 27.242.37.58 08/29 23:19
erisiss0: 再瞎雞巴選,由於這些東西對ai的數據庫 27.242.37.58 08/29 23:19
erisiss0: 都是沒有人給過好答案的新東西,所以就 27.242.37.58 08/29 23:19
erisiss0: 亂弄 27.242.37.58 08/29 23:19
potionx: 資料訓練有很多方法啊 人工回饋也行的 111.240.67.93 08/29 23:19
potionx: 你讓國文好的員工 一直去做評分 111.240.67.93 08/29 23:19
potionx: 自然會變得越來越好 111.240.67.93 08/29 23:20
erisiss0: 對LLM來說散文不難,因為都是常用token 27.242.37.58 08/29 23:20
erisiss0: 還有大量語庫可以參考。詩詞完全不是一 27.242.37.58 08/29 23:20
erisiss0: 回事,這都是很少人使用,且網路上缺訓 27.242.37.58 08/29 23:20
erisiss0: 練資料的東西 27.242.37.58 08/29 23:20
potionx: 難不難 是難度和成本問題 而不是做不到 111.240.67.93 08/29 23:21
potionx: AI大量生成文本這一定做的到 人工補資料 111.240.67.93 08/29 23:21
erisiss0: 對你讓國文科室的一直寫餵給ai確實他會 27.242.37.58 08/29 23:22
erisiss0: 變好,這不是就現代人又不寫格律詩嗎 27.242.37.58 08/29 23:22
potionx: 只是做這些事情有沒有意義的問題... 111.240.67.93 08/29 23:22
erisiss0: 這技術在人類都快失傳了ai哪來的辦法啊 27.242.37.58 08/29 23:22
erisiss0: 成本不符不會有人去做的啦。 27.242.37.58 08/29 23:23
realtw: 這個其實沒有很難 連國中生都懂 作詩就 182.91.103.224 08/29 23:23
potionx: 花資源就行啊 真正的問題是有沒有意義... 111.240.67.93 08/29 23:23
realtw: 四聲要押韻 沒那麼難 182.91.103.224 08/29 23:23
realtw: 而且 還有專門的韻書可以備查 哪些字音是 182.91.103.224 08/29 23:23
realtw: 可以押韻的 古代早就有規范標準 182.91.103.224 08/29 23:23
realtw: 比如平平仄仄仄仄平 仄仄平平平平仄 182.91.103.224 08/29 23:23
realtw: 每一個漢字屬於平還是仄 其實很容易查到 182.91.103.224 08/29 23:24
realtw: 韻母有沒有押韻也很容易查到 只能說現在 182.91.103.224 08/29 23:24
realtw: 的老美的AI還不夠智能 182.91.103.224 08/29 23:24
erisiss0: 別把LLM想的太厲害了… 27.242.37.58 08/29 23:24
realtw: 作詩屬於藝術 你能說藝術是沒有意義的嗎 182.91.103.224 08/29 23:25
realtw: ? 182.91.103.224 08/29 23:25
erisiss0: 就和你說對ai他就沒有音調,他只有toke 27.242.37.58 08/29 23:25
erisiss0: n。而且單位還不是以一個漢子作為最小 27.242.37.58 08/29 23:25
erisiss0: 單位的啊是要啥音調 27.242.37.58 08/29 23:25
potionx: 文組學科學系已經在大量減少了 111.240.67.93 08/29 23:26
realtw: 如果寫詩叫做沒意義的話 那唱歌 聽歌也沒 182.91.103.224 08/29 23:26
realtw: 有意義了 只有吃飯才有意義 182.91.103.224 08/29 23:26
potionx: 很多東西都能搞成藝術 但意義只對特定人 111.240.67.93 08/29 23:26
erisiss0: 對ai來說酒和汽水和茶其實都是一個東西 27.242.37.58 08/29 23:26
erisiss0: 你又怎讓他搞得定詩詞。天和天空和天 27.242.37.58 08/29 23:26
erisiss0: 上對ai都是一個字啊… 27.242.37.58 08/29 23:26
potionx: 泛用的東西才是大量AI該先處理的優先級別 111.240.67.93 08/29 23:27
potionx: AI投資本身就是$$$的產物 111.240.67.93 08/29 23:27
erisiss0: ai是外國人,他只會記憶一個東西大概的 27.242.37.58 08/29 23:27
erisiss0: 意思,不會細到一個字。因為要省錢。每 27.242.37.58 08/29 23:27
realtw: AI怎麼會沒有音調呢 每一個漢字什麼音調 182.91.103.224 08/29 23:27
erisiss0: 個字都考慮太浪費錢了 27.242.37.58 08/29 23:27
potionx: 最終還是要回到市場機制上 111.240.67.93 08/29 23:27
realtw: 字典都可以查啊 如果AI連這點做不到 叫什 182.91.103.224 08/29 23:27
realtw: 麼AI 182.91.103.224 08/29 23:28
erisiss0: ai沒有音調的,因為token的設計本來就 27.242.37.58 08/29 23:28
erisiss0: 不考慮音調。最優先的是意義而不是發音 27.242.37.58 08/29 23:28
erisiss0: 全世界方言那麼多哪裡管的過來 27.242.37.58 08/29 23:28
realtw: 沒有音調不能查嗎 每一個漢字一搜在線字 182.91.103.224 08/29 23:29
realtw: 典都搜到了 182.91.103.224 08/29 23:29
realtw: 這點基礎的工作都做不好 還叫什麼ai 182.91.103.224 08/29 23:29
erisiss0: ai這個外國人都不是用一個字當最小單位 27.242.37.58 08/29 23:29
erisiss0: 的,他是用詞做最小單位。他當然不管你 27.242.37.58 08/29 23:29
erisiss0: 音調,和他這個外國人無關的 27.242.37.58 08/29 23:30
realtw: 說來說去就是不夠智能嘛 現有的規則就是 182.91.103.224 08/29 23:30
realtw: 不夠智能 182.91.103.224 08/29 23:30
erisiss0: 所以那是你對ai也過度幻想好嗎…這東西 27.242.37.58 08/29 23:31
erisiss0: 本來就這樣而已。並不全能也不全知 27.242.37.58 08/29 23:31
realtw: 以前人們也覺得 電腦圍棋程式怎麼都下不 182.91.103.224 08/29 23:31
erisiss0: 管不了啊,世界上語言太多了。根本不可 27.242.37.58 08/29 23:31
erisiss0: 能啥音調都管,那永遠都完成不了 27.242.37.58 08/29 23:31
realtw: 過人 後來證明了完全不是問題 就看你的算 182.91.103.224 08/29 23:31
realtw: 法合不合理而已 你說的什麼token這些 說 182.91.103.224 08/29 23:31
realtw: 明它不合理呀 182.91.103.224 08/29 23:32
erisiss0: 圍棋比詩詞簡單好吧,你還真別小看了 27.242.37.58 08/29 23:32
erisiss0: 合理啊,token是合理的 27.242.37.58 08/29 23:32
realtw: 難也可以實現 我不相信AI寫不出工整對仗 182.91.103.224 08/29 23:33
realtw: 的詩詞 說來說去就是還不夠完善而已 182.91.103.224 08/29 23:33
erisiss0: 我們用中文也不記「葡」「萄」 27.242.37.58 08/29 23:33
erisiss0: 而是葡萄 27.242.37.58 08/29 23:33
realtw: 用不用可以分析呀 AI連這點都做不到 還叫 182.91.103.224 08/29 23:34
realtw: 什麼AI 182.91.103.224 08/29 23:34
erisiss0: token就是表達一個意思的最小單位,而 27.242.37.58 08/29 23:34
erisiss0: 不是一個單字的最小單位。事實上中文要 27.242.37.58 08/29 23:34
erisiss0: 表示單一文字在ai這邊來說反而要用更長 27.242.37.58 08/29 23:34
erisiss0: 的token去解釋這個單一字 27.242.37.58 08/29 23:34
erisiss0: 就剛剛的葡萄的例子,ai生出一個「葡」 27.242.37.58 08/29 23:35
erisiss0: 就要註解這是「葡萄」的第一個字,反而 27.242.37.58 08/29 23:35
realtw: 你說的都不是問題 我也會一點編程 碰到漢 182.91.103.224 08/29 23:35
erisiss0: 很難寫 27.242.37.58 08/29 23:35
realtw: 字能不能多加一個條件 分析它的每個字的 182.91.103.224 08/29 23:36
realtw: 讀音 並不是很難 願不願意做而已 182.91.103.224 08/29 23:36
erisiss0: 你會編成和你會LLM是兩碼事好嗎,如你 27.242.37.58 08/29 23:36
erisiss0: 可以解決這個中文ai的宇宙難題請快點提 27.242.37.58 08/29 23:37
erisiss0: 出。你隨便都可以年收幾千億… 27.242.37.58 08/29 23:37
realtw: 有一些在線的網站還能把你輸入的漢字 直 182.91.103.224 08/29 23:37
erisiss0: 不能啊,你以為每個中文字都給你註解是 27.242.37.58 08/29 23:37
realtw: 接翻譯成拼音或注音 加上聲調 那麼哪些韻 182.91.103.224 08/29 23:37
erisiss0: 多大的問題…這根本處理不來好嗎 27.242.37.58 08/29 23:37
realtw: 母是可以押韻的 這個庫裡面一搜就知道了 182.91.103.224 08/29 23:37
realtw: 有多難? 你給個 50萬給我 我都可以做出 182.91.103.224 08/29 23:37
realtw: 來 182.91.103.224 08/29 23:38
realtw: 你不會認為美國ai連我的編程能力都比不上 182.91.103.224 08/29 23:38
realtw: 吧 182.91.103.224 08/29 23:38
erisiss0: 這麼說拉你要真有辦法搞定算法,列一個122.100.112.197 08/29 23:40
erisiss0: 真的會給你列祖宗牌位,以後中文圈的ai122.100.112.197 08/29 23:40
erisiss0: 公司都要拜你當祖師爺122.100.112.197 08/29 23:40
erisiss0: 麻煩你了。給個算法吧。求你122.100.112.197 08/29 23:40
realtw: 只是看熱錢願不願意進去做這塊而已 不代 182.91.103.224 08/29 23:40
realtw: 表做不出來好嗎 182.91.103.224 08/29 23:40
erisiss0: 你五十萬就能搞定?我馬上讓老闆給你打122.100.112.197 08/29 23:41
erisiss0: 錢,但是要先給方案喔122.100.112.197 08/29 23:41
erisiss0: 所以大大你給個聯絡吧我馬上找人給你122.100.112.197 08/29 23:41
realtw: 我說我能搞定的是能夠分析出每個漢字 的 182.91.103.224 08/29 23:42
realtw: 聲調和它的韻母是什麼 哪些漢字是可以押 182.91.103.224 08/29 23:42
realtw: 韻的 就這麼簡單 182.91.103.224 08/29 23:42
realtw: 寫詩這塊我不會編程 你認為最難的不就是 182.91.103.224 08/29 23:43
realtw: 查每個字的韻母 和聲調嗎 這塊我覺得並不 182.91.103.224 08/29 23:43
realtw: 難 我可以寫的出來 182.91.103.224 08/29 23:43
erisiss0: 並不是好嗎…122.100.112.197 08/29 23:43
erisiss0: 你要真搞不懂就算了,別扯這個了…122.100.112.197 08/29 23:44
realtw: 我一個業餘編程的都可以解決核心問題 你 182.91.103.224 08/29 23:45
realtw: 說美國整個寫不出來 這個有點扯了 182.91.103.224 08/29 23:45
Alcazer: ...模型預訓練資料的問題 中文本來就是De 36.231.87.33 08/30 00:20
Alcazer: epseek會比較多預訓練資料 然後中文資料 36.231.87.33 08/30 00:20
Alcazer: 又以大陸為大宗 不然數發部搞什麼主權AI 36.231.87.33 08/30 00:20
Mikudance0: 滾 1.174.248.226 08/30 01:16
awomkjmn: 模型要訓練 114.136.59.241 08/30 08:20