看板 AC_In 關於我們 聯絡資訊
借串問一下.各位同好覺得甚麼模型表現的最好,我現在是用Gemini Pro 2.5作為主要跟 輔助模型(外掛用小惡魔).其實跑起來已經算是非常滿意了(文筆.劇情.色度) 只是速度上還是不能算是很快.等一次回應大概要等個30秒-1分鐘 所以我在想啊.其實我願意每個月花點錢訂閱更好的模型.只是不知道有甚麼更好的選擇 所以不懂就討論.各位覺得想要又好又快.甚麼模型才是最好的呢?? -- 有時候,有些事比贏球更讓你感動 (Sometimes, this game is more than just the final score.) -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.248.199.178 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/AC_In/M.1755179466.A.4FB.html
driftcreator: 兩個選擇,一是調低上下文,然後把preset減肥 08/14 22:05
driftcreator: 二是換Claude 3.7或GPT 4o直連API,模型記憶力較差 08/14 22:05
h0103661: 換輕量模型最實際,gemini-pro本來就是需要思考比較久的 08/14 22:12
h0103661: 模型,你可以關掉思考或是換成gemini-flash 08/14 22:12
sdfsonic: 其實我是可以等的.我最注重還是文本跟劇情的品質 08/14 22:17
sdfsonic: 當然能夠又好又快速 那是最棒的 08/14 22:17
driftcreator: RisuAI關掉Gemini 2.5的reasoning需要會自寫外掛 08/14 22:18
driftcreator: 門檻比較高,所以我直接兩組非思考課金模型了 08/14 22:18
driftcreator: 對了,追求速度的話,不要用github copilot 08/14 22:18
wangmytsai: 雖然gemini2.5flash整天在那邊重複字詞,不過現在在 08/14 22:49
wangmytsai: 跑的肥度還是不敢隨便換課金模型... 08/14 22:49
kimwang: 目前試用額度還沒用完還是用gemini-2.5-pro 08/14 23:00
kimwang: 但是重複字詞真的是看得有點煩 不過claude的api價格太貴 08/14 23:00
kimwang: 怕大量玩的時候噴太多錢 08/14 23:01
kimwang: 是說最近因為custom API不能用gemini 改回用google cloud 08/14 23:01
kimwang: 但是很容易發生輸出到一半被咖掉或者空白回覆的狀況 08/14 23:01
kimwang: 但是從請求記錄看 finishReason都是代表正常結束的STOP 08/14 23:05
kimwang: 有人也有遇到類似的狀況嗎? 08/14 23:07
sdfsonic: gemini-2.5-pro用太兇我會遇到429的狀況 08/14 23:11
kimwang: 我的狀況是這樣 https://i.imgur.com/c6sYqPM.png 08/14 23:14
kimwang: 不是輸出到一半被切斷就是直接整個空的 但是看請求紀錄是 08/14 23:14
kimwang: 有收到東西 而且finishReason:STOP代表正常結束 08/14 23:15
kimwang: 不是因為吃到審查才斷的才對 08/14 23:16
kimwang: 我去RisuAI的DC看也是有人反應遇到這狀況 不知道怎解決 08/14 23:18
wangmytsai: 樓上的我也有遇到,只有pro會這樣 08/14 23:19
kimwang: RisuAI那邊討論是可能模型有更新造成的 這種就比較麻煩 08/14 23:23
zseineo: 我也有遇到 08/14 23:34
kimwang: 現在在測新的preset幾乎沒辦法正常跑... 08/14 23:53
driftcreator: 這是Gemini API近期的大規模災情不限平台,所以無解 08/15 00:00
kimwang: 真慘 看來最近只能先不跑了嗎...不然就要找別的API 08/15 00:09
kimwang: 不過切回小惡魔又暫時不會了 那個preset是寫了啥才一直斷 08/15 00:15
kimwang: 雖然小惡魔跑久了也會開始斷就是 08/15 00:15
kimwang: 看arca live說改用Vertex的API就不會 有申請的可以試試看 08/15 00:38
Fizban: 我還在用vertex的免費額度所以沒遇到截斷的狀況 08/15 03:37
Fizban: 是說Risu有官方DC群?裡面都是韓國人? 08/15 03:37
driftcreator: Risu的官方DC就英語討論最大聚集地(但還是很小一撮) 08/15 04:22
zseineo: risu首頁拉到最下面就有DC了 08/15 07:48
e04su3no: 這已經算快的了,酒館如果開記憶表格大概要80秒才會回 08/15 09:16
e04su3no: 截斷最近災情很嚴重不過掛cli 反代能解決 08/15 09:16