推 driftcreator: 兩個選擇,一是調低上下文,然後把preset減肥 08/14 22:05
→ driftcreator: 二是換Claude 3.7或GPT 4o直連API,模型記憶力較差 08/14 22:05
推 h0103661: 換輕量模型最實際,gemini-pro本來就是需要思考比較久的 08/14 22:12
→ h0103661: 模型,你可以關掉思考或是換成gemini-flash 08/14 22:12
→ sdfsonic: 其實我是可以等的.我最注重還是文本跟劇情的品質 08/14 22:17
→ sdfsonic: 當然能夠又好又快速 那是最棒的 08/14 22:17
推 driftcreator: RisuAI關掉Gemini 2.5的reasoning需要會自寫外掛 08/14 22:18
→ driftcreator: 門檻比較高,所以我直接兩組非思考課金模型了 08/14 22:18
→ driftcreator: 對了,追求速度的話,不要用github copilot 08/14 22:18
推 wangmytsai: 雖然gemini2.5flash整天在那邊重複字詞,不過現在在 08/14 22:49
→ wangmytsai: 跑的肥度還是不敢隨便換課金模型... 08/14 22:49
推 kimwang: 目前試用額度還沒用完還是用gemini-2.5-pro 08/14 23:00
→ kimwang: 但是重複字詞真的是看得有點煩 不過claude的api價格太貴 08/14 23:00
→ kimwang: 怕大量玩的時候噴太多錢 08/14 23:01
→ kimwang: 是說最近因為custom API不能用gemini 改回用google cloud 08/14 23:01
→ kimwang: 但是很容易發生輸出到一半被咖掉或者空白回覆的狀況 08/14 23:01
推 kimwang: 但是從請求記錄看 finishReason都是代表正常結束的STOP 08/14 23:05
→ kimwang: 有人也有遇到類似的狀況嗎? 08/14 23:07
→ sdfsonic: gemini-2.5-pro用太兇我會遇到429的狀況 08/14 23:11
→ kimwang: 不是輸出到一半被切斷就是直接整個空的 但是看請求紀錄是 08/14 23:14
→ kimwang: 有收到東西 而且finishReason:STOP代表正常結束 08/14 23:15
→ kimwang: 不是因為吃到審查才斷的才對 08/14 23:16
→ kimwang: 我去RisuAI的DC看也是有人反應遇到這狀況 不知道怎解決 08/14 23:18
推 wangmytsai: 樓上的我也有遇到,只有pro會這樣 08/14 23:19
推 kimwang: RisuAI那邊討論是可能模型有更新造成的 這種就比較麻煩 08/14 23:23
推 zseineo: 我也有遇到 08/14 23:34
→ kimwang: 現在在測新的preset幾乎沒辦法正常跑... 08/14 23:53
推 driftcreator: 這是Gemini API近期的大規模災情不限平台,所以無解 08/15 00:00
推 kimwang: 真慘 看來最近只能先不跑了嗎...不然就要找別的API 08/15 00:09
→ kimwang: 不過切回小惡魔又暫時不會了 那個preset是寫了啥才一直斷 08/15 00:15
→ kimwang: 雖然小惡魔跑久了也會開始斷就是 08/15 00:15
推 kimwang: 看arca live說改用Vertex的API就不會 有申請的可以試試看 08/15 00:38
→ Fizban: 我還在用vertex的免費額度所以沒遇到截斷的狀況 08/15 03:37
→ Fizban: 是說Risu有官方DC群?裡面都是韓國人? 08/15 03:37
推 driftcreator: Risu的官方DC就英語討論最大聚集地(但還是很小一撮) 08/15 04:22
→ zseineo: risu首頁拉到最下面就有DC了 08/15 07:48
推 e04su3no: 這已經算快的了,酒館如果開記憶表格大概要80秒才會回 08/15 09:16
→ e04su3no: 截斷最近災情很嚴重不過掛cli 反代能解決 08/15 09:16