看板 MobileComm 關於我們 聯絡資訊
借串問一下 我目前有個需求是把畫面截圖後當作資料來提供給AI做分析 GPT有辦法直接對畫面上的文字/資料來做處理,但Gemini(尚未付費)會說它只能處理文字 想請問這是有無付費造成的影響嗎? 還是這真的算是GPT特有功能? 不然Google買AI又送空間其實是蠻合用的,目前卡在這點不敢轉過去... -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.68.118.242 (印尼) ※ 文章網址: https://www.ptt.cc/bbs/MobileComm/M.1755831699.A.6C3.html
abc0922001 : OCR這塊我覺得ChatGPT做最好 08/22 11:05
abc0922001 : 你是想要圖片進去,之後改裡面文字再圖片輸出? 08/22 11:07
eddie2570922: 其實是因為對新系統不熟悉 前手交接不清楚直接放手 08/22 11:13
eddie2570922: 目前用AI截系統畫面來查錯誤要怎麼追蹤 08/22 11:14
eddie2570922: 所以目的是要能分析,還不用再輸出圖片 08/22 11:14
※ 編輯: eddie2570922 (111.68.118.242 印尼), 08/22/2025 11:15:38
abc0922001 : Gemini能分析圖片,它只是不想幫你用而已 08/22 11:25
abc0922001 : 這就是我沒換到Gemini的原因 08/22 11:26
eddie2570922: 了解,那看來還是得留在chatGPT了 08/22 11:27
simpson083 : 免費版的flash直接跟我說我不是用來分析圖片的工具 08/22 11:52
simpson083 : ,自此不再用:D 08/22 11:52
y800122155 : NotebookLM 的OCR超級強,丟整本書掃描檔不到一分鐘 08/22 12:35
y800122155 : 就全部讀完+翻譯完了 08/22 12:35
clair281 : gemini會偷懶= =開一個新對話再問一次 08/22 12:35
issemn : 我選AI只有一個標準,,,,就是能畫繁體中文字,有些A 08/22 12:37
issemn : I只能畫出簡體中文字跟英文,很爛 08/22 12:37
rangers : 我用G AI pro, 一直都能分析截圖 08/22 12:45
draintank : gemini付費版確定能處理圖片,我印象中免費版也可 08/22 12:45
draintank : 以 08/22 12:45
JH10 : google ai studio處理圖片是免費的 08/22 12:48
j2550420 : gemini可以,不過設定Gem去做事前設定會更快 08/22 12:59
beavertail97: notebooklm讀pdf也是很會出錯.. 08/22 13:13
southlight22: P0no 08/22 13:23
southlight22: 剛好看到,希望有幫助 08/22 13:26
DemonElf : 你Gemini要下拉選pro就能讀圖 08/22 13:27
xoy : 手機有Gemini Live的話可以直接讀圖以及開相機,Ge 08/22 14:35
xoy : mini APP選2.5 Pro然後按畫面下方的加號裡面一樣可 08/22 14:35
xoy : 以讀圖或開相機 08/22 14:35
maplefff : 你公司居然可以讓你把業務內容直接 08/22 19:28
maplefff : 貼在ChatGPT問也是蠻猛的 08/22 19:28
LoveSports : 我昨天用Flash確定可以 拍去光水的瓶身照片請他分析 08/22 21:59
LoveSports : 這罐的成分對人體有無害處 他有正確回答 08/22 21:59
LoveSports : 但是我本來請另外一頁幫我寫指甲油種類報告書的幫我 08/22 22:00
LoveSports : 讀圖 他拒絕 說他無法讀圖 我後來跟隔壁頁幫我讀圖 08/22 22:00
LoveSports : 的Gemini討論 他說後台子模型不一樣 我是免費版用戶 08/22 22:00
LoveSports : https://i.imgur.com/btz3zwa.png 08/22 22:06
laser789 : 同29F 你要不要先確定一下公司IT跟智財允許這樣做 08/23 05:24
stockton19 : 想要自己室內裝潢設計建議用哪個? 08/23 13:39
Alpha2022 : GPT升5後,不論哪個模組,圖片辨字要小心亂掰塞字 08/24 02:08
Alpha2022 : 數或扭曲內文,錯誤細節藏蠻深需逐段認真檢查那種 08/24 02:08
Alpha2022 : ,重跑第二次會錯的更嚴重 08/24 02:08