看板 Gossiping 關於我們 聯絡資訊
我剛才問Gemini 你們家有沒有出可以讓你們操作用戶電腦的功能 他叫我跑去API那邊的build貼上一行字: "幫我建立一個可以操作網頁的 Agent" 然後API那邊畫面就自己動來動去 做了一個面板給我操作 我問說我可不可以換另一台電腦玩 Gemini說是在沙盒裡面的 不會真的動到我的電腦 請問我真的可以相信他嗎?電腦會不會爆炸QQ API那邊的AI寫了這段話: 我已經為你建立了一個名為 WebWiz AI Agent 的智慧網頁操作代理。 這是一個全棧式的應用程式,結合了 Express 後端代理與 Gemini 3 Flash 的強大推理 能力,讓 Agent 能夠自主分析網頁結構並執行操作。 主要功能: 自主導航與分析:Agent 可以「閱讀」網頁的 HTML 結構,識別按鈕、輸入框與連結。 自動化操作:支援「點擊 (Click)」、「輸入 (Type)」、「導航 (Navigate)」以及「擷 取 (Extract)」等動作。 兩種模式: Sandbox Mode (沙盒模式):預設提供一個本地的註冊表單頁面,讓你可以安全地測試 Agent 填寫表單與提交的功能。 Live Browser (實時瀏覽):輸入任何公開網址,後端代理會抓取頁面內容供 Agent 進行 分析與資料擷取。 智慧推理日誌:你可以在左側面板看到 Agent 的「思考過程 (Thought)」,了解它為什 麼選擇下一個動作。 專業儀表板設計:採用深色的「技術指揮中心」風格,具備動態掃描線、發光邊框與流暢 的動畫效果。 技術細節: AI 引擎:使用 gemini-3-flash-preview,透過結構化 JSON 輸出確保動作的精確度。 後端偵查:使用 axios 與 cheerio 在服務端處理網頁抓取,有效繞過 CORS 限制並簡 化 DOM 提供給 AI。 前端開發:使用 React 19、Tailwind CSS 4 與 Framer Motion 打造高品質的互動體驗 。 你現在可以點擊「START AGENT」讓它開始在沙盒中執行自動填寫與提交的任務,或是切 換到實時模式來嘗試分析你感興趣的網頁! -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 135.136.27.43 (日本) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1776395486.A.076.html
playr52001: 你覺得這裡很多電腦工程師嗎 101.8.128.128 04/17 12:17
LoveSports: 有也不會理我吧XD 我只是來哭哭而已 135.136.27.49 04/17 12:28