看板 Gossiping 關於我們 聯絡資訊
https://i.urusai.cc/LCW4K.jpg
# AI Coding 工具生態深度盤點 — 專案報告 v2 > **版本**:v2.6 / 2026-05-02 > **資料截止**:2026-05-02(本次針對模型 / Agent / MCP / 採購結論做官方來源抽樣核驗;價格與配額仍需採購前逐頁確認) > **更新說明**: > - v2.6 深化 5.10 GitHub Copilot:補入「形式」三重身份標註、「外部工具 / 擴充生態」(Copilot Extensions / Skillsets / MCP / Spaces / Custom Instructions)與「限制」段落 > - v2.5 修正 4 處錯置:(1) 第 6.1 Routing 表 4 個過時模型對應(GPT-4o / o3 / Gemini 2.5 Pro / Gemini Thinking)→ GPT-5.x / Gemini 3.x;(2) 第 6.4 Fallback 策略 GPT-4o → GPT-5.4;(3) 第 16.4 AnythingLLM 加註「自架 RAG 平台,非筆記 app」;(4) 第 5 章開頭新增「形式對照表」,呼應 v2.4 第 1 章四分法 > - v2.4 補入「AI 形式四分法」維度(獨立 app / 焊死進 IDE / 外掛塞進別人 app / 雲端服務);修正原表把 Cursor (焊死) 和 Cline / Aider (外掛) 混在同一類的錯誤歸類 > - v2.3 增補 Google Gemini 3.1 Pro 2M context 規格、Gemini CLI 原生運作機制與混合雲採購路徑 > **用途**:對外簡報 / 採購評估 > **標記體系**(內審用,定稿可移除): > - **[事實]** = 直接讀過 / 驗證過 > - **[推論]** = 沒驗證但有外部 source(必附驗證方法) > - **[猜測]** = 純推估(必附驗證方法) > - **[做了]** = 動作完成 / **[等待回應]** = 等決策 / **[過時]** = 標的已不適用 --- ## 目錄 1. Executive Summary 2. 6 層市場架構 3. 平台支援矩陣 4. 模型層深度比較 5. Coding Agent 平台深度檔案 6. 多模型策略 7. MCP 協議深度解析 8. Computer Use 深度解析 9. 專業軟體整合 10. 計費 / TCO 模型 11. 安全與合規 12. 採購決策框架 13. 風險矩陣 14. Roadmap 信號 15. 三家原廠生態系全圖(Anthropic / OpenAI / Google) 16. 知識管理 / 筆記 AI 工具(Obsidian 等) - 附錄 A. 標記體系說明 - 附錄 B. 驗證方法清單 - 附錄 C. 名詞 / 縮寫表 - 附錄 D. 參考資料 - 附錄 E. 用戶環境啟用狀態(內部用,呈報前移除) --- ## 1. Executive Summary(TL;DR) **[事實]** AI 寫程式 / AI 助理工具按 **「產品類別」** 維度分(這工具做什麼?): | 大類 | 形式 | 典型產品 | |---|---|---| | **聊天助理** | Web / 桌面 / 手機 | Claude.ai, ChatGPT, Gemini | | **Coding Agent**(原廠) | CLI / 桌面 / Web / IDE 擴充 | Claude Code, OpenAI Codex CLI, Gemini CLI, Jules | | **第三方 AI IDE**(焊死型)| fork VS Code 把 AI 焊死進去,拆不掉 | Cursor, Windsurf | | **AI 編程外掛**(外掛型)| 主編輯器(VS Code / JetBrains 等)本來沒 AI,外掛塞進去才有 | **GitHub Copilot**, Cline, Continue, Aider | | **自主 Agent / Computer Use** | 雲端 / 本地 agent | OpenHands, Devin, Manus, OpenAI Operator | | **API / SDK** | REST / 套件 | Anthropic API, OpenAI API, Google AI | **[事實]** 換維度按 **「AI 形式」**(AI 怎麼進到你電腦?)看,可分 4 種裝載形式(同一產品可能跨多形式): | AI 形式 | 跟主 app 的關係 | 例子 | |---|---|---| | **1. 獨立 app**(AI 自己就是 app) | 打開直接是 AI,不寄生在別人身上 | Claude.ai 網頁、Claude Desktop、**Claude Code CLI**、ChatGPT、**Gemini CLI**、Codex CLI | | **2. 焊死進整套 IDE**(一體成型) | 主 app 出廠就含 AI,拆不掉 | **Cursor**、Windsurf | | **3. 外掛塞進別人 app**(外掛型) | 主 app 本來沒 AI,後裝外掛才有 | VS Code / JetBrains + **GitHub Copilot**、VS Code + Cline / Continue / Aider、Obsidian + Copilot for Obsidian | | **4. 雲端服務 / API**(不在你電腦) | 透過瀏覽器、雲端 VM 或自己寫程式呼叫 API | Jules、Devin、Manus、Operator、Copilot cloud agent、Anthropic / OpenAI / Google API | **為什麼要兩個維度看**: - 「**產品類別**」回答:**這工具做什麼?**(聊天 / 寫程式 / 自主跑任務 / API) - 「**AI 形式**」回答:**我電腦上要怎麼裝、怎麼用?**(獨立 app / 焊死 / 外掛 / 雲端) 許多產品**跨多形式**:例如 GitHub Copilot = Coding Agent(類別)+ 外掛(形式)+ 雲端 agent(部分功能)三重身份;Claude Code 同時有獨立 CLI 形式、VS Code 外掛形式、Web 雲端形式。 **[事實]** AI coding 工具市場在 2024–2026 經歷三個結構性變化: 1. **協議標準化**:MCP(Model Context Protocol)2024-11 由 Anthropic 開放;2025 後 ChatGPT / Cursor / Gemini / Microsoft Copilot / VS Code 等已採用或整合,且 MCP 已移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF)治理 2. **Agent 化**:從「補完式 Copilot」轉向「自主 Agent」(Claude Code、Codex、Gemini CLI、Cursor Agent、Windsurf Cascade、Copilot cloud agent、OpenHands) 3. **多模型 Routing**:第三方 IDE 普遍支援 4+ 家 LLM;原廠工具仍以自家模型為主,但企業架構層面已很難只押單一供應商 **關鍵數據**(**[推論]** 業界普遍引用,**驗證方法**:搜「SWE-bench Verified leaderboard 2026」與各家官網): | 指標 | 2023 | 2026 | |---|---|---| | 頂級模型 SWE-bench Verified | ~10–20% | **70–80%+**(Claude Opus 4.x / GPT-5.x 級,需看當期 leaderboard)| | 主流 context window | 8k–32k | **200k 起,1M-2M 成為旗艦級規格**(Gemini 3.1 Pro 已達 2M tokens)| | MCP server 數量 | 0 | **10,000+ active public MCP servers**(Anthropic 2025-12 官方說法,仍需核驗口徑)| | Agent 自主完成 PR 比例 | <5% | **無統一公開指標**;簡單 issue 可顯著提升,但正式採購不應用固定百分比承諾 | **核心結論**: 1. **原廠工具以自家模型為核心**(Claude Code → Claude;Codex → OpenAI GPT/Codex 系;Gemini CLI → Gemini);**第三方工具**普遍支援 Claude / GPT / Gemini / OpenRouter / 本地模型 2. **手機端主要支援聊天與雲端任務查看**;本地 repo 編輯、測試、MCP、shell 權限仍以桌面 / IDE / CLI / 雲端 runner 為主 3. **MCP 協議** 是 2025–2026 最大變革,但「控制 Adobe / Unity / Blender」多屬社群 MCP 或腳本橋接,成熟度要逐項驗證 4. **混合模型工作流**(雙 agent 互審、多模型製圖管線、**Claude 推理+Gemini 掃描**)成為頭部團隊新常態 5. **採購已不只「買哪個工具」,而是「組哪一條 stack」**:模型層 + Agent 平台層 + MCP 擴充層 + 觀測層 --- ## 2. 6 層市場架構 **[事實]** 從技術棧角度,AI coding 生態可剝為 6 層,採購決策需各層獨立思考: ``` ┌─────────────────────────────────────────┐ │ Layer 6: 觀測 / 治理 (LangSmith/Helicone)│ ├─────────────────────────────────────────┤ │ Layer 5: 工作流編排 (n8n/Temporal/自製) │ ├─────────────────────────────────────────┤ │ Layer 4: Agent / IDE 平台 │ │ ├─ 原廠: Claude Code / Codex CLI / │ │ │ Gemini CLI / Jules │ │ ├─ 第三方: Cursor / Windsurf / Cline │ │ ├─ 自主: OpenHands / Devin / Manus │ │ └─ Agent SDK: 自製 │ ├─────────────────────────────────────────┤ │ Layer 3: 工具 / MCP 擴充層 │ │ ├─ 檔案/Git/通訊/雲服務/設計/3D 等 │ ├─────────────────────────────────────────┤ │ Layer 2: 模型路由 (OpenRouter/Portkey) │ ├─────────────────────────────────────────┤ │ Layer 1: 模型 API │ │ ├─ Anthropic / OpenAI / Google │ │ ├─ AWS Bedrock / GCP Vertex │ │ └─ 開源: Llama / Qwen / DeepSeek │ └─────────────────────────────────────────┘ ``` **對採購的意涵**: - 多數企業誤把「選工具」當作 Layer 4 一層決策;實際上 **Layer 1 + Layer 4 是兩個獨立決策** - Layer 2(路由層)是新興必要層 — 規模 10+ 團隊應預先設計,避免後期切換成本 --- ## 3. 平台支援矩陣 **[事實]** 各產品的桌面 / 手機支援: | 產品 | Win | Mac | Linux | iOS | Android | Web | |---|---|---|---|---|---|---| | **Claude.ai**(聊天) | – | – | – | – | – | | | **Claude Desktop**(聊天) | | | **[推論]**| – | – | – | | **Claude Mobile**(聊天) | – | – | – | | | – | | **Claude Code CLI** | | | | | | – | | **Claude Code 桌面** | | | **[推論]**| | | – | | **Claude Code Web** | – | – | – | (限 web) | (限 web) | | | **VS Code 擴充**(Anthropic) | | | | | | – | | **JetBrains 擴充**(Anthropic) | | | | | | – | | **OpenAI Codex CLI** | | | | | | – | | **Gemini CLI**(Google) | | | | | | – | | **Cursor**(第三方 IDE) | | | | | | – | | **Windsurf**(第三方 IDE) | | | | | | – | | **Cline**(VS Code 擴充) | | | | | | – | **驗證方法**:[推論] Linux 桌面支援 — 上各家官網 download 頁確認 **桌面 vs 手機關鍵 takeaway**: - **Windows / Mac 桌面**:所有產品基本全可用,無重大缺項 - **iOS / Android 手機**:僅支援聊天類產品,**所有 coding agent 不支援** - **Linux**:開源 / CLI 類完整支援;原廠桌面 app **[推論]** 多無原生版 - **跨裝置同步**:原廠帳號內同條線(聊天 / 寫 code)對話互通;不同條線**不互通**(iOS 聊天不會看到桌面 Coding Agent 對話歷史) --- ## 4. 模型層深度比較(Layer 1) ### 4.1 Anthropic Claude 系列 **[事實]** 公開官方線(2026-05-02 抽樣核驗;採購前仍以 claude.com/pricing 與 Claude docs 為準): | 模型 | Model ID | Context | Output | 推理模式 | |---|---|---|---|---| | Claude Opus 4.7 | `claude-opus-4-7` | **1M tokens**(官方稱旗艦 / coding / agents) | 依 API 限制 | Extended Thinking | | Claude Sonnet 4.6 | `claude-sonnet-4-6` | **1M tokens beta**(API)| 依 API 限制 | Extended Thinking | | Claude Haiku 4.5 | `claude-haiku-4-5` | 依 API 限制 | 依 API 限制 | 輕量 / 速度 | **[事實]** 計費(claude.com/pricing,USD / MTok): | 模型 | Input ($/MTok) | Output ($/MTok) | Cache 寫入 | Cache 讀取 | |---|---|---|---|---| | Opus 4.7 | $5 | $25 | $6.25 | $0.50 | | Sonnet 4.6 | $3 | $15 | $3.75 | $0.30 | | Haiku 4.5 | $1 | $5 | $1.25 | $0.10 | **關鍵特性**: - **Prompt Caching**(**[事實]** Anthropic 文件):5-min TTL,cache hit 讀取費降 **90%** - **Extended Thinking**:可指定推理 token budget,複雜任務可達 64k+ thinking tokens - **Tool Use 並行**:單次回應可發起多個 tool calls ### 4.2 OpenAI GPT 系列(更新至 2026-05) **[事實]/[推論]**(**驗證方法**:developers.openai.com/api/docs/models + openai.com/api/pricing;不同帳戶 rollout 可能不同): | 模型 | Context / Output | 強項 | 計費 | |---|---|---|---| | **GPT-5.5** | 1M / 128k | 最新旗艦;複雜 reasoning、agentic coding、professional work | $5 input / $30 output | | **GPT-5.5 Pro** | **[推論]** 同系 | 最高準確度 / 高難度推理 | $30 input / $180 output(API rollout 需確認)| | **GPT-5.4** | **[推論]** 400k–1M | 成本較低的旗艦級工作模型 | $2.5 input / $15 output | | **GPT-5.4 mini** | **[推論]** 400k 級 | coding / computer use / subagents 的成本平衡 | $0.75 input / $4.5 output | | **GPT-5.4 nano** | **[推論]** 128k+ | 高吞吐 / 低延遲 / batch | $0.10 級以下需查 pricing | | **GPT-5.2-Codex** | 400k / 128k | Codex / agentic coding 優化 | $1.75 input / $14 output | | GPT-5、GPT-4.1、4o | 依模型 | legacy / 過渡 | 新採購不建議作基準 | **關鍵特性**: - **Reasoning effort**:GPT-5.x 系列可調 reasoning effort;成本和 latency 需按任務類型測 - **Predicted Outputs**:預測輸出加速,編輯任務 latency 降 30–50% - **Prompt Caching**:快取輸入通常較標準輸入便宜,具體折扣按模型定價表 - **Codex**:已不只是 CLI;官方 docs 有 CLI / IDE extension / Web / App / GitHub Action / MCP / hooks / skills / subagents 等線 - **Agents SDK / Agent Builder / Apps SDK**:OpenAI 自製 agent 與 ChatGPT app 生態的核心入口 - **Realtime API**:低延遲語音/即時對話 - **MCP / Connectors**:Responses API 支援 remote MCP servers 與 OpenAI 維護的 connectors(Gmail、Drive、Dropbox、SharePoint 等) ### 4.3 Google Gemini 系列(更新至 2026-05) **[事實]/[推論]**(**驗證方法**:ai.google.dev/gemini-api/docs/gemini-3 + models 頁;3.x 多為 preview): | 模型 | Context / Output | 強項 | |---|---|---| | **Gemini 3.1 Pro Preview** | **2M / 64k** | 複雜 reasoning、多模態、2.1M token 巨量 Context、agentic / coding | | **Gemini 3 Flash Preview** | 1M / 64k | Pro 級智能 + Flash 成本 / 速度 | | **Gemini 3.1 Flash-Lite Preview** | 1M / 64k | 高吞吐、成本效率(1/10 Sonnet 成本級別) | | Gemini 2.5 Pro / Flash / Flash-Lite | 1M+ | 生產可用性通常比 3.x preview 穩,需看當期模型頁 | | **Nano Banana** | 圖像 | Gemini 2.5 Flash Image,低延遲圖像生成 / 編輯 | | **Nano Banana Pro** | 圖像 | Gemini 3 Pro Image Preview,高品質文字渲染 / 專業素材 | | **Nano Banana 2** | 圖像 | Gemini 3.1 Flash Image Preview,高效率 / 低價位圖像線 | | **Veo 3.x** | 影片 | 文字 / 圖像 → 影片,價格與可用區域需逐項查 | **關鍵特性**: - **超大 context (2M)** — Gemini 3.1 Pro 在 Vertex AI/AI Studio 已開放 2.1M tokens,適合跨多個微服務 Repo 進行全局重構。 - **Linear Attention 優化** — 底層技術確保在 1M+ token時的檢索準確率(Needle In A Haystack)仍接近 100%。 - **多模態原生應用** — - **影片 Bug 定位**:直接讀取「復現螢幕錄影」,自動匹配 Console Log 執行 Root Cause 分析。 - **Nano Banana 2 參考圖模式**:從 UI 原型截圖直接產出 Tailwind/CSS 佈局代碼。 - **計費最低候選** — Flash-Lite 為大規模索引(Indexing)與基礎 Linting 任務的首選。 - **Workspace 整合** — Docs / Sheets / Slides / Gmail 內 Gemini 嵌入。 - **Preview caveat** — 3.x preview 模型適合試點;嚴格 SLA / 回歸穩定性需用固定 model version。 ### 4.3.1 Nano Banana 詳細(2026-05 最新) **[事實]** Google 文件已將 Nano Banana 作為 Gemini 原生圖像生成 / 編輯能力的產品命名使用,不再稱之為社群綽號。 **版本演進**(**驗證方法**:ai.google.dev/gemini-api/docs/nanobanana): | 版本 | 別名 | 特性 | |---|---|---| | Nano Banana | Gemini 2.5 Flash Image | 快速、便宜、適合大量圖像生成 / 編輯 | | Nano Banana Pro | Gemini 3 Pro Image Preview | 專業素材、複雜指令、文字渲染更強 | | Nano Banana 2 | Gemini 3.1 Flash Image Preview | 高效率、低價位、適合高吞吐圖片工作流 | **對標**: - OpenAI **GPT-Image-1** — 高解析、文字渲染強 - Black Forest Labs **Flux Kontext** — 開源編輯模型 - Adobe **Firefly** — 設計生態整合 ### 4.4 Benchmark 對照 **驗證方法**:上 https://www.swebench.com / Aider leaderboard / LMArena 看當前排行 | 模型 | SWE-bench Verified | Aider Polyglot | LMArena Coding | |---|---|---|---| | Claude Opus 4.7 | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier | | GPT-5.5 / GPT-5.2-Codex | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier | | Gemini 3.1 Pro Preview | **[推論]** 第一梯隊 / preview | **[推論]** 需看當期榜 | top tier | | 開源(Qwen / DeepSeek) | **[推論]** 40–60% | **[推論]** 50–65% | mid-tier | **[推論]** 結論:頂級閉源模型在 coding benchmark 上仍快速輪替;簡報不宜寫死單一百分比,正式採購應以當週 SWE-bench / Aider / LMArena + 自家私有 repo eval 共同判斷。 --- ## 5. Coding Agent 平台層深度檔案(Layer 4) > **形式對照表**(呼應第 1 章 AI 形式四分法;同一工具可能跨多形式): > > | # | 工具 | AI 形式 | host / 部署 | > |---|---|---|---| > | 5.1 | Claude Code | **獨立 app** + **外掛型** | CLI / 桌面 / Web + VS Code / JetBrains 擴充 | > | 5.2 | OpenAI Codex CLI | **獨立 app** + **外掛型** + **雲端** | CLI + IDE 擴充 + Web / App / GitHub Action | > | 5.3 | Gemini CLI | **獨立 app** | CLI(可接 GitHub Actions)| > | 5.4 | Jules | **雲端服務** | GitHub 整合 → Google Cloud VM | > | 5.5 | Cursor | **焊死型 IDE** | fork VS Code | > | 5.6 | Windsurf | **焊死型 IDE** | 自家 IDE | > | 5.7 | Cline | **外掛型** + **獨立 app** | VS Code / Cursor / JetBrains 擴充 + CLI | > | 5.8 | Continue.dev | **外掛型** | VS Code / JetBrains 擴充 | > | 5.9 | Aider | **獨立 app** | CLI | > | 5.10 | GitHub Copilot | **外掛型** + **獨立 app** + **雲端** | VS Code / JetBrains / Vim / Visual Studio 擴充 + CLI + cloud agent | > | 5.11 | OpenHands | **獨立 app** + **雲端** | 自架 / Docker / 雲端 sandbox | > | 5.12 | Devin | **雲端服務** | 商用 VM sandbox | > | 5.13 | Manus | **雲端服務** | 通用 agent,coding 為子集 | > | 5.14 | OpenAI Operator | **雲端服務** | 瀏覽器自動化(Computer Use)| ### 5.1 Claude Code(Anthropic) **[事實]** 部署形式:CLI / 桌面 / Web (claude.ai/code) / VS Code 擴充 / JetBrains 擴充 **核心架構**: - **Tool 系統**:Read / Write / Edit / Glob / Grep / Bash / WebFetch / WebSearch / Agent (subagent) / Task / Schedule 等內建 - **Sub-agent 系統**:可開 specialized agent(如 Explore、Plan、code-reviewer)並行任務 - **Hooks 系統**:PreToolUse / PostToolUse / UserPromptSubmit / Stop 等事件 hook - **Skills 系統**:可重複呼叫的指令包,slash command 觸發 - **MCP 原生支援**:可裝任意 MCP server - **Plan Mode**:先產 plan、用戶確認再執行 - **模型 / 速度模式**:依帳號方案與當期 rollout 切換 Opus / Sonnet / Haiku;高速模式與費率需看當期產品頁 **獨家優勢**: - **Memory 系統**:自動保存 user / feedback / project / reference 4 類記憶跨對話持久化 - **Hooks**:第三方 IDE 多無此細粒度事件鉤 - **Sub-agent 隔離**:可用 worktree 隔離分支實驗 **限制**: - **單一模型** — 鎖 Claude(Opus / Sonnet / Haiku 三模型可切換) - **無原生 IDE 體驗**(VS Code 擴充為 panel 形式) ### 5.2 OpenAI Codex CLI **[事實]** 2025 推出對標 Claude Code;到 2026 已形成 **CLI / IDE extension / Web / App / GitHub Action / SDK / MCP server** 多入口產品線。 **核心功能**(**驗證方法**:developers.openai.com/codex): - **本地 agent loop**:CLI 在本機讀檔、改檔、跑命令;模型推理走 Responses API / ChatGPT Codex endpoint - **Approval modes**:suggest / auto-edit / full-auto 類型模式控制人工介入程度 - **模型線**:GPT-5.2-Codex / GPT-5.5 / GPT-5.x 系;可接 Responses-compatible endpoint,含本地 gpt-oss 場景 - **MCP / hooks / skills / subagents / AGENTS.md**:官方 docs 已列為 Codex 配置與自動化能力 **獨家優勢**: - **OpenAI 生態整合**深 — Responses API、Agents SDK、Computer Use、Image / Video / Realtime 等工具線一致 - **ChatGPT / Codex 訂閱整合** — 對已採購 ChatGPT Team / Enterprise / Edu 的組織摩擦低 **限制**: - **模型供應商仍以 OpenAI 為主**;多模型 routing 需外接第三方或 Responses-compatible layer - **Windows 支援需逐版本驗證**;官方曾標示 macOS / Linux 優先、Windows 可能需 WSL 或專用支援頁 ### 5.3 Gemini CLI(Google) **[事實]** Google 2025-06 推出,定位為高效、開源的 terminal AI agent,與使用者協作完成複雜開發任務。 **核心特性**: - **運作邏輯:Research -> Strategy -> Execution**: - 不同於一般的 Chatbot,Gemini CLI 遵循開發生命週期。在執行修改前會先進入 **Plan Mode** 生成設計文件,確保架構符合專案規範。 - **外科手術式編輯(Surgical Edits)**: - 傾向使用精確的代碼替換(replace),而非重寫整個檔案,降低 Token 消耗並減少對無關代碼的干擾。 - **自主驗證與自我修復(Self-healing)**: - 修改後自動尋找並執行相關測試(npm test, pytest 等)。若驗證失敗,會自動進入修復循環直到通過。 - **Google Search 整合**: - 原生支援即時檢索最新的 API 文件或 StackOverflow 討論,解決模型知識切斷問題。 - **Gemini 2.5 / 3.x 模型線**:個人 Google 帳號可用高額免費額度;企業可接 AI Studio / Vertex AI key。 - **2M context 級別**:適合跨多個微服務 Repo 進行全局重構與大規模分析。 - **多模態原生**:影片(Bug 錄影)/ 圖片 / PDF 可直接作為分析 input。 - **Gemini CLI GitHub Actions**:把 CLI agent 放到 repo workflow 內做 issue triage / PR review / 背景任務。 **獨家優勢**: - **GCP 整合** — Vertex AI / Workspace / Drive 順暢調用。 - **成本領先** — Flash-Lite 系列為三家閉源模型中最便宜的高吞吐選項。 ### 5.4 Jules(Google) **[事實]** Google Labs 2025 推出並走出 beta;定位為非同步雲端 coding agent。 **核心特性**: - **GitHub 整合**:連 repo → Jules clone 到 Google Cloud VM → 擬定計畫 → 產 diff / PR - **完整 task 自動化**:對標 Devin / OpenHands - **VM 沙盒執行** - **Jules Tools / Jules API**:可接終端與內部系統 **戰略定位**:**雲端非同步 agent**(vs Claude Code 的本地互動式 agent) ### 5.5 Cursor(Anysphere) **[事實]** 規格(**驗證方法**:cursor.com/pricing + docs;2026 已改 usage-based,舊版「fast requests」口徑不再可靠): | 方案 | 月費 | 口徑 | |---|---|---| | Hobby(免費)| $0 | limited Agent / Tab | | Pro | $20 | frontier models + MCPs / skills / hooks + cloud agents | | Pro+ | $60 | Pro 的 3x OpenAI / Claude / Gemini 用量 | | Ultra | $200 | Pro 的 20x 用量 + priority | | Teams | $40/seat | shared chats / commands / rules + org privacy controls / SSO | **核心功能**: - **Agent / Composer**:多檔案同時編輯,diff preview 後 apply - **Tab 補完**:行內 / 多行補完 - **`@` 引用**:`@file` / `@folder` / `@web` / `@docs` / `@git` 精準注入 context - **`.cursorrules` / MDC**:專案規則檔,全域 inject - **Cloud agents / hooks / skills / MCPs**:2026 官方定價頁已列為 Pro 以上能力 **支援模型**:Claude / GPT / Gemini / o-系列 / 自管 API key **獨家優勢**: - **IDE 整合最深** — fork VS Code 而非擴充 - **多模型切換零摩擦** **限制**: - 訂閱不可轉 - 隱私 — 程式碼預設經 Cursor 伺服器,企業需 Privacy Mode ### 5.6 Windsurf(前 Codeium) **[事實]/[推論]** 規格(**驗證方法**:docs.windsurf.com / windsurf.com/pricing;2026-03 後自助方案改 usage-based): | 方案 | 特色 | |---|---| | Free | 入門限額 | | Pro / Max | 個人付費,依模型與用量給額度 | | Teams / Enterprise | 集中帳單、SSO / RBAC / admin dashboard、企業治理 | **核心功能**: - **Cascade**:對標 Cursor Composer 的 agent - **Supercomplete**:補完 + 推測下一步意圖 - **Memories / Rules / Workflows / Skills / AGENTS.md**:跨對話與 repo 規則管理 - **MCP / Cascade Hooks**:可接 stdio / Streamable HTTP / SSE;Teams/Enterprise 有 admin controls **獨家優勢**: - **Cascade 產品化早**,IDE 內 agent 體驗成熟 - **企業治理選項較完整**(從 Codeium 企業線延伸) ### 5.7 Cline(前 Claude Dev) **[事實]** 開源 AI coding agent,支援 VS Code / Cursor / JetBrains,也有 CLI。 **核心功能**: - **Plan / Act 雙模式**: - Plan mode:讀 code / 搜尋 / 討論策略,但不改檔、不執行命令 - Act mode:執行 tool - **MCP 原生支援** - **`.clinerules`**:專案規則檔 - **Auto-approve 細粒度**:tool 確認設定 **支援模型**:Claude / GPT / Gemini / OpenRouter / Bedrock / Vertex / 本地(Ollama / LM Studio) **獨家優勢**: - **完全開源** + **支援本地模型** + **MCP 原生** = **隱私敏感場景首選** - **Plan / Act 雙模**為其他工具罕見 ### 5.8 Continue.dev **[推論]** 開源 VS Code / JetBrains 擴充。 **核心功能**: - **Indexer**:本地索引 repo - **Custom commands**:YAML 設定自定 slash command - **多模型 routing**:autocompletion vs chat 可分配不同模型 **戰略定位**:**比 Cline 更輕量**,較不像 agent,更像「強化版 Copilot」 ### 5.9 Aider(開源 CLI) **[事實]** 開源、CLI、社群驅動。 **核心架構**: - **Repo-map**:用 tree-sitter 解析整個 repo,**將 100k 檔案 repo 壓縮為 ~20k tokens** 結構摘要(**驗證方法**:aider.chat/docs/repomap.html) - **Git auto-commit**:每次 agent 變更自動 commit - **Voice coding**:語音輸入支援 - **Model 切換**:CLI flag 即可切換 Claude / GPT / Gemini / 本地 **獨家優勢**: - 完全開源,企業可 fork 客製 - **Repo-map 演算法**為業界最成熟 ### 5.10 GitHub Copilot **形式**:**外掛型** + **獨立 app**(CLI)+ **雲端 agent** 三重身份(裝在 VS Code / JetBrains / Vim / Visual Studio / GitHub.com 等多種 host) **[事實]** 規格(**驗證方法**:docs.github.com/copilot;2026 起 pricing / billing 口徑正在轉 usage-based): | 方案 | 月費 | 特色 | |---|---|---| | Free | $0 | 有限 chat / 補完 / agent 功能 | | Pro | $10 | 個人付費,含 premium requests 與 cloud agent | | Pro+ | $39 | 更多 premium requests / 高階模型 | | Business | $19/seat | 中央政策、組織管理、cloud agent | | Enterprise | $39/seat | Business + enterprise-grade 功能 | **核心定位**:從「補完 + Chat」升級為 GitHub 內建 agent 平台;**Copilot coding agent 2025-09 GA**,可背景開 draft PR;**Copilot CLI 2026-02 GA**,可在 terminal 規劃、改檔、跑測試。 **外部工具 / 擴充生態**(**[推論]**,**驗證方法**:docs.github.com/copilot/customizing-copilot + GitHub Marketplace「Copilot Extensions」分類;partner 清單以 Marketplace 即時為準,常見 partner 隨時異動): - **Copilot Extensions / Apps**(2024-09 GA):第三方應用在 Copilot Chat 用 `@app` 呼叫;代表性合作方含 **Stripe、Sentry、Atlassian (Jira / Confluence)、Microsoft (Teams / Loop)、DataStax、Heroku、Octopus Deploy、LaunchDarkly、Docker、MongoDB** 等 - **擴充開發兩種模式**: - **GitHub App**(自架後端,自由度高)— 複雜業務邏輯、自家認證 - **Skillsets**(GitHub 託管,描述式)— OpenAPI / 工具描述即可,免自架 - **MCP client 支援**(2025 後):VS Code Copilot Chat 已加入 MCP 支援,可裝任意 MCP server,跟 Cursor / Claude Code / Cline 同生態 - **Copilot Spaces**(2024-12):圈一組 repo / files / docs 為對話 context 基準 - **Custom Instructions / `.github/copilot-instructions.md`**:repo 級規則檔,類似 `.cursorrules` / `.clinerules` **獨家優勢**: - GitHub 生態深整合(PR、issues、Actions) - Enterprise 採購最容易(多數公司已有 GitHub 訂閱) - **唯一同時提供「IDE 擴充 + 獨立 CLI + 雲端 agent + 擴充生態」全套** 的工具 **限制**: - **模型主要為 OpenAI / Anthropic 等 GitHub 簽約供應商**,不像 Cline / Cursor 可自管 API key 接百家 - **Extensions vs MCP 雙生態並存**:部分功能重疊(外部工具呼叫),企業需在兩條線之間做技術選型 - **效益綁 GitHub repo 工作流**:沒在 GitHub 上的場景(GitLab / Bitbucket / 內部 git server)效益打折 ### 5.11 OpenHands(前 OpenDevin) **[推論]** 開源自主 SWE agent,社群驅動。 **核心特性**: - **SWE-bench 常勝軍**(**驗證方法**:swebench.com 排行) - **完整 agent loop**:感知 → 規劃 → 執行 - **多 backend 支援**:Claude / GPT / Gemini / 本地 - **Docker 沙盒執行** **戰略定位**:**對標 Cognition Devin 的開源版本** ### 5.12 Devin(Cognition) **[推論]** 商用自主 SWE agent,引爆 2024 「AI 軟體工程師」討論。 **核心特性**: - **完整任務自主**:assign 一個 issue 從頭做到開 PR - **VM 沙盒** - **企業訂閱** **[推論]** 限制:價格高(**驗證方法**:cognition.ai/pricing);**體驗成熟度爭議** ### 5.13 Manus(蝴蝶效應) **[推論]** 中國團隊 2025 推出的通用 agent,coding 為其中一個能力。 **核心特性**: - 通用 agent(不限於 coding) - 雲端非同步任務 - **2025 病毒級爆紅** ### 5.14 OpenAI Operator **[推論]** 2025 Jan 推出,OpenAI 官方 Computer Use 產品。 **核心特性**: - **瀏覽器自動化** agent - **GPT 系列驅動** - **訂閱 ChatGPT Pro 用**(**驗證方法**:openai.com/operator) **戰略定位**:**對標 Anthropic Computer Use API + Browserbase** --- ## 6. 多模型策略(Layer 2) ### 6.1 為什麼需要 Routing 層 **[推論]** 原因(**驗證方法**:搜當期 SWE-bench / LMArena / 各家官網): | 任務 | 最適模型 | 為什麼 | |---|---|---| | 架構設計討論 | Claude Opus 4.7 | reasoning + 長文一致性 | | 大量重複編輯 | GPT-5.4 mini / Claude Sonnet 4.6 / Haiku 4.5 | 速度 + 便宜 | | 超長 context(>500k) | **Gemini 3.1 Pro Preview (2M)** | context 最大 | | 數學 / 演算法 | GPT-5.5 / Gemini 3.x reasoning mode | 推理深度 | | 圖像理解 | Gemini 3 Pro / GPT-5.x(多模態) | 多模態原生 | | Cost-sensitive batch | Haiku 4.5 / Gemini 3.1 Flash-Lite | 便宜 5–10x | ### 6.2 工具支援多模型對照 | 工具 | Claude | GPT | Gemini | 本地 | 其他 | |---|---|---|---|---|---| | Claude Code(全形式) | | | | | – | | OpenAI Codex CLI | | | | | – | | Gemini CLI | | | | | – | | Cursor | | | | **[推論]** | – | | Windsurf | | | | | – | | Cline | | | | Ollama 等 | OpenRouter 接百家 | | Continue.dev | | | | | OpenRouter | | Aider | | | | | OpenRouter | ### 6.3 Routing 工具對照 | 工具 | 形式 | 計費 | 強項 | |---|---|---|---| | **OpenRouter** | API 中介 | +5% markup | 一個 key 接百家 | | **Portkey** | Gateway + 觀測 | 訂閱 + token | 企業治理 / 觀測 | | **LiteLLM** | 開源代理 | 自架免費 | 自管基礎建設 | | **Anthropic / OpenAI Native** | 直連 | 各家計費 | 無中介費 + 最低 latency | **[推論]** 實作建議:團隊 10 人以下用 OpenRouter;30 人以上考慮自架 LiteLLM 或 Portkey ### 6.4 Fallback 策略 **[推論]** 業界常見模式: ``` Primary: Claude Opus 4.7 ↓ (rate limit / error) Fallback1: Claude Sonnet 4.6 ↓ (still failing) Fallback2: GPT-5.4 / GPT-5.4 mini ↓ (last resort) Fallback3: Gemini 3.1 Flash-Lite ``` --- ## 7. MCP 協議深度解析(Layer 3) ### 7.1 技術架構 **[事實]** MCP 是基於 **JSON-RPC 2.0** 的協議,定義 client / server 通訊。 **核心概念**: - **Server**:暴露 tools / resources / prompts - **Client**:發起呼叫(Claude Desktop / Code / Cursor 等) - **Transport**:STDIO(本地進程)/ SSE(Server-Sent Events,遠端)/ Streamable HTTP(2025 spec 已列) - **Auth**:HTTP transport 有授權框架;STDIO 通常透過本機環境變數或外部配置取憑證 **Handshake 流程**: ``` Client → Server: initialize { protocolVersion, capabilities } Server → Client: initialize-response { capabilities, serverInfo } Client → Server: tools/list Server → Client: { tools: [...] } Client → Server: tools/call { name, arguments } Server → Client: { content: [...] } ``` **[事實]** 2025-12 Anthropic 宣布將 MCP 捐給 Linux Foundation 旗下 AAIF;官方稱 MCP 已被 ChatGPT、Cursor、Gemini、Microsoft Copilot、VS Code 等採用,並有 10,000+ active public MCP servers。此數字是生態口徑,不等於「10,000 個皆可安全上 production」。 ### 7.2 主流 MCP server 詳細對照 **[推論]**(**驗證方法**:官方 MCP Registry / mcp.so / Smithery / 各廠商 docs;維護方與安全狀態需逐項確認): #### 早期 reference / 常見基礎類 | Server | 用途 | 配置複雜度 | |---|---|---| | filesystem | 讀寫指定路徑 | 低 | | git | 本地 git 操作 | 低 | | github | issues / PR / repos | 中(OAuth)| | google-drive | 雲端硬碟 | 中(OAuth)| | slack | 訊息 / 頻道 | 中(OAuth)| | postgres | SQL 查詢 | 中 | | puppeteer | headless Chrome | 高(瀏覽器依賴)| | brave-search | Web 搜尋 | 低(API key)| | memory | 鍵值記憶 | 低 | | sequentialthinking | 思考鏈 | 低 | #### 第三方 / 官方 | Server | 維護方 | 用途 | |---|---|---| | **figma** | Figma 官方 | 讀設計檔 / 轉 code | | **stripe** | Stripe 官方 | 支付 / 訂閱 | | **sentry** | Sentry 官方 | 錯誤追蹤 | | **cloudflare** | Cloudflare 官方 | DNS / Workers / R2 | | **notion** | **[推論]** 官方 | 筆記讀寫 | | **linear** | 社群 / 官方 | issue 追蹤 | | **blender-mcp** | ahujasid(社群) | 3D 建模 | | **playwright-mcp** | Microsoft | 跨瀏覽器自動化 | | **browserbase** | Browserbase | 雲端 headless 瀏覽器 | ### 7.3 MCP 安全考量 **[事實]** - MCP server 跑在**本機**(STDIO 模式)— 有完整檔案 / 網路存取權 - **未經審計的 MCP server = 等於跑陌生 binary** - 企業部署應**白名單**,禁止使用者隨意 `pip install` / `npm install` - Remote MCP / connectors 要把 OAuth scope、token refresh、審計 log 納入資安設計 **[推論]** 風險: - 惡意 server 可竊取 API key、檔案、私鑰 - Tool output prompt injection:工具回傳內容可能誘導 agent 執行不該做的命令 - 已有 MCP / coding agent supply-chain 相關報導(**驗證方法**:搜「MCP security incident 2025」「Gemini CLI vulnerability 2025」) --- ## 8. Computer Use 深度解析 ### 8.1 架構 **[事實]** Anthropic Computer Use API 流程: ``` 1. Claude 呼叫 computer tool: { action: "screenshot" } 2. Sandbox 截圖回傳給 Claude 3. Claude 分析畫面,決定下一步: { action: "left_click", coordinate: [x, y] } 4. Sandbox 執行點擊 5. 重複 1–4 直到任務完成 ``` **支援動作**(**[事實]**): - screenshot - mouse_move / left_click / right_click / middle_click / double_click - left_click_drag - key(組合鍵)/ type - scroll - cursor_position ### 8.2 Sandbox 部署 **[推論]** 生產部署選項: - **本機 Docker**:開發測試 - **Browserbase / Anchor Browser**:雲端 headless(**驗證方法**:browserbase.com/computer-use) - **AWS / GCP VM**:自建 ### 8.3 已知失敗模式 **[推論]**(業界 2025 共識): | 失敗模式 | 原因 | 緩解 | |---|---|---| | **點錯位置** | 模型 grounding 不夠精確 | 加 zoom / OCR pre-process | | **無限迴圈** | 看不出任務已完成 | 加 max_steps + 完成判斷 | | **誤操作** | 點到關閉 / 刪除按鈕 | 沙盒隔離 + dry-run mode | | **速度慢** | 每步驟都要截圖 + 推理 | 預期 10–30 秒/步驟 | **[推論]** 適用場景判斷: - 老桌面軟體無 API - 網頁 QA 自動化 - 高頻重複任務(成本太高) - 需要 1 秒內回應的 UI 流程 --- ## 9. 專業軟體整合 — 分項成熟度 **[推論]**(**驗證方法**:mcp.so 各 server 頁面 + 該軟體 scripting 文件): | 軟體 | 底層 API | 主流 MCP server | 成熟度 | 限制 | |---|---|---|---|---| | **Adobe Photoshop** | UXP / ExtendScript | 社群多版(如 photoshop-mcp)| | UXP 需 PS 25+ | | **Adobe Premiere** | ExtendScript / UXP | premiere-mcp(社群)| | 部分功能 UXP 未補齊 | | **Adobe After Effects** | ExtendScript / UXP | ae-mcp(社群)| | 渲染慢 | | **Adobe Illustrator** | UXP / ExtendScript | illustrator-mcp(社群)| | 同 PS | | **Unity** | C# Editor API + Python | unity-mcp(社群多版)| | 需 Editor 開啟 | | **Unreal Engine** | Python + Blueprint | unreal-mcp(社群)| | 較新,文件少 | | **Blender** | Python | **blender-mcp**(ahujasid)| | 強推 | | **Figma** | Plugin API | **官方 figma-mcp** | | 官方支援 | | **Sketchup** | Ruby API | sketchup-mcp(社群)| | 冷門 | | **AutoCAD** | LISP / .NET | autocad-mcp(**[推論]** 社群)| | 不確定活躍度 | | **DaVinci Resolve** | Python API | resolve-mcp(**[推論]** 社群)| | 影片剪接替代 | | **Ableton Live** | Max for Live / Python | **ableton-mcp**(ahujasid)| | 音樂製作 | ### 9.1 多模型製圖管線(2026 最新) **[推論]** 2025–2026 LLM 主導圖像 / 影片生成的標準工作流(**驗證方法**:搜「multi-model image pipeline 2026」): ``` [Agent 層: Claude Code / Codex CLI / Gemini CLI] ↓ 寫 prompt [概念圖] Midjourney v7 / Flux Pro / Imagen 4 / GPT-Image-1 ↓ [編輯層] Nano Banana Pro / Nano Banana 2 / Flux Kontext / GPT-Image-1 edit ↓ [高解析] Magnific / Topaz / Recraft ↓ [後製] Photoshop MCP / Figma MCP(自動圖層 / 字幕) ↓ [影片合成] Premiere MCP / Sora / Veo 3.x ↓ [語音/字幕] ElevenLabs / OpenAI TTS / Gemini Live ``` **[推論]** 2026 最熱組合: - **多輪保人物編輯** → Nano Banana Pro / Nano Banana 2(需按成本與 preview 狀態選) - **高解析文字渲染** → GPT-Image-1(招牌、海報) - **影片含音效 / 敘事** → Veo 3.x / Sora(逐區域與帳戶可用性驗證) - **開源可商用** → Flux Pro / Flux Kontext ### 9.2 雙 Agent 互審架構 **[推論]** 兩個 agent 並行,各做專長 + 互相 review: | 角色 | 強項 | |---|---| | 主筆 agent(如 Claude Code) | 主寫、長文 reasoning、規範遵循 | | 審稿 agent(如 OpenAI Codex CLI) | second opinion、quantitative 計算 | **驗證方法**:搜「multi-agent code review 2025」 --- ## 10. 計費深度模型(TCO) ### 10.1 Token 消耗量級 **[推論]** 典型 coding agent 任務 token 消耗: | 任務類型 | Input tokens | Output tokens | Cache hit 率 | |---|---|---|---| | 簡單修 bug | 5–20k | 1–5k | 20–40% | | 中型 feature | 30–100k | 10–30k | 40–60% | | 大型重構 | 200k–1M | 50k–200k | 60–80% | | 全 repo agent loop | 1M–10M+ | 200k–1M | 80%+ | ### 10.2 團隊規模 cost 模擬 **[推論]** 假設每位開發者每日 200k tokens、每月 20 個工作日;粗算採 70% input / 30% output、未計 prompt cache、未計工具費與 premium processing: | 團隊規模 | 月 tokens | 訂閱方案 cost | API 直連 cost(Sonnet 4.6)| API 直連 cost(Opus 4.7)| |---|---|---|---|---| | 1 人 | 4M | Pro/Max $20–100 | ~$26 | ~$44 | | 5 人 | 20M | $100–500 | ~$132 | ~$220 | | 10 人 | 40M | $200–1,000 | ~$264 | ~$440 | | 50 人 | 200M | $1,000–5,000 | ~$1,320 | ~$2,200 | **結論**: - **API 未必比訂閱貴**:Opus 4.7 $5/$25 後,低到中度使用者 API 可能比 Max 訂閱便宜 - **訂閱仍適合高互動重度使用者**:尤其需要 Claude.ai / Claude Code 共用額度、無需自管 key 與帳務 - **混合策略**:訂閱 cover 重度使用者 + API 跑 batch / CI 任務 ### 10.3 Hidden costs - **MCP server 維運**:自架雲端 server(如 Browserbase)月費 $50–500 - **觀測 / 治理**:Helicone / Langfuse / Portkey $50–500/月 - **訓練 / 採用曲線**:每位開發者 2–4 週 ramp-up,**隱性成本 $5k–10k** - **資安審計**:MCP server 白名單建立 + code review,**初期 1–2 人月** --- ## 11. 安全與合規 ### 11.1 資料流向 | 工具 | 程式碼上傳 | 訓練 opt-out | 留存期 | |---|---|---|---| | Claude Code(API)| 上傳 | 預設不訓練 | **[推論]** 30 天 | | Claude Code(Bedrock)| 同上但企業帳號 | 不訓練 | 由 AWS 控 | | Cursor | 上傳 | Privacy Mode 可關 | **[推論]** 視方案 | | GitHub Copilot | 上傳 | Business+ 不訓練 | **[推論]** 28 天 | | Cline / Aider | API key 直連 | 視 LLM 供應商 | 同 LLM | | 本地模型(Ollama) | 完全本地 | – | – | **驗證方法**:各家 trust center / privacy policy ### 11.2 Enterprise 功能 **[推論]** 大型企業必查 checklist: | 功能 | Claude Pro/Max | Claude Enterprise | Cursor Business | GitHub Copilot Enterprise | |---|---|---|---|---| | SSO / SAML | / | | | | | SCIM 用戶管理 | / | | | | | Audit logs | / | | | | | SOC2 Type II | | | | | | HIPAA / BAA | | **[推論]** | **[推論]** | | | 資料 region 選擇 | 限定 | | **[推論]** | | | 自管 KMS | | ]Bedrock)| | **[推論]** | ### 11.3 MCP 供應鏈風險 **[事實]** MCP server 跑在本機進程,等同於信任作者: - 應建立**內部白名單** - 禁止使用者隨意 `pip install` / `npm install` - 對 MCP server 做 **package signing** 驗證(**[推論]** 規範進行中) --- ## 12. 採購決策框架 ### 12.1 加權評分卡 **[推論]** 標準採購評估面向(10 分制): | 面向 | 權重 | Claude Code | Cursor | Cline | Copilot | |---|---|---|---|---|---| | 模型品質 | 20% | 9 | 9 | 8 | 7 | | 多模型靈活 | 15% | 3 | 9 | 10 | 5 | | Agent 能力 | 15% | 9 | 8 | 7 | 8 | | MCP 生態 | 10% | 9 | 8 | 9 | 7 | | IDE 整合 | 10% | 6 | 10 | 8 | 9 | | 企業合規 | 10% | 8 | 7 | 6 | 9 | | 成本效益 | 10% | 8 | 7 | 9 | 8 | | 學習曲線 | 5% | 6 | 9 | 7 | 9 | | 社群 / 文件 | 5% | 8 | 9 | 7 | 9 | **加權總分([推論]** 示例): - Claude Code: **7.6** - Cursor: **8.3** - Cline: **7.9** - Copilot: **7.6** **[推論]** 結論:**Cursor 在 IDE / 多模型彈性仍強**;Claude Code 在本地 agent 深度 / MCP / hooks 上強;Copilot 的優勢從「採購容易」擴大到 GitHub cloud agent / CLI。最終應按團隊 repo、審查流程、資安限制重算權重。 ### 12.2 三條採購路徑 | 路徑 | 條件 | 推薦組合 | 預期月成本(10 人)| |---|---|---|---| | **A. 原廠深度** | 重視 agent 深度、Hooks / Skills | Claude Pro/Max + VS Code 擴充 + 內部 MCP | $200–1,000 + API | | **B. 多模型靈活** | 重視避免 vendor lock-in | Cursor Teams/Enterprise + 自管 API key | $400 + usage | | **C. GitHub 內建** | 重視 PR / issue / Actions 流程 | GitHub Copilot Business/Enterprise + cloud agent | $190–390 + premium requests | | **D. 開源 + 本地** | 重視隱私、合規、可審計 | Cline + Ollama / 自管 API | API token $300–2,000 | | **E. 混合雲模式** | **效能與成本平衡** | **Claude Code (推理) + Gemini CLI (掃描/測試)** | **API 組合計費** | ### 12.3 場景化推薦 | 情境 | 推薦組合 | 月成本(個人)| |---|---|---| | **個人開發者**(重度)| Claude Max + VS Code 擴充 | $100 | | **多模型實驗者** | Claude Max + Cline(自管 API key) | $100 + token | | **設計 / 影音團隊** | Claude Max + Photoshop/Premiere MCP + 圖像生成 API | $100 + 圖像 API | | **遊戲開發** | Cursor Pro + Unity MCP + Blender MCP | $20 + token | | **大型遺留專案重構** | **Gemini CLI (2M context) + Jules** | **按量計費** | | **企業大型專案** | Anthropic API(Bedrock)+ 自製 Agent SDK | 按 token + AWS | --- ## 13. 風險矩陣 ### 13.1 技術風險 | 風險 | 機率 | 衝擊 | 緩解 | |---|---|---|---| | 模型錯誤導致 production bug | 高 | 高 | 強制 PR review + 測試 | | Agent 無限迴圈耗 token | 中 | 中 | max_steps + budget alert | | MCP server 供應鏈攻擊 | 低 | 高 | 白名單 + 簽章驗證 | | Computer Use 誤刪檔案 | 中 | 高 | 沙盒隔離 + dry-run | | Context 漏寫敏感資料 | 高 | 高 | secret scanning + .gitignore-like | ### 13.2 商業風險 | 風險 | 機率 | 衝擊 | 緩解 | |---|---|---|---| | 模型供應商漲價 | 高 | 中 | Layer 2 routing 預留切換 | | 工具廠商收購 / 倒閉 | 中 | 中 | 避免單押 | | 訓練資料外洩 | 低 | 高 | Enterprise 方案 + opt-out | | 員工技能單一供應商化 | 中 | 中 | 輪換工具培訓 | ### 13.3 合規風險 | 風險 | 影響行業 | 緩解 | |---|---|---| | GDPR 違規 | 歐盟業務 | Enterprise + region 選擇 | | HIPAA 違規 | 醫療 | BAA + Bedrock | | 智財權混淆 | 全行業 | Copilot Business+ / Cursor Business | | 出口管制 | 國際業務 | 模型 region + 用戶白名單 | --- ## 14. Roadmap 信號 **驗證方法**:追各家官方 blog / changelog + GitHub Releases | 趨勢 | 信號 | 影響時程 | |---|---|---| | MCP 標準化 | AAIF / Linux Foundation 治理;ChatGPT / Cursor / Gemini / Copilot / VS Code 採用 | 已進主流,2026 看治理與安全 | | Background / cloud agents | Codex Web/App、Jules、Copilot cloud agent、Cursor cloud agents | 已產品化,2026 看企業治理 | | 影片 / 多模態 agent | Sora / Veo / Gemini 3.x / Computer Use | 2026 全年 | | Local-first 模型 | Llama / Qwen 等開源 quality 追近 | 持續 | | Agent 治理層 | LangSmith / Helicone / Phoenix 競爭 | 2026 後加速 | | Code agent benchmark | SWE-bench Pro / Terminal-Bench / Aider / 私有 repo eval | 2026 H1 後常態化 | | 自主 SWE agent | Devin / Manus / OpenHands / Jules 競爭 | 2026 全年 | | Usage-based billing | Cursor / Windsurf / Copilot 等從請求數轉向 credits / usage | 2026 採購重點 | --- ## 15. 三家原廠生態系全圖(Anthropic / OpenAI / Google) > **本章定位**:跳出「單一工具」視角,按廠商盤點全家桶。採購談判、單一供應商深度綁定、跨家比較皆需此維度。 ### 15.1 Anthropic 生態系 **[事實]/[推論]**(**驗證方法**:anthropic.com/product / docs.claude.com): | 類別 | 產品 | 定位 | |---|---|---| | **模型** | Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5 | 旗艦推理 / 平衡 / 速度 | | **聊天 - Web** | Claude.ai | 主入口 | | **聊天 - 桌面** | Claude Desktop(Mac / Win) | 原生 app | | **聊天 - 手機** | Claude iOS / Android | 行動端 | | **Coding Agent** | Claude Code(CLI / 桌面 / Web / VS Code / JetBrains) | 5 種前端 | | **Agent SDK** | Claude Agent SDK | 自製 agent | | **協議** | **MCP**(協議發起者) | 行業標準 | | **自動化** | Computer Use API | GUI 控制 | | **特性層** | Hooks / Skills / Memory / Plan Mode / Sub-agent / Extended Thinking / Prompt Caching | Coding Agent 高階特性 | | **API** | Messages API / Files API / Batch API / Computer Use API | – | | **託管** | AWS Bedrock / GCP Vertex AI | 企業 | | **訂閱** | Free / Pro / Team / Enterprise;Max / premium seat 依區域與方案 | 個人 → 企業 | **生態系獨家強項**: - **Coding Agent 特性最深**(Hooks / Skills / Plan / Memory) - **MCP 發起者**,協議向心力強 - **長文 reasoning + 規範遵循** 業界第一梯隊 - **缺原生圖像 / 影片生成**(要靠第三方接 API) - **手機端僅聊天**,無 Coding Agent ### 15.2 OpenAI 生態系 **[事實]/[推論]**(**驗證方法**:openai.com / platform.openai.com): | 類別 | 產品 | 定位 | |---|---|---| | **模型 - 通用** | GPT-5.5 / GPT-5.5 Pro / GPT-5.4 / GPT-5.4 mini / nano | 旗艦多模態 / reasoning | | **模型 - coding** | GPT-5.2-Codex / GPT-5.x-Codex 線 | Codex / agentic coding | | **模型 - legacy** | GPT-5、GPT-4.1、GPT-4o | 過渡 / 存量 | | **模型 - 圖** | **GPT-Image-1**(API)/ DALL-E 3(legacy) | 文字→圖、編輯 | | **模型 - 影片** | **Sora**(1)/ **Sora 2**(**[推論]** 2025 推) | 文字→影片 | | **模型 - 語音** | TTS / Whisper / Voice mode | 文字↔語音 | | **聊天 - Web** | ChatGPT.com | 主入口 | | **聊天 - 桌面** | ChatGPT Desktop(Mac / Win) | 原生 app | | **聊天 - 手機** | ChatGPT iOS / Android | 行動端 | | **聊天 - 瀏覽器** | **ChatGPT Atlas / browser-side agent 能力**(**[推論]** 需按產品可用區確認) | 內建 ChatGPT | | **Coding Agent** | **Codex(CLI / IDE / Web / App / GitHub Action)** | 對標 Claude Code / Jules / Copilot agent | | **自動化 Agent** | **Operator**(2025-01 推) | 瀏覽器 / Computer Use | | **Agent 框架** | **Agents SDK / Agent Builder / Apps SDK** | 自製 agent / ChatGPT app | | **特性** | Memory / Custom GPTs / GPT Store / Tasks / Canvas / Projects | 多 | | **API** | **Responses API**(newer)/ Chat Completions(legacy)/ Realtime API / Files / Batch | – | | **託管** | Azure OpenAI Service | 微軟雲 | | **訂閱** | Free / Plus $20 / Pro $200 / Team / Enterprise / Edu | 多層 | **生態系獨家強項**: - **多模態最齊全**:文字 + 圖 + 影片 + 語音 全有原生 - **Sora 影片生成**業界領先 - **GPT Store** 第三方 GPT 應用市集 - **Operator** 是業界首批商用 Computer Use 產品 - **Coding Agent 起步晚但追趕快**,Codex 已補 CLI / IDE / Web / app / automation 線 - **MCP 支援是跟進方**,但 Responses API / connectors 已讓 OpenAI 進入 MCP 生態核心 ### 15.3 Google Gemini 生態系 **[事實]/[推論]**(**驗證方法**:ai.google.dev / gemini.google.com): | 類別 | 產品 | 定位 | |---|---|---| | **模型 - 旗艦** | **Gemini 3.1 Pro Preview** / Gemini 3 Pro / Gemini 2.5 Pro | **2M context** / 多模態 / coding | | **模型 - 速度** | Gemini 3 Flash Preview / 3.1 Flash-Lite Preview / 2.5 Flash | 便宜 / 高吞吐 | | **模型 - 圖** | **Imagen** / **Nano Banana** / **Nano Banana Pro** / **Nano Banana 2** | 純生成 + 編輯 | | **模型 - 影片** | **Veo 3.x** | 文字 / 圖像→影片 | | **模型 - 語音** | Gemini Live / Chirp(語音合成) | 即時對話 | | **聊天 - Web** | gemini.google.com | 主入口 | | **聊天 - 手機** | Gemini iOS / Android | 行動端 | | **聊天 - 桌面** | **[推論]** 主要走 web,無獨立 native app | – | | **Coding Agent - CLI** | **Gemini CLI** | **互動式 Agent (Research-Strategy-Execution)** | | **Coding Agent - IDE** | **Gemini Code Assist**(VS Code / JetBrains / GCP Cloud) | 對標 Copilot;整合 Project Astra 視覺能力 | | **自主 Agent** | **Jules** | 非同步 cloud coding agent,GitHub / VM / PR 工作流 | | **企業整合** | **Vertex AI Extensions** | **對接 BigQuery / 企業內部 API** | | **瀏覽器 Agent** | **Project Mariner**(**[推論]** 研究預覽) | 對標 Operator | | **多模態 Agent** | **Project Astra**(**[推論]** 研究預覽) | 即時相機+語音 agent | | **研究助手** | **NotebookLM** | 多源文件 RAG / Audio Overview | | **Playground** | **Google AI Studio**(aistudio.google.com) | Prompt 試驗 | | **Workspace 整合** | Docs / Sheets / Slides / Gmail / Drive 內嵌 Gemini | 辦公全套 | | **API** | Gemini API(個人)/ Vertex AI(企業) | – | | **託管** | Vertex AI(GCP) | 企業 | | **訂閱** | Free / Gemini Advanced $20 / Business / Enterprise | 多層 | **生態系獨家強項**: - **Context 最大**:**2M tokens** 領先業界,適合全局重構 - **Workspace 整合最深**:Docs / Sheets / Slides / Drive / Gmail 都嵌 Gemini - **Vertex AI Extensions**:可直接連動企業資料庫 (BigQuery) - **計費最低**:Flash-Lite 為三家最便宜 - **多模態原生最強**:影像理解 / Astra 即時相機視覺整合 - **生態整合度** 較分散(Jules / CLI / Code Assist 三條線) ### 15.4 三家對照(一張表) | 維度 | Anthropic | OpenAI | Google Gemini | |---|---|---|---| | **旗艦模型** | Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro Preview | | **Context 上限** | 1M | 1M(GPT-5.5)| **2M (Vertex/AI Studio)** | | **原生圖像生成** | | GPT-Image-1 / DALL-E | Imagen / Nano Banana | | **原生影片生成** | | Sora | Veo 3.x | | **原生語音** | | Realtime API | Live / Chirp | | **Coding Agent** | Claude Code(特性最深)| Codex(多入口)| Gemini CLI / Jules / Code Assist | | **Computer Use** | API(beta)| Operator(產品化)| Project Mariner(預覽)| | **MCP 角色** | **發起者 / AAIF 捐贈方** | 採用 / connectors | 採用 / SDK 支援 | | **企業託管** | AWS Bedrock / GCP Vertex | Azure OpenAI | GCP Vertex AI | | **Workspace 整合** | 弱 | Microsoft 365 Copilot **[推論]** | **強**(Google Workspace)| | **計費最低(Flash 級)**| Haiku 4.5 $1/$5 | GPT-5.4 nano / mini 線需查 pricing | **Flash-Lite (最高性價比)** | | **訂閱起步價** | Pro $20 | Plus $20 | Advanced $20 | **戰略含義**: - **要寫 code 深度**:Anthropic 生態最強(Claude Code + MCP) - **要多媒體生成**:OpenAI / Google 二選一,Anthropic 沒這層 - **要 Workspace 辦公整合**:Google 唯一選 - **要多模型靈活**:用第三方工具(Cursor / Cline)跨家接 --- ## 16. 知識管理 / 筆記 AI 工具(Obsidian 等) > **本章定位**:Coding 之外的「個人 / 團隊知識庫 + AI」工具線。專業團隊普遍同時部署 1 個 coding agent + 1 個知識管理工具。 ### 16.1 Obsidian + AI plugins(最熱筆記 + AI 組合) **[事實]** Obsidian 本身是免費 markdown 筆記 app(Mac / Win / Linux / iOS / Android),AI 能力靠**社群 plugin 接外部 LLM API**。 **主流 AI plugins**(**[推論]**,**驗證方法**:obsidian.md/community-plugins 搜「AI」): | Plugin | 功能 | 接哪家 LLM | |---|---|---| | **Smart Connections** | 語意搜尋 / 相關筆記推薦 / Chat with notes | OpenAI / 本地 embedding | | **Copilot for Obsidian** | 對話 / 改寫 / 摘要 / RAG | Claude / GPT / Gemini / Ollama | | **Text Generator** | 模板化生成 | OpenAI / Anthropic | | **Smart Composer** | inline 補完 | 多家 | | **Obsidian Web Clipper** + AI | 網頁→筆記 + 自動摘要 | – | | **Cubox / Readwise + Obsidian** | RSS / Highlights → 筆記 | – | **戰略定位**: - **完全本地優先** — 筆記檔案在你硬碟,AI 是外掛層 - **可接 MCP** — 部分 plugin 開始支援 MCP server(**[推論]** 2025 後) - **適合**:研究者 / 寫作者 / 個人知識庫 / 第二大腦 **對比 Notion AI**: - Obsidian = local-first + 自由插件 + 開源筆記庫 - Notion AI = SaaS + 內建 AI + 團隊協作 ### 16.2 Notion AI **[推論]** Notion 內建的 AI,2023 推出後持續擴充。 **核心功能**: - AI Writer(內建寫作 / 摘要 / 翻譯) - Q&A(問整個 workspace) - AI Connectors(接 Slack / GitHub / Drive 等查詢) - Notion Calendar AI **戰略定位**:團隊協作 + AI,**SaaS 重,本地輕** ### 16.3 NotebookLM(Google) **[事實]** Google 的 Gemini-powered 研究助手。 **核心功能**: - 上傳多源文件(PDF / Drive / 網址) - 對所有來源做 RAG 問答 - **Audio Overview**:自動生成兩人 podcast 解讀文件 - **Mind Map** / Study Guide / Briefing Doc **獨家**:Audio Overview 是 2024–2025 病毒功能 ### 16.4 其他 AI-first 筆記工具 **[推論]**(**驗證方法**:各官網): | 工具 | 特色 | |---|---| | **Mem.ai** | AI-first,自動 organize | | **Reflect Notes** | AI 啟發 / 自動連結 | | **Tana** | Graph + AI,類 Roam | | **Logseq** | 開源 + 本地,類 Obsidian | | **Capacities** | Object-based + AI | | **Roam Research** | 雙鏈筆記,無強 AI | | **Heptabase** | 視覺 + 卡片 + AI | | **AnythingLLM** | 自架本地 RAG(**非筆記 app**,是自架 RAG 平台,性質與上列筆記工具不同;列此供對照) | ### 16.5 個人工作流範例 **[推論]** 業界常見組合: | 場景 | 組合 | |---|---| | **個人研究 / 寫作** | Obsidian + Smart Connections + Copilot for Obsidian + Claude API | | **團隊文件 / 協作** | Notion AI + Slack / GitHub Connectors | | **論文 / 多源研究** | NotebookLM + Drive + Gemini | | **隱私敏感 / 本地** | Obsidian + Logseq + Ollama 本地模型 | | **第二大腦 + 公開分發** | Obsidian + Quartz publish + AI 自動摘要 | ### 16.6 與 Coding Agent 的整合 **[推論]** 2025 後趨勢: - **Obsidian → MCP server → Claude Code** — 從筆記庫拉 context 進 coding agent - **Notion → Claude.ai Connector** — 直接從 Claude.ai 查 Notion - **NotebookLM ↔ Drive ↔ Gemini CLI** — 全 Google 生態通 **驗證方法**:搜「Obsidian MCP server」/「Notion MCP」於 GitHub --- ## 附錄 A. 標記體系說明 | 標記 | 意義 | 是否需驗證方法 | |---|---|---| | [事實] | 直接讀過 / 驗證過 | 否 | | [推論] | 沒驗證但有外部 source | **必附** | | [猜測] | 沒驗證且無外部 source | **必附** | | [做了] | 動作完成 | 否 | | [等待回應] | 等決策 | 否 | | [過時] | 標的已不適用 | 否 | --- ## 附錄 B. 驗證方法清單彙整 | # | 待驗證項目 | 方法 | |---|---|---| | 1 | 各模型最新計費 | anthropic.com/pricing / platform.openai.com/pricing / ai.google.dev/pricing | | 2 | SWE-bench Verified 排行 | swebench.com | | 3 | LMArena 排名 | lmarena.ai | | 4 | MCP server 列表 | mcp.so / github.com/modelcontextprotocol/servers | | 5 | Cursor / Windsurf 訂閱細節 | cursor.com/pricing / codeium.com/pricing | | 6 | Claude Code 完整 docs | docs.claude.com/claude-code | | 7 | GPT / Gemini 模型規格 | platform.openai.com/docs / ai.google.dev/docs | | 8 | OpenAI MCP 支援聲明 | 搜「OpenAI MCP support 2025」官宣 | | 9 | Aider repo-map 細節 | aider.chat/docs/repomap.html | | 10 | Computer Use sandbox 設計 | docs.claude.com/computer-use | | 11 | Devin 定價 | cognition.ai/pricing | | 12 | OpenHands 排行 | swebench.com leaderboard | | 13 | Manus 現況 | 搜「Manus AI 2025」 | | 14 | OpenAI Operator | openai.com/operator | | 15 | Gemini CLI / Jules 現況 | ai.google.dev / jules.google.com | --- ## 附錄 C. 縮寫 / 名詞表 | 術語 | 解釋 | |---|---| | **Agent** | 自主呼叫工具、多步執行的 AI | | **MCP** | Model Context Protocol,AI ↔ 外部軟體標準協議 | | **Tool Use** | LLM 呼叫 function 的能力(OpenAI: function calling)| | **Computer Use** | 直接控制 GUI(截圖+滑鼠+鍵盤)的 API | | **Context Window** | 模型一次能處理的 token 數 | | **Prompt Caching** | 重複 prompt 部分的快取,降費降 latency | | **Extended Thinking** | Claude 內部 reasoning token,可控制深度 | | **Sub-agent** | 主 agent 開的子 agent,獨立 context | | **Hooks** | 工具事件 callback(如 Pre/PostToolUse)| | **Skills** | 可重用指令包(slash command 觸發)| | **MDC / Cursor Rules** | 專案級規則檔,自動注入 prompt | | **SWE-bench** | 真實 GitHub issue 修復 benchmark | | **TCO** | Total Cost of Ownership | | **OpenRouter** | 統一 API key 接百家 LLM 的中介 | | **LiteLLM** | 開源 LLM gateway / proxy | | **Bedrock** | AWS 託管 LLM 服務 | | **Vertex AI** | GCP 託管 LLM 服務 | | **Nano Banana** | Google Gemini 原生圖像生成 / 編輯能力的產品命名;含 Nano Banana、Nano Banana Pro、Nano Banana 2 等線 | --- ## 附錄 D. 核心參考資料 **[事實]** - Anthropic 官方文件:docs.claude.com - Anthropic Opus 4.7 / Sonnet 4.6 / Haiku 4.5 / pricing:anthropic.com/claude/opus、anthropic.com/claude/sonnet、anthropic.com/claude/haiku、claude.com/pricing - MCP 規範:modelcontextprotocol.io - MCP governance / AAIF:anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation - OpenAI Platform docs: platform.openai.com/docs - OpenAI models / pricing / Codex docs:developers.openai.com/api/docs/models、openai.com/api/pricing、developers.openai.com/codex - Google AI docs: ai.google.dev - Google Gemini 3 / Nano Banana / Gemini CLI / Jules:ai.google.dev/gemini-api/docs/gemini-3、ai.google.dev/gemini-api/docs/nanobanana、blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent、jules.google - Cursor / Windsurf / Cline / GitHub Copilot docs:cursor.com/pricing、docs.windsurf.com、docs.cline.bot、docs.github.com/copilot **[推論]** 業界資源(**驗證方法**:搜尋當前最新版): - SWE-bench leaderboard: swebench.com - LMArena: lmarena.ai - MCP server 索引: mcp.so / smithery.ai - Aider docs: aider.chat - Cline GitHub: github.com/cline/cline - OpenHands GitHub: github.com/All-Hands-AI/OpenHands --- ## 附錄 E. 用戶環境啟用狀態(內部用,呈報前移除) > **[事實]** 標記基於:system prompt + memory + 對話可觀察證據 + **2026-05-02 系統實測查證** > **V** = 已啟用 / **X** = 未啟用 / **** = 已配置但狀態不明 / *** = 證據不足 ### E.1 Coding Agent 平台 | 工具 | 狀態 | 證據 | |---|---|---| | **Gemini CLI** | **V** | **系統當前運行中** | | Claude Code CLI(Windows) | **V** | 系統當前運行 | | Claude Code 桌面 app | **X** | 全系統無 claude*.exe;無 Start Menu 捷徑 | | Claude Code VS Code 擴充 | **X** | `code --list-extensions` 無 anthropic/claude;`~/.vscode/extensions/` 無對應資料夾 | | Claude Code JetBrains 擴充 | **X** | 未見 | | OpenAI Codex CLI | **V** | `mcp__codex-cli__*` 工具載入 | | Jules(Google)| **X** | 未見 | | OpenHands | **X** | 未見 | | OpenAI Operator | **X** | 未見 | | Devin | **X** | 未見 | | Manus | **X** | 未見 | | Cursor | **X** | 未見 | | Windsurf | **X** | 未見 | | Cline | **X** | 未見 | | Continue.dev | **X** | 未見 | | Aider | **X** | 未見 | | GitHub Copilot | **X** | 未見 | ### E.2 聊天類工具 | 工具 | 狀態 | 證據 | |---|---|---| | Claude.ai(web)| **V** | Claude Max 訂閱涵蓋 | | Claude Desktop(Win 聊天 app)| **X** | 全系統無 claude*.exe;`AppData/Local/Claude/` 只有 `Logs/` 子目錄無執行檔;Start Menu 無捷徑 | | Claude iOS app | **V** | **[推論]** 對話中提及 iOS | | Claude Android app | **X** | **[推論]** 用戶為 iOS | | ChatGPT app / web | *** | 未見 | | Gemini app / web | *** | 未見 | ### E.3 訂閱與 API 帳號 | 服務 | 狀態 | 證據 | |---|---|---| | **Claude Max** | **V** | memory `user_claude_code_usage_profile.md` 確認 | | Anthropic API key(直連)| *** | Max 涵蓋,未必另開 | | OpenAI API key | **** | Codex CLI 推測需 key(ChatGPT Plus / API key 二擇一)| | Google Gemini API key | **** | **Gemini CLI 運行中,推測已有 API Studio Key** | | OpenRouter | **X** | 未見 | | Cursor Pro | **X** | 未見 | | Windsurf Pro | **X** | 未見 | | GitHub Copilot 訂閱 | **X** | 未見 | ### E.4 MCP servers 已裝 | Server | 狀態 | 證據 | |---|---|---| | **codex-cli** | **V** | OpenAI Codex CLI 工具集 | | **mempalace** | **V** | **自製知識圖譜記憶系統** | | **Gmail** | **X** | 需認證但未完成 | | **Google Calendar** | **X** | 同上 | | **Google Drive** | **X** | 同上 | | filesystem | **X** | 未見 | | git | **X** | 未見 | | github / gitlab | **X** | 未見 | | slack | **X** | 未見 | | notion | **X** | 未見 | | linear / jira | **X** | 未見 | | puppeteer / playwright | **X** | 未見 | | brave-search / exa / tavily | **X** | 未見 | | postgres / sqlite / mongodb | **X** | 未見 | | sentry / cloudflare / stripe | **X** | 未見 | ### E.5 專業軟體 MCP | Server | 狀態 | 證據 | |---|---|---| | Adobe Photoshop MCP | **X** | 未見 | | Adobe Premiere MCP | **X** | 未見 | | Adobe After Effects MCP | **X** | 未見 | | Adobe Illustrator MCP | **X** | 未見 | | Unity MCP | **X** | 未見 | | Unreal Engine MCP | **X** | 未見 | | Blender MCP | **X** | 未見 | | Figma MCP(官方)| **X** | 未見 | | DaVinci Resolve MCP | **X** | 未見 | ### E.6 Computer Use / 自動化 | 項目 | 狀態 | 證據 | |---|---|---| | Anthropic Computer Use API | **X** | 未見 | | Browserbase / Anchor Browser | **X** | 未見 | ### E.7 平台與終端環境 | 項目 | 狀態 | 證據 | |---|---|---| | Windows 11 Home 桌面 | **V** | system OS 確認 | | macOS | **X** | – | | Linux | **X** | – | | iOS 手機 | **V** | **[推論]** 對話中提及 | | Android | **X** | – | | VS Code(IDE 本體)| **V** | 安裝於 `~/AppData/Local/Programs/Microsoft VS Code/` | | Git Bash mintty | **V** | memory `user_terminal_env.md` 確認 | | Windows Terminal(雙窗)| **V** | memory(`wt-dual.bat`)| | PowerShell 7+ | **V** | system shell | ### E.8 模型使用偏好 | 模型 | 狀態 | 比例 / 用途 | |---|---|---| | Claude Opus 4.7(含 1M context)| **V** 主力 | ~69% (memory) | | Claude Sonnet 4.6 | **V** | ~17% | | Claude Opus 4.6 | **V** | ~14%(含 fast mode)| | **Gemini 3.1 Pro** | **V** | **目前正在與 Gemini CLI 協作中** | | GPT 系列(透過 Codex CLI)| **V** | second opinion / review | ### E.9 知識管理 / 筆記 AI 工具 | 工具 | 狀態 | 證據 | |---|---|---| | **Obsidian** | **X** | 全系統無安裝路徑 | | Notion(含 Notion AI)| **X** | 全系統無安裝路徑 | | NotebookLM(Google)| *** | Web 工具,無本地安裝判斷依據 | | Mem.ai / Reflect / Tana / Logseq / Heptabase | **X** | 未見 | ### E.10 圖像 / 影片生成(API 訂閱) | 服務 | 狀態 | 證據 | |---|---|---| | OpenAI GPT-Image-1 / DALL-E | *** | 取決於 OpenAI API key 狀態 | | Sora / Sora 2 | *** | 同上 | | Google Imagen / Nano Banana | **X** | Gemini API key 未見 | | Google Veo | **X** | 同上 | | Midjourney | *** | 未見證據 | | Stable Diffusion / Flux 本地 | **X** | 未見 | ### E.11 採購建議路徑(基於現況) **[推論]** 從上述環境推導: | 動作 | 預期 ROI | 建議優先級 | |---|---|---| | 完成 **Gmail/Calendar/Drive 連接器 OAuth** | 已配置但卡認證一步,**解鎖文檔直接轉代碼能力** | ]最高優先)| | 採納 **混合雲路徑 (Path E)** | **Claude 推理 + Gemini 2M 掃描**,效能成本最優解 | | | 裝 **VS Code 擴充**(Anthropic Claude Code)| Claude Max 已涵蓋,diff 比 terminal 直覺 | | | 裝 **Claude Desktop**(Win 聊天 app)| 純聊天比 CLI 順,不用排隊 tool call | | | 裝 **github MCP** | issues / PR 自動化 | | | **Cursor / Windsurf** | 訂閱重複付費 | 不建議 | --- **報告完。** ----- Sent from JPTT on my Samsung SM-A5560. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.74.239 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1777771035.A.470.html