Re: [問卦] PTT家裡沒大人啊？

作者AoWsL (AoWsL)

看板Gossiping

標題Re: [問卦] PTT家裡沒大人啊？

時間Sun May 3 09:17:11 2026

https://i.urusai.cc/LCW4K.jpg

# AI Coding 工具生態深度盤點 — 專案報告 v2 > **版本**：v2.6 / 2026-05-02 > **資料截止**：2026-05-02（本次針對模型 / Agent / MCP / 採購結論做官方來源抽樣核驗；價格與配額仍需採購前逐頁確認） > **更新說明**： > - v2.6 深化 5.10 GitHub Copilot：補入「形式」三重身份標註、「外部工具 / 擴充生態」（Copilot Extensions / Skillsets / MCP / Spaces / Custom Instructions）與「限制」段落 > - v2.5 修正 4 處錯置：(1) 第 6.1 Routing 表 4 個過時模型對應（GPT-4o / o3 / Gemini 2.5 Pro / Gemini Thinking）→ GPT-5.x / Gemini 3.x；(2) 第 6.4 Fallback 策略 GPT-4o → GPT-5.4；(3) 第 16.4 AnythingLLM 加註「自架 RAG 平台，非筆記 app」；(4) 第 5 章開頭新增「形式對照表」，呼應 v2.4 第 1 章四分法 > - v2.4 補入「AI 形式四分法」維度（獨立 app / 焊死進 IDE / 外掛塞進別人 app / 雲端服務）；修正原表把 Cursor (焊死) 和 Cline / Aider (外掛) 混在同一類的錯誤歸類 > - v2.3 增補 Google Gemini 3.1 Pro 2M context 規格、Gemini CLI 原生運作機制與混合雲採購路徑 > **用途**：對外簡報 / 採購評估 > **標記體系**（內審用，定稿可移除）： > - **[事實]** = 直接讀過 / 驗證過 > - **[推論]** = 沒驗證但有外部 source（必附驗證方法） > - **[猜測]** = 純推估（必附驗證方法） > - **[做了]** = 動作完成 / **[等待回應]** = 等決策 / **[過時]** = 標的已不適用 --- ## 目錄 1. Executive Summary 2. 6 層市場架構 3. 平台支援矩陣 4. 模型層深度比較 5. Coding Agent 平台深度檔案 6. 多模型策略 7. MCP 協議深度解析 8. Computer Use 深度解析 9. 專業軟體整合 10. 計費 / TCO 模型 11. 安全與合規 12. 採購決策框架 13. 風險矩陣 14. Roadmap 信號 15. 三家原廠生態系全圖（Anthropic / OpenAI / Google） 16. 知識管理 / 筆記 AI 工具（Obsidian 等） - 附錄 A. 標記體系說明 - 附錄 B. 驗證方法清單 - 附錄 C. 名詞 / 縮寫表 - 附錄 D. 參考資料 - 附錄 E. 用戶環境啟用狀態（內部用，呈報前移除） --- ## 1. Executive Summary（TL;DR） **[事實]** AI 寫程式 / AI 助理工具按 **「產品類別」** 維度分（這工具做什麼？）： | 大類 | 形式 | 典型產品 | |---|---|---| | **聊天助理** | Web / 桌面 / 手機 | Claude.ai, ChatGPT, Gemini | | **Coding Agent**（原廠） | CLI / 桌面 / Web / IDE 擴充 | Claude Code, OpenAI Codex CLI, Gemini CLI, Jules | | **第三方 AI IDE**（焊死型）| fork VS Code 把 AI 焊死進去，拆不掉 | Cursor, Windsurf | | **AI 編程外掛**（外掛型）| 主編輯器（VS Code / JetBrains 等）本來沒 AI，外掛塞進去才有 | **GitHub Copilot**, Cline, Continue, Aider | | **自主 Agent / Computer Use** | 雲端 / 本地 agent | OpenHands, Devin, Manus, OpenAI Operator | | **API / SDK** | REST / 套件 | Anthropic API, OpenAI API, Google AI | **[事實]** 換維度按 **「AI 形式」**（AI 怎麼進到你電腦？）看，可分 4 種裝載形式（同一產品可能跨多形式）： | AI 形式 | 跟主 app 的關係 | 例子 | |---|---|---| | **1. 獨立 app**（AI 自己就是 app） | 打開直接是 AI，不寄生在別人身上 | Claude.ai 網頁、Claude Desktop、**Claude Code CLI**、ChatGPT、**Gemini CLI**、Codex CLI | | **2. 焊死進整套 IDE**（一體成型） | 主 app 出廠就含 AI，拆不掉 | **Cursor**、Windsurf | | **3. 外掛塞進別人 app**（外掛型） | 主 app 本來沒 AI，後裝外掛才有 | VS Code / JetBrains + **GitHub Copilot**、VS Code + Cline / Continue / Aider、Obsidian + Copilot for Obsidian | | **4. 雲端服務 / API**（不在你電腦） | 透過瀏覽器、雲端 VM 或自己寫程式呼叫 API | Jules、Devin、Manus、Operator、Copilot cloud agent、Anthropic / OpenAI / Google API | **為什麼要兩個維度看**： - 「**產品類別**」回答：**這工具做什麼？**（聊天 / 寫程式 / 自主跑任務 / API） - 「**AI 形式**」回答：**我電腦上要怎麼裝、怎麼用？**（獨立 app / 焊死 / 外掛 / 雲端）許多產品**跨多形式**：例如 GitHub Copilot = Coding Agent（類別）+ 外掛（形式）+ 雲端 agent（部分功能）三重身份；Claude Code 同時有獨立 CLI 形式、VS Code 外掛形式、Web 雲端形式。 **[事實]** AI coding 工具市場在 2024–2026 經歷三個結構性變化： 1. **協議標準化**：MCP（Model Context Protocol）2024-11 由 Anthropic 開放；2025 後 ChatGPT / Cursor / Gemini / Microsoft Copilot / VS Code 等已採用或整合，且 MCP 已移交 Linux Foundation 旗下 Agentic AI Foundation（AAIF）治理 2. **Agent 化**：從「補完式 Copilot」轉向「自主 Agent」（Claude Code、Codex、Gemini CLI、Cursor Agent、Windsurf Cascade、Copilot cloud agent、OpenHands） 3. **多模型 Routing**：第三方 IDE 普遍支援 4+ 家 LLM；原廠工具仍以自家模型為主，但企業架構層面已很難只押單一供應商 **關鍵數據**（**[推論]** 業界普遍引用，**驗證方法**：搜「SWE-bench Verified leaderboard 2026」與各家官網）： | 指標 | 2023 | 2026 | |---|---|---| | 頂級模型 SWE-bench Verified | ~10–20% | **70–80%+**（Claude Opus 4.x / GPT-5.x 級，需看當期 leaderboard）| | 主流 context window | 8k–32k | **200k 起，1M-2M 成為旗艦級規格**（Gemini 3.1 Pro 已達 2M tokens）| | MCP server 數量 | 0 | **10,000+ active public MCP servers**（Anthropic 2025-12 官方說法，仍需核驗口徑）| | Agent 自主完成 PR 比例 | <5% | **無統一公開指標**；簡單 issue 可顯著提升，但正式採購不應用固定百分比承諾 | **核心結論**： 1. **原廠工具以自家模型為核心**（Claude Code → Claude；Codex → OpenAI GPT/Codex 系；Gemini CLI → Gemini）；**第三方工具**普遍支援 Claude / GPT / Gemini / OpenRouter / 本地模型 2. **手機端主要支援聊天與雲端任務查看**；本地 repo 編輯、測試、MCP、shell 權限仍以桌面 / IDE / CLI / 雲端 runner 為主 3. **MCP 協議** 是 2025–2026 最大變革，但「控制 Adobe / Unity / Blender」多屬社群 MCP 或腳本橋接，成熟度要逐項驗證 4. **混合模型工作流**（雙 agent 互審、多模型製圖管線、**Claude 推理+Gemini 掃描**）成為頭部團隊新常態 5. **採購已不只「買哪個工具」，而是「組哪一條 stack」**：模型層 + Agent 平台層 + MCP 擴充層 + 觀測層 --- ## 2. 6 層市場架構 **[事實]** 從技術棧角度，AI coding 生態可剝為 6 層，採購決策需各層獨立思考： ``` ┌─────────────────────────────────────────┐ │ Layer 6: 觀測 / 治理 (LangSmith/Helicone)│ ├─────────────────────────────────────────┤ │ Layer 5: 工作流編排 (n8n/Temporal/自製) │ ├─────────────────────────────────────────┤ │ Layer 4: Agent / IDE 平台 │ │ ├─ 原廠: Claude Code / Codex CLI / │ │ │ Gemini CLI / Jules │ │ ├─ 第三方: Cursor / Windsurf / Cline │ │ ├─ 自主: OpenHands / Devin / Manus │ │ └─ Agent SDK: 自製 │ ├─────────────────────────────────────────┤ │ Layer 3: 工具 / MCP 擴充層 │ │ ├─ 檔案/Git/通訊/雲服務/設計/3D 等 │ ├─────────────────────────────────────────┤ │ Layer 2: 模型路由 (OpenRouter/Portkey) │ ├─────────────────────────────────────────┤ │ Layer 1: 模型 API │ │ ├─ Anthropic / OpenAI / Google │ │ ├─ AWS Bedrock / GCP Vertex │ │ └─ 開源: Llama / Qwen / DeepSeek │ └─────────────────────────────────────────┘ ``` **對採購的意涵**： - 多數企業誤把「選工具」當作 Layer 4 一層決策；實際上 **Layer 1 + Layer 4 是兩個獨立決策** - Layer 2（路由層）是新興必要層 — 規模 10+ 團隊應預先設計，避免後期切換成本 --- ## 3. 平台支援矩陣 **[事實]** 各產品的桌面 / 手機支援： | 產品 | Win | Mac | Linux | iOS | Android | Web | |---|---|---|---|---|---|---| | **Claude.ai**（聊天） | – | – | – | – | – | | | **Claude Desktop**（聊天） | | | **[推論]**| – | – | – | | **Claude Mobile**（聊天） | – | – | – | | | – | | **Claude Code CLI** | | | | | | – | | **Claude Code 桌面** | | | **[推論]**| | | – | | **Claude Code Web** | – | – | – | (限 web) | (限 web) | | | **VS Code 擴充**（Anthropic） | | | | | | – | | **JetBrains 擴充**（Anthropic） | | | | | | – | | **OpenAI Codex CLI** | | | | | | – | | **Gemini CLI**（Google） | | | | | | – | | **Cursor**（第三方 IDE） | | | | | | – | | **Windsurf**（第三方 IDE） | | | | | | – | | **Cline**（VS Code 擴充） | | | | | | – | **驗證方法**：[推論] Linux 桌面支援 — 上各家官網 download 頁確認 **桌面 vs 手機關鍵 takeaway**： - **Windows / Mac 桌面**：所有產品基本全可用，無重大缺項 - **iOS / Android 手機**：僅支援聊天類產品，**所有 coding agent 不支援** - **Linux**：開源 / CLI 類完整支援；原廠桌面 app **[推論]** 多無原生版 - **跨裝置同步**：原廠帳號內同條線（聊天 / 寫 code）對話互通；不同條線**不互通**（iOS 聊天不會看到桌面 Coding Agent 對話歷史） --- ## 4. 模型層深度比較（Layer 1） ### 4.1 Anthropic Claude 系列 **[事實]** 公開官方線（2026-05-02 抽樣核驗；採購前仍以 claude.com/pricing 與 Claude docs 為準）： | 模型 | Model ID | Context | Output | 推理模式 | |---|---|---|---|---| | Claude Opus 4.7 | `claude-opus-4-7` | **1M tokens**（官方稱旗艦 / coding / agents） | 依 API 限制 | Extended Thinking | | Claude Sonnet 4.6 | `claude-sonnet-4-6` | **1M tokens beta**（API）| 依 API 限制 | Extended Thinking | | Claude Haiku 4.5 | `claude-haiku-4-5` | 依 API 限制 | 依 API 限制 | 輕量 / 速度 | **[事實]** 計費（claude.com/pricing，USD / MTok）： | 模型 | Input ($/MTok) | Output ($/MTok) | Cache 寫入 | Cache 讀取 | |---|---|---|---|---| | Opus 4.7 | $5 | $25 | $6.25 | $0.50 | | Sonnet 4.6 | $3 | $15 | $3.75 | $0.30 | | Haiku 4.5 | $1 | $5 | $1.25 | $0.10 | **關鍵特性**： - **Prompt Caching**（**[事實]** Anthropic 文件）：5-min TTL，cache hit 讀取費降 **90%** - **Extended Thinking**：可指定推理 token budget，複雜任務可達 64k+ thinking tokens - **Tool Use 並行**：單次回應可發起多個 tool calls ### 4.2 OpenAI GPT 系列（更新至 2026-05） **[事實]/[推論]**（**驗證方法**：developers.openai.com/api/docs/models + openai.com/api/pricing；不同帳戶 rollout 可能不同）： | 模型 | Context / Output | 強項 | 計費 | |---|---|---|---| | **GPT-5.5** | 1M / 128k | 最新旗艦；複雜 reasoning、agentic coding、professional work | $5 input / $30 output | | **GPT-5.5 Pro** | **[推論]** 同系 | 最高準確度 / 高難度推理 | $30 input / $180 output（API rollout 需確認）| | **GPT-5.4** | **[推論]** 400k–1M | 成本較低的旗艦級工作模型 | $2.5 input / $15 output | | **GPT-5.4 mini** | **[推論]** 400k 級 | coding / computer use / subagents 的成本平衡 | $0.75 input / $4.5 output | | **GPT-5.4 nano** | **[推論]** 128k+ | 高吞吐 / 低延遲 / batch | $0.10 級以下需查 pricing | | **GPT-5.2-Codex** | 400k / 128k | Codex / agentic coding 優化 | $1.75 input / $14 output | | GPT-5、GPT-4.1、4o | 依模型 | legacy / 過渡 | 新採購不建議作基準 | **關鍵特性**： - **Reasoning effort**：GPT-5.x 系列可調 reasoning effort；成本和 latency 需按任務類型測 - **Predicted Outputs**：預測輸出加速，編輯任務 latency 降 30–50% - **Prompt Caching**：快取輸入通常較標準輸入便宜，具體折扣按模型定價表 - **Codex**：已不只是 CLI；官方 docs 有 CLI / IDE extension / Web / App / GitHub Action / MCP / hooks / skills / subagents 等線 - **Agents SDK / Agent Builder / Apps SDK**：OpenAI 自製 agent 與 ChatGPT app 生態的核心入口 - **Realtime API**：低延遲語音/即時對話 - **MCP / Connectors**：Responses API 支援 remote MCP servers 與 OpenAI 維護的 connectors（Gmail、Drive、Dropbox、SharePoint 等） ### 4.3 Google Gemini 系列（更新至 2026-05） **[事實]/[推論]**（**驗證方法**：ai.google.dev/gemini-api/docs/gemini-3 + models 頁；3.x 多為 preview）： | 模型 | Context / Output | 強項 | |---|---|---| | **Gemini 3.1 Pro Preview** | **2M / 64k** | 複雜 reasoning、多模態、2.1M token 巨量 Context、agentic / coding | | **Gemini 3 Flash Preview** | 1M / 64k | Pro 級智能 + Flash 成本 / 速度 | | **Gemini 3.1 Flash-Lite Preview** | 1M / 64k | 高吞吐、成本效率（1/10 Sonnet 成本級別） | | Gemini 2.5 Pro / Flash / Flash-Lite | 1M+ | 生產可用性通常比 3.x preview 穩，需看當期模型頁 | | **Nano Banana** | 圖像 | Gemini 2.5 Flash Image，低延遲圖像生成 / 編輯 | | **Nano Banana Pro** | 圖像 | Gemini 3 Pro Image Preview，高品質文字渲染 / 專業素材 | | **Nano Banana 2** | 圖像 | Gemini 3.1 Flash Image Preview，高效率 / 低價位圖像線 | | **Veo 3.x** | 影片 | 文字 / 圖像 → 影片，價格與可用區域需逐項查 | **關鍵特性**： - **超大 context (2M)** — Gemini 3.1 Pro 在 Vertex AI/AI Studio 已開放 2.1M tokens，適合跨多個微服務 Repo 進行全局重構。 - **Linear Attention 優化** — 底層技術確保在 1M+ token時的檢索準確率（Needle In A Haystack）仍接近 100%。 - **多模態原生應用** — - **影片 Bug 定位**：直接讀取「復現螢幕錄影」，自動匹配 Console Log 執行 Root Cause 分析。 - **Nano Banana 2 參考圖模式**：從 UI 原型截圖直接產出 Tailwind/CSS 佈局代碼。 - **計費最低候選** — Flash-Lite 為大規模索引（Indexing）與基礎 Linting 任務的首選。 - **Workspace 整合** — Docs / Sheets / Slides / Gmail 內 Gemini 嵌入。 - **Preview caveat** — 3.x preview 模型適合試點；嚴格 SLA / 回歸穩定性需用固定 model version。 ### 4.3.1 Nano Banana 詳細（2026-05 最新） **[事實]** Google 文件已將 Nano Banana 作為 Gemini 原生圖像生成 / 編輯能力的產品命名使用，不再稱之為社群綽號。 **版本演進**（**驗證方法**：ai.google.dev/gemini-api/docs/nanobanana）： | 版本 | 別名 | 特性 | |---|---|---| | Nano Banana | Gemini 2.5 Flash Image | 快速、便宜、適合大量圖像生成 / 編輯 | | Nano Banana Pro | Gemini 3 Pro Image Preview | 專業素材、複雜指令、文字渲染更強 | | Nano Banana 2 | Gemini 3.1 Flash Image Preview | 高效率、低價位、適合高吞吐圖片工作流 | **對標**： - OpenAI **GPT-Image-1** — 高解析、文字渲染強 - Black Forest Labs **Flux Kontext** — 開源編輯模型 - Adobe **Firefly** — 設計生態整合 ### 4.4 Benchmark 對照 **驗證方法**：上 https://www.swebench.com / Aider leaderboard / LMArena 看當前排行 | 模型 | SWE-bench Verified | Aider Polyglot | LMArena Coding | |---|---|---|---| | Claude Opus 4.7 | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier | | GPT-5.5 / GPT-5.2-Codex | **[推論]** 第一梯隊 | **[推論]** 第一梯隊 | top tier | | Gemini 3.1 Pro Preview | **[推論]** 第一梯隊 / preview | **[推論]** 需看當期榜 | top tier | | 開源（Qwen / DeepSeek） | **[推論]** 40–60% | **[推論]** 50–65% | mid-tier | **[推論]** 結論：頂級閉源模型在 coding benchmark 上仍快速輪替；簡報不宜寫死單一百分比，正式採購應以當週 SWE-bench / Aider / LMArena + 自家私有 repo eval 共同判斷。 --- ## 5. Coding Agent 平台層深度檔案（Layer 4） > **形式對照表**（呼應第 1 章 AI 形式四分法；同一工具可能跨多形式）： > > | # | 工具 | AI 形式 | host / 部署 | > |---|---|---|---| > | 5.1 | Claude Code | **獨立 app** + **外掛型** | CLI / 桌面 / Web + VS Code / JetBrains 擴充 | > | 5.2 | OpenAI Codex CLI | **獨立 app** + **外掛型** + **雲端** | CLI + IDE 擴充 + Web / App / GitHub Action | > | 5.3 | Gemini CLI | **獨立 app** | CLI（可接 GitHub Actions）| > | 5.4 | Jules | **雲端服務** | GitHub 整合 → Google Cloud VM | > | 5.5 | Cursor | **焊死型 IDE** | fork VS Code | > | 5.6 | Windsurf | **焊死型 IDE** | 自家 IDE | > | 5.7 | Cline | **外掛型** + **獨立 app** | VS Code / Cursor / JetBrains 擴充 + CLI | > | 5.8 | Continue.dev | **外掛型** | VS Code / JetBrains 擴充 | > | 5.9 | Aider | **獨立 app** | CLI | > | 5.10 | GitHub Copilot | **外掛型** + **獨立 app** + **雲端** | VS Code / JetBrains / Vim / Visual Studio 擴充 + CLI + cloud agent | > | 5.11 | OpenHands | **獨立 app** + **雲端** | 自架 / Docker / 雲端 sandbox | > | 5.12 | Devin | **雲端服務** | 商用 VM sandbox | > | 5.13 | Manus | **雲端服務** | 通用 agent，coding 為子集 | > | 5.14 | OpenAI Operator | **雲端服務** | 瀏覽器自動化（Computer Use）| ### 5.1 Claude Code（Anthropic） **[事實]** 部署形式：CLI / 桌面 / Web (claude.ai/code) / VS Code 擴充 / JetBrains 擴充 **核心架構**： - **Tool 系統**：Read / Write / Edit / Glob / Grep / Bash / WebFetch / WebSearch / Agent (subagent) / Task / Schedule 等內建 - **Sub-agent 系統**：可開 specialized agent（如 Explore、Plan、code-reviewer）並行任務 - **Hooks 系統**：PreToolUse / PostToolUse / UserPromptSubmit / Stop 等事件 hook - **Skills 系統**：可重複呼叫的指令包，slash command 觸發 - **MCP 原生支援**：可裝任意 MCP server - **Plan Mode**：先產 plan、用戶確認再執行 - **模型 / 速度模式**：依帳號方案與當期 rollout 切換 Opus / Sonnet / Haiku；高速模式與費率需看當期產品頁 **獨家優勢**： - **Memory 系統**：自動保存 user / feedback / project / reference 4 類記憶跨對話持久化 - **Hooks**：第三方 IDE 多無此細粒度事件鉤 - **Sub-agent 隔離**：可用 worktree 隔離分支實驗 **限制**： - **單一模型** — 鎖 Claude（Opus / Sonnet / Haiku 三模型可切換） - **無原生 IDE 體驗**（VS Code 擴充為 panel 形式） ### 5.2 OpenAI Codex CLI **[事實]** 2025 推出對標 Claude Code；到 2026 已形成 **CLI / IDE extension / Web / App / GitHub Action / SDK / MCP server** 多入口產品線。 **核心功能**（**驗證方法**：developers.openai.com/codex）： - **本地 agent loop**：CLI 在本機讀檔、改檔、跑命令；模型推理走 Responses API / ChatGPT Codex endpoint - **Approval modes**：suggest / auto-edit / full-auto 類型模式控制人工介入程度 - **模型線**：GPT-5.2-Codex / GPT-5.5 / GPT-5.x 系；可接 Responses-compatible endpoint，含本地 gpt-oss 場景 - **MCP / hooks / skills / subagents / AGENTS.md**：官方 docs 已列為 Codex 配置與自動化能力 **獨家優勢**： - **OpenAI 生態整合**深 — Responses API、Agents SDK、Computer Use、Image / Video / Realtime 等工具線一致 - **ChatGPT / Codex 訂閱整合** — 對已採購 ChatGPT Team / Enterprise / Edu 的組織摩擦低 **限制**： - **模型供應商仍以 OpenAI 為主**；多模型 routing 需外接第三方或 Responses-compatible layer - **Windows 支援需逐版本驗證**；官方曾標示 macOS / Linux 優先、Windows 可能需 WSL 或專用支援頁 ### 5.3 Gemini CLI（Google） **[事實]** Google 2025-06 推出，定位為高效、開源的 terminal AI agent，與使用者協作完成複雜開發任務。 **核心特性**： - **運作邏輯：Research -> Strategy -> Execution**： - 不同於一般的 Chatbot，Gemini CLI 遵循開發生命週期。在執行修改前會先進入 **Plan Mode** 生成設計文件，確保架構符合專案規範。 - **外科手術式編輯（Surgical Edits）**： - 傾向使用精確的代碼替換（replace），而非重寫整個檔案，降低 Token 消耗並減少對無關代碼的干擾。 - **自主驗證與自我修復（Self-healing）**： - 修改後自動尋找並執行相關測試（npm test, pytest 等）。若驗證失敗，會自動進入修復循環直到通過。 - **Google Search 整合**： - 原生支援即時檢索最新的 API 文件或 StackOverflow 討論，解決模型知識切斷問題。 - **Gemini 2.5 / 3.x 模型線**：個人 Google 帳號可用高額免費額度；企業可接 AI Studio / Vertex AI key。 - **2M context 級別**：適合跨多個微服務 Repo 進行全局重構與大規模分析。 - **多模態原生**：影片（Bug 錄影）/ 圖片 / PDF 可直接作為分析 input。 - **Gemini CLI GitHub Actions**：把 CLI agent 放到 repo workflow 內做 issue triage / PR review / 背景任務。 **獨家優勢**： - **GCP 整合** — Vertex AI / Workspace / Drive 順暢調用。 - **成本領先** — Flash-Lite 系列為三家閉源模型中最便宜的高吞吐選項。 ### 5.4 Jules（Google） **[事實]** Google Labs 2025 推出並走出 beta；定位為非同步雲端 coding agent。 **核心特性**： - **GitHub 整合**：連 repo → Jules clone 到 Google Cloud VM → 擬定計畫 → 產 diff / PR - **完整 task 自動化**：對標 Devin / OpenHands - **VM 沙盒執行** - **Jules Tools / Jules API**：可接終端與內部系統 **戰略定位**：**雲端非同步 agent**（vs Claude Code 的本地互動式 agent） ### 5.5 Cursor（Anysphere） **[事實]** 規格（**驗證方法**：cursor.com/pricing + docs；2026 已改 usage-based，舊版「fast requests」口徑不再可靠）： | 方案 | 月費 | 口徑 | |---|---|---| | Hobby（免費）| $0 | limited Agent / Tab | | Pro | $20 | frontier models + MCPs / skills / hooks + cloud agents | | Pro+ | $60 | Pro 的 3x OpenAI / Claude / Gemini 用量 | | Ultra | $200 | Pro 的 20x 用量 + priority | | Teams | $40/seat | shared chats / commands / rules + org privacy controls / SSO | **核心功能**： - **Agent / Composer**：多檔案同時編輯，diff preview 後 apply - **Tab 補完**：行內 / 多行補完 - **`@` 引用**：`@file` / `@folder` / `@web` / `@docs` / `@git` 精準注入 context - **`.cursorrules` / MDC**：專案規則檔，全域 inject - **Cloud agents / hooks / skills / MCPs**：2026 官方定價頁已列為 Pro 以上能力 **支援模型**：Claude / GPT / Gemini / o-系列 / 自管 API key **獨家優勢**： - **IDE 整合最深** — fork VS Code 而非擴充 - **多模型切換零摩擦** **限制**： - 訂閱不可轉 - 隱私 — 程式碼預設經 Cursor 伺服器，企業需 Privacy Mode ### 5.6 Windsurf（前 Codeium） **[事實]/[推論]** 規格（**驗證方法**：docs.windsurf.com / windsurf.com/pricing；2026-03 後自助方案改 usage-based）： | 方案 | 特色 | |---|---| | Free | 入門限額 | | Pro / Max | 個人付費，依模型與用量給額度 | | Teams / Enterprise | 集中帳單、SSO / RBAC / admin dashboard、企業治理 | **核心功能**： - **Cascade**：對標 Cursor Composer 的 agent - **Supercomplete**：補完 + 推測下一步意圖 - **Memories / Rules / Workflows / Skills / AGENTS.md**：跨對話與 repo 規則管理 - **MCP / Cascade Hooks**：可接 stdio / Streamable HTTP / SSE；Teams/Enterprise 有 admin controls **獨家優勢**： - **Cascade 產品化早**，IDE 內 agent 體驗成熟 - **企業治理選項較完整**（從 Codeium 企業線延伸） ### 5.7 Cline（前 Claude Dev） **[事實]** 開源 AI coding agent，支援 VS Code / Cursor / JetBrains，也有 CLI。 **核心功能**： - **Plan / Act 雙模式**： - Plan mode：讀 code / 搜尋 / 討論策略，但不改檔、不執行命令 - Act mode：執行 tool - **MCP 原生支援** - **`.clinerules`**：專案規則檔 - **Auto-approve 細粒度**：tool 確認設定 **支援模型**：Claude / GPT / Gemini / OpenRouter / Bedrock / Vertex / 本地（Ollama / LM Studio） **獨家優勢**： - **完全開源** + **支援本地模型** + **MCP 原生** = **隱私敏感場景首選** - **Plan / Act 雙模**為其他工具罕見 ### 5.8 Continue.dev **[推論]** 開源 VS Code / JetBrains 擴充。 **核心功能**： - **Indexer**：本地索引 repo - **Custom commands**：YAML 設定自定 slash command - **多模型 routing**：autocompletion vs chat 可分配不同模型 **戰略定位**：**比 Cline 更輕量**，較不像 agent，更像「強化版 Copilot」 ### 5.9 Aider（開源 CLI） **[事實]** 開源、CLI、社群驅動。 **核心架構**： - **Repo-map**：用 tree-sitter 解析整個 repo，**將 100k 檔案 repo 壓縮為 ~20k tokens** 結構摘要（**驗證方法**：aider.chat/docs/repomap.html） - **Git auto-commit**：每次 agent 變更自動 commit - **Voice coding**：語音輸入支援 - **Model 切換**：CLI flag 即可切換 Claude / GPT / Gemini / 本地 **獨家優勢**： - 完全開源，企業可 fork 客製 - **Repo-map 演算法**為業界最成熟 ### 5.10 GitHub Copilot **形式**：**外掛型** + **獨立 app**（CLI）+ **雲端 agent** 三重身份（裝在 VS Code / JetBrains / Vim / Visual Studio / GitHub.com 等多種 host） **[事實]** 規格（**驗證方法**：docs.github.com/copilot；2026 起 pricing / billing 口徑正在轉 usage-based）： | 方案 | 月費 | 特色 | |---|---|---| | Free | $0 | 有限 chat / 補完 / agent 功能 | | Pro | $10 | 個人付費，含 premium requests 與 cloud agent | | Pro+ | $39 | 更多 premium requests / 高階模型 | | Business | $19/seat | 中央政策、組織管理、cloud agent | | Enterprise | $39/seat | Business + enterprise-grade 功能 | **核心定位**：從「補完 + Chat」升級為 GitHub 內建 agent 平台；**Copilot coding agent 2025-09 GA**，可背景開 draft PR；**Copilot CLI 2026-02 GA**，可在 terminal 規劃、改檔、跑測試。 **外部工具 / 擴充生態**（**[推論]**，**驗證方法**：docs.github.com/copilot/customizing-copilot + GitHub Marketplace「Copilot Extensions」分類；partner 清單以 Marketplace 即時為準，常見 partner 隨時異動）： - **Copilot Extensions / Apps**（2024-09 GA）：第三方應用在 Copilot Chat 用 `@app` 呼叫；代表性合作方含 **Stripe、Sentry、Atlassian (Jira / Confluence)、Microsoft (Teams / Loop)、DataStax、Heroku、Octopus Deploy、LaunchDarkly、Docker、MongoDB** 等 - **擴充開發兩種模式**： - **GitHub App**（自架後端，自由度高）— 複雜業務邏輯、自家認證 - **Skillsets**（GitHub 託管，描述式）— OpenAPI / 工具描述即可，免自架 - **MCP client 支援**（2025 後）：VS Code Copilot Chat 已加入 MCP 支援，可裝任意 MCP server，跟 Cursor / Claude Code / Cline 同生態 - **Copilot Spaces**（2024-12）：圈一組 repo / files / docs 為對話 context 基準 - **Custom Instructions / `.github/copilot-instructions.md`**：repo 級規則檔，類似 `.cursorrules` / `.clinerules` **獨家優勢**： - GitHub 生態深整合（PR、issues、Actions） - Enterprise 採購最容易（多數公司已有 GitHub 訂閱） - **唯一同時提供「IDE 擴充 + 獨立 CLI + 雲端 agent + 擴充生態」全套** 的工具 **限制**： - **模型主要為 OpenAI / Anthropic 等 GitHub 簽約供應商**，不像 Cline / Cursor 可自管 API key 接百家 - **Extensions vs MCP 雙生態並存**：部分功能重疊（外部工具呼叫），企業需在兩條線之間做技術選型 - **效益綁 GitHub repo 工作流**：沒在 GitHub 上的場景（GitLab / Bitbucket / 內部 git server）效益打折 ### 5.11 OpenHands（前 OpenDevin） **[推論]** 開源自主 SWE agent，社群驅動。 **核心特性**： - **SWE-bench 常勝軍**（**驗證方法**：swebench.com 排行） - **完整 agent loop**：感知 → 規劃 → 執行 - **多 backend 支援**：Claude / GPT / Gemini / 本地 - **Docker 沙盒執行** **戰略定位**：**對標 Cognition Devin 的開源版本** ### 5.12 Devin（Cognition） **[推論]** 商用自主 SWE agent，引爆 2024 「AI 軟體工程師」討論。 **核心特性**： - **完整任務自主**：assign 一個 issue 從頭做到開 PR - **VM 沙盒** - **企業訂閱** **[推論]** 限制：價格高（**驗證方法**：cognition.ai/pricing）；**體驗成熟度爭議** ### 5.13 Manus（蝴蝶效應） **[推論]** 中國團隊 2025 推出的通用 agent，coding 為其中一個能力。 **核心特性**： - 通用 agent（不限於 coding） - 雲端非同步任務 - **2025 病毒級爆紅** ### 5.14 OpenAI Operator **[推論]** 2025 Jan 推出，OpenAI 官方 Computer Use 產品。 **核心特性**： - **瀏覽器自動化** agent - **GPT 系列驅動** - **訂閱 ChatGPT Pro 用**（**驗證方法**：openai.com/operator） **戰略定位**：**對標 Anthropic Computer Use API + Browserbase** --- ## 6. 多模型策略（Layer 2） ### 6.1 為什麼需要 Routing 層 **[推論]** 原因（**驗證方法**：搜當期 SWE-bench / LMArena / 各家官網）： | 任務 | 最適模型 | 為什麼 | |---|---|---| | 架構設計討論 | Claude Opus 4.7 | reasoning + 長文一致性 | | 大量重複編輯 | GPT-5.4 mini / Claude Sonnet 4.6 / Haiku 4.5 | 速度 + 便宜 | | 超長 context（>500k） | **Gemini 3.1 Pro Preview (2M)** | context 最大 | | 數學 / 演算法 | GPT-5.5 / Gemini 3.x reasoning mode | 推理深度 | | 圖像理解 | Gemini 3 Pro / GPT-5.x（多模態） | 多模態原生 | | Cost-sensitive batch | Haiku 4.5 / Gemini 3.1 Flash-Lite | 便宜 5–10x | ### 6.2 工具支援多模型對照 | 工具 | Claude | GPT | Gemini | 本地 | 其他 | |---|---|---|---|---|---| | Claude Code（全形式） | | | | | – | | OpenAI Codex CLI | | | | | – | | Gemini CLI | | | | | – | | Cursor | | | | **[推論]** | – | | Windsurf | | | | | – | | Cline | | | | Ollama 等 | OpenRouter 接百家 | | Continue.dev | | | | | OpenRouter | | Aider | | | | | OpenRouter | ### 6.3 Routing 工具對照 | 工具 | 形式 | 計費 | 強項 | |---|---|---|---| | **OpenRouter** | API 中介 | +5% markup | 一個 key 接百家 | | **Portkey** | Gateway + 觀測 | 訂閱 + token | 企業治理 / 觀測 | | **LiteLLM** | 開源代理 | 自架免費 | 自管基礎建設 | | **Anthropic / OpenAI Native** | 直連 | 各家計費 | 無中介費 + 最低 latency | **[推論]** 實作建議：團隊 10 人以下用 OpenRouter；30 人以上考慮自架 LiteLLM 或 Portkey ### 6.4 Fallback 策略 **[推論]** 業界常見模式： ``` Primary: Claude Opus 4.7 ↓ (rate limit / error) Fallback1: Claude Sonnet 4.6 ↓ (still failing) Fallback2: GPT-5.4 / GPT-5.4 mini ↓ (last resort) Fallback3: Gemini 3.1 Flash-Lite ``` --- ## 7. MCP 協議深度解析（Layer 3） ### 7.1 技術架構 **[事實]** MCP 是基於 **JSON-RPC 2.0** 的協議，定義 client / server 通訊。 **核心概念**： - **Server**：暴露 tools / resources / prompts - **Client**：發起呼叫（Claude Desktop / Code / Cursor 等） - **Transport**：STDIO（本地進程）/ SSE（Server-Sent Events，遠端）/ Streamable HTTP（2025 spec 已列） - **Auth**：HTTP transport 有授權框架；STDIO 通常透過本機環境變數或外部配置取憑證 **Handshake 流程**： ``` Client → Server: initialize { protocolVersion, capabilities } Server → Client: initialize-response { capabilities, serverInfo } Client → Server: tools/list Server → Client: { tools: [...] } Client → Server: tools/call { name, arguments } Server → Client: { content: [...] } ``` **[事實]** 2025-12 Anthropic 宣布將 MCP 捐給 Linux Foundation 旗下 AAIF；官方稱 MCP 已被 ChatGPT、Cursor、Gemini、Microsoft Copilot、VS Code 等採用，並有 10,000+ active public MCP servers。此數字是生態口徑，不等於「10,000 個皆可安全上 production」。 ### 7.2 主流 MCP server 詳細對照 **[推論]**（**驗證方法**：官方 MCP Registry / mcp.so / Smithery / 各廠商 docs；維護方與安全狀態需逐項確認）： #### 早期 reference / 常見基礎類 | Server | 用途 | 配置複雜度 | |---|---|---| | filesystem | 讀寫指定路徑 | 低 | | git | 本地 git 操作 | 低 | | github | issues / PR / repos | 中（OAuth）| | google-drive | 雲端硬碟 | 中（OAuth）| | slack | 訊息 / 頻道 | 中（OAuth）| | postgres | SQL 查詢 | 中 | | puppeteer | headless Chrome | 高（瀏覽器依賴）| | brave-search | Web 搜尋 | 低（API key）| | memory | 鍵值記憶 | 低 | | sequentialthinking | 思考鏈 | 低 | #### 第三方 / 官方 | Server | 維護方 | 用途 | |---|---|---| | **figma** | Figma 官方 | 讀設計檔 / 轉 code | | **stripe** | Stripe 官方 | 支付 / 訂閱 | | **sentry** | Sentry 官方 | 錯誤追蹤 | | **cloudflare** | Cloudflare 官方 | DNS / Workers / R2 | | **notion** | **[推論]** 官方 | 筆記讀寫 | | **linear** | 社群 / 官方 | issue 追蹤 | | **blender-mcp** | ahujasid（社群） | 3D 建模 | | **playwright-mcp** | Microsoft | 跨瀏覽器自動化 | | **browserbase** | Browserbase | 雲端 headless 瀏覽器 | ### 7.3 MCP 安全考量 **[事實]** - MCP server 跑在**本機**（STDIO 模式）— 有完整檔案 / 網路存取權 - **未經審計的 MCP server = 等於跑陌生 binary** - 企業部署應**白名單**，禁止使用者隨意 `pip install` / `npm install` - Remote MCP / connectors 要把 OAuth scope、token refresh、審計 log 納入資安設計 **[推論]** 風險： - 惡意 server 可竊取 API key、檔案、私鑰 - Tool output prompt injection：工具回傳內容可能誘導 agent 執行不該做的命令 - 已有 MCP / coding agent supply-chain 相關報導（**驗證方法**：搜「MCP security incident 2025」「Gemini CLI vulnerability 2025」） --- ## 8. Computer Use 深度解析 ### 8.1 架構 **[事實]** Anthropic Computer Use API 流程： ``` 1. Claude 呼叫 computer tool: { action: "screenshot" } 2. Sandbox 截圖回傳給 Claude 3. Claude 分析畫面，決定下一步: { action: "left_click", coordinate: [x, y] } 4. Sandbox 執行點擊 5. 重複 1–4 直到任務完成 ``` **支援動作**（**[事實]**）： - screenshot - mouse_move / left_click / right_click / middle_click / double_click - left_click_drag - key（組合鍵）/ type - scroll - cursor_position ### 8.2 Sandbox 部署 **[推論]** 生產部署選項： - **本機 Docker**：開發測試 - **Browserbase / Anchor Browser**：雲端 headless（**驗證方法**：browserbase.com/computer-use） - **AWS / GCP VM**：自建 ### 8.3 已知失敗模式 **[推論]**（業界 2025 共識）： | 失敗模式 | 原因 | 緩解 | |---|---|---| | **點錯位置** | 模型 grounding 不夠精確 | 加 zoom / OCR pre-process | | **無限迴圈** | 看不出任務已完成 | 加 max_steps + 完成判斷 | | **誤操作** | 點到關閉 / 刪除按鈕 | 沙盒隔離 + dry-run mode | | **速度慢** | 每步驟都要截圖 + 推理 | 預期 10–30 秒/步驟 | **[推論]** 適用場景判斷： - 老桌面軟體無 API - 網頁 QA 自動化 - 高頻重複任務（成本太高） - 需要 1 秒內回應的 UI 流程 --- ## 9. 專業軟體整合 — 分項成熟度 **[推論]**（**驗證方法**：mcp.so 各 server 頁面 + 該軟體 scripting 文件）： | 軟體 | 底層 API | 主流 MCP server | 成熟度 | 限制 | |---|---|---|---|---| | **Adobe Photoshop** | UXP / ExtendScript | 社群多版（如 photoshop-mcp）| | UXP 需 PS 25+ | | **Adobe Premiere** | ExtendScript / UXP | premiere-mcp（社群）| | 部分功能 UXP 未補齊 | | **Adobe After Effects** | ExtendScript / UXP | ae-mcp（社群）| | 渲染慢 | | **Adobe Illustrator** | UXP / ExtendScript | illustrator-mcp（社群）| | 同 PS | | **Unity** | C# Editor API + Python | unity-mcp（社群多版）| | 需 Editor 開啟 | | **Unreal Engine** | Python + Blueprint | unreal-mcp（社群）| | 較新，文件少 | | **Blender** | Python | **blender-mcp**（ahujasid）| | 強推 | | **Figma** | Plugin API | **官方 figma-mcp** | | 官方支援 | | **Sketchup** | Ruby API | sketchup-mcp（社群）| | 冷門 | | **AutoCAD** | LISP / .NET | autocad-mcp（**[推論]** 社群）| | 不確定活躍度 | | **DaVinci Resolve** | Python API | resolve-mcp（**[推論]** 社群）| | 影片剪接替代 | | **Ableton Live** | Max for Live / Python | **ableton-mcp**（ahujasid）| | 音樂製作 | ### 9.1 多模型製圖管線（2026 最新） **[推論]** 2025–2026 LLM 主導圖像 / 影片生成的標準工作流（**驗證方法**：搜「multi-model image pipeline 2026」）： ``` [Agent 層: Claude Code / Codex CLI / Gemini CLI] ↓ 寫 prompt [概念圖] Midjourney v7 / Flux Pro / Imagen 4 / GPT-Image-1 ↓ [編輯層] Nano Banana Pro / Nano Banana 2 / Flux Kontext / GPT-Image-1 edit ↓ [高解析] Magnific / Topaz / Recraft ↓ [後製] Photoshop MCP / Figma MCP（自動圖層 / 字幕） ↓ [影片合成] Premiere MCP / Sora / Veo 3.x ↓ [語音/字幕] ElevenLabs / OpenAI TTS / Gemini Live ``` **[推論]** 2026 最熱組合： - **多輪保人物編輯** → Nano Banana Pro / Nano Banana 2（需按成本與 preview 狀態選） - **高解析文字渲染** → GPT-Image-1（招牌、海報） - **影片含音效 / 敘事** → Veo 3.x / Sora（逐區域與帳戶可用性驗證） - **開源可商用** → Flux Pro / Flux Kontext ### 9.2 雙 Agent 互審架構 **[推論]** 兩個 agent 並行，各做專長 + 互相 review： | 角色 | 強項 | |---|---| | 主筆 agent（如 Claude Code） | 主寫、長文 reasoning、規範遵循 | | 審稿 agent（如 OpenAI Codex CLI） | second opinion、quantitative 計算 | **驗證方法**：搜「multi-agent code review 2025」 --- ## 10. 計費深度模型（TCO） ### 10.1 Token 消耗量級 **[推論]** 典型 coding agent 任務 token 消耗： | 任務類型 | Input tokens | Output tokens | Cache hit 率 | |---|---|---|---| | 簡單修 bug | 5–20k | 1–5k | 20–40% | | 中型 feature | 30–100k | 10–30k | 40–60% | | 大型重構 | 200k–1M | 50k–200k | 60–80% | | 全 repo agent loop | 1M–10M+ | 200k–1M | 80%+ | ### 10.2 團隊規模 cost 模擬 **[推論]** 假設每位開發者每日 200k tokens、每月 20 個工作日；粗算採 70% input / 30% output、未計 prompt cache、未計工具費與 premium processing： | 團隊規模 | 月 tokens | 訂閱方案 cost | API 直連 cost（Sonnet 4.6）| API 直連 cost（Opus 4.7）| |---|---|---|---|---| | 1 人 | 4M | Pro/Max $20–100 | ~$26 | ~$44 | | 5 人 | 20M | $100–500 | ~$132 | ~$220 | | 10 人 | 40M | $200–1,000 | ~$264 | ~$440 | | 50 人 | 200M | $1,000–5,000 | ~$1,320 | ~$2,200 | **結論**： - **API 未必比訂閱貴**：Opus 4.7 $5/$25 後，低到中度使用者 API 可能比 Max 訂閱便宜 - **訂閱仍適合高互動重度使用者**：尤其需要 Claude.ai / Claude Code 共用額度、無需自管 key 與帳務 - **混合策略**：訂閱 cover 重度使用者 + API 跑 batch / CI 任務 ### 10.3 Hidden costs - **MCP server 維運**：自架雲端 server（如 Browserbase）月費 $50–500 - **觀測 / 治理**：Helicone / Langfuse / Portkey $50–500/月 - **訓練 / 採用曲線**：每位開發者 2–4 週 ramp-up，**隱性成本 $5k–10k** - **資安審計**：MCP server 白名單建立 + code review，**初期 1–2 人月** --- ## 11. 安全與合規 ### 11.1 資料流向 | 工具 | 程式碼上傳 | 訓練 opt-out | 留存期 | |---|---|---|---| | Claude Code（API）| 上傳 | 預設不訓練 | **[推論]** 30 天 | | Claude Code（Bedrock）| 同上但企業帳號 | 不訓練 | 由 AWS 控 | | Cursor | 上傳 | Privacy Mode 可關 | **[推論]** 視方案 | | GitHub Copilot | 上傳 | Business+ 不訓練 | **[推論]** 28 天 | | Cline / Aider | API key 直連 | 視 LLM 供應商 | 同 LLM | | 本地模型（Ollama） | 完全本地 | – | – | **驗證方法**：各家 trust center / privacy policy ### 11.2 Enterprise 功能 **[推論]** 大型企業必查 checklist： | 功能 | Claude Pro/Max | Claude Enterprise | Cursor Business | GitHub Copilot Enterprise | |---|---|---|---|---| | SSO / SAML | / | | | | | SCIM 用戶管理 | / | | | | | Audit logs | / | | | | | SOC2 Type II | | | | | | HIPAA / BAA | | **[推論]** | **[推論]** | | | 資料 region 選擇 | 限定 | | **[推論]** | | | 自管 KMS | | ]Bedrock）| | **[推論]** | ### 11.3 MCP 供應鏈風險 **[事實]** MCP server 跑在本機進程，等同於信任作者： - 應建立**內部白名單** - 禁止使用者隨意 `pip install` / `npm install` - 對 MCP server 做 **package signing** 驗證（**[推論]** 規範進行中） --- ## 12. 採購決策框架 ### 12.1 加權評分卡 **[推論]** 標準採購評估面向（10 分制）： | 面向 | 權重 | Claude Code | Cursor | Cline | Copilot | |---|---|---|---|---|---| | 模型品質 | 20% | 9 | 9 | 8 | 7 | | 多模型靈活 | 15% | 3 | 9 | 10 | 5 | | Agent 能力 | 15% | 9 | 8 | 7 | 8 | | MCP 生態 | 10% | 9 | 8 | 9 | 7 | | IDE 整合 | 10% | 6 | 10 | 8 | 9 | | 企業合規 | 10% | 8 | 7 | 6 | 9 | | 成本效益 | 10% | 8 | 7 | 9 | 8 | | 學習曲線 | 5% | 6 | 9 | 7 | 9 | | 社群 / 文件 | 5% | 8 | 9 | 7 | 9 | **加權總分（[推論]** 示例）： - Claude Code: **7.6** - Cursor: **8.3** - Cline: **7.9** - Copilot: **7.6** **[推論]** 結論：**Cursor 在 IDE / 多模型彈性仍強**；Claude Code 在本地 agent 深度 / MCP / hooks 上強；Copilot 的優勢從「採購容易」擴大到 GitHub cloud agent / CLI。最終應按團隊 repo、審查流程、資安限制重算權重。 ### 12.2 三條採購路徑 | 路徑 | 條件 | 推薦組合 | 預期月成本（10 人）| |---|---|---|---| | **A. 原廠深度** | 重視 agent 深度、Hooks / Skills | Claude Pro/Max + VS Code 擴充 + 內部 MCP | $200–1,000 + API | | **B. 多模型靈活** | 重視避免 vendor lock-in | Cursor Teams/Enterprise + 自管 API key | $400 + usage | | **C. GitHub 內建** | 重視 PR / issue / Actions 流程 | GitHub Copilot Business/Enterprise + cloud agent | $190–390 + premium requests | | **D. 開源 + 本地** | 重視隱私、合規、可審計 | Cline + Ollama / 自管 API | API token $300–2,000 | | **E. 混合雲模式** | **效能與成本平衡** | **Claude Code (推理) + Gemini CLI (掃描/測試)** | **API 組合計費** | ### 12.3 場景化推薦 | 情境 | 推薦組合 | 月成本（個人）| |---|---|---| | **個人開發者**（重度）| Claude Max + VS Code 擴充 | $100 | | **多模型實驗者** | Claude Max + Cline（自管 API key） | $100 + token | | **設計 / 影音團隊** | Claude Max + Photoshop/Premiere MCP + 圖像生成 API | $100 + 圖像 API | | **遊戲開發** | Cursor Pro + Unity MCP + Blender MCP | $20 + token | | **大型遺留專案重構** | **Gemini CLI (2M context) + Jules** | **按量計費** | | **企業大型專案** | Anthropic API（Bedrock）+ 自製 Agent SDK | 按 token + AWS | --- ## 13. 風險矩陣 ### 13.1 技術風險 | 風險 | 機率 | 衝擊 | 緩解 | |---|---|---|---| | 模型錯誤導致 production bug | 高 | 高 | 強制 PR review + 測試 | | Agent 無限迴圈耗 token | 中 | 中 | max_steps + budget alert | | MCP server 供應鏈攻擊 | 低 | 高 | 白名單 + 簽章驗證 | | Computer Use 誤刪檔案 | 中 | 高 | 沙盒隔離 + dry-run | | Context 漏寫敏感資料 | 高 | 高 | secret scanning + .gitignore-like | ### 13.2 商業風險 | 風險 | 機率 | 衝擊 | 緩解 | |---|---|---|---| | 模型供應商漲價 | 高 | 中 | Layer 2 routing 預留切換 | | 工具廠商收購 / 倒閉 | 中 | 中 | 避免單押 | | 訓練資料外洩 | 低 | 高 | Enterprise 方案 + opt-out | | 員工技能單一供應商化 | 中 | 中 | 輪換工具培訓 | ### 13.3 合規風險 | 風險 | 影響行業 | 緩解 | |---|---|---| | GDPR 違規 | 歐盟業務 | Enterprise + region 選擇 | | HIPAA 違規 | 醫療 | BAA + Bedrock | | 智財權混淆 | 全行業 | Copilot Business+ / Cursor Business | | 出口管制 | 國際業務 | 模型 region + 用戶白名單 | --- ## 14. Roadmap 信號 **驗證方法**：追各家官方 blog / changelog + GitHub Releases | 趨勢 | 信號 | 影響時程 | |---|---|---| | MCP 標準化 | AAIF / Linux Foundation 治理；ChatGPT / Cursor / Gemini / Copilot / VS Code 採用 | 已進主流，2026 看治理與安全 | | Background / cloud agents | Codex Web/App、Jules、Copilot cloud agent、Cursor cloud agents | 已產品化，2026 看企業治理 | | 影片 / 多模態 agent | Sora / Veo / Gemini 3.x / Computer Use | 2026 全年 | | Local-first 模型 | Llama / Qwen 等開源 quality 追近 | 持續 | | Agent 治理層 | LangSmith / Helicone / Phoenix 競爭 | 2026 後加速 | | Code agent benchmark | SWE-bench Pro / Terminal-Bench / Aider / 私有 repo eval | 2026 H1 後常態化 | | 自主 SWE agent | Devin / Manus / OpenHands / Jules 競爭 | 2026 全年 | | Usage-based billing | Cursor / Windsurf / Copilot 等從請求數轉向 credits / usage | 2026 採購重點 | --- ## 15. 三家原廠生態系全圖（Anthropic / OpenAI / Google） > **本章定位**：跳出「單一工具」視角，按廠商盤點全家桶。採購談判、單一供應商深度綁定、跨家比較皆需此維度。 ### 15.1 Anthropic 生態系 **[事實]/[推論]**（**驗證方法**：anthropic.com/product / docs.claude.com）： | 類別 | 產品 | 定位 | |---|---|---| | **模型** | Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5 | 旗艦推理 / 平衡 / 速度 | | **聊天 - Web** | Claude.ai | 主入口 | | **聊天 - 桌面** | Claude Desktop（Mac / Win） | 原生 app | | **聊天 - 手機** | Claude iOS / Android | 行動端 | | **Coding Agent** | Claude Code（CLI / 桌面 / Web / VS Code / JetBrains） | 5 種前端 | | **Agent SDK** | Claude Agent SDK | 自製 agent | | **協議** | **MCP**（協議發起者） | 行業標準 | | **自動化** | Computer Use API | GUI 控制 | | **特性層** | Hooks / Skills / Memory / Plan Mode / Sub-agent / Extended Thinking / Prompt Caching | Coding Agent 高階特性 | | **API** | Messages API / Files API / Batch API / Computer Use API | – | | **託管** | AWS Bedrock / GCP Vertex AI | 企業 | | **訂閱** | Free / Pro / Team / Enterprise；Max / premium seat 依區域與方案 | 個人 → 企業 | **生態系獨家強項**： - **Coding Agent 特性最深**（Hooks / Skills / Plan / Memory） - **MCP 發起者**，協議向心力強 - **長文 reasoning + 規範遵循** 業界第一梯隊 - **缺原生圖像 / 影片生成**（要靠第三方接 API） - **手機端僅聊天**，無 Coding Agent ### 15.2 OpenAI 生態系 **[事實]/[推論]**（**驗證方法**：openai.com / platform.openai.com）： | 類別 | 產品 | 定位 | |---|---|---| | **模型 - 通用** | GPT-5.5 / GPT-5.5 Pro / GPT-5.4 / GPT-5.4 mini / nano | 旗艦多模態 / reasoning | | **模型 - coding** | GPT-5.2-Codex / GPT-5.x-Codex 線 | Codex / agentic coding | | **模型 - legacy** | GPT-5、GPT-4.1、GPT-4o | 過渡 / 存量 | | **模型 - 圖** | **GPT-Image-1**（API）/ DALL-E 3（legacy） | 文字→圖、編輯 | | **模型 - 影片** | **Sora**（1）/ **Sora 2**（**[推論]** 2025 推） | 文字→影片 | | **模型 - 語音** | TTS / Whisper / Voice mode | 文字↔語音 | | **聊天 - Web** | ChatGPT.com | 主入口 | | **聊天 - 桌面** | ChatGPT Desktop（Mac / Win） | 原生 app | | **聊天 - 手機** | ChatGPT iOS / Android | 行動端 | | **聊天 - 瀏覽器** | **ChatGPT Atlas / browser-side agent 能力**（**[推論]** 需按產品可用區確認） | 內建 ChatGPT | | **Coding Agent** | **Codex（CLI / IDE / Web / App / GitHub Action）** | 對標 Claude Code / Jules / Copilot agent | | **自動化 Agent** | **Operator**（2025-01 推） | 瀏覽器 / Computer Use | | **Agent 框架** | **Agents SDK / Agent Builder / Apps SDK** | 自製 agent / ChatGPT app | | **特性** | Memory / Custom GPTs / GPT Store / Tasks / Canvas / Projects | 多 | | **API** | **Responses API**（newer）/ Chat Completions（legacy）/ Realtime API / Files / Batch | – | | **託管** | Azure OpenAI Service | 微軟雲 | | **訂閱** | Free / Plus $20 / Pro $200 / Team / Enterprise / Edu | 多層 | **生態系獨家強項**： - **多模態最齊全**：文字 + 圖 + 影片 + 語音全有原生 - **Sora 影片生成**業界領先 - **GPT Store** 第三方 GPT 應用市集 - **Operator** 是業界首批商用 Computer Use 產品 - **Coding Agent 起步晚但追趕快**，Codex 已補 CLI / IDE / Web / app / automation 線 - **MCP 支援是跟進方**，但 Responses API / connectors 已讓 OpenAI 進入 MCP 生態核心 ### 15.3 Google Gemini 生態系 **[事實]/[推論]**（**驗證方法**：ai.google.dev / gemini.google.com）： | 類別 | 產品 | 定位 | |---|---|---| | **模型 - 旗艦** | **Gemini 3.1 Pro Preview** / Gemini 3 Pro / Gemini 2.5 Pro | **2M context** / 多模態 / coding | | **模型 - 速度** | Gemini 3 Flash Preview / 3.1 Flash-Lite Preview / 2.5 Flash | 便宜 / 高吞吐 | | **模型 - 圖** | **Imagen** / **Nano Banana** / **Nano Banana Pro** / **Nano Banana 2** | 純生成 + 編輯 | | **模型 - 影片** | **Veo 3.x** | 文字 / 圖像→影片 | | **模型 - 語音** | Gemini Live / Chirp（語音合成） | 即時對話 | | **聊天 - Web** | gemini.google.com | 主入口 | | **聊天 - 手機** | Gemini iOS / Android | 行動端 | | **聊天 - 桌面** | **[推論]** 主要走 web，無獨立 native app | – | | **Coding Agent - CLI** | **Gemini CLI** | **互動式 Agent (Research-Strategy-Execution)** | | **Coding Agent - IDE** | **Gemini Code Assist**（VS Code / JetBrains / GCP Cloud） | 對標 Copilot；整合 Project Astra 視覺能力 | | **自主 Agent** | **Jules** | 非同步 cloud coding agent，GitHub / VM / PR 工作流 | | **企業整合** | **Vertex AI Extensions** | **對接 BigQuery / 企業內部 API** | | **瀏覽器 Agent** | **Project Mariner**（**[推論]** 研究預覽） | 對標 Operator | | **多模態 Agent** | **Project Astra**（**[推論]** 研究預覽） | 即時相機+語音 agent | | **研究助手** | **NotebookLM** | 多源文件 RAG / Audio Overview | | **Playground** | **Google AI Studio**（aistudio.google.com） | Prompt 試驗 | | **Workspace 整合** | Docs / Sheets / Slides / Gmail / Drive 內嵌 Gemini | 辦公全套 | | **API** | Gemini API（個人）/ Vertex AI（企業） | – | | **託管** | Vertex AI（GCP） | 企業 | | **訂閱** | Free / Gemini Advanced $20 / Business / Enterprise | 多層 | **生態系獨家強項**： - **Context 最大**：**2M tokens** 領先業界，適合全局重構 - **Workspace 整合最深**：Docs / Sheets / Slides / Drive / Gmail 都嵌 Gemini - **Vertex AI Extensions**：可直接連動企業資料庫 (BigQuery) - **計費最低**：Flash-Lite 為三家最便宜 - **多模態原生最強**：影像理解 / Astra 即時相機視覺整合 - **生態整合度** 較分散（Jules / CLI / Code Assist 三條線） ### 15.4 三家對照（一張表） | 維度 | Anthropic | OpenAI | Google Gemini | |---|---|---|---| | **旗艦模型** | Opus 4.7 | GPT-5.5 | Gemini 3.1 Pro Preview | | **Context 上限** | 1M | 1M（GPT-5.5）| **2M (Vertex/AI Studio)** | | **原生圖像生成** | | GPT-Image-1 / DALL-E | Imagen / Nano Banana | | **原生影片生成** | | Sora | Veo 3.x | | **原生語音** | | Realtime API | Live / Chirp | | **Coding Agent** | Claude Code（特性最深）| Codex（多入口）| Gemini CLI / Jules / Code Assist | | **Computer Use** | API（beta）| Operator（產品化）| Project Mariner（預覽）| | **MCP 角色** | **發起者 / AAIF 捐贈方** | 採用 / connectors | 採用 / SDK 支援 | | **企業託管** | AWS Bedrock / GCP Vertex | Azure OpenAI | GCP Vertex AI | | **Workspace 整合** | 弱 | Microsoft 365 Copilot **[推論]** | **強**（Google Workspace）| | **計費最低（Flash 級）**| Haiku 4.5 $1/$5 | GPT-5.4 nano / mini 線需查 pricing | **Flash-Lite (最高性價比)** | | **訂閱起步價** | Pro $20 | Plus $20 | Advanced $20 | **戰略含義**： - **要寫 code 深度**：Anthropic 生態最強（Claude Code + MCP） - **要多媒體生成**：OpenAI / Google 二選一，Anthropic 沒這層 - **要 Workspace 辦公整合**：Google 唯一選 - **要多模型靈活**：用第三方工具（Cursor / Cline）跨家接 --- ## 16. 知識管理 / 筆記 AI 工具（Obsidian 等） > **本章定位**：Coding 之外的「個人 / 團隊知識庫 + AI」工具線。專業團隊普遍同時部署 1 個 coding agent + 1 個知識管理工具。 ### 16.1 Obsidian + AI plugins（最熱筆記 + AI 組合） **[事實]** Obsidian 本身是免費 markdown 筆記 app（Mac / Win / Linux / iOS / Android），AI 能力靠**社群 plugin 接外部 LLM API**。 **主流 AI plugins**（**[推論]**，**驗證方法**：obsidian.md/community-plugins 搜「AI」）： | Plugin | 功能 | 接哪家 LLM | |---|---|---| | **Smart Connections** | 語意搜尋 / 相關筆記推薦 / Chat with notes | OpenAI / 本地 embedding | | **Copilot for Obsidian** | 對話 / 改寫 / 摘要 / RAG | Claude / GPT / Gemini / Ollama | | **Text Generator** | 模板化生成 | OpenAI / Anthropic | | **Smart Composer** | inline 補完 | 多家 | | **Obsidian Web Clipper** + AI | 網頁→筆記 + 自動摘要 | – | | **Cubox / Readwise + Obsidian** | RSS / Highlights → 筆記 | – | **戰略定位**： - **完全本地優先** — 筆記檔案在你硬碟，AI 是外掛層 - **可接 MCP** — 部分 plugin 開始支援 MCP server（**[推論]** 2025 後） - **適合**：研究者 / 寫作者 / 個人知識庫 / 第二大腦 **對比 Notion AI**： - Obsidian = local-first + 自由插件 + 開源筆記庫 - Notion AI = SaaS + 內建 AI + 團隊協作 ### 16.2 Notion AI **[推論]** Notion 內建的 AI，2023 推出後持續擴充。 **核心功能**： - AI Writer（內建寫作 / 摘要 / 翻譯） - Q&A（問整個 workspace） - AI Connectors（接 Slack / GitHub / Drive 等查詢） - Notion Calendar AI **戰略定位**：團隊協作 + AI，**SaaS 重，本地輕** ### 16.3 NotebookLM（Google） **[事實]** Google 的 Gemini-powered 研究助手。 **核心功能**： - 上傳多源文件（PDF / Drive / 網址） - 對所有來源做 RAG 問答 - **Audio Overview**：自動生成兩人 podcast 解讀文件 - **Mind Map** / Study Guide / Briefing Doc **獨家**：Audio Overview 是 2024–2025 病毒功能 ### 16.4 其他 AI-first 筆記工具 **[推論]**（**驗證方法**：各官網）： | 工具 | 特色 | |---|---| | **Mem.ai** | AI-first，自動 organize | | **Reflect Notes** | AI 啟發 / 自動連結 | | **Tana** | Graph + AI，類 Roam | | **Logseq** | 開源 + 本地，類 Obsidian | | **Capacities** | Object-based + AI | | **Roam Research** | 雙鏈筆記，無強 AI | | **Heptabase** | 視覺 + 卡片 + AI | | **AnythingLLM** | 自架本地 RAG（**非筆記 app**，是自架 RAG 平台，性質與上列筆記工具不同；列此供對照） | ### 16.5 個人工作流範例 **[推論]** 業界常見組合： | 場景 | 組合 | |---|---| | **個人研究 / 寫作** | Obsidian + Smart Connections + Copilot for Obsidian + Claude API | | **團隊文件 / 協作** | Notion AI + Slack / GitHub Connectors | | **論文 / 多源研究** | NotebookLM + Drive + Gemini | | **隱私敏感 / 本地** | Obsidian + Logseq + Ollama 本地模型 | | **第二大腦 + 公開分發** | Obsidian + Quartz publish + AI 自動摘要 | ### 16.6 與 Coding Agent 的整合 **[推論]** 2025 後趨勢： - **Obsidian → MCP server → Claude Code** — 從筆記庫拉 context 進 coding agent - **Notion → Claude.ai Connector** — 直接從 Claude.ai 查 Notion - **NotebookLM ↔ Drive ↔ Gemini CLI** — 全 Google 生態通 **驗證方法**：搜「Obsidian MCP server」/「Notion MCP」於 GitHub --- ## 附錄 A. 標記體系說明 | 標記 | 意義 | 是否需驗證方法 | |---|---|---| | [事實] | 直接讀過 / 驗證過 | 否 | | [推論] | 沒驗證但有外部 source | **必附** | | [猜測] | 沒驗證且無外部 source | **必附** | | [做了] | 動作完成 | 否 | | [等待回應] | 等決策 | 否 | | [過時] | 標的已不適用 | 否 | --- ## 附錄 B. 驗證方法清單彙整 | # | 待驗證項目 | 方法 | |---|---|---| | 1 | 各模型最新計費 | anthropic.com/pricing / platform.openai.com/pricing / ai.google.dev/pricing | | 2 | SWE-bench Verified 排行 | swebench.com | | 3 | LMArena 排名 | lmarena.ai | | 4 | MCP server 列表 | mcp.so / github.com/modelcontextprotocol/servers | | 5 | Cursor / Windsurf 訂閱細節 | cursor.com/pricing / codeium.com/pricing | | 6 | Claude Code 完整 docs | docs.claude.com/claude-code | | 7 | GPT / Gemini 模型規格 | platform.openai.com/docs / ai.google.dev/docs | | 8 | OpenAI MCP 支援聲明 | 搜「OpenAI MCP support 2025」官宣 | | 9 | Aider repo-map 細節 | aider.chat/docs/repomap.html | | 10 | Computer Use sandbox 設計 | docs.claude.com/computer-use | | 11 | Devin 定價 | cognition.ai/pricing | | 12 | OpenHands 排行 | swebench.com leaderboard | | 13 | Manus 現況 | 搜「Manus AI 2025」 | | 14 | OpenAI Operator | openai.com/operator | | 15 | Gemini CLI / Jules 現況 | ai.google.dev / jules.google.com | --- ## 附錄 C. 縮寫 / 名詞表 | 術語 | 解釋 | |---|---| | **Agent** | 自主呼叫工具、多步執行的 AI | | **MCP** | Model Context Protocol，AI ↔ 外部軟體標準協議 | | **Tool Use** | LLM 呼叫 function 的能力（OpenAI: function calling）| | **Computer Use** | 直接控制 GUI（截圖+滑鼠+鍵盤）的 API | | **Context Window** | 模型一次能處理的 token 數 | | **Prompt Caching** | 重複 prompt 部分的快取，降費降 latency | | **Extended Thinking** | Claude 內部 reasoning token，可控制深度 | | **Sub-agent** | 主 agent 開的子 agent，獨立 context | | **Hooks** | 工具事件 callback（如 Pre/PostToolUse）| | **Skills** | 可重用指令包（slash command 觸發）| | **MDC / Cursor Rules** | 專案級規則檔，自動注入 prompt | | **SWE-bench** | 真實 GitHub issue 修復 benchmark | | **TCO** | Total Cost of Ownership | | **OpenRouter** | 統一 API key 接百家 LLM 的中介 | | **LiteLLM** | 開源 LLM gateway / proxy | | **Bedrock** | AWS 託管 LLM 服務 | | **Vertex AI** | GCP 託管 LLM 服務 | | **Nano Banana** | Google Gemini 原生圖像生成 / 編輯能力的產品命名；含 Nano Banana、Nano Banana Pro、Nano Banana 2 等線 | --- ## 附錄 D. 核心參考資料 **[事實]** - Anthropic 官方文件：docs.claude.com - Anthropic Opus 4.7 / Sonnet 4.6 / Haiku 4.5 / pricing：anthropic.com/claude/opus、anthropic.com/claude/sonnet、anthropic.com/claude/haiku、claude.com/pricing - MCP 規範：modelcontextprotocol.io - MCP governance / AAIF：anthropic.com/news/donating-the-model-context-protocol-and-establishing-of-the-agentic-ai-foundation - OpenAI Platform docs: platform.openai.com/docs - OpenAI models / pricing / Codex docs：developers.openai.com/api/docs/models、openai.com/api/pricing、developers.openai.com/codex - Google AI docs: ai.google.dev - Google Gemini 3 / Nano Banana / Gemini CLI / Jules：ai.google.dev/gemini-api/docs/gemini-3、ai.google.dev/gemini-api/docs/nanobanana、blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent、jules.google - Cursor / Windsurf / Cline / GitHub Copilot docs：cursor.com/pricing、docs.windsurf.com、docs.cline.bot、docs.github.com/copilot **[推論]** 業界資源（**驗證方法**：搜尋當前最新版）： - SWE-bench leaderboard: swebench.com - LMArena: lmarena.ai - MCP server 索引: mcp.so / smithery.ai - Aider docs: aider.chat - Cline GitHub: github.com/cline/cline - OpenHands GitHub: github.com/All-Hands-AI/OpenHands --- ## 附錄 E. 用戶環境啟用狀態（內部用，呈報前移除） > **[事實]** 標記基於：system prompt + memory + 對話可觀察證據 + **2026-05-02 系統實測查證** > **V** = 已啟用 / **X** = 未啟用 / **** = 已配置但狀態不明 / *** = 證據不足 ### E.1 Coding Agent 平台 | 工具 | 狀態 | 證據 | |---|---|---| | **Gemini CLI** | **V** | **系統當前運行中** | | Claude Code CLI（Windows） | **V** | 系統當前運行 | | Claude Code 桌面 app | **X** | 全系統無 claude*.exe；無 Start Menu 捷徑 | | Claude Code VS Code 擴充 | **X** | `code --list-extensions` 無 anthropic/claude；`~/.vscode/extensions/` 無對應資料夾 | | Claude Code JetBrains 擴充 | **X** | 未見 | | OpenAI Codex CLI | **V** | `mcp__codex-cli__*` 工具載入 | | Jules（Google）| **X** | 未見 | | OpenHands | **X** | 未見 | | OpenAI Operator | **X** | 未見 | | Devin | **X** | 未見 | | Manus | **X** | 未見 | | Cursor | **X** | 未見 | | Windsurf | **X** | 未見 | | Cline | **X** | 未見 | | Continue.dev | **X** | 未見 | | Aider | **X** | 未見 | | GitHub Copilot | **X** | 未見 | ### E.2 聊天類工具 | 工具 | 狀態 | 證據 | |---|---|---| | Claude.ai（web）| **V** | Claude Max 訂閱涵蓋 | | Claude Desktop（Win 聊天 app）| **X** | 全系統無 claude*.exe；`AppData/Local/Claude/` 只有 `Logs/` 子目錄無執行檔；Start Menu 無捷徑 | | Claude iOS app | **V** | **[推論]** 對話中提及 iOS | | Claude Android app | **X** | **[推論]** 用戶為 iOS | | ChatGPT app / web | *** | 未見 | | Gemini app / web | *** | 未見 | ### E.3 訂閱與 API 帳號 | 服務 | 狀態 | 證據 | |---|---|---| | **Claude Max** | **V** | memory `user_claude_code_usage_profile.md` 確認 | | Anthropic API key（直連）| *** | Max 涵蓋，未必另開 | | OpenAI API key | **** | Codex CLI 推測需 key（ChatGPT Plus / API key 二擇一）| | Google Gemini API key | **** | **Gemini CLI 運行中，推測已有 API Studio Key** | | OpenRouter | **X** | 未見 | | Cursor Pro | **X** | 未見 | | Windsurf Pro | **X** | 未見 | | GitHub Copilot 訂閱 | **X** | 未見 | ### E.4 MCP servers 已裝 | Server | 狀態 | 證據 | |---|---|---| | **codex-cli** | **V** | OpenAI Codex CLI 工具集 | | **mempalace** | **V** | **自製知識圖譜記憶系統** | | **Gmail** | **X** | 需認證但未完成 | | **Google Calendar** | **X** | 同上 | | **Google Drive** | **X** | 同上 | | filesystem | **X** | 未見 | | git | **X** | 未見 | | github / gitlab | **X** | 未見 | | slack | **X** | 未見 | | notion | **X** | 未見 | | linear / jira | **X** | 未見 | | puppeteer / playwright | **X** | 未見 | | brave-search / exa / tavily | **X** | 未見 | | postgres / sqlite / mongodb | **X** | 未見 | | sentry / cloudflare / stripe | **X** | 未見 | ### E.5 專業軟體 MCP | Server | 狀態 | 證據 | |---|---|---| | Adobe Photoshop MCP | **X** | 未見 | | Adobe Premiere MCP | **X** | 未見 | | Adobe After Effects MCP | **X** | 未見 | | Adobe Illustrator MCP | **X** | 未見 | | Unity MCP | **X** | 未見 | | Unreal Engine MCP | **X** | 未見 | | Blender MCP | **X** | 未見 | | Figma MCP（官方）| **X** | 未見 | | DaVinci Resolve MCP | **X** | 未見 | ### E.6 Computer Use / 自動化 | 項目 | 狀態 | 證據 | |---|---|---| | Anthropic Computer Use API | **X** | 未見 | | Browserbase / Anchor Browser | **X** | 未見 | ### E.7 平台與終端環境 | 項目 | 狀態 | 證據 | |---|---|---| | Windows 11 Home 桌面 | **V** | system OS 確認 | | macOS | **X** | – | | Linux | **X** | – | | iOS 手機 | **V** | **[推論]** 對話中提及 | | Android | **X** | – | | VS Code（IDE 本體）| **V** | 安裝於 `~/AppData/Local/Programs/Microsoft VS Code/` | | Git Bash mintty | **V** | memory `user_terminal_env.md` 確認 | | Windows Terminal（雙窗）| **V** | memory（`wt-dual.bat`）| | PowerShell 7+ | **V** | system shell | ### E.8 模型使用偏好 | 模型 | 狀態 | 比例 / 用途 | |---|---|---| | Claude Opus 4.7（含 1M context）| **V** 主力 | ~69% (memory) | | Claude Sonnet 4.6 | **V** | ~17% | | Claude Opus 4.6 | **V** | ~14%（含 fast mode）| | **Gemini 3.1 Pro** | **V** | **目前正在與 Gemini CLI 協作中** | | GPT 系列（透過 Codex CLI）| **V** | second opinion / review | ### E.9 知識管理 / 筆記 AI 工具 | 工具 | 狀態 | 證據 | |---|---|---| | **Obsidian** | **X** | 全系統無安裝路徑 | | Notion（含 Notion AI）| **X** | 全系統無安裝路徑 | | NotebookLM（Google）| *** | Web 工具，無本地安裝判斷依據 | | Mem.ai / Reflect / Tana / Logseq / Heptabase | **X** | 未見 | ### E.10 圖像 / 影片生成（API 訂閱） | 服務 | 狀態 | 證據 | |---|---|---| | OpenAI GPT-Image-1 / DALL-E | *** | 取決於 OpenAI API key 狀態 | | Sora / Sora 2 | *** | 同上 | | Google Imagen / Nano Banana | **X** | Gemini API key 未見 | | Google Veo | **X** | 同上 | | Midjourney | *** | 未見證據 | | Stable Diffusion / Flux 本地 | **X** | 未見 | ### E.11 採購建議路徑（基於現況） **[推論]** 從上述環境推導： | 動作 | 預期 ROI | 建議優先級 | |---|---|---| | 完成 **Gmail/Calendar/Drive 連接器 OAuth** | 已配置但卡認證一步，**解鎖文檔直接轉代碼能力** | ]最高優先）| | 採納 **混合雲路徑 (Path E)** | **Claude 推理 + Gemini 2M 掃描**，效能成本最優解 | | | 裝 **VS Code 擴充**（Anthropic Claude Code）| Claude Max 已涵蓋，diff 比 terminal 直覺 | | | 裝 **Claude Desktop**（Win 聊天 app）| 純聊天比 CLI 順，不用排隊 tool call | | | 裝 **github MCP** | issues / PR 自動化 | | | **Cursor / Windsurf** | 訂閱重複付費 | 不建議 | --- **報告完。** ----- Sent from JPTT on my Samsung SM-A5560. -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.241.74.239 (臺灣) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1777771035.A.470.html