[新聞] 超OpenAI？ 陸團隊發布通用型AI Agent產

作者ilyj2012 (麒麟才子)

看板Gossiping

標題[新聞] 超OpenAI？陸團隊發布通用型AI Agent產

時間Thu Mar 6 22:04:48 2025

1.媒體來源: 聯合新聞網 2.記者署名: 謝守真 3.完整新聞標題: 超OpenAI？陸團隊發布通用型AI Agent產品Manus爆紅 4.完整新聞內文: 一個由大陸團隊研發的全球首個通用型AI Agent（自主智能體）產品－Manus開啟部分內測。值得注意的是，它能直接交付的完整成果遠超OpenAI同類產品，創下GAIA基準測試新紀錄。據鈦媒體報導，Manus由大陸公司Monica.im團隊研發，而Manus的名字源自拉丁語「Mens et Manus」（寓意「mind and hand」，即手腦並用），其設計哲學強調「知識不僅要在腦中，更要用手執行」。身為全球首款通用型AI Agent，Manus的定位遠超傳統聊天機器人或任務助手，其核心能力在於從目標設定到成果交付的全部自主執行，可媲美人類專家的思考與行動能力。快科技提到，比起其他同樣能操作多任務或能幫忙點外送訂飯店的Agent，Manus涵蓋更多領域和達成更高的執行品質。不論用戶需要深入的市場研究、繁瑣的文件批量處理、個性化的旅行規劃還是專業的數據分析，Manus都能透過獨立思考和系統規劃，在其虛擬環境中調用如編寫並執行代碼、智能瀏覽網頁、操作各類網頁應用等各類工具，Manus已超越其他AI，能獨立思考並採取行動。據悉，官方放出約40個案例，展示Manus在多領域的應用能力，包括個性化旅行規劃、股票分析、教育課程開發、保險政策比較、B2B供應商採購、財務報告分析、公司名單整理、在線商店運營分析、活動解釋圖製作、面試安排、潛在客戶尋找，以及記者會提詞器製作。消息一出，關注AI Agent產品的全球網友即一窩蜂湧入Manus官網，一度使其頁面當機，造成需要輸入邀請碼才能試用的局面。甚至有不少網友現在二手交易平台上求購邀請碼，導致Manus邀請碼被炒至標價人民幣999元至5萬元不等。財聯社指出，Manus在具權威性的GAIA基準測試中取得了SOTA（State-of-the-Art）的成績創下新紀錄，顯示其性能遠超OpenAI同類產品。其自主任務執行能力涵蓋金融分析、教育課件生成、工業設計等場景，單任務平均調用5.3個專業工具，複雜專案首次完成率突破78%，進一步證明AI自主智能領域邁出了重要一步。 Monica.im創辦人肖弘是位大陸年輕的創業家，1992年生，自2015年大學畢業後，肖弘開始了創業之旅，2022年隨大模型浪潮興起，正式創立Monica，專注海外市場。透過推出獨立開發者產品ChatGPT for Google，Monica迅速完成冷啟動，並獲大量用戶。 https://i.imgur.com/NkRsSuL.jpg Manus在具權威性的GAIA基準測試中創下新紀錄，顯示其性能遠超OpenAI同類產品。其自主任務執行能力涵蓋金融分析、教育課件生成、工業設計等場景，單任務平均調用5.3個專業工具，複雜專案首次完成率突破78%。圖／取自快科技 5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體: https://udn.com/news/story/7333/8591118 6.備註: Manus AI Agent 與一般的 AI 大模型（如 Deepseek、GPT-4、Claude、Gemini 等）在多個方面存在差異，主要體現在以下幾個方面： 1. 核心理念與架構一般 AI 大模型（如 GPT-4、Claude）：這些是通用的自然語言處理（NLP）大模型，通常基於 Transformer 架構，經過大規模數據訓練，能夠執行各種任務，如文本生成、翻譯、代碼編寫、問答等。 Manus AI Agent：作為一種智能代理（AI Agent），它不僅僅是一個大模型，而是具備自主決策、執行複雜任務、調用外部工具的能力。它通常由多個大模型或多個 AI 組件協作工作，以完成更複雜的自動化任務。 2. 功能定位一般 AI 大模型：主要用於文本理解與生成，例如對話、寫作、編程輔助等。主要依賴單次交互，不會自主執行後續操作。 Manus AI Agent：更傾向於成為智能體（Agent），可以持續運行，並自主調用不同工具完成特定任務（如數據分析、文檔處理、遠程控制等）。具備任務自動化能力，能進行多步決策和操作，比如自動完成流程化工作，而不僅僅是提供文本回答。 3. 多模態能力一般 AI 大模型：可能具備多模態能力（如 GPT-4o 既能處理文本，也能理解圖像、語音等）。 Manus AI Agent：可能集成多個模型，能跨越文本、圖像、語音，甚至與資料庫、API、外部軟體進行交互，實現更豐富的自動化應用。 4. 自主性 & 交互方式一般 AI 大模型：主要通過被動響應（即用戶輸入指令，模型生成輸出）。缺乏自主決策能力，不能主動執行任務。 Manus AI Agent：具備一定的自主決策能力，能夠持續運行，並根據上下文動態調整策略。可以主動推理、計劃和執行，例如處理任務隊列、主動調取外部數據、動態調整行動。 5. 實際應用一般 AI 大模型：主要應用於文本對話、創意寫作、編程輔助、翻譯等任務。 Manus AI Agent：適用於自動化辦公、數據分析、智能客服、IT 運維、AI 機器人等需要執行複雜任務的場景。可以結合 RPA（機器人流程自動化）、API 調用，甚至操作 Web 界面，實現端到端的自動化任務處理。 6. 技術實現一般 AI 大模型：以深度學習（如 Transformer 架構）為核心，依賴大規模數據訓練。主要依靠神經網絡推理，不一定具備實際執行能力。 Manus AI Agent：可能集成多個 AI 技術，如 LLM（大語言模型）、RPA（機器人流程自動化）、API 調用、資料庫查詢等，使其具備更強的任務執行能力。 -- -- ※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 50.74.253.17 (美國) ※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1741269891.A.296.html

推 xzcb2008: =.= 我真的覺得中國可能是真的越來越強36.232.238.235 03/06 22:06

→ xzcb2008: 莫名其妙的超越越來越多36.232.238.235 03/06 22:06

※ 編輯: ilyj2012 (172.56.218.210 美國), 03/06/2025 22:08:02

推 kenclyde: 這個已經被對岸自媒體人質疑了，先測風 114.39.82.215 03/06 22:07

→ neo5277: 微軟上個月就開源了MAGMA了.... 1.162.180.59 03/06 22:07

→ kenclyde: 向吧 114.39.82.215 03/06 22:07

→ neo5277: 這TMD跟MAGMA方式一樣阿 1.162.180.59 03/06 22:08

→ johnhmj: 人家共匪都做出一堆東西了反觀科技島？ 49.216.177.131 03/06 22:09

推 rainnawind: 看他的功能邏輯不符常理先別上車 49.218.92.243 03/06 22:09

→ rainnawind: 很簡單的觀念 AI不會通靈，你的指示要 49.218.92.243 03/06 22:10

→ rainnawind: 細到一定程度他的執行才能真正符合需 49.218.92.243 03/06 22:11

→ rainnawind: 求，這也是為什麼會有AI咒術師存在 49.218.92.243 03/06 22:11

推 iLeyaSin365: 這也有什麼翻車的？其實 111.82.32.31 03/06 22:13

→ iLeyaSin365: 真的有工具就用杯 111.82.32.31 03/06 22:13

推 rainnawind: 依新聞的講法，這個AI助理什麼都通， 49.218.92.243 03/06 22:13

→ rainnawind: 什麼都能自動完美執行，一要馬他內建 49.218.92.243 03/06 22:13

→ rainnawind: 咒術轉譯主動會跟你反覆確認細部需求 49.218.92.243 03/06 22:14

→ rainnawind: ，要馬你得自己coding一大票咒語才能 49.218.92.243 03/06 22:15

→ rainnawind: 讓他實現這些功能，不然他可能最多就 49.218.92.243 03/06 22:15

→ rainnawind: 是跑一套模板給你，甚至中間還有機會 49.218.92.243 03/06 22:15

→ rainnawind: 出現幻覺 49.218.92.243 03/06 22:15

推 chysh: 看起來比習近平還厲害，中國給它領導還比較 106.1.117.179 03/06 22:22

→ chysh: 有希望 106.1.117.179 03/06 22:22

推 Brioni: 就是個新玩具，但不是個改變遊戲規則的東 223.139.69.242 03/06 22:27

→ Brioni: 西 223.139.69.242 03/06 22:27

→ pooznn: 去看了中国博主示範好幾個場景看起來SOSO 111.240.25.239 03/06 22:31

→ TsmcEE: 有點感覺像手機為跑分而train的114.137.171.179 03/06 22:32

推 caelum: 傻鳥：都是幻覺，嚇不倒我的！118.171.133.238 03/06 22:32

推 LittleLuo: 突然冒出好多中國初創，之前完全沒消 61.230.58.87 03/06 22:41

→ LittleLuo: 息，資金哪來的 61.230.58.87 03/06 22:41

推 TaiwanUp: M號的anus 119.14.30.29 03/06 23:02

噓 angeltear15: ?223.141.145.203 03/06 23:10

→ lcl0128: 青鳥：假的，一切都是假的 123.193.179.84 03/06 23:17

推 kenclyde: 我說的翻車是指沒有影片中吹的那麼神， 114.39.82.215 03/06 23:21

→ kenclyde: 中國AI進步快，但也不是要亂吹一通 114.39.82.215 03/06 23:21

→ eric13940: 反觀垃圾酬庸數位部 64.68.217.49 03/06 23:24

→ henry1234562: openAI最近是一直獅子大開口沒錯220.141.216.222 03/06 23:27

→ henry1234562: 新的chatgpt4.5 超貴然後沒強多少220.141.216.222 03/06 23:28

→ henry1234562: 我看有點在收割最後一波的樣子了220.141.216.222 03/06 23:28

推 Peurintesa: 自己宣稱是通用型AI太狂妄了吧== 61.224.147.57 03/07 13:48