作者ilyj2012 (麒麟才子)
看板Gossiping
標題[新聞] 超OpenAI? 陸團隊發布通用型AI Agent產
時間Thu Mar 6 22:04:48 2025
1.媒體來源:
聯合新聞網
2.記者署名:
謝守真
3.完整新聞標題:
超OpenAI? 陸團隊發布通用型AI Agent產品Manus爆紅
4.完整新聞內文:
一個由大陸團隊研發的全球首個通用型AI Agent(自主智能體)產品-Manus開啟部分內
測。值得注意的是,它能直接交付的完整成果遠超OpenAI同類產品,創下GAIA基準測試新
紀錄。
據鈦媒體報導,Manus由大陸公司Monica.im團隊研發,而Manus的名字源自拉丁語「Mens
et Manus」(寓意「mind and hand」,即手腦並用),其設計哲學強調「知識不僅要在
腦中,更要用手執行」。身為全球首款通用型AI Agent,Manus的定位遠超傳統聊天機器
人或任務助手,其核心能力在於從目標設定到成果交付的全部自主執行,可媲美人類專家
的思考與行動能力。
快科技提到,比起其他同樣能操作多任務或能幫忙點外送訂飯店的Agent,Manus涵蓋更多
領域和達成更高的執行品質。不論用戶需要深入的市場研究、繁瑣的文件批量處理、個性
化的旅行規劃還是專業的數據分析,Manus都能透過獨立思考和系統規劃,在其虛擬環境
中調用如編寫並執行代碼、智能瀏覽網頁、操作各類網頁應用等各類工具,Manus已超越
其他AI,能獨立思考並採取行動。
據悉,官方放出約40個案例,展示Manus在多領域的應用能力,包括個性化旅行規劃、股
票分析、教育課程開發、保險政策比較、B2B供應商採購、財務報告分析、公司名單整理
、在線商店運營分析、活動解釋圖製作、面試安排、潛在客戶尋找,以及記者會提詞器製
作。
消息一出,關注AI Agent產品的全球網友即一窩蜂湧入Manus官網,一度使其頁面當機,
造成需要輸入邀請碼才能試用的局面。甚至有不少網友現在二手交易平台上求購邀請碼,
導致Manus邀請碼被炒至標價人民幣999元至5萬元不等。
財聯社指出,Manus在具權威性的GAIA基準測試中取得了SOTA(State-of-the-Art)的成
績創下新紀錄,顯示其性能遠超OpenAI同類產品。其自主任務執行能力涵蓋金融分析、教
育課件生成、工業設計等場景,單任務平均調用5.3個專業工具,複雜專案首次完成率突
破78%,進一步證明AI自主智能領域邁出了重要一步。
Monica.im創辦人肖弘是位大陸年輕的創業家,1992年生,自2015年大學畢業後,肖弘開
始了創業之旅,2022年隨大模型浪潮興起,正式創立Monica,專注海外市場。透過推出獨
立開發者產品ChatGPT for Google,Monica迅速完成冷啟動,並獲大量用戶。
https://i.imgur.com/NkRsSuL.jpg
Manus在具權威性的GAIA基準測試中創下新紀錄,顯示其性能遠超OpenAI同類產品。其自
主任務執行能力涵蓋金融分析、教育課件生成、工業設計等場景,單任務平均調用5.3個
專業工具,複雜專案首次完成率突破78%。圖/取自快科技
5.完整新聞連結 (或短網址)不可用YAHOO、LINE、MSN等轉載媒體:
https://udn.com/news/story/7333/8591118
6.備註:
Manus AI Agent 與 一般的 AI 大模型(如 Deepseek、GPT-4、Claude、Gemini 等)在
多個方面存在差異,主要體現在以下幾個方面:
1. 核心理念與架構
一般 AI 大模型(如 GPT-4、Claude):
這些是通用的自然語言處理(NLP)大模型,通常基於 Transformer 架構,經過大規模數
據訓練,能夠執行各種任務,如文本生成、翻譯、代碼編寫、問答等。
Manus AI Agent:
作為一種智能代理(AI Agent),它不僅僅是一個大模型,而是具備自主決策、執行複雜
任務、調用外部工具的能力。它通常由多個大模型或多個 AI 組件協作工作,以完成更複
雜的自動化任務。
2. 功能定位
一般 AI 大模型:
主要用於文本理解與生成,例如對話、寫作、編程輔助等。
主要依賴單次交互,不會自主執行後續操作。
Manus AI Agent:
更傾向於成為智能體(Agent),可以持續運行,並自主調用不同工具完成特定任務(如
數據分析、文檔處理、遠程控制等)。
具備任務自動化能力,能進行多步決策和操作,比如自動完成流程化工作,而不僅僅是提
供文本回答。
3. 多模態能力
一般 AI 大模型:
可能具備多模態能力(如 GPT-4o 既能處理文本,也能理解圖像、語音等)。
Manus AI Agent:
可能集成多個模型,能跨越文本、圖像、語音,甚至與資料庫、API、外部軟體進行交互
,實現更豐富的自動化應用。
4. 自主性 & 交互方式
一般 AI 大模型:
主要通過被動響應(即用戶輸入指令,模型生成輸出)。
缺乏自主決策能力,不能主動執行任務。
Manus AI Agent:
具備一定的自主決策能力,能夠持續運行,並根據上下文動態調整策略。
可以主動推理、計劃和執行,例如處理任務隊列、主動調取外部數據、動態調整行動。
5. 實際應用
一般 AI 大模型:
主要應用於文本對話、創意寫作、編程輔助、翻譯等任務。
Manus AI Agent:
適用於自動化辦公、數據分析、智能客服、IT 運維、AI 機器人等需要執行複雜任務的場
景。
可以結合 RPA(機器人流程自動化)、API 調用,甚至操作 Web 界面,實現端到端的自
動化任務處理。
6. 技術實現
一般 AI 大模型:
以深度學習(如 Transformer 架構)為核心,依賴大規模數據訓練。
主要依靠神經網絡推理,不一定具備實際執行能力。
Manus AI Agent:
可能集成多個 AI 技術,如 LLM(大語言模型)、RPA(機器人流程自動化)、API 調用
、資料庫查詢等,使其具備更強的任務執行能力。
--
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 50.74.253.17 (美國)
※ 文章網址: https://www.ptt.cc/bbs/Gossiping/M.1741269891.A.296.html
推 xzcb2008: =.= 我真的覺得中國可能是真的越來越強36.232.238.235 03/06 22:06
→ xzcb2008: 莫名其妙的超越越來越多36.232.238.235 03/06 22:06
※ 編輯: ilyj2012 (172.56.218.210 美國), 03/06/2025 22:08:02
推 kenclyde: 這個已經被對岸自媒體人質疑了,先測風 114.39.82.215 03/06 22:07
→ neo5277: 微軟上個月就開源了MAGMA了.... 1.162.180.59 03/06 22:07
→ kenclyde: 向吧 114.39.82.215 03/06 22:07
→ neo5277: 這TMD跟MAGMA方式一樣阿 1.162.180.59 03/06 22:08
→ johnhmj: 人家共匪都做出一堆東西了 反觀科技島? 49.216.177.131 03/06 22:09
推 rainnawind: 看他的功能邏輯不符常理 先別上車 49.218.92.243 03/06 22:09
→ rainnawind: 很簡單的觀念 AI不會通靈,你的指示要 49.218.92.243 03/06 22:10
→ rainnawind: 細到一定程度他的執行才能真正符合需 49.218.92.243 03/06 22:11
→ rainnawind: 求,這也是為什麼會有AI咒術師存在 49.218.92.243 03/06 22:11
推 iLeyaSin365: 這也有什麼翻車的?其實 111.82.32.31 03/06 22:13
→ iLeyaSin365: 真的有工具就用杯 111.82.32.31 03/06 22:13
推 rainnawind: 依新聞的講法,這個AI助理什麼都通, 49.218.92.243 03/06 22:13
→ rainnawind: 什麼都能自動完美執行,一要馬他內建 49.218.92.243 03/06 22:13
→ rainnawind: 咒術轉譯主動會跟你反覆確認細部需求 49.218.92.243 03/06 22:14
→ rainnawind: ,要馬你得自己coding一大票咒語才能 49.218.92.243 03/06 22:15
→ rainnawind: 讓他實現這些功能,不然他可能最多就 49.218.92.243 03/06 22:15
→ rainnawind: 是跑一套模板給你,甚至中間還有機會 49.218.92.243 03/06 22:15
→ rainnawind: 出現幻覺 49.218.92.243 03/06 22:15
推 chysh: 看起來比習近平還厲害,中國給它領導還比較 106.1.117.179 03/06 22:22
→ chysh: 有希望 106.1.117.179 03/06 22:22
推 Brioni: 就是個新玩具,但不是個改變遊戲規則的東 223.139.69.242 03/06 22:27
→ Brioni: 西 223.139.69.242 03/06 22:27
→ pooznn: 去看了中国博主示範好幾個場景 看起來SOSO 111.240.25.239 03/06 22:31
→ TsmcEE: 有點感覺像手機為跑分而train的114.137.171.179 03/06 22:32
推 caelum: 傻鳥:都是幻覺,嚇不倒我的!118.171.133.238 03/06 22:32
推 LittleLuo: 突然冒出好多中國初創,之前完全沒消 61.230.58.87 03/06 22:41
→ LittleLuo: 息,資金哪來的 61.230.58.87 03/06 22:41
推 TaiwanUp: M號的anus 119.14.30.29 03/06 23:02
噓 angeltear15: ?223.141.145.203 03/06 23:10
→ lcl0128: 青鳥:假的,一切都是假的 123.193.179.84 03/06 23:17
推 kenclyde: 我說的翻車是指沒有影片中吹的那麼神, 114.39.82.215 03/06 23:21
→ kenclyde: 中國AI進步快,但也不是要亂吹一通 114.39.82.215 03/06 23:21
→ eric13940: 反觀垃圾酬庸數位部 64.68.217.49 03/06 23:24
→ henry1234562: openAI最近是一直獅子大開口沒錯220.141.216.222 03/06 23:27
→ henry1234562: 新的chatgpt4.5 超貴然後沒強多少220.141.216.222 03/06 23:28
→ henry1234562: 我看有點在收割最後一波的樣子了220.141.216.222 03/06 23:28
推 Peurintesa: 自己宣稱是通用型AI太狂妄了吧== 61.224.147.57 03/07 13:48