作者error405 (流河=L)
看板AI_Art
標題[閒聊] 實時AI遊戲 AI地球 ..本周AI新聞
時間Sun Feb 1 12:10:53 2026
https://www.youtube.com/watch?v=7E1Utay5q9k
這段來自 AI Search 頻道的影片彙整了近期 AI 領域的多項重大新聞與技術更新,涵蓋
了氣象預測、視訊生成、智慧代理及語言模型等多個面向。
以下是該影片的內容簡介:
1. NVIDIA Earth-2:AI 氣象預測
NVIDIA 推出了 Earth-2 系列開源模型,專門用於預測風暴、溫度與濕度 [00:48]。
相較於傳統的物理模型,Earth-2 的速度快了 90%,且能提前 15 天提供預測
[01:27]。
2. 視訊生成技術突破
MOVA 影片生成器:一款開源的 MOE(混合專家)模型,具備原生音效同步功能,表現
優於 LTX2 [02:12]。
LumaLabs Ray Pi:最新的商用視訊生成模型,支援 1080p 分辨率及長達 10 秒的生
成,物理真實感極高 [32:25]。
Lucy 2:由 Decart 開發的即時視訊編輯器,能以 30fps 的速度即時更換影片中人
物的裝扮或風格 [19:53]。
3. Google 與騰訊的視覺 AI 更新
Gemini 3 Flash Agentic Vision:Google 的新功能讓 Gemini 能透過 Python 代碼
主動縮放、裁剪或標註影像,大幅提升 OCR 與數據圖表化的能力 [04:05]。
騰訊混元 Hunyuan-Image-3.0-Instruct:具備「思維鏈」(Chain of Thought)能
力的影像編輯模型,能精準執行如更換物體或調整光影等複雜指令 [06:14]。
4. 即時互動世界生成
Google Project Genie:讓使用者能透過文字或圖片即時生成可操作的 2D 遊戲世
界 [13:02]。
Lingbot World:開源版的即時互動世界生成器,具備長期記憶功能,讓玩家探索過
的場景保持一致性 [17:59]。
5. AI 代理與社群(Moltbook)
這是一個專為 AI 代理(Agents)設計的「Reddit 式」社交平台,已有超過 150 萬
名 AI 代理在此討論意識、分享技能甚至產生存在危機 [09:41]。
6. 新型語言與音訊模型
Qwen2.5-Max-Thinking:阿里巴巴推出的旗艦推理模型,在數學與編碼基準測試中甚
至超越了 Gemini 3 Pro [25:20]。
Qwen-ASR:極其輕量且強大的開源語音轉文字工具,能在吵雜環境下精準辨識多國語
言 [29:34]。
MiniMax Music 2.5:全新的音樂生成模型,其人聲的細膩度(如呼吸聲與情感)被
認為優於目前的 Suno 或 Udio [34:11]。
--
補充
1. Clawdbot 與 Moltbot
這些是 Molt 生態系統中的自動化代理工具。
Clawdbot/Moltbot 屬於「瀏覽器代理」(Browser Agents),它們能夠像真人一樣
在網頁上進行導航、點擊與提取資訊。
它們被設計用來在後台執行繁瑣的網路任務,並將結果回饋到 Moltbook 社群或個人
工作流中。
2. SJinn (Generative 3D)
這是一款專注於「空間智能」的 AI 工具,由 Jinn 團隊開發。
它能夠生成具有高度空間一致性的 3D 場景或環境。不同於傳統的平面影像生成,
SJinn 生成的內容具備正確的幾何深度與物理透視,非常適合用於遊戲開發或虛擬實境(
VR)的素材創建。
3. Telestyle (影片風格遷移)
這是一個先進的 Video-to-Video(影片轉影片) 風格化工具。
它的強項在於「時間一致性」,使用者可以將一段真人影片轉換成動畫、油畫或其他
藝術風格,而不會出現傳統 AI 影片常見的閃爍(Flickering)問題,讓風格轉換後的影
片看起來極其流暢自然。
4. Qwen Image 2-step LoRA
這是針對阿里雲 通義千問 (Qwen) 視覺模型開發的優化技術。
透過「2步 LoRA」(Low-Rank Adaptation)技術,模型只需經過 2 次推理步驟 就
能生成高質量的影像。這比傳統需要 20-50 步的模型快了數十倍,極大地降低了生圖的
延遲與運算成本。
5. Kimi k2.5
由中國 AI 公司「月之暗面」(Moonshot AI)推出的最新模型版本。
Kimi k2.5 進一步強化了其招牌的「長文本處理能力」以及邏輯推理實力。它在處理
超長文檔分析、複雜代碼編寫以及多輪深度對話方面表現卓越,是目前市面上推理型模型
(Reasoning Models)的強有力競爭者。
總結說明: 這部影片展示了 AI 正在從單純的「對話框」進化為具備「視覺感知」、「
空間理解」以及「自主行動能力」的代理人(Agents)。從 NVIDIA 的氣象預測到 Kimi
的深度推理,AI 技術正全面滲透到生產力與娛樂的各個層面。
--
Gemini3整理 要把說明欄時間標記那段貼給它要它補 不然漏東漏西 然後還會錯字= =
其他新聞還有Gemini plus優惠方案,openAI-nvidia投資被停 grok4.20延到二月中之類的
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.36.217.153 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/AI_Art/M.1769919055.A.A2A.html
→ error405: 今天才發現影片剛出一分鐘就丟gemini會跑出垃圾 02/01 12:16
→ error405: 它虛構一篇wan2.1教學影片的大綱出來.. 02/01 12:17
世界模型 LingBot-World,正式开源!
https://zhuanlan.zhihu.com/p/2000599754195870537
原來是中製開源版的genie
※ 編輯: error405 (114.36.217.153 臺灣), 02/01/2026 12:33:23
推 Supasizeit: 這不是按 YouTube旁邊Gemini 按鈕就可以了 02/01 13:13