2026年5月23日 星期六

Google I/O 2026

2026/5/19 Google I/O 2026 盛大登場,從我的角度來看,這次 Google I/O 2026 的真正主角不是 Gemini Omni 那段影片,是 Antigravity 2.0 完全取代 Gemini CLI


每年 I/O 結束我都會問一個問題:這場 keynote 之後,開發者明天的工作流程會不會變。今年 5/19 ~ 5/20 在 Shoreline Amphitheatre 那場,答案是會,而且變動的幅度比過去幾年都大。


大多數人很容易被 Gemini Omni 那段影片生成 demo 搶走目光。Demis Hassabis 把它定位成「從任何輸入創建任何內容」,單一架構原生處理 video、audio、image、text,跨模態 reasoning 之後產出單一輸出。可以用對話編輯影片,角色、物理性質、先前的編輯在多輪對話中保持一致;對重力、流體、運動的理解明顯改善;使用者可以建自己的 avatar 拍片,建立時要錄一段念數字以防 deepfake。首發 Omni Flash 一次最多生 10 秒影片,每個輸出內嵌 SynthID 浮水印加 C2PA Content Credentials,從 Gemini app、YouTube Shorts、AI 創作工作室 Flow 進入。


這段 demo 適合上新聞,但對大多數工程師的日常沒有直接影響。會改變開發者明天工作流程的另一條線,是 Google Antigravity 2.0。


Antigravity 過去是附在 IDE 內的 agent 插件。這次升級成獨立 desktop app 加完整生態系,分成四塊:Antigravity Desktop 是圍繞 agent orchestration 設計的獨立 app,不是傳統 IDE;Antigravity CLI 完全取代 Gemini CLI,原本的 Agent Skills、Hooks、Subagents 都保留,Extensions 改名 Antigravity plugins;Antigravity SDK 開放程式化存取,跑的是 Google 內部產品用的同一套 agent harness;Managed Agents 透過 Gemini API 與 AI Studio 提供,跑在 Google 託管的環境上。Enterprise 那條線整合進 Gemini Enterprise Agent Platform。


技術層面看,新工具支援動態 subagents 平行 workflow、scheduled tasks 背景自動化、多輪 session 狀態保存、原生語音指令。


產品層面看,Google 公開選擇跟進 Claude 和 Codex:未來開發者跟 LLM 互動的單位從「我問一句、它答一句」改成 agent harness 跑一段,把多個子任務分派下去,自己處理中間的失敗、重試、狀態。


而這次,底層模型也跟著換。新發表的 Gemini 3.5 Flash 是「最新模型家族第一款,結合 frontier intelligence 與 action」,主打便宜加為 agent workflow 設計,成本大約是同等前沿模型的 1/2 到 1/3。這個價格是 Antigravity 2.0 能跑得起來的前提,agent 工作流的特性是會反覆呼叫模型,模型成本不壓下來,整個 platform 就只能服務小眾。


還有幾個比較不顯眼的工具也一起發布。Code Mender 是自動找漏洞並修補的安全工具,目前邀請外部專家測試中。Google AI Studio 加上原生 Android 支援、Workspace 整合、行動 app。Gemini API 新增 Interactions API。這幾個消息放在一起,隱約可以看到 Google 在補的是「從模型到生產系統」中間的那一段,也就是測試、安全、整合、行動端。這段過去是 Vercel、LangChain、Cursor 這些公司在做的事,Google 現在自己來。


消費者端的更新則有自己的節奏。Gemini Spark 是一般用途 AI agent,定位 24/7 personal agent,「在你指示下執行動作」。Daily Brief 是 Gemini app 每日簡報。Universal Cart 是跨網站智能購物車,agentic commerce 的基礎建設。搜尋結果加入 Search Information Agents 主動整理。Android XR 智慧眼鏡確定秋季正式推出,具備導航、訊息、拍照、Gemini live demo。Android Halo 把 agent 智能整合進狀態欄。Google Pics 是 Google Workspace 的新設計工具。SynthID 加 C2PA 的 AI 生成內容識別則擴展到更多場景,確保內容的安全。


訂閱方案部分則多了一階。新增 Google AI Ultra 月費 $100 USD,給 dev、creator、power user。


把這些放在一起看,2026 的 Google I/O 跟 2025 之前最大的差別是產品定位。過去 Google 講 AI,講的是 Gemini 變強了,更好的 benchmark、更長的 context window、更多模態。今年講的則是 AI agent,是在你指示下執行動作,是跑一段、做完一件事、回報結果。從 Omni 的多模態原生產出,到 3.5 Flash 為 agent workflow 設計的成本結構,到 Antigravity 2.0 全棧取代 Gemini CLI,到 Spark、Universal Cart、智慧眼鏡這些消費者入口,整套東西指向同一個產品形態。


來源:

- Google I/O 2026 官方 collection: https://blog.google/innovation-and-ai/technology/developers-tools/google-io-2026-collection/

- I/O 2026 developer highlights: https://developers.googleblog.com/all-the-news-from-the-google-io-2026-developer-keynote/

- Gemini Omni 詳細介紹: https://techcrunch.com/2026/05/19/googles-gemini-omni-turns-images-audio-and-text-into-video-and-thats-just-the-start/

- Antigravity 2.0 詳細介紹: https://www.marktechpost.com/2026/05/19/google-launches-antigravity-2-0-at-i-o-2026-a-standalone-agent-first-platform-with-cli-sdk-managed-execution-and-enterprise-support/


沒有留言: