腦袋裡已經有畫面了,卻卡在不會剪輯這關?找外包太貴、自己學又沒時間?AI 工具看起來很強大,但光是搞懂怎麼下提示詞就已經讓人頭痛。更別說生出來的東西跟想像差了十萬八千里,改來改去還是不對。很多人影片創作的門檻,一直卡在技術,而Google 在 2026 年 I/O 大會上,正式發表 Gemini Omni 讓你用說的就能生成、編輯影片的全新模型,用學剪輯軟體,不用背提示詞格式,只要像傳訊息一樣跟它說你想要什麼,它就會幫你做出來,本篇將介紹什麼是 Gemini Omni 以及四大功能。
Gemini Omni 是什麼?
Gemini Omni 是 Google 推出的全新模型,結合了 Gemini 的邏輯推理與創作能力,能以任何輸入素材創造出任意形式的內容,並率先支援影片生成輸出。可以自由混搭圖片、音訊、影片和文字作為素材,再結合 Gemini 基於現實世界的知識,生成高品質的影片——甚至透過像聊天一樣的簡單對話來編輯影片。去年,Google 已透過 Nano Banana 將 Gemini 的智慧導入影像生成與編輯領域,幫助數百萬名使用者修復老照片、將草圖化為設計。Omni 則是這條路上令人期待的下一步。

Gemini Omni 四大核心功能
一、聊天就能編輯影片,能聽懂人話的剪輯軟體
Gemini Omni 讓你用最自然的語言進行影片編輯,而且每一次的指令都會承接上一步的脈絡,角色外觀保持一致、物理邏輯合理,場景也會記住前一幕發生的細節。具體可以做什麼?
- 改變眼前的世界
針對畫面中的特定物件進行微調,或是徹底改變整個世界背景。隨手拍下的影片,可以成為打造新世界的起點,讓你創作出過去無法親自拍攝的畫面。舉個例子:把一座雕塑改成用泡泡做的,一句話就能完成。 - 重新想像動作與情節
上傳一段拍好的影片,直接要求 Omni 改變其中的情境——調整動作、加入新角色或物品,或是把平凡瞬間變成令人意想不到的驚喜情節。例如:讓人觸碰鏡子時產生水波紋效果,同時讓手臂變成鏡面材質。 - 反覆微調影片細節
調整環境、視角、風格,甚至是特定的小細節,並保留影片原始場景的連續性。不需要每次重頭來過,Omni 會在你已有的基礎上持續疊加修改。
➤ 延伸閱讀:ChatGPT Images 2.0 是什麼? 四大亮點、免費與付費方案差異、熱門提示詞一次看

二、不只生圖,還懂世界的物理常識
Omni 不只能建構逼真的場景,還能推理接下來該發生什麼事。透過結合物理常識與 Gemini 豐富的歷史、科學與文化知識,讓生成畫面不只看起來真實,背後的邏輯也站得住腳。
- 更符合真實物理法則的畫面
Omni 大幅提升了對重力、動能與流體力學的理解,讓生成的場景更加逼真。一顆彈珠在連鎖軌道上滾動的畫面,物理細節的呈現都比過去更難挑剔。 - 融合知識與創意
透過 Gemini 的知識庫,Omni 不只是「看過很多圖就照著畫」,而是在語言、影像與背後的深層意涵間建立更深的理解。這讓生成出來的內容不只是看起來像,也要說得通。 - 複雜概念視覺化
透過簡短的提示詞,Omni 就能製作出生動的解說影片。例如:用黏土動畫風格解說蛋白質折疊的過程,所有物件都是黏土材質、以定格動畫呈現,而且內容在科學上也是準確的。
三、混搭任何素材,輸出風格一致的影片
- 參考任何東西
Omni 能將圖像、文字、影片或音訊等任何參考來源,揉合轉化為單一且風格連貫的成品。在音訊輸入上,初期先開放語音檔作為參考素材,後續會持續擴充支援的音訊類型。 - 從手邊的素材開始
透過輸入角色圖片、場景圖或手繪草圖等參考資料,就能創作出符合心中想像的作品。例如:把一張圖片的復古未來主義風格套用到實際拍攝的影片上,同時搭配對應的背景音樂。 - 套用風格、動態或特效
你可以使用參考素材來定義視覺風格,或是直接用自然對話描述你想要的效果,Omni 會融合所有輸入的參考內容,產出風格一致的短片。比如:保留原本的滑板影片畫面,再加上從滑板延伸出去的動態特效。
➤ 延伸閱讀:Claude Design 是什麼?零設計基礎也能上手的 AI 設計工具,入門教學一次看!

四、用自己的虛擬化身出鏡
使用者可以透過「虛擬化身(Avatars)」建立一個數位版本的自己,生成無論在外觀或聲音上都極具個人特色的影片。Google 表示,目前進一步編輯影片以修改音訊和語音的功能,仍在持續測試與評估,確保能負責任地將這項技術帶給大眾。
值得注意的是,所有由 Omni 創作的影片,都會包含無法以肉眼察覺的 SynthID 數位浮水印。你可以透過 Gemini 應用程式、Chrome 瀏覽器中的 Gemini 以及 Google 搜尋,驗證影片是否由 Gemini Omni 生成,確保內容透明度。

可以在哪裡使用?
目前推出的第一款模型是 Gemini Omni Flash,開放對象與管道如下:
- Gemini 應用程式 & Google Flow:Google AI Plus、Pro、Ultra 訂閱用戶可搶先體驗
- YouTube Shorts & YouTube Create:本週起免費開放給一般使用者
- API:接下來幾週將陸續開放給開發者與企業客戶使用
未來,Omni 也將逐步支援圖片與音訊等更多元的輸出模態類型。
➤ 延伸閱讀:2026 AI 工具怎麼選?7 大情境對照,免花時間盲測!

影片創作一直是有技術門檻的事,Gemini Omni 把門檻調低,讓剪片也能像聊天般輕鬆自如。不管你是內容創作者、行銷人,還是躍躍欲試的使用者,現在都有機會親身感受對話式影片生成能做到什麼程度。
資料來源:Google 台灣官方部落格


