Gemini Omni Video:一站式多模態 AI 影片生成器
Gemini Omni Video 是谷歌的新多模態 AI 影片模型。上傳參考圖像、音訊、或影片剪輯,撰寫簡短提示,Gemini Omni Video 創建或完善遵循每個輸入的影片。一個 Gemini Omni Video 模型處理所有模態 — 無需額外工具。
一次 Gemini Omni Video 生成中的多模態參考
Gemini Omni Video 可以以任何組合讀取文字、圖像、音訊和視頻輸入。放入一張參考照片以獲得視覺風格、插入視頻剪輯以獲得運動,或是插入音軌以獲得節奏 — Gemini Omni Video 將每種模態融合為單一剪輯,而無需使用不同的 AI 工具。
使用 Gemini Omni Video 的參考引導影片編輯
上傳一段現有的視頻,讓 Gemini Omni Video 使用新的參考進行編輯。使用樣式圖像更換外觀,用音樂剪輯替換聲音軌道,或使用另一段視頻重新映射運動。Gemini Omni Video 在保持未更改部分穩定的同時重新渲染視頻。
由 Gemini Omni Video 驅動的風格和運動轉移
將參考圖像交給 Gemini Omni Video 以獲得視覺風格,並提供參考剪輯以進行鏡頭移動,Gemini Omni Video 將它們融合為您的視頻。非常適合匹配品牌外觀、複製熱門剪輯或重現電影鏡頭 — 全部在一次 Gemini Omni Video 生成中完成。
自然運動、聲音和口型同步
早期的 Gemini Omni Video 演示顯示出乾淨的口型同步、栩栩如生的聲音和平滑的鏡頭運作。將人像和音軌提供給 Gemini Omni Video,就能獲得嘴巴與言語相符的講話片段;加載產品參考,Gemini Omni Video 則呈現出穩定的現實鏡頭。
如何使用 Gemini Omni Video
上傳您的參考資料
導入 Gemini Omni Video 應該讀取的輸入 — 參考圖像、音訊、影片剪輯或任何組合。Gemini Omni Video 讓您自由混合模態,因此您可以僅提供一個參考或同時層疊幾個。
描述您的需求
撰寫簡短提示告訴 Gemini Omni Video 要生成什麼或如何完善剪輯。Gemini Omni Video 將您的提示與上傳的參考資料結合,並規劃完整的鏡頭 — 動作、照明、身份和時機。
生成並下載
點擊生成,Gemini Omni Video 將渲染該片段。預覽結果,更換參考或調整提示以進行迭代,然後下載完成的 Gemini Omni Video 輸出,為您的下一個項目做好準備。
有關Gemini Omni Video的常見問題
什麼是 Gemini Omni Video?
Gemini Omni Video 是谷歌的新多模態 AI 影片模型。Gemini Omni Video 通過在單一模型內讀取文字提示、參考圖像、音訊和影片剪輯來生成和編輯影片。不像處理每種模態的舊 AI 影片工具,Gemini Omni Video 將它們統一,讓一次生成滿足您的整體意圖。
Gemini Omni Video 與 Veo 3 有何不同?
Veo 3 專注於帶有原生音訊的電影級視頻生成。Gemini Omni Video 更進一步,除了文字提示外,還接受圖像、音訊和視頻參考,並處理參考驅動的編輯 — 不僅僅是生成。早期資訊也顯示,Gemini Omni Video 是一個統一的多模態模型,而不是僅限於影片的模型。
Gemini Omni Video 何時可用?
谷歌尚未正式推出 Gemini Omni Video。Gemini Omni Video 首次出現在 2026 年 5 月的 Gemini 應用測試中,預計將在 2026 年 Google I/O 上揭幕。啟動時的訪問可能與付費的 Gemini 計劃有關,並有限的免費試用。
Gemini Omni Video 支援哪些輸入?
Gemini Omni Video 支援四種您可以組合的參考類型:文字提示、參考圖片、音頻軌道和參考視頻。單獨使用文字,為風格層疊圖片,添加音頻以配合節奏或語音,或提供一個視頻片段以表現動作——Gemini Omni Video 可以無需重新訓練地讀取這些模態的任何子集。
Gemini Omni Video 可以編輯我已經有的視頻嗎?
是的。上傳您現有的片段並提供描述更改的參考輸入——一個風格圖片、一個音樂軌道或另一個參考視頻。Gemini Omni Video 根據這些參考重新渲染該片段,同時保持拍攝中未受影響的部分穩定。
Gemini Omni Video 是否包含聲音和口型同步?
早期的 Gemini Omni Video 示範展示了自然的聲音和準確的對口型。提供一個肖像加上音頻參考,Gemini Omni Video 創作出一個口型與言詞匹配且聲音聽起來像人的講話片段。
我可以將 Gemini Omni Video 用於廣告或社交媒體嗎?
是的。Gemini Omni Video 非常適合短廣告、產品示範和社交短片。提供 Gemini Omni Video 一個品牌風格的參考圖片以鎖定一致的外觀,然後為不同的平台重新混合變體,而無需重新拍攝任何內容。
Gemini Omni Video 可以免費使用嗎?
在 Google 的一方,Gemini Omni Video 預計將是一項限於付費 Gemini 級別的高級功能,並有有限的免費使用。進入 Omni Video,您可以使用點數運行 Gemini Omni Video——購買點數包或邀請朋友以賺取免費生成。
哪種影片最適合搭配 Gemini Omni Video 使用?
對於 Gemini Omni Video,短片段中只需一個明確焦點的片段效果最佳:一個人講話、一個桌子上的產品,或是兩三個行動的快速場景。Gemini Omni Video 能很好地處理現實的動作和燈光,當您需要匹配特定圖片、音軌或動作來源的片段時,基於參考的工作流程表現良好。
立即開始使用 Gemini Omni Video 創作
通過上傳任何組合的文字、圖片、音頻和視頻參考來使用 Gemini Omni Video 生成 AI 視頻。從頭創作,重新混合您已擁有的素材,並發送精修的短片——所有這一切都在 Omni Video 的一個 Gemini Omni Video 模型內完成。