AI 影片在 2025 年跨過了「真的能用」這條線,然後整個領域大爆發。2026 年至少有八個模型值得考慮,單一段 10 秒 clip 的價格從 0.2 美金到 4 美金都有。重點是要知道哪個工具贏在哪種鏡頭 — 沒有一個是全能冠軍。
Runway Gen-4:剪接師的全能首選
對已經在做影片的人來說,Runway 介面最熟悉。看起來就像一般剪接軟體,輸出穩定,動態自然。Gen-4 在角色一致性上比 Gen-3 好太多 — 同一個人物可以橫跨多個鏡頭而臉不會跑掉。
Runway 強在:短敘事 clip、MV 鏡頭、廣告 B-roll、任何需要「一系列相關鏡頭」而不只是「一張英雄 clip」的場景。Director Mode 的鏡頭運動控制(orbit、dolly、pan)是這個產業最可靠的。價格也合理,大概每秒 720p 5 個 credit。
弱點:Runway 看起來就是 Runway。看多了 AI 影片的觀眾會認得那種微微的「滑感」。臉部寫實度不如 Veo。長鏡頭(10 秒以上)常常會漂掉。
Google Veo 3:寫實感的領先者
當任務是「要看起來像真的拍的」,Veo 3 是首選。皮膚紋理、景深、光線物理 — 它最接近真正的攝影。Veo 還支援原生音訊(背景音樂、環境音、對嘴 dialog),光是這點對某些工作流就值得了;其他模型都還是要你後製加音軌。
Veo 適合:高品質廣告鏡頭、寫實對話頭、任何觀眾會在意紋理跟光線的場景。Gemini app 把 Veo 開得很便宜給一般用戶;production 用 Vertex AI 或 Gemini API。
弱點:風格很窄。要它畫風格化的動漫感或繪畫感,結果都很冷。安全濾鏡也是所有影片模型裡最嚴的 — 涉及人物、品牌 logo、政治邊緣內容都會被擋或被淡化。
Kling 2.0:prompt 服從度怪物
快手的 Kling 出來時讓整個產業吃驚,2.0 把它推上頂級選項。Kling 比其他模型更會「按照你說的做」。複雜 prompt、特定動作、角色互動、不尋常的鏡頭運動都比 Runway 或 Veo 接近預期。長鏡頭也強 — 10 秒連續可用畫面很正常。
Kling 適合:動作戲、多角色各做各事的場面、Veo 或 Runway 處理不好細節的 prompt。中文介面跟對華語區友善的伺服器,對台港 builder 來說省下不少美國工具的金流麻煩。國際用戶走 klingai.com。
弱點:美感不穩定。同一個 prompt 可能出一個電影感鏡頭,也可能出有點塑膠感的。clip 之間的角色臉部一致性弱於 Runway。西方市場品牌力還小,教學跟 prompt 工藝社群主要在中文圈。
OpenAI Sora 2:還好,但不再領先
Sora 2024 demo 改變了整個產業。實際產品(2026 年 ChatGPT 跟 API 裡的 Sora 2)穩,但沒在任何指標上領先了。貴、安全濾鏡嚴、render 1-3 分鐘、品質大概是 Runway 中段。
Sora 適合:跟 ChatGPT 整合的工作流(聊天時描述場景就生影片),以及把現有圖轉影片這件事處理得很好。如果你已經訂了 ChatGPT Pro,偶爾需要影片,Sora 很方便。如果影片是工作流的固定輸出,Runway 或 Veo 是更好的專門選擇。
Pika、Luma、Hailuo、Hunyuan 等其他選項
- Pika 2.0 — 風格化、卡通、VFX 重的場景最強。比 Runway 便宜。迷因跟短影音很適合。
- Luma Dream Machine — 快、便宜、社群內容夠用。鏡頭控制基本。
- Hailuo(MiniMax) — 中文模型很強、超便宜、品質稍弱但進步很快。
- Hunyuan Video — 騰訊開源。需要好 GPU 才能自架。第一個真正可信的開源影片模型。
- Wan 2.1 — 阿里巴巴的開源對手,也能自架,Apache 2.0 授權。品質略遜 Hunyuan 但授權更寬鬆。
什麼時候不適合用
任何要在畫面停留超過 10-15 秒的東西。現在的模型擅長 clip,不擅長要連貫並有意圖的長鏡頭。如果你要做 90 秒的產品影片,用 AI 出單獨鏡頭,然後像真正的剪接師一樣硬剪,用切點藏掉模型的崩壞點。不要試著叫 AI 用一個連續長 take 講 90 秒的故事。
任何涉及真實、可辨識的真人 — 就算對方同意 — 在 2026 年都是法律地雷。美國好幾個州都有專門針對 AI 生成的肖像權法規。要嘛拿到明確簽名授權,要嘛只用 AI 原創角色。
任何動作物理要精準的場景(運動分析、科學演示、教學影片裡動作要做對的)。AI 還是會幻覺物理 — 四肢穿過物體、水往上流、重力怪怪的。
成本實況
2026 年每 10 秒 clip 大概價(中段):
- Veo 3 via Gemini API:$1.50-3.00
- Runway Gen-4:$1.50-2.50
- Kling 2.0:$0.30-0.80(價格優勢明顯)
- Sora 2:$1.20-4.00
- Hailuo:$0.10-0.30(主流裡最便宜)
如果你在量產 — 例如 SaaS 公司產 100 個廣告測試版 — $0.30 跟 $3.00 之間就是真錢。一次性創作就無所謂。
決策樹
- 寫實、高製作感:Veo 3
- 編輯流程、多鏡頭、角色一致:Runway Gen-4
- 複雜 prompt、動作戲、性價比:Kling 2.0
- 風格化、卡通、迷因:Pika 2.0
- 最便宜堪用:Hailuo 或 Luma
- 自架、開源權重:Hunyuan Video 或 Wan 2.1
2026 年大部分製作會留兩個訂閱:Runway 處理大部分工作 + Veo 或 Kling 處理主工具搞不定的鏡頭。
下一步
- 學 image-to-video 工作流(從 Flux 或 Midjourney 出靜態圖再讓它動)
- 看一下能很好處理 AI clip 的剪接工具:CapCut、Descript、Resolve
- 想要自架 Hunyuan 或 Wan 工作流的話試試 ComfyUI
- 看一下 AI 影片的「安全構圖」 — 每個模型擅長哪種主題