世界最高水準の動画生成AI『Veo2』
概要
Google DeepMindが開発した動画生成AI「Veo 2」
2024年12月16日にリリースされた世界最高水準の性能を誇る動画生成AIが、ついに2025年2月23日に日本でも利用が可能になりました。
その性能は他の競合モデルを凌駕し、Metaが提供するベンチマークテスト「MovieGenBench」において総合評価で1位を獲得。
現在、”最高峰の動画生成AI”と世界中のユーザーから評価されています。
このモデルは、テキストや画像を基に高品質な動画を生成する能力を持ち、最大4K解像度の映像を作成することができます。
現実世界の物理法則や人間の動き、表情の微妙なニュアンスをより正確に再現することが可能で、リアリズムと映像の忠実度を大幅に向上させています。
また、映画撮影技術に関連する専門用語を理解しており、特定のレンズやカメラアングル、被写界深度などの指示に基づいたシネマティックな表現も可能。
今回は動画生成AIの新たなスタンダードを確立していくであろう『Veo2』についてご紹介します。
1. Veo 2とは?
Veo 2は、Google DeepMindが開発した最先端のAI動画生成ツールで、2024年12月16日にリリース。
Google Labsの「VideoFX」プラットフォームを通じて提供が開始されました。
テキストプロンプトや静止画像を入力するだけで、超高品質な動画を生成できます。(現在、最大4K解像度、最長8秒間の動画を生成可能)
従来のモデルと比較して、現実世界の物理法則や人間の動作・表情の忠実な再現が可能であり、極めてリアルな映像を誰でも制作することができます。
1.1.Veo2の利用方法
動画生成AI「Veo2」を始めるには、以下の2つの方法があります:
①順番待ちリストに登録
Google Labsの「VideoFX」ページで順番待ちリストに登録する必要があります。承認されると利用可能になります。
②Freepikの有料プランを利用
Veo2が統合されているFreepikの有料プランへの加入することにより、Veo2をすぐに体験できます。
1.2. Veo2の主な特徴と機能
✅ 高解像度の動画生成
最大4K解像度/最長8秒の映像を生成可能。
映画品質のビジュアルを実現。
✅ リアルな動きと物理法則の再現
人間の表情や動作を忠実に再現。
ハルシネーションを抑制し、不自然な映像を削減。
✅ 柔軟なカメラ操作
映画撮影技術に基づく演出が可能。
「ローアングルのトラッキングショット」「浅い被写界深度」など、プロの撮影手法を指定可能。
✅ 多様なビジュアルスタイル
アニメーション風、映画風、リアル映像など、用途に応じたビジュアル表現が可能。
✅ 直感的な操作性
テキストプロンプトを入力するだけで動画を自動生成。
専門知識がなくても簡単に扱える直観的なUI。
✅ AI生成の識別機能(SynthID透かし)
生成された動画に、AI生成であることを示す「SynthID」透かしが埋め込まれている。
フェイク動画の拡散を防止。
2.Veo2の映像クオリティ
※筆者はFreepikのPremiumプラン利用
現在リリースされているText to Video機能(テキストから動画を生成する機能)で動画を生成してみました。
実際のプロンプトと合わせていくつかご紹介します。
※今後のアップデートでImage to Video機能(アップロードした画像から動画を生成する機能)が展開予定
動画①
プロンプト:Steadicam follow shot: The camera smoothly follows behind a young boy riding a skateboard down an urban street in the golden hour light. The setting is a quiet neighborhood with tree-lined sidewalks and graffiti-covered walls. His hoodie flutters in the wind as he effortlessly glides over cracks in the pavement. The warm glow of the sun casts long shadows, creating a cinematic and nostalgic atmosphere. Dust particles dance in the air as he pushes forward.
動画②
プロンプト:Slow motion close-up shot: A breathtakingly beautiful woman turns her head gracefully, her long hair flowing gently as she gazes back with a captivating expression. The camera focuses on her radiant face, highlighting her deep, expressive eyes and soft, flawless skin. Backlit lighting enhances the natural glow of her features, creating a dreamy and ethereal effect. The scene is set against a blurred, golden sunset background, adding warmth and depth to the moment. Cinematic and moody aesthetics enhance the elegance and intimacy of the shot.
動画③
プロンプト:A cute Japanese woman filming herself with a selfie stick as she walks through the city at night, seen from her selfie camera’s perspective. The footage has stabilization enabled but still shows slight natural camera shake.
実写と遜色ないリアルな解像度はもちろんですが、AI動画特有の”不自然な人物やカメラワークの動き”や”人体描写の破綻”が全く見られない驚異のクオリティです!
(本記事の執筆にあたり、Veo2で約20本の動画を生成しましたが、不自然なモーションや描写破綻が発生した動画は一つもありませんでした。)
プロンプトで指示したカメラワーク/カメラアングル、照明の演出も正確に動画で再現していることにも目を見張ります。
このクオリティの高さは、たしかに他の動画生成AIの中でも群を抜いており、”最高峰の動画生成AI”と言えるかもしれません。
3. Veo2の期待される活用シーン
🔹 YouTube Shorts
YouTube Shortsに統合されているDream Screen機能に、2025年2月13日、YouTubeがVeo 2を組み込みました。
これにより、誰でもテキストプロンプトを入力するだけで、YouTubeのショート動画において、独自の動画クリップを生成することが可能に。
🔹 広告・プロモーション
🔹 映画・映像制作
🔹 教育・トレーニング
🔹 ソーシャルメディア
まとめ - 動画生成AIの転換期
群雄割拠の動画生成AI市場において、『Veo2』の登場は大きな転換点となっています。
Veo2は、世界最高水準の性能を誇る動画生成AIとして、クリエイターや企業の映像制作に革命をもたらす存在となっていくことでしょう。
その驚くべきリアルな描写とプロ顔負けのシネマティックな演出能力は、これまでの動画生成AIを超えるクオリティだと実際に利用してみて感じました。
まさに、映像制作のあり方を根本から変えるポテンシャルを秘めた動画生成AIと思います。。
しかし、その一方で、著作権の問題やディープフェイク動画の拡散といった新たな課題も浮かび上がっていくのではないでしょうか。
昨今の高度な動画生成AIの進化は、利便性の向上をもたらす一方で、倫理的・法的な課題への対応がますます求められる時代を迎えていることの裏返しとも言えるでしょう。
今後、Veo2は「Image to Video」機能をはじめ、さらなるアップデートが予想されます。
リリース直後から”最高峰の動画生成AI”として注目を集めるVeo2の最新情報を、「AIとハタラクラボ」では今後も発信していきます。
執筆、編集作業の所要時間
所要時間: 180分
人間: 90分
AI: 90分
内訳
記事執筆(by 人間): 90分
記事構成(by AI):15分
誤字脱字の確認(by AI): 10分
編集(by AI): 20分
添削(by AI): 15分
動画生成(by AI): 30分
人間のみで記事作成した場合に想定される所要時間: 240分
AIによる所要時間削減率: 25%