アニメーションにおける人工知能:最新動向 2024年2月

アニメーションにおける人工知能:最新動向 2024年2月

2023年にはAI(人工知能)が誰の口にも上りましたが、2024年に何が待ち受けているのか、そしてアニメーション制作スタジオに何をもたらすのかは、まだ誰にも完全には分かっていません。

AIほど賛否が分かれるテーマはほかにありません。ある一方では、作品がアルゴリズムによって違法に取り込まれていることに憤るアーティストがいます。対するもう一方では、自己表現や金銭的な利益のためにAIを活用する新しい波のクリエイターが現れています。

あなたの意見がどちらであれ、私たちはアニメーション業界に、利用可能なツールの概要と、その実用的なユースケース、そしてアニメーターとしての仕事にどのような影響を与えうるのかを把握してもらうことが重要だと考えました。この記事は、一般的なAIアートとあなたを差別化する方法を見つけるのに役立つだけでなく、関連する場面ではツールセットのもう一つの道具としてAIを取り込む方法も示してくれるはずです。

以下のリストは網羅的ではありませんが、コンセプトアートからレンダリングまで、制作プロセスのあらゆるステップをカバーしようとしています。ぜひ、みなさんのおすすめもお寄せください!

1. テキスト生成

AIの最初で最も注目される用途はテキスト生成です。人工知能を使って、最初のプロンプトにもとづきテキストを自動で書かせること—数語を入力すると、学習した大量のデータから、そこに基づく全文を生成してくれます。大規模言語モデルは、アニメーションスタジオ向けにさまざまな一般的・専門的タスクをこなせます:

  • 脚本づくりの着想 - シーンやキャラクターの説明案を出したり、セリフを生成したり、プロットのひねりのアイデアを提案したりできます。
  • シーンの説明 - アニメーターがシーンをイメージしやすくするために、詳細なシーン説明を生成し、カメラアングルを決めたり、アニメーション全体の雰囲気を確立したりするのに役立ちます。
  • キャラクターの過去設定 - 主要な特性を指定することで、アニメーターはさまざまなキャラクターのニュアンスを試し、よりバランスの取れた説得力ある人物像を作り出せます。

リンクと参考情報

2. 画像生成

AIが扱えるのはテキストだけではありません。おそらく2023年でもっとも物議を醸した技術の一つが、DALL·EやMidJourneyのような画像生成モデルです。これらは高度なニューラルネットワークを使って、テキストのプロンプト、あるいは別の画像から画像を生成します:

  • 図形を完全なイラストに変える - アニメーションスタジオは、スクリプトから—あるいは少なくともテキストによる説明から—新しいプロジェクトのための多様なコンセプトアートを素早く作り出し、さまざまなデザインの可能性を探れます。
  • ラフスケッチを完成イラストへ - Midjourneyは下書きのようなスケッチを理解し、完成したイラストに変換できます。
  • キャラクターおよび環境デザイン - AI生成の画像は、キャラクターデザインの出発点として、または環境やレイアウトのさまざまなアイデアを探るために使えます。アニメーターがそこから作り込むための視覚的な参照(リファレンス)として機能します。
  • テクスチャ生成 - すでにDream Textures(Blenderプラグイン)のような、テクスチャ生成に特化したモデルがあります。キャラクター、オブジェクト、または環境に利用できます。

Dream Textures(Blender)を使ったテクスチャ生成の例

テキスト生成と組み合わせれば、大きな手間をかけずにコンセプトブック全体を生成することも可能です。これは明らかに、小規模スタジオやインディーアニメーターにとって、ほとんどコストをかけずにプロデューサーへコンセプトを売り込む際に大きな利点になります。

リンクと参考情報

3. アップスケーラー

AIアップスケーラーは、手作業による介入なしに、画像や動画の解像度と品質を高めます。

  • より速く、より安くレンダリング - スタジオは厳しい締め切りに対応し、コンテンツを素早く納品する必要があります。しかしレンダリングは、多くの場合フィードバックループにおける最大のボトルネックです。AIアップスケーラーなら、低品質のレンダリングを受け取り、通常のレンダリングと比べて遜色のない高品質なプレビューを、より短い時間で出力できます。 Blenderアップスケーラー などが例で、同等の品質の画像を37分から5分へ(86.5%高速化)短縮できます:
  • リアリティの追加 - Photoshop UpscalerやMagnific AIのようなアップスケーラーは、あらゆるレンダリングに素早くディテールを加えて、より細部が見える/よりリアルに見えるようにできます。低解像度の画像から、シーンに素早くディテールを足したいとき、またはフォトリアルなキャラクターを作りたいときに特に役立ちます。

リンクと参考情報

4. モデル生成

技術の進歩があまりに速いため、私たちは画像の一歩先へ進んでいます。すでに、スマホの画像を本番用の3Dアセットへ変換するためのコンセプト実証(PoC)も存在します。

  • 自動アセット作成 - 制作には大量のアセットが必要で、それを作ることはしばしば退屈で時間のかかる作業です。AIは画像から3Dモデルを生成できるため、アニメーターが細部の追加や最終結果の仕上げに集中できるようになります。
  • キャラクターのカスタマイズとバリエーション - AIによる3Dモデル生成は、外見、服装、アクセサリーにおけるバリエーションを自動で生成することで、キャラクターのカスタマイズを容易にします。
  • 手続き型アニメーション - 複雑な環境や大規模な群衆では、AIは多様な3Dモデルやアニメーションを手続き的に(プロシージャルに)スケールへ適用し、はるかに効率よく生成できます:

リンクと参考情報

5. 動画生成

プロンプトと任意の画像を入力すると、AIが動画を生成してくれます!

画像を生成できるなら、動画も生成できます。しかし現時点での主な技術的な難しさは、スケールさせたときに一貫性のあるフレームを生成することです。技術はまだ黎明期ですが、数秒分の映像によって短い動画を生成し、絵コンテに使える形にすることはすでに可能です。

たとえば、TikTokやYouTubeで「にんじん物語(Carrot Saga)」のバイラルクリップを見たことがあるかもしれません。何百万という再生回数を得ています:

リンクと参考情報

6. リアルタイムレンダリング

リアルタイムレンダリングとは、ミリ秒単位でアニメーションのフレームを生成し、即座に表示するプロセスです。レンダリングは伝統的に計算コストが高い作業ですが、AIを活用したレンダリングなら、さまざまなタスクでほぼ即時の結果を提供できます:

  • 事前可視化 - リアルタイムレンダリングにより、アニメーターは動き、表情、インタラクションをすぐに確認でき、より魅力的なキャラクターや環境を作ることができます。
  • インタラクティブなストーリーテリング - リアルタイムレンダリングを使えば、ユーザーの選択がストーリー展開に動的に影響するインタラクティブな物語を制作できます。AIアルゴリズムが別のシーンやキャラクター、結果のレンダリングを支えることで、より没入感のある体験を観客に提供できます。
  • 協同プロトタイピング - リアルタイムレンダリングはプロトタイピングの段階で非常に価値があります。アニメーターがさまざまなビジュアルスタイル、ライティング設定、カメラアングルをすぐに試せるからです。プロジェクトの異なる要素に取り組むアーティスト同士が、即座に更新内容を共有でき、より効率的な共同ワークフローを促進します。

リンクと参考情報

7. キーフレームアニメーション

キーフレームアニメーションは、動きの開始点と終了点を定義するために一連のフレームを作成する手法です。Cascadeur のようなAIツールは、アニメーターに膨大な時間を節約できます:

  • 自動補間 - AIによる補間(インターポレーション)は、キーフレーム間のフレームを生成する別の方法です。いくつかのポーズから、Cascadeurはキーフレームだけでなく、セカンダリモーションも含めたリアルなモーションアニメーションを生成できます。
  • リグ生成 - Cascadeurは、複雑な3Dモデル用のリグも自動生成できます。

リンクと参考情報

8. ロトスコープアニメーション

ロトスコープアニメーションは、実写の映像をなぞり、リアルなアニメーションを作り出す手法です。AIは、ロトスコーピングのプロセスを支援しつつ、さまざまなメリットを提供します:

  • Vtuber - リアルタイムレンダリングと組み合わせることで、AI支援のロトスコープアニメーションを使い、ライブ配信やその他の動画コンテンツ向けのバーチャルアバターを作成できます。
  • 自動フレーム検出 - AIアルゴリズムは実写映像の中からキーフレームを自動で検出し、ロトスコーピングの初期段階を効率化します。これにより、フレームごとのトレースに必要な手作業を減らせます。
  • トレース支援 - AIは、キャラクターやオブジェクトの輪郭をなぞるなど、特定のトレース作業を自動化して、アニメーターを支援できます。

リンクと参考情報

9. 画像認識

画像認識とは、画像の中の物体を特定し分類するプロセスです。 

  • シーン分解と分析 - AIアルゴリズムは複雑なシーンを解析し、キャラクター、オブジェクト、背景、照明条件といった要素を自動で特定・分類できます。この機能により、シーン分解のプロセスがシンプルになり、各フレームの詳細な分析が可能になって、さらにレビューを速めるために、シーン内の視覚要素をより効率的に理解しやすくなります。
  • 注釈 - テキスト生成ツールと組み合わせることで、AIはストーリーボードに説明やメモを自動で付けられます。これにより、アニメーション制作に関わる異なるチーム間でのコミュニケーションを簡潔にし、各プレビューのフレームにおける意図された視覚要素や物語要素を、関係者全員が明確に理解できるようにします。
  • 顔認識と表情分析 - アニメーターはモーショントラッキングを活用してリアルなアニメーションを実現できます。これがVtuberアバターによるリップシンクやハンドシンクの実装方法です。
  • 品質管理とエラー検出 - AIは品質管理に活用でき、画像内の異常、エラー、不整合を自動で検出して、アニメーション制作プロセスの精度を高め、制作パイプラインの早い段階でスタジオが問題を発見し修正できるよう支援します。

リンクと参考情報

10. 声優(ボイス演技)

AI支援の声優(ボイス演技)とは、アニメーションキャラクターやその他の音声コンテンツについて、音声の生成または強化を行うことです。

  • テキスト読み上げ(TTS)合成 - AIは、書かれたテキストを自然な抑揚や表現を伴って話し言葉へ変換できます。アニメーションスタジオは、TTSを使って素早くプロトタイプを作ったり、仮のボイスオーバーを生成したり、人間の声優を起用する前にセリフのバリエーションを試したりできます。
  • 音声クローンと複製 - AIは特定の声優のスタイル、トーン、ニュアンスを分析し、実質的にその声をクローンできます。この機能は、プロジェクト間での一貫性を保ったり、元の声優が利用可能でない場合でも追加のセリフを作ったりするのに役立ちます。
  • 多言語の音声生成 - AIによる音声生成は複数言語での発話を可能にし、世界中の視聴者に対応する柔軟性を提供します。アニメーションスタジオはコンテンツを容易にローカライズでき、広範な手作業による音声収録を行わずに、キャラクターが各言語で自然に話しているかのようにできます。

リンクと参考情報

結論

AIはすでにアニメーション業界を変え始めており、今後数年でその流れはさらに続いていくでしょう。まだ始まったばかりではあるものの、コンセプトアートからレンダリング、そして配信に至るまで、アニメーションスタジオにおけるAIの可能性はすでに見えてきています。

アニメーション制作のアーティストにとって、AIは制作プロセスを効率化し、初期スキルに関係なく、より創造性を発揮できる強力な道具です。

AIは人間の創造性に取って代わるものではなく、アニメーターの道具箱の中のもう一つのツールであることを忘れないことが重要です。つまり、近い将来には一人で作るアニメーションスタジオの新しい波が来ることが期待できるだけでなく、スタジオ間の連携もさらに増えていくでしょう。もちろん、人件費の低下により、より多くのプロジェクトが生まれることも期待できます。

最後になりましたが、AIプラットフォームは著作権(作者の権利)への対応を迫られ、制作の現場に広く浸透するために適切な形を見つける必要があります。アーティストの承認がなければ、アート生成は繁栄できません。これらの点がクリアになれば、この新しい技術は私たちの目を楽しませるために、創造性を押し上げるはずです!

クリエイティブな制作パイプラインの未来について語りたい、または世界中の1000人以上のアニメーション専門家と気軽に交流したい場合は Discordに参加してください

この記事はいかがでしたか?

ニュースレターを購読して、さらなる考察、チュートリアル、業界ニュースをお受け取りください。