人工知能は2021年に興味深い場所にあります。この分野での開発は、今後数十年で最大の技術的進歩を表す可能性がありますが、今日でもその革命のごくわずかな部分だけが展開するのを見てきました。 機械学習を厳密にAI と見なすかどうかにかかわらず、この分野での加速画期的な影響があります。
私たちはすでにこの革命の真っ只中にいます。ビデオゲームは、制作のほぼすべての段階でAIを活用できる独自の位置にあります。 AIはすでに
最近のすべてのアプリケーションの中で、最も興味深いものの1つは、改造コミュニティで公開されているAIツールを採用していることです。これらは、モッダーがAI画像強調による画質やAI音声合成による声優などのコア制約をターゲットにするのに役立ちます。 Skyrim用のWyrmstoothmodの作成者である
声の演技は、ソロや非常に小さなチームで作業することが多い改造者にとって常に挑戦的でしたが、それでも需要は RPGゲームは、フルボイスのキャストに向かう傾向があります。 「ほとんどの場合、改造者は新しいNPCとのプレイヤーの相互作用のために既存の音声ラインを転用することに制限されています」とJonx0rは説明します。 「したがって、クエストmodで物語を前進させる責任は、主にNPCの肩にかかっています。」
NPCのコミュニティの声優はオプションのままですが、Geraltのような主人公に一貫した独特の声を1つ持つことで、公式コンテンツとコミュニティコンテンツの間に明確な線が引かれます。 Nikich340 、 The Witcher 3 mod A Night to Remember は、まさにこの理由から、CyberVoiceの印象的に複製されたGeralt音声を使用することを選択しました。 「ストーリーに必要な適切なフレーズを取得するために、いくつかの行をスライスするだけでは不十分なことは明らかでした」と彼は言います。
主人公を描写するために既存の行を切り刻むことに頼る必要なしに、作成者は通常どおり自由にスクリプトを作成できます。 「改造コミュニティには才能のある作家がたくさんいます」とJonx0rは言います。 「[音声合成]は、プレイヤーキャラクターの開発、物語、選択肢が豊富なクエストやコンパニオンモッドにつながる可能性があると思います。」
何よりも、そのようなツールはたくさんあるようです。 Jonx0rは、FastTacotronやRealTime Voice CloningなどのGitHub上のいくつかの異なる音声合成リポジトリの出力を比較してから、Skyrimの音声動作の最も近いエミュレーションとしてNvidia Tacotron2リポジトリに落ち着きました。 「そこから、Audacityでオーディオをアップサンプリングして、実際の声優の品質と一致するようにできることを行いました。」
一方、
Nikich340は、既存のGeralt音声からの特定の音声回線についてCyberMindに連絡しました。彼は完璧な見本でした、とNikich340は説明します:「感情のない声はジェラルトの性格に合っています。」
では、これらのツールはどこから来たのですか? 「ビデオゲームは最初から役割を果たしてきました」と、博士課程の学生でオープンソースの開発者である Dan Ruta xVASynth の機械学習ベースの音声合成アプリです。フォールアウト4で有声の主人公を使用するというベセスダの決定によって2018年に拍車がかかり、ルタはコミュニティを改造するための解決策が必要であることを知っていました。ツールの説明ページには、クエスト、音声コンパニオン、ダイアログの拡張と変更、翻訳が含まれるようになりました。
同様に、Mind SimulationLabの
一般的な人工知能の
xVASynthとCyberVoiceはどちらも、現在利用可能なAIツールの多様性を示しています。前者はオープンソースのダウンロード可能なアプリケーションであり、後者は一元化されており、自己資金によるラボからの有料製品としてクラウドで実行されます。どちらも、彼らのアプローチにはメリットがあると信じています。
xVASynthを使用すると、ユーザーは文のすべての文字のピッチと長さを調整できます。 「これにより、線がどのように話されるかを正確に 制御できます」とRutaは説明します。「特に強調と感情の観点から」。 Rutaは、クラウドで実行されているCyberVoiceや15.aiなどのツールがどのデバイスからでもアクセスできるという利点があることを認めていますが、オープンソースツールのコミュニティ所有権を好みます。 「コミュニティはいつでも完全で無制限のアクセス権を持っています」とRutaは言います。 「Modは、最近のプラグインシステムを介して実際のツール用に作成できます。したがって、ツールは私の不在下でも存在し、進化し続けることができます。」
一方、Derikyantsは、CyberVoiceによって生成されるオーディオの品質と、
このスペースの現在の制限は何ですか?印象的な結果にもかかわらず、Nikich340は、機械学習が引き継ぐ準備ができているかどうかについて懐疑的なままです。 「音声による改造は常に注目を集めるのに適していますが、人工的な音声は実際の音声と競合することはできず、何年もの間競合することはできません」とNikich340は主張します。
ライブラリに追加: ここでSkyrimを入手または
「新しい開発が行われるにつれて、合成音声の信頼性は今後数年間で向上すると期待しています」とJonx0r氏は言います。 「合成音声の韻律を簡単に変更できるリポジトリがすでに利用可能です。」 Neural Parametric Singing Synthesizerの存在と品質も、作曲家を興奮させています。「才能のある作曲家LeónvanderStadtの助けを借りて、Wyrmstoothの新しいバードソングの歌声を合成してみるかもしれません。」
機械学習も単純で迅速なプロセスではありません。 「遅くなる可能性があります」とJonx0rは言います。 「通常、特定の声から新しいTacotronおよびWaveGlowモデルをトレーニングするには、数日から1週間かかります。また、歪みを最小限に抑えてコヒーレントモデルをトレーニングするには、データセットに少なくとも数時間分のオーディオが必要です。これらの新しいAIベースのテクノロジーをより利用しやすくするユーティリティがさらにリリースされることを期待しています。 xVASynthはこの良い例です。 Skyrim、Fallout 4、The Witcher 3などのさまざまなゲームから増え続ける音声タイプのリストをサポートし、非常にきめ細かいレベルでのピッチ編集をサポートします。」
「xVASynthのやることリストはまだかなり長いです」とRutaは言います。一度に多数の行を生成するバッチ合成モード(数百行のキャラクターに便利)や、自分の声からピッチと持続時間の変化を生成するスピーチツースピーチモードなどの最近の追加は、ごく一部を構成します。そのリストの。新しい声を訓練するためにコミュニティを改造するためのコンパニオンツールもカードにあります。 「このアプリは現在、25以上のゲームで約300の音声をサポートしていますが、コミュニティトレーニングツールがリリースされると、これらの数は急増すると確信しています」とRuta氏は熱心に語っています。
CyberVoiceは、より多くの音声、他のサービスとのより多くの統合、より多くのサポートされている言語など、すべてのことを約束します。たとえば、音声の権利を保護するためのオーディオファイルでのデジタル署名の作成、およびアクセントのない言語間の多言語音声合成は、Derikyantsの優先事項です。
現在の改造シーンでのAIの限定的かつ的を絞った使用は、クリエイターが素晴らしい結果を達成するのに役立っています。ウィッチャー3のジェラルトは、彼のモノトーン配信により、CyberVoiceがほとんどのパフォーマンスを再現できるようにしましたが、現在のAI音声モデルを備えた他のほとんどのキャラクターをシームレスに提示することはできませんでした。 「より多くのツールが確実に登場し、機械学習は間違いなく、改造コミュニティを含むゲーム開発の大部分になるでしょう」とRuta氏は言います。
「本当に興味深いのは、ゲーム内での機械学習モデルのリアルタイム使用です。機械学習用のリアルタイムゲームアプリケーションは、 NvidiaのDLSS とレイトレーシングノイズ除去ですでに確認できます。モデル」とルタは説明します。この潜在的なAIが注入された未来は、CyberMindのパンとバターです。リップシンク、ビジュアル、キャラクターアニメーションと動き、および場所はすべて、機械学習アプローチによって生成される可能性があります。 「それは業界の構造変化になるでしょう」とDerikyantsは述べています。
「ゲームがその周りに注意深く設計されている場合、ゲームフレームを実際の生活のように見せるためのリアルタイムの画像間変換モデルさえあるかもしれません」とRuta氏は言います。
「しかし、後で、プレイヤーの応答が事前に作成されていないNPCの会話や、NPCが明示的にプログラムされていなくても周囲の世界に反応できる状況などが発生する可能性があります」とRuta氏は言います。 p>
Rutaによると、MODとAIの最良の交差点はまだありません。 「