人工知能は2021年に興味深い場所にあります。この分野での開発は、今後数十年で最大の技術的進歩を表す可能性がありますが、今日でもその革命のごくわずかな部分だけが展開するのを見てきました。 機械学習を厳密にAI と見なすかどうかにかかわらず、この分野での加速画期的な影響があります。

私たちはすでにこの革命の真っ只中にいます。ビデオゲームは、制作のほぼすべての段階でAIを活用できる独自の位置にあります。 AIはすでにアーティスト向けの世界構築ツール、マルチプレイヤーでの音声フィルタリング、その他インテリジェントボット画像のアップスケーリング 、およびフォトリアリスティックグラフィックスの生成。

最近のすべてのアプリケーションの中で、最も興味深いものの1つは、改造コミュニティで公開されているAIツールを採用していることです。これらは、モッダーがAI画像強調による画質やAI音声合成による声優などのコア制約をターゲットにするのに役立ちます。 Skyrim用のWyrmstoothmodの作成者である Jonx0r は、これらの能力はそうではないと考えていますModderがトリプルAゲームと技術的に同等になるのを助けるだけでなく、創造性の新しい波を解き放ちます。

声の演技は、ソロや非常に小さなチームで作業することが多い改造者にとって常に挑戦的でしたが、それでも需要は RPGゲームは、フルボイスのキャストに向かう傾向があります。 「ほとんどの場合、改造者は新しいNPCとのプレイヤーの相互作用のために既存の音声ラインを転用することに制限されています」とJonx0rは説明します。 「したがって、クエストmodで物語を前進させる責任は、主にNPCの肩にかかっています。」

Wyrmstooth mod in Skyrim

NPCのコミュニティの声優はオプションのままですが、Geraltのような主人公に一貫した独特の声を1つ持つことで、公式コンテンツとコミュニティコンテンツの間に明確な線が引かれます。 Nikich340 The Witcher 3 mod A Night to Remember は、まさにこの理由から、Cyber​​Voiceの印象的に複製されたGeralt音声を使用することを選択しました。 「ストーリーに必要な適切なフレーズを取得するために、いくつかの行をスライスするだけでは不十分なことは明らかでした」と彼は言います。

主人公を描写するために既存の行を切り刻むことに頼る必要なしに、作成者は通常どおり自由にスクリプトを作成できます。 「改造コミュニティには才能のある作家がたくさんいます」とJonx0rは言います。 「[音声合成]は、プレイヤーキャラクターの開発、物語、選択肢が豊富なクエストやコンパニオンモッドにつながる可能性があると思います。」

何よりも、そのようなツールはたくさんあるようです。 Jonx0rは、FastTacotronやRealTime Voice CloningなどのGitHub上のいくつかの異なる音声合成リポジトリの出力を比較してから、Skyrimの音声動作の最も近いエミュレーションとしてNvidia Tacotron2リポジトリに落ち着きました。 「そこから、Audacityでオーディオをアップサンプリングして、実際の声優の品質と一致するようにできることを行いました。」

声の男性主人公フォールアウト4

一方、

Nikich340は、既存のGeralt音声からの特定の音声回線についてCyber​​Mindに連絡しました。彼は完璧な見本でした、とNikich340は説明します:「感情のない声はジェラルトの性格に合っています。」

著作権所有者、特に俳優は、使用料を受け取る価値があると信じています

Leonid Derikyants

CEO

では、これらのツールはどこから来たのですか? 「ビデオゲームは最初から役割を果たしてきました」と、博士課程の学生でオープンソースの開発者である Dan Ruta xVASynth の機械学習ベースの音声合成アプリです。フォールアウト4で有声の主人公を使用するというベセスダの決定によって2018年に拍車がかかり、ルタはコミュニティを改造するための解決策が必要であることを知っていました。ツールの説明ページには、クエスト、音声コンパニオン、ダイアログの拡張と変更、翻訳が含まれるようになりました。

同様に、Mind SimulationLabの Cyber​​Voice は、独自のビデオゲームに触発された起源を、はるかに野心的なCyber​​Mindのコンポーネントと見なしていました事業。 「私たちのプロジェクトは、NPCを生き生きとさせることを目的としています」とMindSimulationのCEOであるLeonidDerikyantsは説明します。 「私たちは彼らにインテリジェンスを与え、デジタルパーソナリティを作成したいので、あなたが探求の外にいる場合でも彼らとコミュニケーションをとることは興味深いです。」

The Witcher 3 Night to Remembermodのダイアログ

一般的な人工知能の議論の余地のない目標の追求、Derikyantsのラボは、Cyber​​Voiceですぐに役立つ、より根拠のあるツールを見つけました。 「物理的に声に出せないコンテンツがたくさんあります」とDerikyantsは言い、本の4.5%しか聞くことができないと指摘します。同様に、Cyber​​Voiceには、Webサイトからの記事の読み取りや、ストリーマーへの寄付メッセージなどのリアルタイムアプリケーションもあります。 「これらはすべて短期的に利用可能です」とDerikyants氏は言います。

xVASynthとCyber​​Voiceはどちらも、現在利用可能なAIツールの多様性を示しています。前者はオープンソースのダウンロード可能なアプリケーションであり、後者は一元化されており、自己資金によるラボからの有料製品としてクラウドで実行されます。どちらも、彼らのアプローチにはメリットがあると信じています。

xVASynthを使用すると、ユーザーは文のすべての文字のピッチと長さを調整できます。 「これにより、線がどのように話されるかを正確に 制御できます」とRutaは説明します。「特に強調と感情の観点から」。 Rutaは、クラウドで実行されているCyber​​Voiceや15.aiなどのツールがどのデバイスからでもアクセスできるという利点があることを認めていますが、オープンソースツールのコミュニティ所有権を好みます。 「コミュニティはいつでも完全で無制限のアクセス権を持っています」とRutaは言います。 「Modは、最近のプラグインシステムを介して実際のツール用に作成できます。したがって、ツールは私の不在下でも存在し、進化し続けることができます。」

ウィッチャー3ナイトトゥリメンバーmod

一方、Derikyantsは、Cyber​​Voiceによって生成されるオーディオの品質と、他のAIツールによって生成される倫理的および法的問題。 「著作権所有者、特に俳優は、ロイヤルティを受け取るに値すると信じています」とDerikyants氏は言います。 「そして、Cyber​​Voiceは適切なプラットフォームと法的前例を形成できると信じているので、将来的にはディープフェイクに溺れることはありません。」

このスペースの現在の制限は何ですか?印象的な結果にもかかわらず、Nikich340は、機械学習が引き継ぐ準備ができているかどうかについて懐疑的なままです。 「音声による改造は常に注目を集めるのに適していますが、人工的な音声は実際の音声と競合することはできず、何年もの間競合することはできません」とNikich340は主張します。

ライブラリに追加: ここでSkyrimを入手またはウィッチャー3はこちら

「新しい開発が行われるにつれて、合成音声の信頼性は今後数年間で向上すると期待しています」とJonx0r氏は言います。 「合成音声の韻律を簡単に変更できるリポジトリがすでに利用可能です。」 Neural Parametric Singing Synthesizerの存在と品質も、作曲家を興奮させています。「才能のある作曲家LeónvanderStadtの助けを借りて、Wyrmstoothの新しいバードソングの歌声を合成してみるかもしれません。」

Wrymstooth Skyrim mod with dragons

機械学習も単純で迅速なプロセスではありません。 「遅くなる可能性があります」とJonx0rは言います。 「通常、特定の声から新しいTacotronおよびWaveGlowモデルをトレーニングするには、数日から1週間かかります。また、歪みを最小限に抑えてコヒーレントモデルをトレーニングするには、データセットに少なくとも数時間分のオーディオが必要です。これらの新しいAIベースのテクノロジーをより利用しやすくするユーティリティがさらにリリースされることを期待しています。 xVASynthはこの良い例です。 Skyrim、Fallout 4、The Witcher 3などのさまざまなゲームから増え続ける音声タイプのリストをサポートし、非常にきめ細かいレベルでのピッチ編集をサポートします。」

人工の声は本物の声と競争することはできず、何年も競争することはできません

Nikich340

Mod作成者

「xVASynthのやることリストはまだかなり長いです」とRutaは言います。一度に多数の行を生成するバッチ合成モード(数百行のキャラクターに便利)や、自分の声からピッチと持続時間の変化を生成するスピーチツースピーチモードなどの最近の追加は、ごく一部を構成します。そのリストの。新しい声を訓練するためにコミュニティを改造するためのコンパニオンツールもカードにあります。 「このアプリは現在、25以上のゲームで約300の音声をサポートしていますが、コミュニティトレーニングツールがリリースされると、これらの数は急増すると確信しています」とRuta氏は熱心に語っています。

Cyber​​Voiceは、より多くの音声、他のサービスとのより多くの統合、より多くのサポートされている言語など、すべてのことを約束します。たとえば、音声の権利を保護するためのオーディオファイルでのデジタル署名の作成、およびアクセントのない言語間の多言語音声合成は、Derikyantsの優先事項です。

Skyrim mod Wrymstooth

現在の改造シーンでのAIの限定的かつ的を絞った使用は、クリエイターが素晴らしい結果を達成するのに役立っています。ウィッチャー3のジェラルトは、彼のモノトーン配信により、Cyber​​Voiceがほとんどのパフォーマンスを再現できるようにしましたが、現在のAI音声モデルを備えた他のほとんどのキャラクターをシームレスに提示することはできませんでした。 「より多くのツールが確実に登場し、機械学習は間違いなく、改造コミュニティを含むゲーム開発の大部分になるでしょう」とRuta氏は言います。

「本当に興味深いのは、ゲーム内での機械学習モデルのリアルタイム使用です。機械学習用のリアルタイムゲームアプリケーションは、 NvidiaのDLSS とレイトレーシングノイズ除去ですでに確認できます。モデル」とルタは説明します。この潜在的なAIが注入された未来は、Cyber​​Mindのパンとバターです。リップシンク、ビジュアル、キャラクターアニメーションと動き、および場所はすべて、機械学習アプローチによって生成される可能性があります。 「それは業界の構造変化になるでしょう」とDerikyantsは述べています。

「ゲームがその周りに注意深く設計されている場合、ゲームフレームを実際の生活のように見せるためのリアルタイムの画像間変換モデルさえあるかもしれません」とRuta氏は言います。

Geralt of Rivia in a night to Remember mod

「しかし、後で、プレイヤーの応答が事前に作成されていないNPCの会話や、NPCが明示的にプログラムされていなくても周囲の世界に反応できる状況などが発生する可能性があります」とRuta氏は言います。 p>

Rutaによると、MODとAIの最良の交差点はまだありません。 「トーマスザタンクとしてプレイしている場合Skyrimのエンジン、あなたはNPCがそれについて何か言うことを期待するでしょう。」

Categories: IT Info