OpenAI Whisper は、Windows 11/10 デバイスであなたの音声をテキストに変換します。このプログラムは OpenAI によって開発されているため、人工知能がその機能の中心にあることは明らかです。 ChatGPT が信頼できるものであれば、Whisper を強化する AI テクノロジーは一流であると信頼できます。
さらに、Whisper は次のような人に最適であると言わなければなりません。音声をテキストに変換したいが資金が少ない人。これは、AI を活用したアプリケーションが無料でダウンロードして使用できるためです。
Whisper の欠点は何ですか?
インストールはおそらく、ほとんどのユーザーが気に入らない部分の 1 つです。それは一筋縄ではいかないからだ。通常と考えられるよりも長いプロセスが必要であり、初心者ユーザーにとっては問題になる可能性があります。
さらに、AMD GPU はサポートされていません。これは、これらの GPU が、NVIDIA によって作成され、並列コンピューティング プラットフォームおよびプログラミング モデルとみなされているツールである CUDA をサポートしていないためです。
現状では、CUDA は NVIDIA GPU とそれに最も近い代替手段のみをサポートしています。 AMD の観点から見ると、Radeon Compute Platform と OpenCL です。 OpenAI は将来的にそのようなプラットフォームをサポートすると思われるため、今のところは待つ必要があります。
それでも、CUDA は他のものと比較するとより成熟しているため、それが主要なプラットフォームになる可能性があることを指摘しなければなりません。 OpenAI が当面 OpenCL と Radeon Compute Platform を廃止することを決定した理由。
Windows 11/10 に OpenAIs Whisper をダウンロードしてインストールする方法
コンピュータに Whisper をインストールして使用するには、以下が必要です。 PowerShell の使用と Python などの主要なツールのインストール。必要な手順は次のとおりです。
Python をダウンロードしてインストールするPIP をダウンロードしてインストールするChocolatey をダウンロードしてインストールするFFMPEG をダウンロードしてインストールするWhisper を使用して音声をテキストに変換する
1 ] Python をダウンロードしてインストールします
まだ行っていない場合は、<にアクセスしてください。 href="https://www.python.org/downloads/"target="_blank">Python の公式 Web サイトにアクセスし、アプリケーションをダウンロードしてインストールします。
Python は次の点に留意してください。ユーザー インターフェイスがないため、すべてコマンド ラインで行われます。
2] PIP をダウンロードしてインストールします。
Python を使用している場合は、次のことが重要です。 2.7.9 以降の場合、PIP はデフォルトでインストールされます。これは、PIP が Python インストーラーに組み込まれているためです。古いバージョンは永久にサポートされないため、最新リリースをダウンロードすることをお勧めします。
3] Chocolatey をダウンロードしてインストールします
最後に、時間をかけて Chocolatey パッケージをコンピュータにダウンロードする必要があります。
これを行うには、次のようにします。コンピュータ上で管理者としてPowerShellを開きます。
Get-ExecutionPolicyが制限されていないことを確認する必要があるため、次のコマンドを実行します。コマンドを入力して Enter キーを押します。
Get-ExecutionPolicy
「制限付き」と表示された場合は、次を実行してください。
Set-ExecutionPolicy AllSigned
または
Set-ExecutionPolicy Bypass-Scope Process
すべてが計画どおりに進むと、次のメッセージが表示されます。
貼り付けた直後に必ず Enter キーを押してコマンドを実行してください。実行ポリシーは、信頼できないスクリプトからユーザーを保護するのに役立ちます。実行ポリシーを変更すると、https:/go.microsoft.com/fwlink/?LinkID=135170 の実行ポリシーについてのヘルプ トピックで説明されているセキュリティ リスクにさらされる可能性があります。
「」と入力します。 >Y (はい) を選択し、Enter キーをクリックして変更を正式に行います。
ここで、通常どおり、次のコマンドを PowerShell に貼り付ける必要があります。 Enter キーを押します。
Set-ExecutionPolicy Bypass-Scope Process-Force; [System.Net.ServicePointManager]::SecurityProtocol=[System.Net.ServicePointManager]::SecurityProtocol-bor 3072; iex ((New-Object System.Net.WebClient).DownloadString(‘https://community.chocolatey.org/install.ps1’))
Chocolatey がコンピュータにインストールされるまで気長に待ちます。
4] FFMPEG をダウンロードしてインストールします
次のステップはダウンロードです。そしてFFMPEGをインストールします。これは Chocolatey がインストールされている場合にのみ実行できます。また、インストールは PowerShell ツールを使用して実行する必要があります。
次のコマンドをコピーして PowerShell に貼り付け、Enter キーを押します:
choco install ffmpeg
Python バージョンの FFMPEG もインストールする必要があります。次のコマンドを使用します:
pip3 install python-ffmpeg
5] Whisper をダウンロードしてインストールします
最後に、次のコマンドを使用して Whisper をコンピュータにインストールします。
pip3 install git+https://github.com/openai/whisper.git
すべてが必要です。今は正しい方向に進んでいます。自分を祝福しましょう。
6] Whisper で音声をテキストに変換する
すべてがインストールされ準備が整ったので、文字起こしを始めます。 GUI がないため、コマンド プロンプトが唯一の味方です。
始める前に、オーディオ ファイルを録音するか、コンピュータに既に保存されているファイルを準備する必要があります。
たとえば、TWCThings というフォルダに保存されている TWCAudio.mp3 というオーディオ ファイルがあるとします。
ここで最初に行うことは、次のコマンドを使用してディレクトリを変更することです:
cd C:\TWCThings
次のコマンドを使用してファイルに対して Whisper ツールを実行します:
whisper–model Base–language gr–task translation TWCAudio.mp3
フォルダーに戻り、テキスト ファイルを探します。そのファイル内には、翻訳された音声がテキスト形式で含まれています。
読む: OpenAI Playground とは何ですか、またその使用方法は何ですか?
Whisper をローカルで実行できますか?
はい、Whisper をパーソナル コンピュータ上でローカルに実行することも、このオープンソースの音声認識アプリケーションの実行をサポートするクラウド プラットフォームから実行することもできます。
Whisper AI は使用できますか?オフラインですか?
Whisper AI ツールはオフラインでの使用をサポートしていますが、強力で高速なコンピューターで最適に動作します。コンピュータの性能が低いと、ファイルが書き起こされるまでに長時間待たなければなりません。それはすべて音声録音の長さに依存します。