ユーザーは、ランダム化された一連のテキスト プロンプトを読み上げてパーソナル ボイスを作成し、iPhone または iPad で 15 分間の音声を録音できます。この音声アクセシビリティ機能は、オンデバイスの機械学習を使用してユーザーの情報をプライベートかつ安全に保ち、Live Speech とシームレスに統合するため、ユーザーは愛する人とつながるときに個人の声で話すことができます。Appleそうです! ChatGPT と Google に続いて、今度は Apple が高度な AI の世界に足を踏み入れる番です。この旅を始めるにあたって、ティム・クック&カンパニーは何という機能を考案したのでしょうか。 iOS 17 (9 月リリース) を実行している iPad と iPhone では、自分の声のデジタル バージョンを作成できるようになります。少し考えてみましょう…Apple が自分の声の「ディープフェイク」の作成を許可するように聞こえるとしたら、それは本当だからです。ある意味。しかし、それはそれほど単純ではありません。
Apple は、15 分間のトレーニングであなたの iPhone がすぐにあなたの声で話せるようになると言っています。なぜ?そのため、「ユーザーは友人や家族とつながるときにパーソナルボイス(機能の実際の名前)で話すことができます」。しかし、これは単なるパーティートリックではありません。Apple がアクセシビリティの観点から Personal Voice AI 機能にアプローチしていることは驚くことではありません。これがここでの重要な目標であると言われています。クパチーノには、iPhone をより包括的なものにするために、これまで以上に努力してきた確かな実績があります。しかし、今回は、多くの人が自分のプライバシーや究極のセキュリティについても懸念しています。

AI は信じられないほど強力になっており、ChatGPT がエッセイの執筆を支援し、Google の Bard が Gmail アシスタントの役割を引き継いだり、サポートを行ったりすることもできます。あなたのキッチンに最適な冷蔵庫が見つかったとしても、AI の真の力は人間と対話し、社会の一部になる能力にあるかもしれません。

では、私たちは次の事実に怯えるべきでしょうか。 iPhone はすぐに私たち自身の声で話せるようになるでしょうか?私はそうは思わない。どちらかというと、私はとても興奮しています!

怖いけど役立つ-iOS 17 を実行している iPhone は「パーソナル ボイス」で会話できるようになります。 Apple は、可能な限り最もスマートな方法で高度な AI 競争に参入します

あなたはどうか知りませんが、Apple は AI 競争に参入することに非常に慎重だと思います。なぜなら、AI 競争に参入する場合、アクセシビリティが最も安全な選択肢の 1 つである可能性があるからです。 iPhone や iPad における AI の必要性を合理化することになります。しかし、これは Apple が楽な道を選んだという意味ではありません。

どちらかといえば、真に有意義な方法で人々の生活を楽にするという使命を持った AI 機能は、その他の AI トリックよりも重要です。まずは私たちを助けてください。さらに、Apple が Personal Voice 機能の背後にあるという事実は、Personal Voice に対する批評家や一般大衆の関心と監視のレベルをさらに高めることになるでしょう。しかし、Apple は注目されることに抵抗を感じません。

もちろん、まだ誰も Personal Voice をテストする機会がありません。そのため、この機能がリリースされるときまで、強い意見は保留しておく必要があります (今年末にリリースされる予定です) )。しかし、私たちが今できることは、iPhone に搭載される高度な AI のポジティブな性質について話すことです。そして、ポジティブな影響を与えるには、人々が人生を生き抜くのを助けること以上に良い方法はないでしょうか。

残念ながら、この種の世界的な統計を見つけるのは困難ですが、米国で入手可能な統計によると、約 1,850 万人が言語障害、発声障害、または言語障害を抱えています。このことは、テクノロジーを最大限に活用できる人々のためにテクノロジーを活用する必要性が明らかであることを示しています。

ここで、Apple が新境地を開拓するのではなく、既存の拡張代替コミュニケーション (AAC) の世界に単純に参入していることについて触れておきます。 AAC アプリは、音声を生成する記号や予測キーボードを使用して、話せない人々がより効果的にコミュニケーションできるように設計されています。 ALS、脳性麻痺、自閉症の人など、口頭で話すことができない人の多くは、コミュニケーションに AAC アプリを使用する必要があります。

興味がある場合は、Apple は、AAC と AssistiveWare に関する専用の記事を公開しました (1 件) AAC 分野の主要な開発者による)。 AssistiveWare は、AAC を効果的で受け入れられるコミュニケーション手段にすることが彼らの使命だと述べています。今のところ、Apple が AssistiveWare の買収を検討しているようには見えません。

AssistiveWare の創設者兼 CEO の David Niemeijer 氏は、Proloquo2Go のような AAC アプリがテキストメッセージと同じくらい広く受け入れられることを望んでいます。 「話すことができない場合でも、おそらく話すことがあまりないのではないかと考えられます。その仮定が最大の問題です。このテクノロジーが最大限の影響を与えることができるよう、このテクノロジーを尊重する方向に移行することを期待しています」とニーマイヤー氏は言います。一部の AAC アプリは無料ですが、現在、Proloquo2Go のプレミアム バージョンを App Store からダウンロードするには 250 ドルの費用がかかることに注意してください。

Apple の Personal Voice-スマートフォンをスマートにし、革新的な機能を提供します。

これで、iPhone と iPad をよりアクセスしやすくするための Apple の取り組みが Personal Voice のような機能の主な話題となる理由が少しは明確になったと思います。 TikTok ビデオや Instagram ストーリーの世界では、Personal Voice のようなアクセシビリティと生活の質 (QoL) 機能は、スマートフォンが私たちの生活を楽にするために存在できる (そしてそうすべきである) ことを思い出させてくれます。

AssistiveWare の CEO、David Niemeijer 氏が言うように、iPhone/スマートフォンは誰もが使用する「クールな」デバイスであり、これはすでに、「異なる」ように見える「特殊な」ハードウェアではなく、同じユビキタスなデバイス上に存在する AAC アプリの受け入れやすさに大きな違いを生み出しています。

つまり、特別なソフトウェアを必要とせずに、Apple の Personal Voice が iPhone 上に直接搭載されるという事実により、この (できれば) 革新的な AI の部分をより使いやすく、「普通」に使用できるようになるでしょう。

今年後半にリリースされる予定で、認知障害のあるユーザーは、Assistive Access を使用して iPhone と iPad をより簡単かつ自立して使用できるようになります。話せない人でも、Live Speech を使用して通話中や会話中に入力して話すことができます。話す能力を失う危険があるユーザーは、パーソナルボイスを使用して自分に似た合成音声を作成し、家族や友人と連絡を取ることができます。

話す能力を失う危険があるユーザーの場合-など最近、ALS (筋萎縮性側索硬化症) またはスピーキング能力に徐々に影響を与える可能性のあるその他の疾患と診断された人-Personal Voice は、その人に似た声を作成する簡単かつ安全な方法です。

Personal Voice は次のような可能性があります。 Siri の新しく、改良され、強化されたバージョン-Apple の最も野心的なアクセシビリティ機能は、究極の Google アシスタントの競合相手になれるでしょうか?

Personal Voice が、Siri が間もなく最大のアップグレードを受けることを示す Apple のヒントだとしたらどうなるでしょうか?

そうは言っても、「技術者」として、私は Personal Voice の拡張された可能性に注目せずにはいられません。それが何を意味するのか説明しましょう…

Siri はここ数年、さまざまな種類の悪役を務めており、Google アシスタントはあらゆる方法で Apple のロボットの周りを走り回っています。しかし、Personal Voice が iPhone の究極の AI 音声認識電話への移行の始まりにすぎないとしたらどうなるでしょうか?現在、この栄誉は Google Pixel に与えられており、Google Pixel は (Google の Tensor チップのおかげで) 市場の他のどの携帯電話よりも音声を理解し、録音し、文字に起こすことができます。

見た目によれば、Personal Voice は本質的に次のような形になりつつあります。テキスト読み上げエンジン。さまざまなシナリオで役立ちます。 Personal Voice のような機能が、ボイスメモやメモなどの他の iPhone や iPad アプリにも拡張されることを願っています。私がそう言っているのは、無料で自然な響きの優れたテキスト読み上げソフトウェアを見つけるのはほぼ不可能だからです。

明らかに、iPhone はすぐにあなたの声で話すことができるようになりますが、私はパーソナルボイス機能には特定の制限があることが予想されます。しかし、あなたの iPhone があなた自身の声、または適切なイントネーションで自然に聞こえる別の声で自由に内容を読み上げられるとしたらどうなるでしょうか?これは次のような人に役立ちます。 試験の準備をしている学生 退屈な広告を読むのが嫌いなポッドキャスター コメディのセットを暗記しようとしているコメディアン 台本を学ぼうとしている俳優
わかっています…ここでは私の想像力が少し暴走していますが、アーティストや一般の人々は、次のようなことができると本当に思いますPersonal Voice のような機能の広範な実装をうまく活用します。 Personal Voice の現在の使命を考えると、前述の例はおかしく見えるかもしれませんが、これは Apple の AI 変革の始まりにすぎないと私は本気で信じています。

私は行き過ぎですが、Personal Voice がその役割を果たすことができるかどうか、自分自身に問いかけています。さらに大きな、そしてはるかに物議を醸す何かの始まりです。メタバースのアイデアや、ボイス バンキングがどのようにして私たちを「不滅」にするのかなどです。ボイス バンキングは、理想的には自然な声に聞こえる合成音声を作成できるようにするプロセスです。これは、あなたの声がクリアなときに大量のメッセージを録音することによって実現されます。

では、あなたの声を永久に保存したり、あなたの声を仮想イメージと組み合わせて保存したりして、その後も保存できるとしたらどうなるでしょうか。」もう「なくなってしまった」のですか?これが魅力的だと思われる場合は、「アップロード」という素晴らしいショーを見ることをお勧めします。これは SF コメディ ドラマで、人間が 2033 年に自分自身を選択した仮想死後の世界に「アップロード」できるというアイデアを探ります。それは今からわずか 10 年後のことです!

iPhone と iPad はあなたの声で話すことができます: Apple は詐欺師に扉を開いていますか?仮想誘拐とディープフェイクに対する懸念が高まる

私たちは誰もがつながり、コミュニケーションする力を持っている世界を信じています。自分の情熱を追求し、新しいものを発見すること。グローバル アクセシビリティ啓発デー (5 月 19 日) に、私たちはすべての人に役立つ包括的なテクノロジーを祝います。

ティム クック

次に、Apple の Personal Voice の物議を醸す側面について…

もちろん、新しい Personal Voice 機能に対する主な懸念はセキュリティに関連しています。 人々 (主流ニュース メディアを含む) が質問をしています。個人データの収集を伴う新しいソフトウェア機能。ただし、今回は、ランチの写真や酔っぱらったテキストについて話しているのではありません。iPhone と iPad はあなたの声を録音、保持、複製することが期待されているため、(当然のことながら) プライバシーとセキュリティに対する懸念が増幅されます。もちろん、Apple は Personal Voice が「あなたに似た声を作成する簡単かつ安全な方法」であると約束しているため、Personal Voice アクションはすべて暗号化され、iPhone 上で直接 (そしてのみ) 行われると私は考えています。/iPad (またはむしろその SoC 上)。

それでも、シンプルで安全な AI に対する Apple の約束にもかかわらず、人々は、悪意のある者や「いたずら者」による強力なアクセシビリティ機能の潜在的な悪用の可能性についての懸念を表明することはできません。 。ソーシャル メディア ユーザーは、Personal Voice を便利な機能以外のものに変えるさまざまな方法をすでに考えています。

軽微な詐欺 仮想誘拐 欺瞞的な音声メッセージ/録音 限界を超えるいたずら
特に目立ったもの (ありがとう)大手報道機関で話題になっている)は、電話詐欺であるバーチャル誘拐です。それはさまざまな形をとります。これは本質的に、暴力や死の脅威にさらされていると信じている愛する人を解放するために、被害者をだまして身代金を支払わせる恐喝計画です。ひねりは? 「従来の誘拐とは異なり、仮想誘拐犯は実際には誰も誘拐していません。その代わりに、欺瞞と脅迫によって、計画が崩壊する前に被害者に迅速な身代金の支払いを強要します」と FBI

アームチェア エキスパート ポッドキャストの魅力的な (それでも楽しい) エピソードをお勧めします。このエピソードでは、人々がダックス シェパードに電話して、詐欺に遭ったときのことを話します。仮想誘拐のストーリーは強烈でありながら、非常に洞察力に富んだものでした。

ただし、仮想誘拐には通常、実際の「誘拐」が含まれないため、iPhone の個人音声を利用する唯一の選択肢は、悪者が何らかの方法で行った場合のみです。つまり、この時点であなたは「実際に誘拐された」か、Apple の暗号化に失敗した可能性があります。言い換えれば、もしそれが起こったら、もっと大きなことを心配する必要があるということです。

だから、私が言いたいのは…パーソナルボイスやその他すべての AI や ML を利用したアクセシビリティのポジティブな側面に焦点を当てるべきではないかということです。困っている人を助けることができる機能?疑惑は後回しにしておきます。一方、Apple の ブログ投稿

Categories: IT Info