Os usuários podem criar uma voz pessoal lendo junto com um conjunto aleatório de prompts de texto para gravar 15 minutos de áudio no iPhone ou iPad. Esse recurso de acessibilidade de fala usa aprendizado de máquina no dispositivo para manter as informações dos usuários privadas e seguras e integra-se perfeitamente ao Live Speech para que os usuários possam falar com sua voz pessoal ao se conectar com seus entes queridos.AppleIsso mesmo! Depois do ChatGPT e do Google, agora é a vez da Apple mergulhar no mundo da IA avançada, e que recurso para começar esta jornada foi criado por Tim Cook & Co! iPads e iPhones com iOS 17 (lançamento em setembro) permitirão que você crie uma versão digital de sua própria voz. Deixe isso afundar por um momento… Se parece que a Apple permitirá que você crie um”deepfake”de sua própria voz, é porque é verdade. Tipo de. Mas não é tão simples.
A Apple diz que em breve seu iPhone poderá falar em sua voz com 15 minutos de treinamento. Por que? Assim, “os usuários podem falar com sua voz pessoal (o nome real do recurso) ao se conectar com amigos e familiares”. Mas não é apenas um truque de festa. Não deve ser surpresa que a Apple esteja abordando o recurso Personal Voice AI de um ângulo de acessibilidade, que é considerado o principal objetivo aqui. Cupertino tem um histórico sólido de ir além para tornar o iPhone mais inclusivo. No entanto, desta vez, muitos também estão preocupados com sua privacidade e segurança máxima.
A IA está ficando incrivelmente poderosa e, embora o ChatGPT possa ajudá-lo a escrever uma redação, o Bard do Google pode assumir o papel de assistente do Gmail ou ajudar você encontra a melhor geladeira para sua cozinha, o verdadeiro poder da IA pode estar em sua capacidade de interagir com humanos e, assim, tornar-se parte de nossa sociedade.
Então, devemos nos assustar com o fato de que o iPhone em breve poderá falar em nossa própria voz? Eu não acho. De qualquer forma, estou muito animado!
Assustador, mas útil-iPhones com iOS 17 poderão falar em sua “Voz Pessoal”; A Apple entra na corrida da IA avançada da maneira mais inteligente possível
Não sei você, mas acho que a Apple está sendo bastante cuidadosa ao entrar na corrida da IA, pois a acessibilidade pode ser uma das opções mais seguras quando se trata trata de racionalizar a necessidade de IA em iPhones e iPads. No entanto, isso não significa que a Apple escolheu um caminho fácil.
No mínimo, um recurso de IA com a missão de facilitar a vida das pessoas de uma maneira verdadeiramente significativa é mais importante do que qualquer outro truque de IA que possa ou não estar nos ajudando em primeiro lugar. Além disso, o fato de a Apple estar por trás do recurso Personal Voice só aumentará o nível de interesse e escrutínio sobre o Personal Voice por parte dos críticos e do público em geral. Mas a Apple está confortável com a atenção.
Claro, ninguém teve a chance de testar o Personal Voice ainda, então terei que reservar qualquer opinião forte para quando o recurso for lançado (espera-se que no final deste ano ). Mas o que podemos fazer agora é falar sobre a natureza positiva da IA avançada chegando ao iPhone. E que melhor maneira de causar um impacto positivo do que ajudar as pessoas a passar pela vida.
Infelizmente, é difícil encontrar estatísticas globais desse tipo, mas de acordo com as disponíveis nos EUA, aproximadamente 18,5 milhões de pessoas têm um distúrbio de fala, voz ou linguagem, o que mostra a clara necessidade de fazer a tecnologia funcionar para aqueles que podem se beneficiar ao máximo dela.
Este é o momento de mencionar que, em vez de abrir novos caminhos, a Apple está simplesmente explorando o mundo já existente da Comunicação Aumentativa e Alternativa (AAC). Os aplicativos AAC são projetados para ajudar as pessoas que não falam a se comunicarem de maneira mais eficaz por meio do uso de símbolos e teclados preditivos que produzem fala. Muitos que não conseguem produzir fala oral, incluindo aqueles com ELA, paralisia cerebral e autismo, precisam usar aplicativos AAC para se comunicar.
Se você está curioso, A Apple publicou uma história dedicada ao AAC e AssistiveWare (uma dos principais desenvolvedores na área de AAC). A AssistiveWare diz que sua missão é tornar o AAC um meio de comunicação eficaz e aceito. Por enquanto, não parece que a Apple esteja procurando adquirir o AssistiveWare.
O fundador e CEO da AssistiveWare, David Niemeijer, espera que aplicativos AAC como o Proloquo2Go se tornem tão amplamente aceitos quanto mensagens de texto. “Se você não pode falar, a suposição ainda é que você provavelmente não tem muito a dizer. Essa suposição é o maior problema. Espero ver uma mudança no sentido de respeitar essa tecnologia para que ela tenha o maior impacto”, diz Niemeijer. Lembre-se de que, embora alguns aplicativos AAC sejam gratuitos, a versão Premium do Proloquo2Go atualmente custa US$ 250 para download na App Store.
Apple’s Personal Voice-um recurso revolucionário que torna os smartphones inteligentes e nossas vidas mais fáceis?
Acredito que isso deixa um pouco mais claro por que o trabalho da Apple para tornar o iPhone e o iPad mais acessíveis deve ser o principal ponto de discussão de um recurso como o Personal Voice. Em um mundo de vídeos do TikTok e histórias do Instagram, os recursos de acessibilidade e qualidade de vida (QoL), como o Personal Voice, são um lembrete de que os smartphones podem (e devem) existir para facilitar nossas vidas.
Como diz o CEO da AssistiveWare, David Niemeijer, os iPhones/smartphones são os dispositivos “legais” que todo mundo usa, e isso já fez uma grande diferença na aceitabilidade dos aplicativos AAC, que existem nos mesmos dispositivos onipresentes em vez de um hardware “especializado” que parece “diferente”.
Portanto, o fato de que a Voz Pessoal da Apple viverá diretamente no iPhone, mesmo sem a necessidade de nenhum software especial, tornaria o uso dessa (espero) revolucionária peça de IA muito mais acessível e “normal”.
No final deste ano, os usuários com deficiências cognitivas poderão usar o iPhone e o iPad com maior facilidade e independência com o Acesso Assistido; indivíduos não falantes podem digitar para falar durante chamadas e conversas com o Live Speech; e aqueles em risco de perder a capacidade de falar podem usar o Personal Voice para criar uma voz sintetizada que soe como eles para se conectar com familiares e amigos.
Para usuários em risco de perder a capacidade de falar-como aqueles com um diagnóstico recente de ELA (esclerose lateral amiotrófica) ou outras condições que podem afetar progressivamente a capacidade de falar-o Personal Voice é uma maneira simples e segura de criar uma voz que soe como eles.
O Personal Voice pode ser a versão nova, aprimorada e superalimentada da Siri-o recurso de acessibilidade mais ambicioso da Apple pode se transformar no maior concorrente do Google Assistant?
E se o Personal Voice for a dica da Apple de que a Siri receberá em breve sua maior atualização já?
Agora, com tudo o que foi dito, como uma”pessoa de tecnologia”, eu simplesmente não posso deixar de olhar para o potencial estendido do Personal Voice. E deixe-me explicar o que quero dizer com isso…
A Siri tem sido diferente há anos, com o Google Assistant rodando em círculos ao redor do robô da Apple de quase todas as maneiras possíveis. Mas e se o Personal Voice for apenas o começo da transição do iPhone para se tornar o melhor telefone de reconhecimento de voz AI? Atualmente, essa honra pertence ao Google Pixel, que (graças ao chip Tensor do Google) pode entender, gravar e transcrever a fala melhor do que qualquer outro telefone no mercado.
Pelo que parece, o Personal Voice está se preparando para ser um mecanismo de conversão de texto em fala, que pode ser útil em vários cenários diferentes. Eu adoraria ver um recurso como o Personal Voice se expandir para outros aplicativos para iPhone e iPad, como Voice Memos e Notes. Estou dizendo isso porque encontrar um bom software de conversão de texto em fala que seja gratuito e com som natural é quase impossível.
Claramente, o iPhone em breve será capaz de falar em sua voz, mas eu espere que o recurso Personal Voice venha com certas limitações. No entanto, e se o seu iPhone puder ler livremente as coisas para você em sua própria voz ou em outra voz natural, com a entonação adequada? Isso seria útil para Estudantes se preparando para um exame Podcasters que odeiam ler anúncios chatos Comediantes tentando memorizar um set de comédia Atores tentando aprender um roteiro
Eu sei… Minha imaginação está um pouco louca aqui, mas eu realmente acho que artistas e o público em geral podem fazer ótimo uso de uma implementação mais ampla de um recurso como o Personal Voice. Os exemplos mencionados podem parecer engraçados, considerando a missão atual do Personal Voice, mas eu realmente acredito que este é apenas o começo da transformação da IA da Apple.
Estou exagerando, mas também estou me perguntando se o Personal Voice poderia ser o início de algo ainda maior e muito mais controverso. Como a ideia do Metaverso e como o banco de voz pode nos tornar “imortais”. O banco de voz é um processo que permite a alguém criar uma voz sintética que soe idealmente como sua voz natural. Isso é obtido gravando um grande número de mensagens quando sua voz está clara.
E se sua voz puder ser preservada para sempre e/ou combinada com uma imagem virtual sua, que pode permanecer após você? você “foi” foi? Se isso parece fascinante para você, recomendo assistir a um programa brilhante chamado “Upload”. É uma comédia dramática de ficção científica, que explora a ideia de os humanos serem capazes de se”carregar”em uma vida após a morte virtual de sua escolha no ano de 2033. Isso é apenas daqui a dez anos, pessoal!
iPhone e iPad poderão falar em sua voz: a Apple está abrindo a porta para golpistas? Surgem preocupações sobre sequestro virtual e deepfakes
Nós acreditam em um mundo onde todos têm o poder de se conectar e se comunicar. Para perseguir suas paixões e descobrir novas. No Dia Mundial de Conscientização sobre Acessibilidade (19 de maio), celebramos a tecnologia inclusiva que funciona para todos.
Tim Cook
Agora, sobre os lados controversos do Personal Voice da Apple…
Obviamente, as principais preocupações sobre o novo recurso Personal Voice estão relacionadas à segurança. As pessoas (incluindo a grande mídia de notícias) estão fazendo perguntas, que nos acostumamos a ver no lançamento de qualquer novo recurso de software que envolve a coleta de dados pessoais. No entanto, desta vez, não estamos falando de fotos do seu almoço ou de suas mensagens de texto bêbadas. Espera-se que o iPhone e o iPad gravem, retenham e repliquem sua voz, o que (naturalmente) amplifica qualquer preocupação com privacidade e segurança. Claro, a Apple promete que o Personal Voice é uma “maneira simples e segura de criar uma voz que soa como você”, o que me leva a supor que toda a ação do Personal Voice será criptografada, ocorrendo diretamente (e apenas) no seu iPhone/iPad (ou melhor, em seu SoC).
Ainda assim, a promessa da Apple de IA simples e segura não impede que as pessoas expressem suas preocupações sobre a possibilidade de abuso potencial do poderoso recurso de acessibilidade por malfeitores e “brincalhões”. Os usuários de mídia social já estão pensando nas várias maneiras pelas quais o Personal Voice pode ser transformado em algo mais do que um recurso útil:
Golpes mesquinhosSequestro virtualMensagens/gravações de voz enganosasPegadinhas que ultrapassam os limites
Uma que se destaca em particular (obrigado para ser discutido por grandes veículos de notícias) é Virtual Kidnapping, que é um golpe por telefone que assume muitas formas. Este é essencialmente um esquema de extorsão que engana as vítimas para que paguem um resgate para libertar um ente querido que acreditam estar sendo ameaçado de violência ou morte. A reviravolta? “Ao contrário dos sequestros tradicionais, os sequestradores virtuais não sequestraram ninguém. Em vez disso, por meio de enganos e ameaças, eles coagem as vítimas a pagar um resgate rápido antes que o esquema desmorone”, diz o FBI.
Recomendo um episódio fascinante (mas ainda divertido) do podcast Armchair Expert, em que as pessoas ligam para Dax Shepard para contar a ele sobre o momento em que foram enganadas. A história do sequestro virtual foi intensa, mas muito perspicaz.
No entanto, como o sequestro virtual geralmente não envolve um”sequestro”real, a única opção para tirar proveito da voz pessoal do iPhone é se os bandidos de alguma forma obteve acesso ao seu iPhone/gravações, o que significa que neste ponto você pode ser “realmente sequestrado” ou que a criptografia da Apple falhou. Em outras palavras, se isso acontecer, haveria coisas maiores com que se preocupar.
Então, o que eu digo é… Talvez devêssemos tentar focar no lado positivo do Personal Voice e todas as outras acessibilidades baseadas em IA e ML recursos, que podem ajudar os necessitados? Eu deixaria a suspeita para depois. Enquanto isso, você pode aprender tudo sobre os novos recursos da Apple para acessibilidade cognitiva, junto com Live Speech, Personal Voice e Point and Speak in Magnifier através do postagem do blog.