Ang mga user ay maaaring lumikha ng isang Personal na Boses sa pamamagitan ng pagbabasa kasama ng isang randomized na hanay ng mga text prompt upang mag-record ng 15 minuto ng audio sa iPhone o iPad. Ang feature ng speech accessibility na ito ay gumagamit ng on-device machine learning para panatilihing pribado at secure ang impormasyon ng mga user, at walang putol na isinasama sa Live Speech para makapagsalita ang mga user gamit ang kanilang Personal na Boses kapag kumokonekta sa mga mahal sa buhay. AppleTama! Pagkatapos ng ChatGPT at Google, ngayon na ang Apple na isawsaw ang mga daliri nito sa mundo ng advanced AI, at napakagandang feature para simulan ang paglalakbay na ito na magkaroon ng Tim Cook & Co! Ang mga iPad at iPhone na nagpapatakbo ng iOS 17 (ilulunsad sa Setyembre) ay magbibigay-daan sa iyong lumikha ng digital na bersyon ng iyong sariling boses. Hayaang bumagsak iyon sandali… Kung mukhang hahayaan ka ng Apple na gumawa ng”deepfake”ng sarili mong boses, iyon ay dahil, totoo ito. Medyo. Ngunit hindi ganoon kadali.
Sabi ng Apple, malapit nang makapagsalita ang iyong iPhone sa iyong boses sa loob ng 15 minutong pagsasanay. Bakit? Kaya”maaaring magsalita ang mga user gamit ang kanilang Personal na Boses (ang aktwal na pangalan ng feature) kapag kumokonekta sa mga kaibigan at pamilya.”Ngunit ito ay hindi lamang isang party trick. Hindi dapat nakakagulat na ang Apple ay lumalapit sa Personal Voice AI feature mula sa isang anggulo ng accessibility, na sinasabing pangunahing layunin dito. Ang Cupertino ay may matatag na track record ng pagpunta sa itaas at higit pa upang gawing mas inclusive ang iPhone. Gayunpaman, sa pagkakataong ito, marami rin ang nag-aalala tungkol sa kanilang privacy, at sukdulang seguridad.
Ang AI ay nagiging napakalakas, at habang ang ChatGPT ay makakatulong sa iyo na magsulat ng isang sanaysay, at ang Bard ng Google ay maaaring pumalit bilang iyong Gmail assistant, o tumulong. nahanap mo ang pinakamahusay na refrigerator para sa iyong kusina, ang tunay na kapangyarihan ng AI ay maaaring nasa kakayahan nitong makipag-ugnayan sa mga tao, at sa gayon ay maging bahagi ng ating lipunan.
Kaya, dapat ba tayong matakot sa katotohanan na malapit nang makapagsalita ang iPhone sa sarili nating boses? hindi ko akalain. Kung mayroon man, medyo nasasabik ako!
Nakakatakot ngunit nakakatulong-Ang mga iPhone na gumagamit ng iOS 17 ay makakapag-usap sa iyong”Personal na Boses”; Ang Apple ay pumasok sa advanced na AI race sa pinakamatalinong paraan na posible
Hindi ko alam tungkol sa iyo ngunit sa tingin ko ang Apple ay lubos na nag-iingat sa pagpasok sa AI race, dahil ang accessibility ay maaaring isa sa mga pinakaligtas na opsyon kapag ito pagdating sa rasyonalisasyon ng pangangailangan para sa AI sa mga iPhone at iPad. Gayunpaman, hindi ito nangangahulugan na pinili ng Apple ang isang madaling landas.
Kung mayroon man, ang isang tampok na AI na may misyon na gawing mas madali ang buhay ng mga tao sa isang tunay na makabuluhang paraan ay mas mahalaga kaysa sa anumang iba pang panlilinlang ng AI na maaaring o hindi. tulungan mo kami sa una. Bukod dito, ang katotohanan na ang Apple ay nasa likod ng tampok na Personal na Boses ay magpapalaki lamang sa antas ng interes at pagsisiyasat sa paligid ng Personal Voice na nakukuha mula sa mga kritiko at pangkalahatang publiko. Ngunit kumportable ang Apple sa atensyon.
Siyempre, walang sinuman ang nagkaroon ng pagkakataong subukan ang Personal na Boses, kaya kailangan kong magreserba ng anumang malakas na opinyon kung kailan ilalabas ang feature (inaasahan ito sa katapusan ng taong ito ). Ngunit ang magagawa natin ngayon ay pag-usapan ang positibong katangian ng advanced AI na darating sa iPhone. At isang mas mahusay na paraan upang makagawa ng positibong epekto kaysa sa pagtulong sa mga tao na makamit ang buhay.
Sa kasamaang palad, mahirap makahanap ng mga pandaigdigang istatistika ng ganitong uri, ngunit ayon sa mga available sa US, humigit-kumulang 18.5 milyong indibidwal ang may kapansanan sa pagsasalita, boses, o wika, na nagpapakita ng malinaw na pangangailangan sa paggawa ng teknolohiya para sa mga taong mas makikinabang dito.
Iyon na ang sandali para banggitin na sa halip na magsimula ng bagong landas, ang Apple ay nag-tap sa umiiral nang mundo ng Augmentative and Alternative Communication (AAC). Ang mga AAC app ay idinisenyo upang tulungan ang mga taong hindi nagsasalita na makipag-usap nang mas epektibo sa pamamagitan ng paggamit ng mga simbolo at predictive na keyboard na gumagawa ng pagsasalita. Maraming hindi makapagbigay ng oral speech, kabilang ang mga may ALS, cerebral palsy, at autism ang kailangang gumamit ng AAC app para makipag-usap.
Kung gusto mong malaman, Nag-publish ang Apple ng isang nakatuong kuwento sa AAC at AssistiveWare (isa ng mga nangungunang developer sa larangan ng AAC). Sinasabi ng AssistiveWare na ang kanilang misyon ay gawing epektibo at tinatanggap na paraan ng komunikasyon ang AAC. Sa ngayon, mukhang hindi hinahanap ng Apple ang AssistiveWare.
Umaasa ang founder at CEO ng AssistiveWare na si David Niemeijer na ang mga AAC app tulad ng Proloquo2Go ay magiging kasing dami ng pag-text. “If you can’t speak, the assumption is still that you probably don’t have much to say. Ang pagpapalagay na iyon ang pinakamalaking problema. Umaasa akong makakita ng pagbabago tungo sa paggalang sa teknolohiyang ito para magkaroon ito ng pinakamalaking epekto”, sabi ni Niemeijer. Tandaan na habang ang ilang AAC app ay libre, ang Premium na bersyon ng Proloquo2Go ay kasalukuyang nagkakahalaga ng $250 para i-download mula sa App Store.
Apple’s Personal Voice-isang feature na nagpapabago ng laro na ginagawang matalino ang mga smartphone at mas madali ang ating buhay?
Naniniwala ako na ginagawa nitong mas malinaw nang kaunti kung bakit ang gawain ng Apple sa paggawa ng iPhone at iPad na mas madaling ma-access ay dapat ang pangunahing pinag-uusapan ng isang tampok tulad ng Personal na Boses. Sa mundo ng mga TikTok na video at mga kwento sa Instagram, ang accessibility at Quality of Life (QoL) na mga feature tulad ng Personal Voice ay isang paalala na ang mga smartphone ay maaaring (at dapat) umiral upang gawing mas madali ang ating buhay.
Gaya ng sinabi ng CEO ng AssistiveWare na si David Niemeijer, ang mga iPhone Ang/smartphones ay ang”cool”na mga device na ginagamit ng lahat, at nakagawa na ito ng malaking pagkakaiba sa pagiging katanggap-tanggap ng mga AAC app, na umiiral sa parehong lahat ng device sa halip na isang”espesyalisadong”piraso ng hardware na mukhang”iba”.
Kaya, ang katotohanan na ang Personal Voice ng Apple ay direktang mabubuhay sa iPhone, kahit na hindi nangangailangan ng anumang espesyal na software, ay gagawing mas madaling ma-access at “normal” ang paggamit nito (sana) na bahagi ng AI na nagbabago ng laro. >Darating sa huling bahagi ng taong ito, ang mga user na may kapansanan sa pag-iisip ay maaaring gumamit ng iPhone at iPad nang mas madali at malaya gamit ang Assistive Access; Ang mga indibidwal na hindi nagsasalita ay maaaring mag-type upang magsalita sa mga tawag at pakikipag-usap sa Live Speech; at ang mga nasa panganib na mawalan ng kakayahang magsalita ay maaaring gumamit ng Personal na Boses upang lumikha ng isang synthesized na boses na kamukha nila para sa pagkonekta sa pamilya at mga kaibigan.
Para sa mga user na nanganganib na mawalan ng kakayahang magsalita-gaya ng ang mga may kamakailang diagnosis ng ALS (amyotrophic lateral sclerosis) o iba pang mga kondisyon na maaaring unti-unting makaapekto sa kakayahan sa pagsasalita-Ang Personal na Boses ay isang simple at secure na paraan upang lumikha ng boses na kamukha nila.
Maaaring ang Personal na Boses ay ang bago, pinahusay, at supercharged na bersyon ng Siri-maaari bang ang pinaka-ambisyoso na feature ng pagiging naa-access ng Apple ay maging tunay na katunggali ng Google Assistant?
Paano kung Personal Voice ang pahiwatig ng Apple na malapit nang matanggap ng Siri ang pinakamalaking pag-upgrade nito kailanman?
Ngayon lahat ng sinasabi, bilang isang”tech na tao”, hindi ko lang maiwasang tingnan ang pinalawak na potensyal ng Personal Voice. At hayaan mo akong ipaliwanag kung ano ang ibig kong sabihin diyan…
Siri ay naging iba’t ibang uri ng masama sa loob ng maraming taon na ngayon, kasama ang Google Assistant na tumatakbo sa paligid ng robot ng Apple sa halos lahat ng posibleng paraan. Ngunit paano kung ang Personal Voice ay simula lamang ng paglipat ng iPhone sa pagiging tunay na AI voice recognition phone? Ang karangalang ito ay kasalukuyang pagmamay-ari ng Google Pixel, na (salamat sa Tensor chip ng Google) ay nakakaunawa, nakakapag-record, at nakaka-transcribe ng pagsasalita nang mas mahusay kaysa sa anumang iba pang telepono sa merkado.
Sa hitsura nito, ang Personal na Boses ay talagang nahuhubog upang maging isang text-to-speech engine, na maaaring maging kapaki-pakinabang sa maraming iba’t ibang mga sitwasyon. Gusto kong makakita ng feature tulad ng Personal Voice na lumawak sa iba pang iPhone at iPad app tulad ng Voice Memo at Notes. Sinasabi ko iyan, dahil ang paghahanap ng magandang text-to-speech na piraso ng software na parehong libre at natural na tunog ay halos imposible.
Maliwanag, malapit nang makapagsalita ang iPhone sa iyong boses, ngunit ako asahan ang tampok na Personal na Boses na may ilang partikular na limitasyon. Gayunpaman, paano kung ang iyong iPhone ay maaaring malayang magbasa ng mga bagay pabalik sa iyo sa sarili mong boses, o isa pang natural na tunog na boses, na may wastong intonasyon? Makakatulong ito sa Mag-aaral na naghahanda para sa pagsusulit MgaPodcaster na ayaw magbasa ng mga nakakainip na ad Mga komedyante na nagsisikap na magsaulo ng isang hanay ng komedyaMga aktor na nagsisikap na matuto ng script
Alam ko… Ang aking imahinasyon ay tumatakbo nang medyo ligaw dito ngunit sa tingin ko talaga ay magagawa ng mga artista at ng pangkalahatang publiko mahusay na paggamit ng mas malawak na pagpapatupad ng isang feature tulad ng Personal Voice. Ang mga nabanggit na halimbawa ay maaaring mukhang nakakatawa, kung isasaalang-alang ang kasalukuyang misyon ng Personal na Boses, ngunit talagang naniniwala ako na ito ay simula pa lamang ng pagbabagong AI ng Apple.
Nasobra na ako ngunit tinatanong ko rin ang aking sarili kung ang Personal na Boses ay maaaring ang simula ng isang bagay na mas malaki pa, at mas kontrobersyal. Tulad ng ideya ng Metaverse at kung paano tayo magagawa ng Voice banking na”imortal”. Ang voice banking ay isang proseso na nagbibigay-daan sa isang tao na lumikha ng isang synthetic na boses na parang natural na boses. Nakakamit ito sa pamamagitan ng pagre-record ng malaking bilang ng mga mensahe kapag malinaw ang iyong boses.
Kaya, paano kung mapangalagaan ang iyong boses magpakailanman at/o isama sa isang virtual na imahe mo, na maaaring manatili pagkatapos mo’muling”wala”nawala? Kung mukhang kaakit-akit ito sa iyo, inirerekomenda kong manood ng napakahusay na palabas na tinatawag na”Upload”. Isa itong sci-fi comedy-drama, na nagsasaliksik sa ideya ng mga tao na magagawang”i-upload”ang kanilang sarili sa isang virtual afterlife na kanilang pinili sa taong 2033. Sampung taon na lang mula ngayon, mga kababayan!
Magagawa ng iPhone at iPad na magsalita sa iyong boses: Nagbubukas ba ang Apple ng pinto sa mga scammer? Bumangon ang mga alalahanin sa Virtual Kidnapping at Deepfakes
Kami naniniwala sa isang mundo kung saan lahat ay may kapangyarihang kumonekta at makipag-usap. Upang ituloy ang kanilang mga hilig at tumuklas ng mga bago. Sa Global Accessibility Awareness Day (Mayo 19), ipinagdiriwang namin ang inclusive technology na gumagana para sa lahat.
Tim Cook
Ngayon, tungkol sa mga kontrobersyal na panig ng Personal Voice ng Apple…
Siyempre, ang mga pangunahing alalahanin sa bagong tampok na Personal na Boses ay nauugnay sa seguridad. Ang mga tao (kabilang ang mainstream news media) ay nagtatanong, na nakasanayan na naming makita sa paglulunsad ng anumang bagong feature ng software na kinabibilangan ng pangongolekta ng personal na data. Gayunpaman, sa pagkakataong ito, hindi namin pinag-uusapan ang tungkol sa mga larawan ng iyong tanghalian, o ang iyong mga lasing na text. Inaasahang ire-record, papanatilihin, at gagayahin ng iPhone at iPad ang iyong boses, na (natural) ay nagpapalaki ng anumang alalahanin tungkol sa privacy at seguridad. Siyempre, ipinangako ng Apple na ang Personal Voice ay isang”simple at secure na paraan upang lumikha ng boses na kamukha mo”, na humahantong sa akin na ipagpalagay na ang lahat ng pagkilos ng Personal na Boses ay mai-encrypt, na direktang magaganap (at lamang) sa iyong iPhone/iPad (o sa halip sa kanilang SoC).
Gayunpaman, ang pangako ng Apple para sa simple at secure na AI ay hindi pumipigil sa mga tao na ipahayag ang kanilang mga alalahanin sa posibilidad ng potensyal na pang-aabuso sa malakas na feature ng accessibility ng mga masasamang aktor at”pranksters”. Ang mga gumagamit ng social media ay nag-iisip na ng iba’t ibang paraan na maaaring gawing ibang bagay ang Personal na Boses kaysa sa isang kapaki-pakinabang na feature:
Mga maliliit na scamVirtual na pagkidnap Mga mapanlinlang na voice message/recording Mga biro na lumalampas sa mga limitasyon
Isa na kapansin-pansin sa partikular (salamat na tinatalakay ng malalaking news outlet) ay Virtual Kidnapping, na isang scam sa telepono na may maraming anyo. Ito ay mahalagang pamamaraan ng pangingikil na nanlilinlang sa mga biktima na magbayad ng ransom upang palayain ang isang mahal sa buhay na pinaniniwalaan nilang pinagbabantaan ng karahasan o kamatayan. Ang twist?”Hindi tulad ng tradisyonal na pagdukot, ang mga virtual na kidnapper ay hindi talaga kumidnap ng sinuman. Sa halip, sa pamamagitan ng mga panlilinlang at pagbabanta, pinipilit nila ang mga biktima na magbayad ng mabilisang ransom bago masira ang pamamaraan”, sabi ng FBI.
Inirerekomenda ko ang isang kamangha-manghang (ngunit masaya pa rin) na episode ng podcast ng Armchair Expert, kung saan tinatawagan ng mga tao si Dax Shepard para sabihin sa kanya ang tungkol sa oras kung kailan sila na-scam. Ang virtual na kuwento ng kidnapping ay matindi ngunit napaka-insightful.
Gayunpaman, dahil ang Virtual Kidnapping ay hindi karaniwang may kasamang aktwal na”kidnapping”, ang tanging pagpipilian upang samantalahin ang Personal Voice ng iPhone ay kung ang mga masasamang tao sa anumang paraan nakakuha ng access sa iyong iPhone/recording, na nangangahulugang sa puntong ito ay maaaring ikaw ay “aktwal na kinidnap”, o nabigo ang pag-encrypt ng Apple. Sa madaling salita, kung nangyari iyon, magkakaroon ng mas malalaking bagay na dapat ipag-alala.
Kaya, ang sinasabi ko ay… Marahil ay dapat nating subukan at tumuon sa positibong bahagi ng Personal Voice at lahat ng iba pang accessibility na pinapagana ng AI at ML mga tampok, na makakatulong sa mga nangangailangan? Iiwan ko ang hinala para mamaya. Samantala, maaari mong matutunan ang lahat tungkol sa mga bagong feature ng Apple para sa cognitive accessibility, kasama ng Live Speech, Personal Voice, at Point and Speak in Magnifier sa pamamagitan ng post sa blog.