Người dùng có thể tạo Giọng nói cá nhân bằng cách đọc cùng với một bộ lời nhắc văn bản ngẫu nhiên để ghi lại 15 phút âm thanh trên iPhone hoặc iPad. Tính năng hỗ trợ giọng nói này sử dụng công nghệ máy học trên thiết bị để giữ thông tin của người dùng ở chế độ riêng tư và bảo mật, đồng thời tích hợp hoàn hảo với Live Speech để người dùng có thể nói bằng Giọng nói cá nhân của họ khi kết nối với những người thân yêu.AppleĐúng vậy! Sau ChatGPT và Google, giờ đến lượt Apple nhúng chân vào thế giới AI tiên tiến và Tim Cook & Co đã nghĩ ra tính năng nào để bắt đầu hành trình này! iPad và iPhone chạy iOS 17 (ra mắt vào tháng 9) sẽ cho phép bạn tạo phiên bản kỹ thuật số cho giọng nói của chính mình. Hãy để điều đó chìm sâu trong giây lát… Nếu có vẻ như Apple sẽ cho phép bạn tạo “deepfake” giọng nói của chính mình, thì đó là bởi vì, đó là sự thật. Sắp xếp. Nhưng nó không đơn giản như vậy.
Apple cho biết iPhone của bạn sẽ sớm có thể nói bằng giọng nói của bạn sau 15 phút đào tạo. Tại sao? Vì vậy, “người dùng có thể nói bằng Giọng nói cá nhân của họ (tên thật của tính năng) khi kết nối với bạn bè và gia đình”. Nhưng nó không chỉ là một thủ thuật của bữa tiệc. Không có gì ngạc nhiên khi Apple đang tiếp cận tính năng Personal Voice AI từ góc độ khả năng tiếp cận, được cho là mục tiêu chính ở đây. Cupertino có thành tích vững chắc trong việc vượt lên trên tất cả để làm cho iPhone trở nên toàn diện hơn. Tuy nhiên, khoảng thời gian này, nhiều người cũng lo ngại về quyền riêng tư và bảo mật tối ưu của họ.
AI đang trở nên vô cùng mạnh mẽ và trong khi ChatGPT có thể giúp bạn viết một bài luận thì Bard của Google có thể đảm nhận vai trò trợ lý hoặc trợ giúp Gmail của bạn bạn tìm thấy chiếc tủ lạnh tốt nhất cho nhà bếp của mình, sức mạnh thực sự của AI có thể nằm ở khả năng tương tác với con người và do đó trở thành một phần của xã hội chúng ta.
Vì vậy, chúng ta có nên lo lắng về thực tế là iPhone sẽ sớm có thể nói bằng giọng nói của chúng ta? Tôi không nghĩ vậy. Nếu có bất cứ điều gì, tôi rất phấn khích!
Đáng sợ nhưng hữu ích-iPhone chạy iOS 17 sẽ có thể nói chuyện trong “Giọng nói cá nhân” của bạn; Apple tham gia cuộc đua AI tiên tiến theo cách thông minh nhất có thể
Không biết bạn thế nào nhưng tôi nghĩ Apple đang khá cẩn thận khi tham gia cuộc đua AI, vì khả năng tiếp cận có thể là một trong những lựa chọn an toàn nhất khi nó đến để hợp lý hóa nhu cầu về AI trong iPhone và iPad. Tuy nhiên, điều này không có nghĩa là Apple đã chọn một con đường dễ dàng.
Nếu có thì một tính năng AI với sứ mệnh làm cho cuộc sống của mọi người trở nên dễ dàng hơn theo cách thực sự có ý nghĩa quan trọng hơn bất kỳ thủ thuật AI nào khác có thể có hoặc không. giúp đỡ chúng tôi ngay từ đầu. Hơn nữa, việc Apple đứng sau tính năng Giọng nói cá nhân sẽ chỉ làm tăng mức độ quan tâm và xem xét kỹ lưỡng về Giọng nói cá nhân nhận được từ các nhà phê bình và công chúng. Nhưng Apple rất thoải mái với sự chú ý.
Tất nhiên, chưa có ai có cơ hội thử nghiệm Giọng nói cá nhân, vì vậy tôi sẽ phải bảo lưu bất kỳ ý kiến mạnh mẽ nào khi tính năng này được phát hành (dự kiến vào cuối năm nay ). Nhưng những gì chúng ta có thể làm ngay bây giờ là nói về bản chất tích cực của AI tiên tiến đến với iPhone. Và còn cách nào tốt hơn để tạo ra tác động tích cực hơn là giúp đỡ mọi người vượt qua cuộc sống.
Thật không may, rất khó để tìm số liệu thống kê toàn cầu thuộc loại này, nhưng theo số liệu có sẵn ở Hoa Kỳ, xấp xỉ 18,5 triệu người mắc chứng rối loạn ngôn ngữ, giọng nói hoặc ngôn ngữ, điều này cho thấy nhu cầu rõ ràng là làm cho công nghệ hoạt động cho những người có thể hưởng lợi nhiều nhất từ công nghệ đó.
Đó là thời điểm để đề cập rằng thay vì tạo ra một nền tảng mới, Apple chỉ đơn giản là khai thác thế giới Truyền thông Thay thế và Tăng cường (AAC) đã tồn tại. Các ứng dụng AAC được thiết kế để giúp những người không biết nói giao tiếp hiệu quả hơn thông qua việc sử dụng các ký hiệu và bàn phím tiên đoán để tạo ra lời nói. Nhiều người không thể nói bằng miệng, bao gồm cả những người mắc bệnh ALS, bại não và tự kỷ phải sử dụng các ứng dụng AAC để giao tiếp.
Nếu bạn tò mò, hãy Apple đã xuất bản một câu chuyện riêng về AAC và AssistiveWare (một của các nhà phát triển hàng đầu trong lĩnh vực AAC). AssistiveWare cho biết nhiệm vụ của họ là làm cho AAC trở thành một phương tiện liên lạc hiệu quả và được chấp nhận. Hiện tại, có vẻ như Apple không muốn mua lại AssistiveWare.
Người sáng lập kiêm Giám đốc điều hành của AssistiveWare, David Niemeijer, hy vọng các ứng dụng AAC như Proloquo2Go sẽ được chấp nhận rộng rãi như nhắn tin. “Nếu bạn không thể nói, giả định vẫn là bạn có thể không có nhiều điều để nói. Giả định đó là vấn đề lớn nhất. Tôi hy vọng sẽ thấy sự thay đổi hướng tới việc tôn trọng công nghệ này để nó có thể tạo ra tác động lớn nhất,” Niemeijer nói. Hãy nhớ rằng mặc dù một số ứng dụng AAC miễn phí nhưng phiên bản Premium của Proloquo2Go hiện có giá 250 đô la để tải xuống từ App Store.
Giọng nói cá nhân của Apple-một tính năng thay đổi cuộc chơi giúp điện thoại thông minh trở nên thông minh và cuộc sống của chúng ta dễ dàng hơn?
Tôi tin rằng điều này làm sáng tỏ hơn một chút về lý do tại sao nỗ lực của Apple hướng tới việc làm cho iPhone và iPad trở nên dễ tiếp cận hơn lại là điểm chính của một tính năng như Giọng nói cá nhân. Trong thế giới của video TikTok và câu chuyện trên Instagram, khả năng truy cập và các tính năng Chất lượng cuộc sống (QoL) như Giọng nói cá nhân là lời nhắc nhở rằng điện thoại thông minh có thể (và nên) tồn tại để giúp cuộc sống của chúng ta dễ dàng hơn.
Như David Niemeijer, Giám đốc điều hành của AssistiveWare cho biết, iPhone/điện thoại thông minh là thiết bị “tuyệt vời” mà mọi người đều sử dụng và điều này đã tạo ra sự khác biệt lớn về khả năng chấp nhận ứng dụng AAC, vốn tồn tại trên cùng một thiết bị phổ biến thay vì một phần cứng “chuyên dụng” có vẻ “khác biệt”.
Vì vậy, thực tế là Giọng nói cá nhân của Apple sẽ trực tiếp trên iPhone, ngay cả khi không cần bất kỳ phần mềm đặc biệt nào, sẽ khiến việc sử dụng phần AI thay đổi cuộc chơi (hy vọng) này trở nên “bình thường” và dễ tiếp cận hơn nhiều.
Sắp ra mắt vào cuối năm nay, người dùng bị khuyết tật về nhận thức có thể sử dụng iPhone và iPad một cách dễ dàng và độc lập hơn với tính năng Truy cập có hỗ trợ; những người không biết nói có thể nhập để nói trong các cuộc gọi và cuộc trò chuyện với Live Speech; và những người có nguy cơ mất khả năng nói có thể sử dụng Giọng nói cá nhân để tạo giọng nói tổng hợp giống họ để kết nối với gia đình và bạn bè.
Đối với những người dùng có nguy cơ mất khả năng nói-chẳng hạn như những người gần đây được chẩn đoán mắc bệnh ALS (xơ cứng teo cơ một bên) hoặc các tình trạng khác có thể ảnh hưởng dần dần đến khả năng nói-Giọng nói cá nhân là một cách đơn giản và an toàn để tạo ra giọng nói giống họ.
Giọng nói cá nhân có thể là phiên bản Siri mới, được cải tiến và tăng cường-liệu tính năng trợ năng đầy tham vọng nhất của Apple có thể trở thành đối thủ cuối cùng của Trợ lý Google không?
Điều gì sẽ xảy ra nếu Personal Voice là gợi ý của Apple rằng Siri sẽ sớm nhận được bản nâng cấp lớn nhất của mình? bao giờ?
Tất cả những gì đã nói, với tư cách là một “dân công nghệ”, tôi chỉ đơn giản là không thể không nhìn vào tiềm năng mở rộng của Giọng nói cá nhân. Và hãy để tôi giải thích ý của tôi khi nói điều đó…
Siri đã trở nên tồi tệ theo nhiều cách khác nhau trong nhiều năm nay, với việc Trợ lý Google chạy vòng quanh rô-bốt của Apple theo mọi cách có thể. Nhưng điều gì sẽ xảy ra nếu Personal Voice chỉ là bước khởi đầu trong quá trình chuyển đổi của iPhone thành điện thoại nhận dạng giọng nói AI cuối cùng? Vinh dự này hiện thuộc về Google Pixel, thiết bị (nhờ chip Tensor của Google) có thể hiểu, ghi âm và phiên âm lời nói tốt hơn bất kỳ điện thoại nào khác trên thị trường.
Có vẻ như, Personal Voice về cơ bản đang được định hình là một công cụ chuyển văn bản thành giọng nói, có thể hữu ích trong một số tình huống khác nhau. Tôi muốn thấy một tính năng như Giọng nói cá nhân mở rộng sang các ứng dụng iPhone và iPad khác như Bản ghi nhớ giọng nói và Ghi chú. Tôi nói vậy bởi vì việc tìm kiếm một phần mềm chuyển văn bản thành giọng nói vừa miễn phí vừa có âm thanh tự nhiên gần như là không thể.
Rõ ràng, iPhone sẽ sớm có thể nói bằng giọng nói của bạn, nhưng tôi hy vọng tính năng Giọng nói cá nhân sẽ đi kèm với một số hạn chế nhất định. Tuy nhiên, điều gì sẽ xảy ra nếu iPhone của bạn có thể tự do đọc lại mọi thứ cho bạn bằng giọng nói của chính bạn hoặc một giọng nói tự nhiên khác với ngữ điệu phù hợp? Điều này sẽ hữu ích cho Sinh viên đang chuẩn bị cho một kỳ thi Những người phát thanh viên ghét đọc những quảng cáo nhàm chán Các diễn viên hài đang cố gắng ghi nhớ một bộ hài kịch Các diễn viên đang cố gắng học một kịch bản
Tôi biết… Trí tưởng tượng của tôi hơi hoang dã ở đây nhưng tôi thực sự nghĩ rằng các nghệ sĩ và công chúng nói chung có thể tạo ra sử dụng tuyệt vời việc triển khai rộng rãi hơn một tính năng như Giọng nói cá nhân. Các ví dụ nói trên có thể trông buồn cười khi xem xét nhiệm vụ hiện tại của Giọng nói cá nhân, nhưng tôi thực sự tin rằng đây chỉ là bước khởi đầu cho quá trình chuyển đổi AI của Apple.
Tôi đang nói quá nhưng tôi cũng đang tự hỏi liệu Giọng nói cá nhân có thể là bắt đầu một thứ thậm chí còn lớn hơn và gây tranh cãi hơn nhiều. Giống như ý tưởng về Metaverse và cách Dịch vụ ngân hàng bằng giọng nói có thể khiến chúng ta trở nên “bất tử”. Dịch vụ ngân hàng bằng giọng nói là một quy trình cho phép ai đó tạo ra giọng nói tổng hợp giống như giọng nói tự nhiên của họ một cách lý tưởng. Điều này đạt được bằng cách ghi lại một số lượng lớn tin nhắn khi giọng nói của bạn rõ ràng.
Vì vậy, điều gì sẽ xảy ra nếu giọng nói của bạn có thể được lưu giữ mãi mãi và/hoặc kết hợp với hình ảnh ảo của bạn, hình ảnh này có thể lưu lại sau bạn’lại”đi”đi? Nếu điều này nghe có vẻ hấp dẫn đối với bạn, thì tôi khuyên bạn nên xem một chương trình tuyệt vời có tên là “Tải lên”. Đây là một bộ phim hài-chính kịch khoa học viễn tưởng, khám phá ý tưởng về việc con người có thể”tải”bản thân sang thế giới ảo bên kia mà họ chọn vào năm 2033. Chỉ còn mười năm nữa thôi các bạn ạ!
iPhone và iPad sẽ có thể nói bằng giọng nói của bạn: Có phải Apple đang mở cửa cho những kẻ lừa đảo? Lo ngại về Bắt cóc ảo và Deepfakes nảy sinh
Chúng tôi tin vào một thế giới nơi mọi người đều có khả năng kết nối và giao tiếp. Để theo đuổi đam mê của họ và khám phá những đam mê mới. Vào Ngày Nhận thức về Khả năng Tiếp cận Toàn cầu (19 tháng 5), chúng ta kỷ niệm công nghệ toàn diện phù hợp với mọi người.
Tim Cook
Bây giờ, về các khía cạnh gây tranh cãi của Giọng nói Cá nhân của Apple…
Tất nhiên, mối quan tâm chính đối với tính năng Giọng nói cá nhân mới có liên quan đến bảo mật. Mọi người (bao gồm cả các phương tiện truyền thông chính thống) đang đặt câu hỏi, điều mà chúng tôi đã quen thấy khi ra mắt bất kỳ tính năng phần mềm mới liên quan đến việc thu thập dữ liệu cá nhân. Tuy nhiên, khoảng thời gian này, chúng tôi không nói về những bức ảnh chụp bữa trưa hay tin nhắn khi say rượu của bạn. iPhone và iPad được cho là sẽ ghi lại, lưu giữ và sao chép giọng nói của bạn, điều này (tự nhiên) sẽ khuếch đại mọi lo ngại về quyền riêng tư và bảo mật. Tất nhiên, Apple hứa hẹn Giọng nói cá nhân là “một cách đơn giản và an toàn để tạo ra giọng nói giống bạn”, điều này khiến tôi cho rằng tất cả hành động Giọng nói cá nhân sẽ được mã hóa, diễn ra trực tiếp (và duy nhất) trên iPhone của bạn/iPad (hay đúng hơn là trên SoC của họ).
Tuy nhiên, lời hứa của Apple về AI đơn giản và an toàn không ngăn được mọi người bày tỏ mối quan ngại của họ về khả năng bị kẻ xấu và “những kẻ chơi khăm”lạm dụng tiềm năng tính năng trợ năng mạnh mẽ.. Người dùng mạng xã hội đã nghĩ đến nhiều cách khác nhau để biến Giọng nói cá nhân thành một thứ khác ngoài tính năng hữu ích:
Lừa đảo nhỏ Bắt cóc ảo Tin nhắn thoại/bản ghi âm lừa đảo Trò đùa vượt quá giới hạn
Một trò chơi đặc biệt nổi bật (cảm ơn được các hãng tin lớn thảo luận) là Bắt cóc ảo, đây là một trò lừa đảo qua điện thoại mà có nhiều hình thức. Đây thực chất là một kế hoạch tống tiền lừa nạn nhân trả tiền chuộc để giải thoát cho người thân mà họ tin rằng đang bị đe dọa bằng bạo lực hoặc cái chết. Vắt? “Không giống như những vụ bắt cóc truyền thống, những kẻ bắt cóc ảo không thực sự bắt cóc bất kỳ ai. Thay vào đó, thông qua lừa dối và đe dọa, chúng ép buộc nạn nhân trả tiền chuộc nhanh chóng trước khi âm mưu sụp đổ”, FBI.
Tôi đề xuất một tập hấp dẫn (nhưng vẫn thú vị) của podcast Chuyên gia về Ghế bành, trong đó mọi người gọi điện cho Dax Shepard để kể cho anh ấy nghe về thời điểm họ bị lừa đảo. Câu chuyện bắt cóc ảo căng thẳng nhưng rất sâu sắc.
Tuy nhiên, vì Bắt cóc ảo thường không liên quan đến một vụ “bắt cóc” thực sự nên lựa chọn duy nhất để tận dụng Giọng nói cá nhân của iPhone là nếu kẻ xấu bằng cách nào đó có quyền truy cập vào iPhone/bản ghi âm của bạn, điều đó có nghĩa là tại thời điểm này, bạn có thể”thực sự bị bắt cóc”hoặc mã hóa của Apple đã thất bại. Nói cách khác, nếu điều đó xảy ra, sẽ có nhiều điều lớn hơn phải lo lắng.
Vì vậy, điều tôi muốn nói là… Có lẽ chúng ta nên thử và tập trung vào mặt tích cực của Giọng nói cá nhân cũng như tất cả các khả năng truy cập khác do AI và ML hỗ trợ các tính năng, có thể giúp những người có nhu cầu? Tôi sẽ để lại sự nghi ngờ cho sau này. Trong thời gian chờ đợi, bạn có thể tìm hiểu mọi thứ về các tính năng mới của Apple dành cho khả năng truy cập nhận thức, cùng với Bài phát biểu trực tiếp, Giọng nói cá nhân và Chỉ và nói trong Kính lúp thông qua bài đăng blog.