Khi viết bài này, OpenAI đang ở giữa một cuộc chiến pháp lý. Một công ty ở California đang tuyên bố rằng OpenAI đã vi phạm quyền riêng tư của người dùng trong khi đào tạo chatbot ChatGPT của họ. Vì tuyên bố này và lượng dữ liệu mà công ty đã thu thập cho chatbot của mình, điều này có thể có một số tác động lớn đối với OpenAI và các công ty AI khác. Câu hỏi đặt ra là: OpenAI có sai trong tình huống này không?
Vụ việc nói về cái gì?
Sau khi xem xét vụ việc này nói về vấn đề gì, bạn sẽ dễ dàng hiểu được nguyên nhân trọng lực của tình hình. Bây giờ, AI giống như bộ não con người; nó cần phải được đào tạo. Nó cần phải được dạy. Các công ty cung cấp hàng tấn dữ liệu vào LLM của họ (Mô hình ngôn ngữ lớn) để họ có thể học. Các LLM càng biết nhiều, họ càng có thể hữu ích hơn. Google là một trong những công ty AI hàng đầu vì họ có quyền truy cập vào hàng tỷ tấn dữ liệu thông qua tìm kiếm của Google, Android, v.v.
Trong trường hợp của ChatGPT, nó cũng sử dụng LLM cần được đào tạo ; và công ty đã đào tạo nó bằng cách sử dụng rất nhiều dữ liệu. Vấn đề nằm ở một số nơi mà nó có thông tin này. Công ty đã sử dụng rất nhiều dữ liệu từ internet. Điều này bao gồm một loạt dữ liệu mà mọi người đã tải lên mà không được phép sử dụng bởi một chatbot AI.
Chúng ta đang nói về các bài báo, bài đăng trên blog, truyện ngắn, kịch bản phim, bài thơ, bài đăng trên mạng xã hội, v.v. Danh sách này cứ lặp đi lặp lại. Vì kiến thức về ChatGPT đã có từ xa xưa nên không thể biết được có bao nhiêu dữ liệu của mọi người đã được sử dụng để đào tạo ChatGPT. Vụ kiện nói rằng thông tin này được lấy mà không có sự đồng ý của người đăng ban đầu.
Đây là lý do OpenAI gặp khó khăn. Quy mô tuyệt đối của thông tin mà OpenAI cung cấp vào ChatGPT là khổng lồ. Nếu tòa án kết luận rằng công ty có lỗi, thì đó có thể là tin xấu cho AI nói chung.
Vậy, OpenAI có sai không?
Đó là miền tây hoang dã ngoài kia đối với AI, vì các nhà lập pháp vẫn đang tìm cách điều chỉnh nó. Trong khi họ đang đấu tranh với tính hợp pháp của AI, những Joe bình thường đang đối mặt với vấn đề đạo đức của nó. OpenAI có sai khi sử dụng quá nhiều dữ liệu để huấn luyện ChatGPT không?
Có thể tranh luận là có.
Phần lớn tranh luận này xuất phát từ tranh cãi về nghệ thuật do AI tạo ra. Có một cuộc phản đối đang diễn ra chống lại công nghệ này bởi vì nó mang lại cho mọi người khả năng tạo ra hình ảnh ngay lập tức mà không cần gì khác ngoài từ ngữ. Cũng giống như ChatGPT, trình tạo hình ảnh AI cần được cung cấp hình ảnh nghệ thuật từ các nghệ sĩ con người. Nhiều nghệ sĩ con người không muốn nghệ thuật của họ được sử dụng để đào tạo các bot hình ảnh này.
Chà, hãy nghĩ về việc mọi người sử dụng nội dung bằng văn bản của họ để đào tạo ChatGPT. Giống như cách các trình tạo hình ảnh có thể khiến các nghệ sĩ ngừng hoạt động, chatbot cũng có thể khiến các nhà văn ngừng hoạt động. Chatbots có thể tạo các bài báo, truyện ngắn, kịch bản, bài đăng trên blog, v.v. chỉ trong vài giây. Tại sao phải thuê và trả tiền cho một người viết khi bạn có thể tạo nội dung của mình? Có thể hiểu được, những nhà văn con người đã dành nhiều năm để phát triển nghề của họ sẽ không muốn nội dung của họ được sử dụng để đào tạo chính cỗ máy có thể khiến họ mất việc.
Đây là những người cần đặt công việc của họ ra khỏi đó để kiếm sống. Các nhà báo đăng bài viết của họ trên các trang web công cộng, các nhà văn viết các bài đăng trên blog cho các trang web công cộng của công ty, v.v. Họ làm điều này để chia sẻ công việc của mình với độc giả và hy vọng truyền cảm hứng cho các nhà văn khác. Họ không đăng nhập để công việc của họ được thu thập và sử dụng để huấn luyện các chatbot AI.
Những người khác có thể phản đối
Lập luận này có hai mặt. Khi các nghệ sĩ, nhà văn và nhạc sĩ đăng tác phẩm của họ lên mạng, họ có nguy cơ bị sử dụng cho các mục đích khác. Nó không khác nhiều so với việc nội dung của bạn bị đánh cắp và đạo văn. Người sáng tạo đưa nội dung của họ ra ngoài với sự hiểu biết rằng nội dung đó có thể được dỡ bỏ và sử dụng cho một số mục đích khác.
Cuộc trò chuyện thậm chí còn trở nên rối rắm hơn nếu nội dung không được bảo vệ bởi bản quyền. Nếu nội dung của bạn có sẵn miễn phí trên internet cho bất kỳ ai lấy, thì OpenAI có thể có quyền sử dụng nội dung đó để đào tạo ChatGPT.
Nếu OpenAI thua kiện, đó có thể là một điều tốt
Những người trong số các bạn sử dụng ChatGPT để viết bài luận của mình và những người như vậy rất có thể đang ủng hộ OpenAI thắng kiện. Tuy nhiên, nếu công ty thua kiện, đó có thể không phải là điều tồi tệ nhất. Chắc chắn, OpenAI sẽ phải đối mặt với tổn thất tài chính, điều này không tốt cho công ty. Tuy nhiên, nếu tòa án thắng kiện này, thì điều đó có thể giúp thúc đẩy quy định về AI.
Như đã nêu trước đó, quy định về AI là cả một miền tây hoang dã. Các nhà lập pháp đang tranh giành để kiềm chế sự phát triển của AI và đảm bảo rằng nó sẽ không có bất kỳ tác động tiêu cực nào. Quyền của mọi người đối với nội dung của họ chưa bao giờ gặp nguy hiểm hơn khi các trình tạo hình ảnh AI và chatbot AI đang xuất hiện ở khắp mọi nơi. Nội dung từ khắp nơi trên internet đang được thu thập và sử dụng cho các LLM này và không có cách nào để ngăn chặn nó.
Nếu OpenAI thua kiện này, thì nó sẽ đưa vấn đề này lên hàng đầu. Nó sẽ khiến mọi người nói về cách các LLM này lấy thông tin của họ. Mọi người đang khóc để AI được điều chỉnh vào thời điểm này. Nó khiến mọi người mất việc làm. Những người sáng tạo độc lập đang được hỗ trợ bởi những người không có tài năng, những người tạo ra nội dung và tiếp thị nội dung đó. Ai đó có thể dễ dàng tạo ra một “bài hát” do AI tạo ra và tiếp thị nó trên Spotify. Hãy tưởng tượng tung ra toàn bộ album trong một ngày hoặc một tuần và thu nhập từ đó.
Điều tương tự cũng xảy ra với “nghệ sĩ” AI và “tác giả” AI. Nó có thể đã là quá muộn đối với hầu hết mọi người. Chúng tôi vẫn đang tìm hiểu tiềm năng của công nghệ AI tổng hợp; điều này bao gồm cả khả năng xấu.
Chỉ có thời gian mới trả lời
Tại thời điểm này, chúng tôi vẫn đang chờ kết quả của vụ việc nên rất khó để nói điều gì sẽ xảy ra. Chúng ta sẽ cần chờ xem trường hợp này phát triển như thế nào để biết tương lai của công nghệ. Một trường hợp như thế này chắc chắn có thể có một số tác động lớn đối với trí tuệ nhân tạo.