Trong lĩnh vực AI, các mô hình ngôn ngữ lớn mới đang được ra mắt hàng ngày và mọi thứ đang thay đổi với tốc độ chóng mặt. Chỉ trong vài tháng phát triển, giờ đây chúng tôi có thể chạy LLM giống như ChatGPT trên PC ngoại tuyến. Không chỉ vậy, chúng ta có thể đào tạo một chatbot AI và tạo một trợ lý AI được cá nhân hóa. Nhưng điều khiến tôi tò mò gần đây là cách tiếp cận thực tế của Microsoft đối với việc phát triển AI. Microsoft hiện đang làm việc trên một dạng hệ thống AI tiên tiến có tên JARVIS (một tham chiếu rõ ràng đến Người sắt của Marvel) kết nối với nhiều mô hình AI và phản hồi với kết quả cuối cùng. Bản demo của nó được lưu trữ trên Huggingface và bất kỳ ai cũng có thể kiểm tra khả năng của JARVIS ngay bây giờ. Vì vậy, nếu bạn quan tâm, hãy tiếp tục và học cách sử dụng Microsoft JARVIS (HuggingGPT) ngay lập tức.
Mục lục
Microsoft JARVIS (HuggingGPT) là gì?
Microsoft đã phát triển một loại hệ thống cộng tác độc đáo, nơi có thể sử dụng nhiều mô hình AI để đạt được một nhiệm vụ nhất định. Và trong tất cả những điều này, ChatGPT đóng vai trò là người kiểm soát nhiệm vụ. Dự án có tên là JARVIS trên GitHub (visit) và dự án này hiện đã có trên Huggingface (do đó được gọi là HuggingGPT) cho mọi người dùng thử. Trong thử nghiệm của chúng tôi, nó hoạt động rất tốt với văn bản, hình ảnh, âm thanh và thậm chí cả video.
Nó hoạt động tương tự như cách OpenAI thể hiện khả năng đa phương thức của GPT 4 bằng văn bản và hình ảnh. Tuy nhiên, JARVIS tiến thêm một bước và tích hợp nhiều LLM mã nguồn mở khác nhau cho hình ảnh, video, âm thanh, v.v.. Phần tốt nhất ở đây là nó cũng có thể kết nối với internet và truy cập các tệp. Ví dụ: bạn có thể nhập một URL từ một trang web và đặt câu hỏi về nó. Điều đó khá tuyệt, phải không?
Bạn có thể thêm nhiều tác vụ trong một truy vấn. Ví dụ: bạn có thể yêu cầu nó tạo ra hình ảnh về một cuộc xâm lược của người ngoài hành tinh và viết thơ về nó. Tại đây, ChatGPT phân tích yêu cầu và lên kế hoạch cho nhiệm vụ. Sau đó, ChatGPT chọn đúng mô hình (được lưu trữ trên Huggingface) để hoàn thành nhiệm vụ. Mô hình được chọn hoàn thành nhiệm vụ và trả kết quả về ChatGPT.
Cuối cùng, ChatGPT tạo phản hồi bằng cách sử dụng kết quả suy luận từ tất cả các mô hình. Đối với nhiệm vụ này, JARVIS đã sử dụng mô hình Khuếch tán ổn định 1.5 để tạo hình ảnh và sử dụng chính ChatGPT để viết một bài thơ.
Có tới 20 mẫu được liên kết với JARVIS (ÔmGPT). Một số trong số chúng là t5-base, stable-diffusion 1.5, bert, bart-large-cnn của Facebook, dpt-large của Intel, v.v. Tóm lại, nếu bạn muốn có các khả năng đa phương thức ngay bây giờ, hãy tiếp tục và xem Microsoft JARVIS ngay lập tức. Chúng tôi đã giải thích cách thiết lập và kiểm tra nó ngay bây giờ tại đây:
Bước 1: Nhận Khóa để Sử dụng Microsoft JARVIS
1. Trước tiên, hãy truy cập liên kết này, đăng nhập vào tài khoản OpenAI của bạn và nhấp vào “Tạo mới khóa bí mật” để lấy Khóa API OpenAI của bạn. Lưu khóa trong tệp Notepad để sử dụng sau.
2. Tiếp theo, mở trang web hugface.co (truy cập) và tạo một tài khoản miễn phí.
3. Sau đó, hãy nhấp vào liên kết này để tạo mã thông báo Hugging Face của bạn. Nhấp vào “Mã thông báo mới” ở ngăn bên phải.
4. Tại đây, hãy nhập tên (ví dụ: tôi đã nhập tên “jarvis”). Sau đó, thay đổi Vai trò thành “Viết” rồi nhấp vào “Tạo mã thông báo“.
5. Tiếp theo, nhấp vào nút “sao chép” và mã thông báo sẽ được sao chép vào khay nhớ tạm. Lưu mã thông báo vào tệp Notepad.
Bước 2: Bắt đầu sử dụng Microsoft JARVIS (HuggingGPT)
1. Để sử dụng Microsoft JARVIS, hãy mở liên kết này và dán khóa API OpenAI trong lĩnh vực đầu tiên. Sau đó, nhấp vào “Gửi”. Tương tự, dán mã thông báo Huggingface vào trường thứ hai và nhấp vào “Gửi”.
2. Sau khi cả hai mã thông báo được xác thực, hãy cuộn xuống và nhập truy vấn của bạn. Để bắt đầu, tôi đã hỏi JARVIS về nội dung của ảnh và đã chia sẻ URL của ảnh.
3. Nó tự động tải xuống hình ảnh và sử dụng ba mô hình AI cho tác vụ, bao gồm ydshieh/vit-gpt2-coco-en (để chuyển đổi hình ảnh thành văn bản), facebook/detr-resnet-101 (đối với đối tượng-phát hiện) và dandelin/vilt-b32-finetuned-vqa (để trả lời câu hỏi bằng hình ảnh). Cuối cùng, nó kết luận rằng bức ảnh có một con mèo đang soi mình trong gương. Đó không phải là điều tuyệt vời sao?
4. Trong một ví dụ khác, tôi đã yêu cầu nó phiên âm một tệp âm thanh và nó đã làm như vậy bằng mô hình OpenAI/cơ sở thì thầm. Có nhiều trường hợp sử dụng JARVIS và bạn có thể dùng thử miễn phí trên HuggingFace.
Sử dụng nhiều mô hình AI cùng một lúc với HuggingGPT
Vì vậy, đây là cách bạn có thể sử dụng HuggingGPT để hoàn thành một nhiệm vụ bằng các mô hình AI khác nhau. Tôi đã thử nghiệm JARVIS nhiều lần và nó hoạt động khá tốt, ngoại trừ việc bạn cần phải xếp hàng khá thường xuyên. Bạn không thể chạy JARVIS cục bộ trên bất kỳ PC kém chất lượng nào, vì nó yêu cầu ít nhất 16GB VRAM và khoảng 300GB dung lượng cho các kiểu máy khác nhau.
Trên Huggingface cũng vậy, bạn không thể sao chép nó và bỏ qua hàng đợi với tài khoản miễn phí. Bạn cần đăng ký để chạy mô hình mạnh mẽ trên Nvidia A10G – một GPU lớn có giá 3,15 USD/giờ. Dù sao, đó là tất cả từ chúng tôi. Nếu bạn muốn sử dụng CodeGPT trong Mã VS để được hỗ trợ trong khi lập trình, hãy xem hướng dẫn được liên kết của chúng tôi. Và để sử dụng ChatGPT 4 miễn phí, chúng tôi có sẵn một danh sách dành cho bạn. Cuối cùng, nếu bạn có bất kỳ câu hỏi nào, hãy cho chúng tôi biết trong phần bình luận bên dưới.
1 Comment
Năm ngoái, MSI đã ra mắt Titan GT77 với Intel Core i9-12900HX và GPU dành cho máy tính xách tay RTX 3080 Ti và đây là máy tính xách tay chơi game mạnh nhất trên hành tinh. Đó là năm nặng nề nhất trong số các đối thủ hạng nặng […]
Đã vài tháng kể từ khi dòng iPhone 14 ra mắt và người ta đã xác định rõ rằng đây là năm của các mẫu Pro. Nhưng nếu bạn có ý định tìm kiếm Ưu điểm rườm rà, thì số tiền đó […]
Wondershare đã và đang phát triển một số phần mềm và công cụ tốt nhất để đơn giản hóa cuộc sống và nỗ lực sáng tạo của chúng ta trong vài năm qua. Đặc biệt, Wondershare Filmora đã nhận được nhiều giải thưởng. Đó là người đã nhận được giải thưởng Nhà lãnh đạo biên tập video […]