Di bidang AI, model bahasa besar baru diluncurkan setiap hari dan berbagai hal berubah dengan sangat cepat. Hanya dalam beberapa bulan pengembangan, kami sekarang dapat menjalankan LLM mirip ChatGPT di PC kami secara offline. Tidak hanya itu, kami dapat melatih chatbot AI dan membuat asisten AI yang dipersonalisasi. Tapi yang membuat saya penasaran baru-baru ini adalah pendekatan langsung Microsoft untuk pengembangan AI. Microsoft saat ini sedang mengerjakan bentuk lanjutan dari sistem AI yang disebut JARVIS (referensi yang jelas untuk Marvel’s Iron Man) yang terhubung ke beberapa model AI dan merespons dengan hasil akhir. Demonya dihosting di Huggingface dan siapa pun dapat melihat kemampuan JARVIS sekarang. Jadi jika Anda tertarik, langsung saja pelajari cara menggunakan Microsoft JARVIS (HuggingGPT).

Daftar Isi

Apa itu Microsoft JARVIS (HuggingGPT)?

Microsoft telah mengembangkan semacam sistem kolaboratif unik di mana beberapa model AI dapat digunakan untuk mencapai tugas tertentu. Dan dalam semua ini, ChatGPT bertindak sebagai pengontrol tugas. Proyek ini disebut JARVIS di GitHub (kunjungi), dan sekarang tersedia di Huggingface (sehingga disebut HuggingGPT) untuk orang untuk mencobanya. Dalam pengujian kami, ini bekerja sangat baik dengan teks, gambar, audio, dan bahkan video.

Ini bekerja mirip dengan cara OpenAI mendemonstrasikan kemampuan multimodal GPT 4 dengan teks dan gambar. Namun, JARVIS mengambil satu langkah lebih jauh dan mengintegrasikan berbagai LLM sumber terbuka untuk gambar, video, audio, dan lainnya. Bagian terbaiknya di sini adalah juga dapat terhubung ke internet dan mengakses file. Misalnya, Anda dapat memasukkan URL dari situs web dan mengajukan pertanyaan tentangnya. Itu sangat keren, bukan?

Anda dapat menambahkan banyak tugas dalam satu kueri. Misalnya, Anda dapat memintanya untuk membuat gambar invasi alien dan menulis puisi tentangnya. Di sini, ChatGPT menganalisis permintaan dan merencanakan tugas. Setelah itu, ChatGPT memilih model yang benar (dihosting di Huggingface) untuk menyelesaikan tugas tersebut. Model yang dipilih menyelesaikan tugas dan mengembalikan hasilnya ke ChatGPT.

Akhirnya, ChatGPT menghasilkan respons menggunakan hasil inferensi dari semua model. Untuk tugas ini, JARVIS menggunakan model Stable Diffusion 1.5 untuk menghasilkan gambar dan menggunakan ChatGPT sendiri untuk menulis puisi.

Ada sebanyak 20 model yang ditautkan ke JARVIS (HuggingGPT). Beberapa di antaranya adalah t5-base, stable-diffusion 1.5, bert, Facebook’s bart-large-cnn, Intel’s dpt-large, dan banyak lagi. Singkatnya, jika Anda menginginkan kemampuan multimodal sekarang, silakan dan periksa Microsoft JARVIS segera. Kami telah menjelaskan cara menyiapkan dan mengujinya sekarang juga di sini:

Langkah 1: Dapatkan Kunci untuk Menggunakan Microsoft JARVIS

1. Pertama, buka tautan ini, masuk ke akun OpenAI Anda, dan klik “Buat baru secret key” untuk mendapatkan kunci OpenAI API Anda. Simpan kunci dalam file Notepad untuk digunakan nanti.

2. Selanjutnya, buka situs web huggingface.co (kunjungi) dan buat akun gratis.

3. Setelah itu, klik tautan ini untuk membuat token Hugging Face Anda. Klik “Token baru” di panel kanan.

4. Di sini, masukkan nama (misalnya, saya telah memasukkan nama “jarvis”). Kemudian, ubah Peran menjadi “Tulis” lalu klik “Hasilkan token“.

5. Selanjutnya, klik tombol “salin”, dan token akan disalin ke papan klip. Simpan token ke file Notepad.

Langkah 2: Mulai Menggunakan Microsoft JARVIS (HuggingGPT)

1. Untuk menggunakan Microsoft JARVIS, buka tautan ini dan tempel kunci OpenAI API di bidang pertama. Setelah itu, klik”Kirim”. Demikian pula, rekatkan token Huggingface di bidang kedua dan klik”Kirim.”

2. Setelah kedua token divalidasi, gulir ke bawah dan masukkan kueri Anda. Untuk memulai, saya bertanya kepada JARVIS tentang apa foto itu dan membagikan URL dari gambar tersebut.

3. Secara otomatis mengunduh gambar dan menggunakan tiga model AI untuk tugas tersebut, termasuk ydshieh/vit-gpt2-coco-en (untuk mengonversi gambar menjadi teks), facebook/detr-resnet-101 (untuk objek-deteksi), dan dandelin/vilt-b32-finetuned-vqa (untuk visual-question-answering). Akhirnya disimpulkan bahwa foto tersebut berisi seekor kucing yang sedang melihat dirinya sendiri di cermin. Bukankah itu luar biasa?

4. Dalam contoh lain, saya memintanya untuk mentranskripsi file audio, dan melakukannya menggunakan model OpenAI/whisper-base. Ada banyak kasus penggunaan JARVIS, dan Anda dapat mencobanya di HuggingFace secara gratis.

Gunakan Beberapa Model AI Sekaligus Dengan HuggingGPT

Jadi begini caranya dapat menggunakan HuggingGPT untuk menyelesaikan tugas menggunakan model AI yang berbeda. Saya menguji JARVIS beberapa kali, dan itu bekerja dengan cukup baik, kecuali Anda harus cukup sering berada di belakang antrean. Anda tidak dapat menjalankan JARVIS secara lokal di PC setengah layak mana pun, karena memerlukan setidaknya 16GB VRAM dan sekitar 300GB ruang untuk berbagai model.

Di Huggingface juga, Anda tidak dapat mengkloningnya dan melewati antrean di bawah akun gratis. Anda perlu berlangganan untuk menjalankan model yang kuat pada Nvidia A10G – GPU besar dengan biaya $3,15/jam. Bagaimanapun, itu semua dari kami. Jika Anda ingin menggunakan CodeGPT dalam VS Code untuk mendapatkan bantuan saat memprogram, buka panduan tertaut kami. Dan untuk menggunakan ChatGPT 4 secara gratis, kami memiliki daftar yang siap untuk Anda. Terakhir, jika Anda memiliki pertanyaan, beri tahu kami di bagian komentar di bawah.

1 Komentar

Tahun lalu, MSI meluncurkan Titan GT77 dengan Intel Core i9-12900HX dan GPU Laptop RTX 3080 Ti, dan ini adalah laptop gaming terkuat di muka bumi. Itu adalah pemukul berat terberat […]

Sudah beberapa bulan sejak seri iPhone 14 diluncurkan, dan telah ditetapkan dengan baik bahwa ini adalah tahun model Pro. Tetapi jika Anda berniat untuk mencari Pro berenda, jumlah yang harus ditanggung […]

Wondershare telah mengembangkan beberapa perangkat lunak dan alat terbaik untuk menyederhanakan hidup dan upaya kreatif kita selama beberapa tahun terakhir. Secara khusus, Wondershare Filmora telah menerima banyak penghargaan. Itu adalah penerima penghargaan Video Editing Leader […]

Categories: IT Info