Google মূলত 2021 সালে ড্রিম ফিল্ডস নামে তার জেনারেটিভ 3D AI সিস্টেম উন্মোচন করেছিল এবং এখন একটি নতুন এবং উন্নত সংস্করণ এসেছে।

গুগলের নতুন পরবর্তী প্রজন্মের কৃত্রিম টেক্সটকে 3D জেনারেটেড ইমেজে রূপান্তর করার জন্য ডিজাইন করা গোয়েন্দা সফ্টওয়্যারকে ড্রিমফিউশন বলা হয়। তাহলে এটা কিভাবে কাজ করে? প্রি-প্রিন্ট সার্ভার arXiv, গবেষকরা রূপরেখা দিয়েছেন যে ড্রিম ফিউশন, অনেকটা ড্রিম ফিল্ডের মতো, নিউরাল রেডিয়েন্স ফিল্ড (NeRF) নামে একটি নিউরাল নেটওয়ার্ক ব্যবহার করে যা 2D ডেটাসেট ব্যবহার করে জটিল 3D দৃশ্যের সাধারণ অভিনব দৃশ্যের জন্য ডিজাইন করা হয়েছে।

তবে, DreamFusion-এর ড্রিম ফিল্ডের চেয়ে ভিন্ন পন্থা নিয়েছে, যেমনটি ব্যাখ্যা করেছেন গুগলের গবেষণা বিজ্ঞানী বেন পুল, যিনি টুইটারে লিখেছেন যে দলটি OpenAI-এর CLIP প্রযুক্তি প্রতিস্থাপন করেছে যা ড্রিম ফিল্ডসকে Google-এর নিজস্ব AI মডেল ইমেজেন বলে। উপরে এবং নীচে দেখা 3D মডেলগুলি আমরা মিডজার্নির সাথে যা দেখেছি তার মতো ফটো-বাস্তববাদী নয়। যাইহোক, তারা অবশ্যই এখনও চিত্তাকর্ষক কারণ 3D মডেলগুলির সঠিক পৃষ্ঠের জ্যামিতি, গভীরতা রয়েছে এবং এমনকি বিভিন্ন আলোর অবস্থার জন্যও এটি আনন্দদায়ক৷ একটি একক দৃশ্যে।

ওপেন সোর্স মডেলগুলির সাথে আমাদের পদ্ধতিগুলিকে অন্তর্ভুক্ত করতে এবং 3D প্রজন্মের জন্য একটি নতুন ভবিষ্যত সক্ষম করতে আমরা উত্তেজিত!“লিখেছেন পুল৷ p>

আমাদের পদ্ধতির জন্য কোনো 3D প্রশিক্ষণের ডেটার প্রয়োজন নেই এবং ইমেজ ডিফিউশন মডেলে কোনো পরিবর্তনের প্রয়োজন নেই, যা পূর্বের মতো পূর্বপ্রশিক্ষিত ইমেজ ডিফিউশন মডেলের কার্যকারিতা প্রদর্শন করে,“Google এর গবেষণা দল লিখেছে।

আপনি যদি নিজের জন্য 3D মডেলগুলি পরীক্ষা করতে আগ্রহী হন, তাহলে DreamFusion ওয়েবসাইটে যান এখানে

Categories: IT Info