تصویر: Intel

Intel Labs، Blockade Labs کے تعاون سے، 3D (LDM3D) کے لیے لیٹنٹ ڈفیوژن ماڈل متعارف کرایا ہے، ایک نیا اور انڈسٹری کا پہلا AI ڈفیوژن ماڈل جو صارفین کو صرف ٹیکسٹ کے ذریعے 360 ڈگری ویوز کے ساتھ 3D تصاویر بنانے کی اجازت دیتا ہے۔ Intel کے مطابق، یہ ترقی”مواد کی تخلیق، میٹاورس، اور ڈیجیٹل تجربات میں انقلاب برپا کرے گی۔”

“جنریٹیو AI ٹیکنالوجی کا مقصد انسانی تخلیقی صلاحیتوں کو مزید بڑھانا اور بڑھانا اور وقت کی بچت کرنا ہے۔ تاہم، آج کے زیادہ تر تخلیقی AI ماڈلز 2D امیجز بنانے تک محدود ہیں اور صرف بہت کم ہی ٹیکسٹ پرامپٹس سے 3D امیجز بنا سکتے ہیں۔ موجودہ اویکت مستحکم ڈفیوژن ماڈلز کے برعکس، LDM3D صارفین کو تقریباً اسی تعداد کے پیرامیٹرز کا استعمال کرتے ہوئے دیئے گئے ٹیکسٹ پرامپٹ سے ایک تصویر اور گہرائی کا نقشہ بنانے کی اجازت دیتا ہے۔ یہ گہرائی کے تخمینے کے لیے پوسٹ پروسیسنگ کے معیاری طریقوں کے مقابلے میں ایک تصویر میں ہر پکسل کے لیے زیادہ درست رشتہ دار گہرائی فراہم کرتا ہے اور ڈیولپرز کو مناظر تیار کرنے میں اہم وقت بچاتا ہے۔”

ایک Intel پریس ریلیز:

کیوں یہ اہمیت رکھتا ہے: بند ماحولیاتی نظام محدود پیمانے پر۔ اور AI کی حقیقی جمہوریت کے لیے Intel کی وابستگی ایک کھلے ماحولیاتی نظام کے ذریعے AI کے فوائد تک وسیع تر رسائی کے قابل بنائے گی۔ ایک ایسا شعبہ جس میں حالیہ برسوں میں نمایاں پیش رفت دیکھنے میں آئی ہے وہ کمپیوٹر ویژن کے میدان میں ہے، خاص طور پر جنریٹو AI میں۔ تاہم، آج کے بہت سے جدید جنریٹو AI ماڈلز صرف 2D امیجز بنانے تک محدود ہیں۔ موجودہ ڈفیوژن ماڈلز کے برعکس، جو عام طور پر ٹیکسٹ پرامپٹ سے صرف 2D RGB امیجز تیار کرتے ہیں، LDM3D صارفین کو دیئے گئے ٹیکسٹ پرامپٹ سے تصویر اور گہرائی کا نقشہ دونوں بنانے کی اجازت دیتا ہے۔ تقریباً اتنی ہی تعداد میں پیرامیٹرز کا استعمال کرتے ہوئے لیٹنٹ سٹیبل ڈفیوژن، LDM3D گہرائی کے تخمینے کے لیے معیاری پوسٹ پروسیسنگ طریقوں کے مقابلے میں ایک تصویر میں ہر پکسل کے لیے زیادہ درست رشتہ دار گہرائی فراہم کرتا ہے۔ ڈیجیٹل مواد صارفین کو ان کے ٹیکسٹ اشارے کا تجربہ کرنے کے قابل بنا کر پہلے سے ناقابل فہم طریقوں سے۔ LDM3D کے ذریعے تیار کردہ تصاویر اور گہرائی کے نقشے صارفین کو ایک پر سکون اشنکٹبندیی ساحل، ایک جدید فلک بوس عمارت یا سائنس فائی کائنات کی متن کی تفصیل کو 360 ڈگری کے تفصیلی پینوراما میں تبدیل کرنے کے قابل بناتے ہیں۔ گہرائی سے متعلق معلومات حاصل کرنے کی یہ صلاحیت فوری طور پر مجموعی حقیقت پسندی اور وسرجن کو بڑھا سکتی ہے، جو تفریح ​​اور گیمنگ سے لے کر اندرونی ڈیزائن اور رئیل اسٹیٹ کی فہرستوں کے ساتھ ساتھ ورچوئل عجائب گھروں اور عمیق ورچوئل رئیلٹی (VR) کے تجربات تک کی صنعتوں کے لیے اختراعی ایپلی کیشنز کو فعال کر سکتی ہے۔

20 جون کو، LDM3D نے بہترین پوسٹر کا ایوارڈ  LAION-400M ڈیٹاسیٹ کو تحقیقی مقاصد کے لیے بنایا گیا ہے تاکہ وسیع پیمانے پر ٹیسٹنگ ماڈل ٹریننگ کو فعال کیا جا سکے۔ محقق اور دیگر دلچسپی رکھنے والی کمیونٹیز۔ نتیجتاً ماڈل اور پائپ لائن تیار کردہ RGB امیج اور گہرائی کے نقشے کو یکجا کر کے عمیق تجربات کے لیے 360-ڈگری ویوز پیدا کرتی ہے۔ عمیق اور انٹرایکٹو 360 ڈگری منظر کے تجربات تخلیق کرنے کے لیے تصاویر اور گہرائی کے نقشے۔ DepthFusion TouchDesigner کا استعمال کرتا ہے، ایک نوڈ پر مبنی بصری پروگرامنگ لینگویج ریئل ٹائم انٹرایکٹو ملٹی میڈیا مواد کے لیے، متن کے اشارے کو انٹرایکٹو اور عمیق ڈیجیٹل تجربات میں تبدیل کرنے کے لیے۔ LDM3D ماڈل ایک واحد ماڈل ہے جو RGB امیج اور اس کی گہرائی کا نقشہ دونوں تخلیق کرتا ہے، جس سے میموری فوٹ پرنٹ اور لیٹنسی میں بہتری آتی ہے۔

آگے کیا ہے: LDM3D کا تعارف اور ڈیپتھ فیوژن ملٹی ویو جنریٹو AI اور کمپیوٹر ویژن میں مزید ترقی کی راہ ہموار کرتا ہے۔ Intel انسانی صلاحیتوں کو بڑھانے اور اوپن سورس AI تحقیق اور ترقی کا ایک مضبوط ماحولیاتی نظام بنانے کے لیے جنریٹو AI کے استعمال کی تلاش جاری رکھے گا جو اس ٹیکنالوجی تک رسائی کو جمہوری بناتا ہے۔ AI میں کھلے ماحولیاتی نظام کے لیے Intel کی مضبوط حمایت کو جاری رکھتے ہوئے، LDM3D کو HuggingFace کے ذریعے اوپن سورس کیا جا رہا ہے۔ یہ AI کے محققین اور پریکٹیشنرز کو اس سسٹم کو مزید بہتر بنانے اور اپنی مرضی کے مطابق ایپلی کیشنز کے لیے اسے بہتر بنانے کی اجازت دے گا۔ اور پیٹرن ریکگنیشن کانفرنس (CVPR) جون 18-22۔ مزید معلومات کے لیے،”LDM3D: 3D کے لیے لیٹنٹ ڈفیوژن ماڈل“سے رجوع کریں یا LDM3D ڈیمو دیکھیں۔

ہمارے فورمز پر اس پوسٹ کے لیے بحث میں شامل ہوں…

Categories: IT Info