படம்: Intel

Intel Labs, Blockade Labs உடன் இணைந்து, 3D (LDM3D)க்கான லேட்டன்ட் டிஃப்யூஷன் மாடலை அறிமுகப்படுத்தியுள்ளது. இண்டஸ்ட்ரி-முதல் AI பரவல் மாதிரியானது, 360 டிகிரி காட்சிகளுடன் 3D படங்களை வெறுமனே உரை மூலம் உருவாக்க பயனர்களை அனுமதிக்கிறது. இன்டெல்லின் கூற்றுப்படி, இந்த மேம்பாடு”உள்ளடக்க உருவாக்கம், மெட்டாவேர்ஸ் மற்றும் டிஜிட்டல் அனுபவங்களில் புரட்சியை ஏற்படுத்தும்.”

“உருவாக்கும் AI தொழில்நுட்பம் மனித படைப்பாற்றலை மேலும் அதிகரிக்கவும் மேம்படுத்தவும் நேரத்தை மிச்சப்படுத்தவும் நோக்கமாக உள்ளது. இருப்பினும், இன்றைய AI மாடல்களில் பெரும்பாலானவை 2D படங்களை உருவாக்குவதற்கு மட்டுமே வரையறுக்கப்பட்டுள்ளன, மேலும் சிலரால் மட்டுமே உரைத் தூண்டுதல்களிலிருந்து 3D படங்களை உருவாக்க முடியும். தற்போதுள்ள உள்ளுறை நிலையான பரவல் மாதிரிகள் போலல்லாமல், LDM3D ஆனது, கிட்டத்தட்ட அதே எண்ணிக்கையிலான அளவுருக்களைப் பயன்படுத்தி கொடுக்கப்பட்ட உரை வரியில் இருந்து ஒரு படத்தையும் ஆழமான வரைபடத்தையும் உருவாக்க பயனர்களை அனுமதிக்கிறது. ஆழமான மதிப்பீட்டிற்கான நிலையான பிந்தைய செயலாக்க முறைகளுடன் ஒப்பிடும்போது ஒரு படத்தில் உள்ள ஒவ்வொரு பிக்சலுக்கும் மிகவும் துல்லியமான ஒப்பீட்டு ஆழத்தை வழங்குகிறது மற்றும் டெவலப்பர்கள் காட்சிகளை உருவாக்க கணிசமான நேரத்தைச் சேமிக்கிறது.”

ஒரு இன்டெல் செய்திக்குறிப்பு:

ஏன் இது முக்கியமானது: மூடப்பட்ட சுற்றுச்சூழல் அமைப்புகளின் வரம்பு அளவு. AI இன் உண்மையான ஜனநாயகமயமாக்கலுக்கான இன்டெல்லின் அர்ப்பணிப்பு ஒரு திறந்த சுற்றுச்சூழல் அமைப்பின் மூலம் AI இன் நன்மைகளை பரந்த அணுகலை செயல்படுத்தும். சமீபத்திய ஆண்டுகளில் குறிப்பிடத்தக்க முன்னேற்றங்களைக் கண்ட ஒரு பகுதி கணினி பார்வைத் துறையில், குறிப்பாக உருவாக்கும் AI இல். இருப்பினும், இன்றைய பல மேம்பட்ட ஜெனரேட்டிவ் AI மாதிரிகள் 2D படங்களை மட்டுமே உருவாக்குவதற்கு மட்டுப்படுத்தப்பட்டுள்ளன. தற்போதுள்ள பரவல் மாதிரிகள் போலல்லாமல், பொதுவாக 2D RGB படங்களை மட்டுமே உரைத் தூண்டுதல்களிலிருந்து உருவாக்குகிறது, LDM3D பயனர்கள் கொடுக்கப்பட்ட உரை வரியில் இருந்து ஒரு படத்தையும் ஆழமான வரைபடத்தையும் உருவாக்க அனுமதிக்கிறது. மறைந்த நிலையான பரவல் போன்ற அளவுருக்களின் எண்ணிக்கையைப் பயன்படுத்தி, ஆழமான மதிப்பீட்டிற்கான நிலையான பிந்தைய செயலாக்க முறைகளுடன் ஒப்பிடும்போது, ​​LDM3D ஒரு படத்தில் உள்ள ஒவ்வொரு பிக்சலுக்கும் மிகவும் துல்லியமான ஒப்பீட்டு ஆழத்தை வழங்குகிறது.

இந்த ஆராய்ச்சி நாம் எவ்வாறு தொடர்பு கொள்கிறோம் என்பதில் புரட்சியை ஏற்படுத்தலாம். டிஜிட்டல் உள்ளடக்கம், பயனர்கள் தங்கள் உரைத் தூண்டுதல்களை முன்னர் நினைத்துப் பார்க்க முடியாத வழிகளில் அனுபவிக்க உதவுகிறது. LDM3D ஆல் உருவாக்கப்பட்ட படங்கள் மற்றும் ஆழமான வரைபடங்கள் பயனர்களுக்கு அமைதியான வெப்பமண்டல கடற்கரை, நவீன வானளாவிய கட்டிடம் அல்லது அறிவியல் புனைகதை பிரபஞ்சத்தின் உரை விளக்கத்தை 360 டிகிரி விரிவான பனோரமாவாக மாற்ற உதவுகிறது. ஆழமான தகவலைப் படம்பிடிக்கும் இந்தத் திறன், ஒட்டுமொத்த யதார்த்தம் மற்றும் அமிழ்தலை உடனடியாக மேம்படுத்தும், பொழுதுபோக்கு மற்றும் கேமிங்கிலிருந்து உள்துறை வடிவமைப்பு மற்றும் ரியல் எஸ்டேட் பட்டியல்கள், அத்துடன் மெய்நிகர் அருங்காட்சியகங்கள் மற்றும் அதிவேக விர்ச்சுவல் ரியாலிட்டி (VR) அனுபவங்கள் வரையிலான தொழில்களுக்கான புதுமையான பயன்பாடுகளை செயல்படுத்துகிறது.

ஜூன் 20 அன்று, LDM3D சிறந்த போஸ்டர் விருதை வென்றது.//3dmv2023.github.io/”>CVPR இல் 3DMV பட்டறை.

அது எப்படி வேலை செய்கிறது: LDM3D 10,000 மாதிரிகளின் துணைக்குழுவிலிருந்து உருவாக்கப்பட்ட தரவுத்தொகுப்பில் பயிற்சியளிக்கப்பட்டது LAION-400M தரவுத்தளத்தில், 400 மில்லியன் பட-தலைப்பு ஜோடிகளைக் கொண்டுள்ளது. பயிற்சி கார்பஸைக் குறிப்பதற்காக அடர்த்தியான கணிப்பு டிரான்ஸ்ஃபார்மரை (DPT) பெரிய ஆழமான மதிப்பீட்டு மாதிரியை (முன்பு Intel Labs இல் உருவாக்கப்பட்டது) குழு பயன்படுத்தியது. DPT-பெரிய மாதிரியானது ஒரு படத்தில் உள்ள ஒவ்வொரு பிக்சலுக்கும் மிகவும் துல்லியமான ஒப்பீட்டு ஆழத்தை வழங்குகிறது.  LAION-400M தரவுத்தொகுப்பு ஆராய்ச்சி நோக்கங்களுக்காக, பரந்த அளவிலான சோதனை மாதிரிப் பயிற்சியை செயல்படுத்துவதற்காக உருவாக்கப்பட்டுள்ளது ஆராய்ச்சியாளர் மற்றும் பிற ஆர்வமுள்ள சமூகங்கள்.

LDM3D மாதிரியானது Intel Xeon செயலிகள் மற்றும் Intel Habana Gaudi AI முடுக்கிகள் மூலம் இயங்கும் Intel AI சூப்பர் கம்ப்யூட்டரில் பயிற்சியளிக்கப்பட்டது. இதன் விளைவாக வரும் மாதிரி மற்றும் பைப்லைன் ஆகியவை உருவாக்கப்பட்ட RGB படம் மற்றும் ஆழமான வரைபடத்தை இணைத்து 360 டிகிரி காட்சிகளை அதிவேக அனுபவங்களை உருவாக்குகின்றன. 360 டிகிரி காட்சி அனுபவங்களை அதிவேக மற்றும் ஊடாடத்தக்க வகையில் உருவாக்க புகைப்படங்கள் மற்றும் ஆழமான வரைபடங்கள். டெப்த்ஃப்யூஷன், நிகழ்நேர ஊடாடும் மல்டிமீடியா உள்ளடக்கத்திற்கான முனை அடிப்படையிலான காட்சி நிரலாக்க மொழியான TouchDesigner ஐப் பயன்படுத்துகிறது. LDM3D மாடல் என்பது RGB படம் மற்றும் அதன் ஆழ வரைபடம் இரண்டையும் உருவாக்குவதற்கான ஒரு மாதிரியாகும், இது நினைவக தடம் மற்றும் தாமத மேம்பாடுகளில் சேமிப்பிற்கு வழிவகுக்கும்.

அடுத்து என்ன: LDM3D மற்றும் DepthFusion மல்டி-வியூ ஜெனரேட்டிவ் AI மற்றும் கணினி பார்வையில் மேலும் முன்னேற்றங்களுக்கு வழி வகுக்கிறது. மனித திறன்களை அதிகரிக்கவும், இந்த தொழில்நுட்பத்திற்கான அணுகலை ஜனநாயகப்படுத்தும் திறந்த மூல AI ஆராய்ச்சி மற்றும் மேம்பாட்டிற்கான வலுவான சுற்றுச்சூழல் அமைப்பை உருவாக்கவும் Intel தொடர்ந்து AI இன் பயன்பாட்டை ஆய்வு செய்யும். AI இல் திறந்த சுற்றுச்சூழல் அமைப்பிற்கான Intel இன் வலுவான ஆதரவைத் தொடர்கிறது, LDM3D ஆனது HuggingFace மூலம் திறக்கப்பட்டது. இது AI ஆராய்ச்சியாளர்கள் மற்றும் பயிற்சியாளர்களை இந்த அமைப்பை மேலும் மேம்படுத்தவும், தனிப்பயன் பயன்பாடுகளுக்கு சிறந்ததாக மாற்றவும் அனுமதிக்கும்.

மேலும் சூழல்: Intel இன் ஆராய்ச்சி IEEE/CVF Computer Vision இல் வழங்கப்படும் மற்றும் வடிவ அங்கீகார மாநாடு (CVPR) ஜூன் 18-22. மேலும் தகவலுக்கு, “LDM3D: 3Dக்கான மறைந்திருக்கும் பரவல் மாதிரி” அல்லது LDM3D டெமோவைப் பார்க்கவும்.

எங்கள் மன்றங்களில் இந்த இடுகைக்கான விவாதத்தில் சேரவும்…

Categories: IT Info