NVIDIA के अनुसार, NVIDIA ने डिजिटल मनुष्यों की क्षमताओं को बढ़ाने के उद्देश्य से छोटे भाषा मॉडल (एसएलएम) की एक नई श्रृंखला की घोषणा की है। ये मॉडल NVIDIA ACE का एक हिस्सा हैं, जो RTX AI पीसी की शक्ति का लाभ उठाते हुए एजेंटों, सहायकों और अवतारों में जीवन लाने के लिए डिज़ाइन की गई प्रौद्योगिकियों का एक सूट है।
मल्टी-मोडल क्षमताओं का परिचय
नए मॉडल में NVIDIA Nemovision-4B-Instruct, एक मल्टी-मोडल SLM शामिल है जो डिजिटल मनुष्यों को दृश्य इमेजरी की व्याख्या करने और प्रासंगिक रूप से प्रासंगिक प्रतिक्रियाएं प्रदान करने की अनुमति देता है। नवीनतम NVIDIA VILA और NeMo फ्रेमवर्क का उपयोग करके निर्मित, ये मॉडल NVIDIA RTX GPU की एक विस्तृत श्रृंखला में प्रदर्शन के लिए अनुकूलित हैं, जो डेवलपर्स के लिए आवश्यक उच्च सटीकता स्तर को बनाए रखते हैं।
बड़े-संदर्भ भाषा मॉडल
NVIDIA के नए बड़े-संदर्भ वाले SLM को व्यापक डेटा इनपुट को प्रबंधित करने के लिए डिज़ाइन किया गया है, जिससे जटिल संकेतों को समझने में सुविधा होती है। मिस्ट्रल-नीमो-मिनिट्रॉन-128k-इंस्ट्रक्ट परिवार, 8बी, 4बी और 2बी पैरामीटर संस्करणों में उपलब्ध है, जो एनवीआईडीआईए आरटीएक्स एआई पीसी पर गति, मेमोरी उपयोग और सटीकता को संतुलित करता है। ये मॉडल एक ही पास में महत्वपूर्ण डेटा वॉल्यूम को संसाधित कर सकते हैं, डेटा विभाजन की आवश्यकता को कम करके सटीकता बढ़ा सकते हैं।
Audio2Face-3D NIM में संवर्द्धन
NVIDIA ने चेहरे के एनिमेशन के यथार्थवाद को बेहतर बनाने के लिए अपने Audio2Face-3D NIM माइक्रोसर्विस को भी अपडेट किया है, जो प्रामाणिक डिजिटल मानव इंटरैक्शन के लिए महत्वपूर्ण है। यह माइक्रोसर्विस अब वास्तविक समय लिप-सिंक और चेहरे के एनीमेशन का समर्थन करता है, एक डाउनलोड करने योग्य अनुकूलित कंटेनर के माध्यम से अनुकूलन विकल्पों को बढ़ाता है।
आरटीएक्स एआई पीसी पर तैनाती को सुव्यवस्थित करना
आरटीएक्स एआई पीसी पर डिजिटल इंसानों को तैनात करने के लिए एनीमेशन, इंटेलिजेंस और स्पीच एआई मॉडल के कुशल ऑर्केस्ट्रेशन की आवश्यकता होती है। NVIDIA ऑन-डिवाइस वर्कफ़्लो को सुविधाजनक बनाने के लिए नए SDK प्लगइन्स और नमूने पेश कर रहा है, जिसमें NVIDIA रीवा ऑटोमैटिक स्पीच रिकग्निशन और Audio2Face-3D द्वारा संचालित एक अवास्तविक इंजन 5 नमूना एप्लिकेशन शामिल है। ये उपकरण NVIDIA इन-गेम इन्फेरेंस एसडीके का हिस्सा हैं, जो वर्तमान में बीटा में उपलब्ध हैं, मॉडल और निर्भरता डाउनलोड को प्रबंधित करके और हाइब्रिड एआई संचालन को सक्षम करके एआई एकीकरण को सरल बनाते हैं।
इन प्रगतियों में रुचि रखने वाले डेवलपर्स इन उपकरणों तक पहुंच सकते हैं एनवीडिया डेवलपर प्लैटफ़ॉर्म।
छवि स्रोत: शटरस्टॉक