10 घंटों के सिम-टू-रियल मोशन डेटा के साथ फिजिकल एआई और ह्यूमनॉइड रोबोटिक्स का विस्तार करना

Shaip ने किस प्रकार 4,000 प्रतिभागियों, 100 कार्यों और 5 से अधिक वास्तविक दुनिया के वातावरणों में 10,000 घंटे का अहं-केंद्रित VR मोशन-कैप्चर डेटा प्रदान किया - जिसे सिम-टू-रियल ह्यूमनॉइड रोबोटिक्स के लिए उत्पादन-ग्रेड फिजिकल AI प्रशिक्षण डेटा पाइपलाइन के रूप में बनाया गया था।

भौतिक बुद्धिमत्ता

परियोजना अवलोकन

जैसे-जैसे फिजिकल एआई और ह्यूमनॉइड रोबोटिक्स वास्तविक दुनिया में उपयोग में आ रहे हैं, क्लाइंट को एक ऐसे स्केलेबल फ्रेमवर्क की आवश्यकता थी जो विभिन्न वातावरणों में 10,000 घंटे का टास्क-आधारित वीआर मोशन डेटा लगातार कैलिब्रेशन, निष्पादन और क्यूए के साथ एकत्र कर सके।

शैप ने 100 ग्राहक-परिभाषित कार्यों का समर्थन करने और बड़े पैमाने पर मॉडल-तैयार मूर्त एआई डेटासेट वितरित करने के लिए दृश्य सेटअप, क्यूआर मैपिंग, पांच-सेंसर ट्रैकिंग, प्रतिभागी पूर्वाभ्यास, नियंत्रित कैप्चर और समीक्षा वर्कफ़्लो को कवर करने वाली एंड-टू-एंड डेटा संचालन पाइपलाइन का निर्माण किया।

भौतिक कृत्रिम बुद्धिमत्ता और मानवरूपी रोबोटिक्स

मुख्य आँकड़े

प्रतिभागियों

~ 4,000

डेटा की मात्रा

10,000 वैध घंटे

पर्यावरण कवरेज

कार्यालय, घर, कारखाना, कैफे, गोदाम आदि।

समयरेखा

1 महीने

चुनौतियां

  • नियंत्रित पायलट-शैली वर्कफ़्लो से गति डेटा संग्रह को स्केल करना 10,000 घंटे, बहु-पर्यावरण कार्यक्रम.
  • को बनाए रखने के लगातार ट्रैकिंग सटीकता विभिन्न वास्तविक दुनिया के दृश्यों और प्रतिभागियों की व्यवस्थाओं में।
  • यह सुनिश्चित करना कि प्रत्येक सत्र सख्त आवश्यकताओं को पूरा करे APK/वर्जन कंट्रोल, साझा नेटवर्क सेटअप, स्क्रीनकास्टिंग और सेंसर पेयरिंग।
  • प्रबंध 100 ग्राहक-परिभाषित कार्य इसमें लोकोमोशन, ऑब्जेक्ट मैनिपुलेशन, घरेलू बातचीत, ऑफिस बातचीत और बहु-चरणीय भौतिक वर्कफ़्लो जैसी श्रेणियां शामिल हैं—जिनमें से प्रत्येक के लिए सही दृश्य सेटअप, ऑब्जेक्ट प्लेसमेंट, प्रतिभागी की तैयारी और मॉडरेटर के नेतृत्व में सत्यापन की आवश्यकता होती है।
  • कच्चे सत्रों को परिवर्तित करना मॉडल-तैयार आउटपुट दोहराने योग्य QA, रिटेक हैंडलिंग और अपलोड रिव्यू वर्कफ़्लो के माध्यम से।

उपाय

संग्रह रणनीति

शैप ने एक स्केलेबल संग्रह ढांचा तैयार किया 10,000 वैध घंटे वीआर मोशन डेटा, जिसे माइलस्टोन-आधारित बैचों में वितरित किया जाता है। स्रोत नियोजन अनुपात के आधार पर। प्रति 10 वैध घंटों में 3-5 प्रतिभागीपूरा कार्यक्रम अनुमानित रूप से बढ़ाया जा सकता है 3,000–5,000 प्रतिभागी, साथ में लगभग 4,000 प्रतिभागी मध्यबिंदु नियोजन आकृति के रूप में उपयोग किया जाता है।

पर्यावरण एवं दृश्य प्रबंधन

प्रत्येक कैप्चर स्थान को एक संरचित दृश्य के रूप में माना गया। शैप ने वाइड-एंगल रूम फोटोग्राफी का उपयोग करके वातावरण का दस्तावेजीकरण किया, एडमिन सिस्टम में दृश्यों को कॉन्फ़िगर किया, ग्राहक समीक्षा का समन्वय किया और भौतिक प्लेसमेंट के लिए सीन पीडीएफ निर्यात किए। क्यूआर-लिंक्ड सीन मैपिंग ने सुनिश्चित किया कि प्रत्येक वास्तविक दुनिया के वातावरण को सही रिकॉर्डिंग संदर्भ से विश्वसनीय रूप से जोड़ा जा सके।

डिवाइस और एप्लिकेशन की तैयारी

शाइप ने यह सुनिश्चित करके तकनीकी तत्परता को मानकीकृत किया कि वीआर हेडसेट और मॉनिटरिंग डिवाइस एक ही नेटवर्क से जुड़े हों, एपीके इंस्टॉलेशन/अपडेट प्रवाह को नियंत्रित किया जाए, और सत्र के दौरान मॉडरेटर की दृश्यता के लिए ब्राउज़र-आधारित स्क्रीनकास्टिंग को सक्षम किया जाए।

गति ट्रैकिंग और अंशांकन

प्रत्येक सत्र से पहले, सभी पाँच मोशन ट्रैकर्स को पेयर किया गया और उनकी पुष्टि की गई। प्रत्येक प्रतिभागी के लिए कैलिब्रेशन अनिवार्य था, जिसमें अवतार अलाइनमेंट चेक, फ्लोर एडजस्टमेंट और कस्टम बाउंड्री सेटअप शामिल थे, ताकि रिकॉर्ड करने योग्य गतिविधि क्षेत्र के भीतर सटीक फुल-बॉडी मोशन कैप्चर सुनिश्चित किया जा सके।

कार्य निष्पादन एवं मध्यस्थता

रिकॉर्डिंग से पहले प्रतिभागियों को दृश्य-विशिष्ट कार्यों की तैयारी और पूर्वाभ्यास के लिए निर्देशित किया गया था। मॉडरेटरों ने स्क्रीनकास्ट के माध्यम से अवलोकन किया, कार्यों की सटीकता और गति की स्पष्टता को सत्यापित किया और सेंसर की गतिविधि और प्रतिभागी की हलचल गुणवत्ता संबंधी अपेक्षाओं को पूरा करने के बाद ही लाइव रिकॉर्डिंग शुरू की। रिकॉर्डिंग शुरू/बंद करने का कार्य निर्धारित जेस्चर वर्कफ़्लो के माध्यम से किया गया।

गुणवत्ता आश्वासन और मॉडल-तैयार आउटपुट

रिकॉर्डिंग के बाद, सत्रों को समीक्षा के लिए इतिहास में अपलोड किया गया। शाइप ने गति की स्पष्टता, कार्य की शुद्धता, दृश्य संरेखण और सेंसर की सटीकता की पुष्टि की, और आवश्यकता पड़ने पर अनुपयोगी रिकॉर्डिंग को रद्द या पुनः रिकॉर्ड किया। इससे कृत्रिम कृत्रिम बुद्धिमत्ता और रोबोटिक्स प्रशिक्षण के लिए एनोटेशन-तैयार, गुणवत्ता आश्वासन-सत्यापित और मॉडल-तैयार डेटासेट प्राप्त करने का एक अधिक विश्वसनीय मार्ग प्रशस्त हुआ।

परियोजना गुंजाइश

डेटासेट प्रकार प्रतिभागियों रिकॉर्डिंग वॉल्यूम वातावरण कार्य मात्रा कैप्चर सेटअप समयरेखा
अहं-केंद्रित वीआर मोशन कैप्चर ~ 4,000 10,000 वैध घंटे कार्यालय, घर, कैफे, कारखाना, गोदाम और अन्य वास्तविक दुनिया के वातावरण 100 ग्राहक-परिभाषित कार्य वीआर हेडसेट + 5 मोशन ट्रैकर्स 1 महीने

परिणाम

  • एक स्केलेबल डेटा संचालन ढांचा स्थापित किया गया 10,000 घंटे का फिजिकल एआई प्रशिक्षण डेटा
  • मानकीकृत दृश्य प्रबंधन, क्यूआर-आधारित मानचित्रण और पांच-सेंसर अंशांकन वितरित वातावरणों में
  • बेहतर संग्रह स्थिरता के माध्यम से नियंत्रित पूर्वाभ्यास, वास्तविक समय में स्क्रीनकास्ट समीक्षा और सत्र-स्तरीय प्रश्नोत्तर
  • सक्षम कार्य-मान्य, एनोटेशन-तैयार आउटपुट डाउनस्ट्रीम एम्बोडेड एआई, सिमुलेशन और रोबोटिक्स मॉडल विकास के लिए
  • ग्राहक को मजबूत किया सिम-टू-रियल डेटा पाइपलाइन उच्च गुणवत्ता वाले अहं-केंद्रित गति कैप्चर के साथ
    विभिन्न वास्तविक दुनिया के वातावरणों से

कुल मिलाकर, शैप ने एक जटिल वीआर कैप्चर आवश्यकता को एक संरचित, उत्पादन-तैयार डेटा पाइपलाइन में बदलने में मदद की - एक ऐसी पाइपलाइन जो समर्थन करने में सक्षम है। भौतिक कृत्रिम बुद्धिमत्ता, मूर्त बुद्धिमत्ता और मानवरूपी रोबोटिक्स अधिक सुसंगतता, पता लगाने की क्षमता और व्यापकता वाली पहलें।

उद्धरण चिह्न

शैप ने हमारे फिजिकल एआई रोडमैप के लिए डेटा ऑपरेशंस का आधारभूत ढांचा तैयार करने में हमारी मदद की। उनकी टीम ने मल्टी-एनवायरनमेंट मोशन कैप्चर, पार्टिसिपेंट मैनेजमेंट, सीन सेटअप, कैलिब्रेशन और क्यूए को व्यवस्थित रूप दिया, जिससे हम ऐसे मॉडल-रेडी डेटासेट तैयार कर सके जो एम्बोडेड एआई और ह्यूमनॉइड रोबोटिक्स के लिए सिम-टू-रियल लर्निंग को सपोर्ट करते हैं।

— उपाध्यक्ष, डेटा और सिमुलेशन इंफ्रास्ट्रक्चर

★ ★ ★ ★ ★
उद्धरण चिह्न