परिभाषा
सिंथेटिक डेटा कृत्रिम रूप से उत्पन्न जानकारी है जो वास्तविक दुनिया के डेटा की नकल करती है। इसे सिमुलेशन, GAN या अन्य जनरेटिव विधियों का उपयोग करके बनाया जा सकता है।
उद्देश्य
इसका उद्देश्य वास्तविक डेटा को बढ़ाना या प्रतिस्थापित करना है, जब वह दुर्लभ, संवेदनशील या एकत्र करने के लिए महंगा हो।
महत्व
- व्यक्तिगत डेटा पर निर्भरता कम करके गोपनीयता की रक्षा करता है।
- दुर्लभ या महत्वपूर्ण मामलों के लिए प्रशिक्षण सक्षम करता है।
- इसमें वास्तविक दुनिया के डेटा की पूर्ण जटिलता का अभाव हो सकता है।
- सुरक्षा-महत्वपूर्ण एआई में इसका उपयोग तेजी से बढ़ रहा है।
यह कैसे काम करता है:
- प्रतिकृति बनाने के लिए डेटा विशेषताओं को परिभाषित करें.
- डेटा बनाने के लिए सिमुलेशन या जनरेटिव मॉडल का उपयोग करें।
- वास्तविक वितरण के विरुद्ध सिंथेटिक डेटा को मान्य करें।
- प्रशिक्षण पाइपलाइनों में सिंथेटिक डेटा का उपयोग करें।
- यथार्थवाद में अंतराल पर नजर रखें।
उदाहरण (वास्तविक दुनिया)
- वेमो: स्वायत्त प्रशिक्षण के लिए सिंथेटिक ड्राइविंग दृश्यों का उपयोग करता है।
- NVIDIA Omniverse: रोबोटिक्स के लिए सिंथेटिक 3D डेटा उत्पन्न करता है।
- स्वास्थ्य देखभाल: अनुसंधान के लिए सिंथेटिक रोगी डेटा।
संदर्भ / आगे पढ़ने के लिए
- सिंथेटिक डेटा पर एनआईएसटी विशेष प्रकाशन।
- गोन्काल्वेस एट अल. “सिंथेटिक डेटा का निर्माण और मूल्यांकन।” एसीएम कंप्यूटिंग सर्वेक्षण।
- सिंथेटिक डेटा वॉल्ट (एमआईटी)।
- AI में सिंथेटिक डेटा क्या है?