डेटासेट खोलें

ओपन सोर्स डेटासेट खोजें जो आपको एमएल मॉडल को प्रशिक्षित करने में मदद करता है

एआई/एमएल मॉडल के साथ शुरुआत करने के लिए ओपन सोर्स डेटासेट

आपके एआई और एमएल मॉडल का आउटपुट उतना ही अच्छा है जितना डेटा आप इसे प्रशिक्षित करने के लिए उपयोग करते हैं - इसलिए डेटा एकत्रीकरण और उस डेटा की टैगिंग और पहचान पर आप जो सटीकता लागू करते हैं वह महत्वपूर्ण है!

इसलिए यदि आप एक नई एआई/एमएल पहल शुरू करना चाहते हैं और अब आप जल्दी से महसूस कर रहे हैं कि उच्च-गुणवत्ता वाला प्रशिक्षण डेटा ढूंढना आपके प्रोजेक्ट के अधिक चुनौतीपूर्ण पहलुओं में से एक होगा क्योंकि उच्च-गुणवत्ता वाले डेटासेट वह ईंधन हैं जो एआई/ को बनाए रखते हैं। एमएल इंजन चल रहा है। हमने खुले डेटासेट की एक सूची जमा की है जो भविष्य के आपके एआई/एमएल मॉडल का उपयोग और प्रशिक्षण करने के लिए निःशुल्क हैं।

विशेषज्ञता	डाटा प्रकार	डेटासेट का नाम	उद्योग/विभाग	एनोटेशन/उपयोग मामला	Description	संपर्क
एनएलपी	टेक्स्ट	अमेज़न समीक्षा	ई - कॉमर्स	भावनाओं का विश्लेषण	उपयोगकर्ता और उत्पाद विवरण के साथ सादे पाठ में पिछले 35 वर्षों में 18 मिलियन समीक्षाओं और रेटिंग का एक सेट।	संपर्क
एनएलपी	टेक्स्ट	विकिपीडिया लिंक डेटा	सामान्य जानकारी		4 मिलियन से अधिक. 1.9 बीएन युक्त लेख। वह शब्द जिसमें शब्दों और वाक्यांशों के साथ-साथ पैराग्राफ भी शामिल हों।	संपर्क
एनएलपी	टेक्स्ट	स्टैंडफोर्ड सेंटीमेंट ट्रीबैंक	मनोरंजन	भावनाओं का विश्लेषण	HTML फ़ाइल स्वरूप में रॉटेन टोमाटोज़ की 10,000 से अधिक समीक्षाओं के लिए सेंटीमेंट एनोटेशन डेटासेट	संपर्क
एनएलपी	टेक्स्ट	ट्विटर यूएस एयरलाइन भावना	एयरलाइन	भावनाओं का विश्लेषण	यूएस एयरलाइंस पर 2015 के ट्वीट्स सकारात्मक, नकारात्मक और तटस्थ स्वरों में विभाजित हैं	संपर्क
CV	छवि	जंगल में लेबल वाले चेहरे	सामान्य जानकारी	चेहरे की पहचान	चेहरे की पहचान प्रशिक्षण के लिए दो अलग-अलग चित्रों के साथ 13,000 से अधिक कटे हुए चेहरों वाला डेटासेट।	संपर्क
CV	वीडियो, छवि	यूएमडीफ़ेस डेटासेट	सामान्य जानकारी	चेहरे की पहचान	एनोटेटेड डेटासेट जिसमें 367,000 से अधिक विषयों के 8,000 से अधिक चेहरे हैं जिनमें स्थिर और वीडियो छवियां शामिल हैं।	संपर्क
CV	छवि	इमेजनेट	सामान्य जानकारी		14 मिलियन से अधिक डेटासेट। वर्डनेट पदानुक्रम के अनुसार व्यवस्थित विभिन्न फ़ाइल स्वरूपों में छवियां।	संपर्क
CV	छवि	Google की खुली छवियां	सामान्य जानकारी		9 मिलियन 6,000 से अधिक श्रेणियों में से सार्वजनिक छवियों को वर्गीकृत करने के लिए यूआरएल।	संपर्क
एनएलपी	टेक्स्ट	एमआईएमआईसी क्रिटिकल केयर डेटाबेस	हेल्थकेयर		40,000 गंभीर देखभाल रोगियों से पहचाने गए डेटा के साथ कम्प्यूटेशनल फिजियोलॉजी डेटासेट। डेटासेट में जनसांख्यिकी, महत्वपूर्ण संकेत, दवाएं आदि जैसी जानकारी शामिल है।	संपर्क
CV	छवि	यूएस नेशनल ट्रैवल एंड टूरिज्म ऑफिस	पर्यटन		भरोसेमंद डेटाबेस के साथ पर्यटन उद्योग से व्यापक तस्वीरें प्रदान करता है, जिसमें इनबाउंड और आउटबाउंड यात्रा और अंतरराष्ट्रीय पर्यटक जानकारी जैसे विषयों को शामिल किया गया है।	संपर्क
एनएलपी	टेक्स्ट	परिवहन विभाग	पर्यटन		पर्यटन डेटासेट जिसमें राष्ट्रीय उद्यान, ड्राइवर रजिस्टर, पुल और रेल जानकारी आदि शामिल हैं।	संपर्क
एनएलपी	ऑडियो	फ़्लिकर ऑडियो कैप्शन कॉर्पस	सामान्य जानकारी		बिना पर्यवेक्षित भाषण पैटर्न के लिए डिज़ाइन की गई 40 तस्वीरों से 8,000 हजार से अधिक बोले गए कैप्शन	संपर्क
एनएलपी	ऑडियो	स्पीच कमांड डेटासेट	सामान्य जानकारी	वाक् पहचान, ऑडियो एनोटेशन	बुनियादी ध्वनि इंटरफ़ेस बनाने के लिए, हजारों व्यक्तियों के 1 सेकंड लंबे कथन।	संपर्क
एनएलपी	ऑडियो	पर्यावरण ऑडियो डेटासेट	सामान्य जानकारी		पर्यावरण ऑडियो डेटासेट जिसमें इवेंट टेबल और ध्वनिक दृश्य टेबल की ध्वनि शामिल है।	संपर्क
एनएलपी	टेक्स्ट	COVID-19 ओपन रिसर्च डेटासेट	हेल्थकेयर	मेडिकल ए.आई	एक शोध डेटासेट जिसमें COVID-45,000 और वायरस के कोरोनोवायरस परिवार पर 19 विद्वानों के लेख शामिल हैं।	संपर्क
CV	छवि	वेमो ओपन डेटासेट	मोटर वाहन		वेमो द्वारा जारी किए गए सबसे विविध स्वायत्त ड्राइविंग डेटासेट	संपर्क
CV	छवि	दृश्य जीनोम	सामान्य जानकारी	छवि कैप्शनिंग	100K से अधिक छवियों के विस्तृत कैप्शनिंग के साथ एक दृश्य ज्ञान का आधार	संपर्क
CV	छवि	मुझे लेबल करो	सार्वजनिक सरकार.		लेबलमे मैटलैब के माध्यम से पहुंच योग्य एनोटेट छवियों का बड़ा सेट	संपर्क
CV	छवि	कुंडल 100	सामान्य जानकारी		100 से अधिक विभिन्न वस्तुओं की कई कोणों (अर्थात 360 डिग्री) से तस्वीरें खींची गईं	संपर्क
CV	छवि	स्टैनफोर्ड डॉग्स डेटासेट	सामान्य जानकारी		20,500 से अधिक छवियों को 120 विभिन्न कुत्तों की नस्लों के छवि सेट में वर्गीकृत किया गया है	संपर्क
CV	छवि	इनडोर दृश्य पहचान	सामान्य जानकारी	दृश्य पहचान	दृश्य पहचान मॉडल बनाने के लिए 15620 इनडोर श्रेणियों से 67 छवियों वाला एक विशिष्ट डेटासेट	संपर्क
CV	छवि	विज़ुअलक्यूए	सामान्य जानकारी		एक डेटासेट जिसमें 265,016 फ़ोटो से संबंधित ओपन-एंडेड प्रश्न शामिल हैं जिनका उत्तर देने के लिए दृष्टि और भाषा की समझ की आवश्यकता होती है।	संपर्क
एनएलपी	टेक्स्ट	मल्टीडोमेन सेंटीमेंट विश्लेषण डेटासेट	ई - कॉमर्स	भावनाओं का विश्लेषण	डेटासेट जिसमें अमेज़ॅन से उत्पाद समीक्षाएं शामिल हैं	संपर्क
एनएलपी	टेक्स्ट	IMDB समीक्षा	मनोरंजन	भावनाओं का विश्लेषण	भावना विश्लेषण के लिए 25000 मूवी समीक्षा वाला डेटासेट	संपर्क
एनएलपी	टेक्स्ट	भावना 140	सामान्य जानकारी	भावनाओं का विश्लेषण	उच्च सटीकता के लिए पहले से हटाए गए इमोटिकॉन्स के साथ 160,000 ट्वीट्स वाला डेटासेट	संपर्क
एनएलपी	टेक्स्ट	ब्लॉगर कॉर्पस	सामान्य जानकारी	कीप्रेज़ एनालिसिस	ब्लॉगर.कॉम के 681,288 ब्लॉग पोस्ट वाले डेटासेट में व्यापक रूप से उपयोग किए जाने वाले अंग्रेजी शब्दों की न्यूनतम 200 घटनाएं शामिल हैं।	संपर्क
एनएलपी	टेक्स्ट	ख़तरा	सामान्य जानकारी	चैटबॉट प्रशिक्षण	200,000 से अधिक प्रश्नों वाला डेटासेट जिसका उपयोग मशीन लर्निंग मॉडल को बुद्धिमानी से स्वचालित प्रतिक्रिया देने के लिए प्रशिक्षित करने के लिए किया जा सकता है	संपर्क
एनएलपी	टेक्स्ट	अंग्रेजी में एसएमएस स्पैम संग्रह	दूरसंचार	स्पैम पहचान	एक स्पैम संदेश डेटासेट जिसमें 5,574 अंग्रेजी एसएमएस शामिल हैं	संपर्क
एनएलपी	टेक्स्ट	Yelp समीक्षाएं	सामान्य जानकारी	भावनाओं का विश्लेषण	येल्प द्वारा प्रकाशित 5 मिलियन से अधिक समीक्षा वाला डेटासेट	संपर्क
एनएलपी	टेक्स्ट	यूसीआई का स्पैमबेस	उद्यम	स्पैम पहचान	स्पैम ईमेल का एक बड़ा डेटासेट, स्पैम फ़िल्टरिंग के लिए उपयोगी।	संपर्क
CV	वीडियो, छवि	बर्कले डीपड्राइव BDD100k	मोटर वाहन	स्वायत्त वाहन	सेल्फ-ड्राइविंग एआई के लिए सबसे बड़े डेटासेट में से एक, जिसमें न्यूयॉर्क और सैन फ्रांसिस्को क्षेत्र से दिन के अलग-अलग समय के 1,100 से अधिक वीडियो में 100,000 घंटे का ड्राइविंग अनुभव शामिल है।	संपर्क
CV	वीडियो	अल्पविराम.एआई	मोटर वाहन	स्वायत्त वाहन	7 घंटे का हाईवे ड्राइविंग डेटासेट जिसमें कार की गति, त्वरण, स्टीयरिंग कोण और जीपीएस निर्देशांक की जानकारी शामिल है	संपर्क
CV	वीडियो, छवि	सिटीस्केप डेटासेट	मोटर वाहन	स्वायत्त वाहन के लिए सिमेंटिक लेबल	5,000 पिक्सेल-स्तरीय एनोटेशन का एक डेटासेट और 20,000 अलग-अलग शहरों से रिकॉर्ड किए गए स्टीरियो वीडियो अनुक्रमों में 50 कमजोर एनोटेटेड फ़्रेमों का एक बड़ा सेट	संपर्क
CV	छवि	केयूएल बेल्जियम ट्रैफिक साइन डेटासेट	मोटर वाहन	स्वायत्त वाहन	संपूर्ण बेल्जियम से भौतिक रूप से भिन्न ट्रैफ़िक संकेतों के आधार पर फ़्लैंडर्स क्षेत्र से 10000+ से अधिक ट्रैफ़िक संकेत एनोटेशन।	संपर्क
CV	छवि	एलआईएसए: इंटेलिजेंट और सुरक्षित ऑटोमोबाइल के लिए प्रयोगशाला, यूसी सैन डिएगो डेटासेट	मोटर वाहन	स्वायत्त वाहन	एक समृद्ध डेटासेट जिसमें ट्रैफ़िक संकेत, वाहन का पता लगाना, ट्रैफ़िक लाइट और प्रक्षेपवक्र पैटर्न शामिल हैं।	संपर्क
CV	छवि	सीआईएफएआर-10	सामान्य जानकारी	वस्तु मान्यता	वस्तु पहचान के लिए 50,000 छवियों और 10,000 परीक्षण छवियों (यानी 60,000 वर्गों में 32 32×10 रंगीन छवियां) से युक्त एक डेटासेट।	संपर्क
CV	छवि	फैशन एमएनआईएसटी	फैशन		एक छवि डेटासेट जिसमें 60,000 उदाहरण होते हैं और 10,000×28 ग्रेस्केल छवियों में 28 उदाहरणों का एक परीक्षण सेट होता है, जो 10 वर्गों के लेबल से जुड़ा होता है।	संपर्क
CV	छवि	आईएमडीबी-विकी डेटासेट	मनोरंजन	चेहरे की पहचान	लिंग और उम्र जैसे लेबल के साथ चेहरे की छवियों का एक बड़ा डेटासेट। कुल 523,051 चेहरे की छवियों में से, 460,723 छवियां IMDB से 20,284 मशहूर हस्तियों से और 62,328 विकिपीडिया से प्राप्त की गई हैं।	संपर्क
CV	वीडियो	कैनेटीक्स-700	सामान्य जानकारी		प्रत्येक एक्शन क्लास के लिए, उच्च-गुणवत्ता वाले डेटासेट में 650,000 वीडियो क्लिप होते हैं और इसमें कम से कम 700 वीडियो क्लिप के साथ 600 मानव एक्शन क्लास शामिल होते हैं। यहां, प्रत्येक क्लिप 10 सेकंड या उससे अधिक समय तक चलती है।	संपर्क
CV	छवि	एमएस कोको	सामान्य जानकारी	वस्तु का पता लगाना, विभाजन	डेटासेट में 328k छवियां हैं और बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और डेटा कैप्शनिंग संबंधित एमएल मॉडल को प्रशिक्षित करने के लिए कुल 2.5 मिलियन इंस्टेंस और 91 ऑब्जेक्ट छवियां हैं।	संपर्क
CV	छवि	एमपीआईआई मानव मुद्रा डेटासेट	सामान्य जानकारी		डेटासेट में एनोटेट किए गए शरीर के जोड़ों के साथ 25K से अधिक व्यक्तियों की लगभग 40K तस्वीरें शामिल हैं, जिनका उपयोग मानव मुद्रा अनुमान को स्पष्ट करने के लिए किया जाता है। कुल मिलाकर डेटासेट में 410 मानवीय गतिविधियाँ शामिल हैं और प्रत्येक छवि को एक गतिविधि लेबल प्रदान किया गया है।	संपर्क
CV	छवि	छवियाँ खोलें	सामान्य जानकारी	ऑब्जेक्ट स्थान एनोटेशन	छवि-स्तरीय लेबल, ऑब्जेक्ट बाउंडिंग बॉक्स, ऑब्जेक्ट सेगमेंटेशन इत्यादि के साथ एनोटेटेड लगभग 9 मिलियन छवियों वाला छवि डेटासेट। डेटासेट में 16 मिलियन भी शामिल हैं। 600 मिलियन छवियों पर 1.9 ऑब्जेक्ट वर्गों के लिए बाउंडिंग बॉक्स।	संपर्क
CV	वीडियो	Baidu Inc, चीन द्वारा अपोलो ओपन प्लेटफ़ॉर्म	मोटर वाहन	बाउंडिंग बॉक्स, LiDAR	एक समृद्ध ऑटोनॉमस ड्राइविंग डेटासेट, जो डेवलपर्स को नवोन्वेषी पुनरावृत्ति की दक्षता में तेजी लाने के लिए स्वायत्त ड्राइविंग में आवश्यक डेटा प्रदान करता है।	संपर्क
CV	वीडियो, छवि	अर्गो, अर्गो, यूएसए द्वारा	मोटर वाहन	बाउंडिंग बॉक्स, ऑप्टिकल फ्लो, बिहेवियरल लेबल, सिमेंटिक लेबल, लेन मार्किंग	एक स्व-ड्राइविंग डेटासेट जिसमें ज्यामितीय और सिमेंटिक मेटाडेटा यानी लेन सेंटरलाइन, लेन दिशा और ड्राइव करने योग्य क्षेत्र के साथ एचडी मानचित्र शामिल हैं। डेटासेट का उपयोग एमएल मॉडल को प्रशिक्षित करने, अधिक सटीक धारणा एल्गोरिदम बनाने के लिए किया जाता है, जो स्व-ड्राइविंग वाहनों को सुरक्षित रूप से नेविगेट करने में मदद करेगा।	संपर्क
CV	वीडियो	बॉश नॉर्थ अमेरिका रिसर्च द्वारा बॉश स्मॉल ट्रैफिक लाइट्स	मोटर वाहन	आकार निर्धारक बॉक्स	दृष्टि-आधारित ट्रैफिक लाइट डिटेक्शन सिस्टम बनाने के लिए 13427*1280 रिज़ॉल्यूशन के साथ 720 कैमरा छवियों वाला एक डेटासेट। डेटासेट में 24000 से अधिक एनोटेटेड ट्रैफिक लाइटें हैं।	संपर्क
CV	वीडियो	ब्रेन4कार्स, कॉर्नेल यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारा	मोटर वाहन	व्यवहार लेबल	ड्राइवर की सतर्कता के बारे में उपयोगी आँकड़े निकालने के लिए केबिन सेंसर (कैमरा, स्पर्श सेंसर, स्मार्ट डिवाइस इत्यादि) की एक श्रृंखला से युक्त एक डेटासेट। हमारे एल्गोरिदम उन ड्राइवरों का पता लगा सकते हैं जो नींद में हैं या विचलित हैं और सुरक्षा में सुधार के लिए आवश्यक अलार्म बढ़ा सकते हैं।	संपर्क
CV	छवि	कुलेन, चीनी विश्वविद्यालय द्वारा। का A) हांगकांग B) बीजिंग D) चीन	मोटर वाहन	लेन मार्किंग	ट्रैफ़िक लेन का पता लगाने पर एक कंप्यूटर विज़न डेटासेट, जिसमें 55 घंटे के वीडियो शामिल थे, जिनमें से 133,235 (88880 प्रशिक्षण सेट, 9675 सत्यापन सेट और 34680 परीक्षण सेट) फ़्रेम निकाले गए थे। इसे बीजिंग में विभिन्न ड्राइवरों द्वारा संचालित छह अलग-अलग वाहनों पर लगे कैमरों द्वारा एकत्र किया गया है।	संपर्क
CV	वीडियो	डेविस, विश्वविद्यालय द्वारा। का ज्यूरिख, ETH ¨ ज्यूरिख, जर्मनी, स्विट्जरलैंड	मोटर वाहन		एक एंड-टू-एंड वाहन ड्राइविंग प्रशिक्षण डेटासेट जो DAVIS इवेंट+फ़्रेम कैमरा का उपयोग करता है। कार डेटा जैसे स्टीयरिंग, थ्रॉटल, जीपीएस इत्यादि का उपयोग ऑटोमोटिव ऐप्स के लिए फ्रेम और इवेंट डेटा के संलयन का मूल्यांकन करने के लिए किया जाता है।	संपर्क
CV	वीडियो	डीबीनेट, शंघाई जिओ टोंग यूनिवर्सिटी, ज़ियामेन यूनिवर्सिटी, चीन द्वारा	मोटर वाहन	प्वाइंट क्लाउड, LiDAR	वास्तविक दुनिया का 1000 KM ड्राइविंग डेटा, जिसमें ड्राइविंग व्यवहार पर गहन शोध के लिए संरेखित वीडियो, पॉइंट क्लाउड, जीपीएस और ड्राइवर व्यवहार शामिल है।	संपर्क
CV	वीडियो	डॉ. (नेत्र)वे, विश्वविद्यालय द्वारा। मोडेना और रेगियो एमिलिया, मोडेना, इटली के	मोटर वाहन	व्यवहार लेबल	डेटासेट में प्रत्येक 74 मिनट के 5 वीडियो अनुक्रम थे, जिन्हें 500,000 से अधिक फ़्रेमों में एनोटेट किया गया था। डेटासेट में भू-संदर्भित स्थान, ड्राइविंग गति, पाठ्यक्रम शामिल है, और ड्राइवरों को टकटकी निर्धारण और कार्य-विशिष्ट मानचित्र प्रदान करने वाले उनके अस्थायी एकीकरण को भी लेबल करता है।	संपर्क
CV	वीडियो	ईटीएच पैदल यात्री (2009), ईटीएच ज्यूरिख, ज्यूरिख, स्विट्जरलैंड द्वारा	सामान्य जानकारी	आकार निर्धारक बॉक्स	प्रत्येक 74 मिनट के 5 वीडियो अनुक्रमों का एक डेटासेट, 500,000 से अधिक फ़्रेमों में एनोटेट किया गया। डेटासेट भू-संदर्भित स्थिति, ड्राइविंग गति, दिशा प्रदान करता है, और ड्राइवरों के लिए टकटकी निर्धारण और कार्य-विशिष्ट मानचित्रों सहित उनके अस्थायी एकीकरण को भी लेबल करता है।	संपर्क
CV	वीडियो	फोर्ड (2009), यूनिवर्सिटी द्वारा। मिशिगन, मिशिगन, यू.एस. का	मोटर वाहन	बाउंडिंग बॉक्स, LiDAR	वेलोडाइन 3डी-लिडार स्कैनर, दो पुश-ब्रूम फॉरवर्ड-लुकिंग रीग लिडार, एक तकनीकी और उपभोक्ता जड़त्व माप इकाई (आईएमयू), और एक प्वाइंट ग्रे लेडीबग 3 सर्वदिशात्मक कैमरा सिस्टम से लैस एक स्वचालित भूमि वाहन द्वारा संकलित डेटासेट।	संपर्क
CV	वीडियो	एचसीआई चैलेंजिंग स्टीरियो, बॉश कॉर्पोरेशन रिसर्च, हिल्डेशाइम, जर्मनी	सामान्य जानकारी		कैप्चर किए गए वीडियो दृश्यों से कई मिलियन फ़्रेमों का एक डेटासेट जिसमें विभिन्न मौसम स्थितियों की एक विस्तृत श्रृंखला, गति और गहराई की कई परतें शामिल हैं; शहर और ग्रामीण इलाकों में स्थितियाँ, आदि।	संपर्क
CV	वीडियो	जेएएडी, यॉर्क यूनिवर्सिटी, यूक्रेन, कनाडा द्वारा	मोटर वाहन	बाउंडिंग बॉक्स, व्यवहार लेबल	"JAAD स्वायत्त ड्राइविंग के संदर्भ में संयुक्त ध्यान का अध्ययन करने के लिए एक डेटासेट है। क्रॉसिंग के बिंदु पर पैदल यात्री और ड्राइवर के व्यवहार और उन्हें प्रभावित करने वाले कारकों पर ध्यान केंद्रित किया गया है। इस अंत तक, JAAD डेटासेट 346 लघु वीडियो का एक समृद्ध एनोटेटेड संग्रह प्रदान करता है क्लिप (5-10 सेकंड लंबी) उत्तरी अमेरिका और पूर्वी यूरोप के कई स्थानों से 240 घंटे से अधिक की ड्राइविंग फुटेज से निकाली गई हैं। रोड़ा टैग वाले बाउंडिंग बॉक्स का उपयोग सभी पैदल यात्रियों के लिए किया जाता है, जो इस डेटासेट को पैदल यात्री का पता लगाने के लिए उपयुक्त बनाता है। व्यवहार एनोटेशन पैदल चलने वालों के लिए व्यवहार निर्दिष्ट करते हैं जो ड्राइवर के साथ बातचीत करता है या उस पर ध्यान देने की आवश्यकता है। प्रत्येक वीडियो के लिए कई टैग (मौसम, स्थान, आदि) और टाइमस्टैम्प्ड व्यवहार लेबल (जैसे रुकना, चलना, देखना, आदि) हैं। इसके अलावा, जनसांख्यिकीय विशेषताओं की एक सूची है प्रत्येक पैदल यात्री (जैसे उम्र, लिंग, गति की दिशा, आदि) के साथ-साथ प्रत्येक फ्रेम में दृश्य यातायात दृश्य तत्वों (जैसे स्टॉप साइन, ट्रैफिक सिग्नल, आदि) की एक सूची प्रदान की जाती है।"	संपर्क
CV	वीडियो	KAIST अर्बन, KAIST, दक्षिण कोरिया द्वारा	सामान्य जानकारी	LIDAR का	डेटा संग्रह में LiDAR डेटा और बहुत जटिल शहरी क्षेत्र (जैसे महानगर क्षेत्र, जटिल इमारतें और आवासीय क्षेत्र) को लक्षित करने वाली स्टीरियो छवियों के लिए कई स्थान सेंसर शामिल हैं।	संपर्क
CV	छवि	यूनिवर्सिटी द्वारा एलआईएसए ट्रैफिक साइन। कैलिफोर्निया, सैन डिएगो, संयुक्त राज्य अमेरिका के	मोटर वाहन	आकार निर्धारक बॉक्स	डेटासेट का सेट जिसमें वीडियो और एनोटेटेड फ़्रेम हैं जिनमें यूएस ट्रैफ़िक संकेत शामिल हैं। इसे दो चरणों में रिलीज़ किया जाता है, एक केवल चित्रों के साथ और दूसरा चित्र और वीडियो दोनों के साथ।	संपर्क
CV	छवि	मैपिलरी विस्टा, मैपिलरी एबी, ग्लोबल द्वारा	मोटर वाहन	सिमेंटिक लेबल	पिक्सेल-सटीक और उदाहरण-विशिष्ट मानव एनोटेशन के साथ दुनिया भर के सड़क दृश्यों की व्याख्या के लिए एक सड़क-स्तरीय फोटोग्राफी डेटासेट।	संपर्क
CV	वीडियो, छवि	सिमेंटिक KITTI, बॉन विश्वविद्यालय, कार्लज़ूए, जर्मनी द्वारा	मोटर वाहन	बाउंडिंग बॉक्स, सिमेंटिक लेबल, लेन मार्किंग	एक डेटासेट जिसमें सभी ओडोमेट्री बेंचमार्क अनुक्रमों के लिए सिमेंटिक एनोटेशन शामिल है। डेटासेट विभिन्न प्रकार के गतिशील और गैर-गतिशील ट्रैफ़िक की व्याख्या करता है: जिसमें कार, बाइक, साइकिल, पैदल यात्री और साइकिल चालक शामिल हैं, जिससे दृश्य में वस्तुओं का अध्ययन किया जा सकता है।	संपर्क
CV	वीडियो	स्टैनफोर्ड यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारा स्टैनफोर्ड ट्रैक	मोटर वाहन	ऑब्जेक्ट डिटेक्शन/वर्गीकरण LiDAR, जीपीएस, कोड	एक डेटासेट जिसमें 14,000 लेबल वाले ऑब्जेक्ट ट्रैक शामिल हैं, जैसा कि प्राकृतिक सड़क दृश्यों में वेलोडाइन एचडीएल-64ई एस2 लिडार द्वारा देखा गया है, जिसका उपयोग 3डी ऑब्जेक्ट रिकग्निशन के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जा सकता है।	संपर्क
CV	वीडियो, छवि	बॉश, संयुक्त राज्य अमेरिका द्वारा बॉक्सी डेटासेट	मोटर वाहन	बाउंडिंग बॉक्स/वाहन का पता लगाना	एक वाहन पहचान डेटा सेट जिसमें मोटरवे पर स्व-ड्राइविंग कारों के लिए ऑब्जेक्ट पहचान रणनीतियों के प्रशिक्षण और विश्लेषण के लिए 2 मिलियन एनोटेटेड वाहन शामिल हैं।	संपर्क
CV	वीडियो	टीएमई मोटरवे, चेक टेक्निकल यूनिवर्सिटी, उत्तरी इटली द्वारा	मोटर वाहन	आकार निर्धारक बॉक्स	कुल 28 मिनट के लिए 27 क्लिप का एक डेटासेट 30,000+ वाहन एनोटेशन फ्रेम में विभाजित किया गया। लेजर स्कैनर से डेटा का उपयोग करके एनोटेशन अर्ध-स्वचालित रूप से तैयार किया गया था। इस डेटा संग्रह में परिवर्तनशील यातायात परिदृश्य, लेन की संख्या, सड़क की वक्रता और रोशनी शामिल है, जिसमें पूर्ण अधिग्रहण की अधिकांश शर्तें शामिल हैं।	संपर्क
CV	वीडियो	बॉश, संयुक्त राज्य अमेरिका द्वारा अनसुपरवाइज्ड लामास	मोटर वाहन	लेन मार्किंग, LiDAR	अनसुपरवाइज्ड लामास डेटासेट को लिडार-आधारित लेन मार्करों सहित उच्च-परिभाषा स्वचालित ड्राइविंग मानचित्र तैयार करके एनोटेट किया गया था। स्वायत्त वाहन को इन मानचित्रों के अनुरूप संरेखित किया जा सकता है और लेन चिह्नों को कैमरे के फ्रेम में प्रक्षेपित किया जा सकता है। 3डी प्रक्षेपण को पहले से देखे गए और अनुमानित छवि मार्करों के बीच विसंगति को कम करके अनुकूलित किया गया है।	संपर्क
एनएलपी	ऑडियो	फेसबुक एआई बहुभाषी लिब्रिस्पीच (एमएलएस)	सामान्य जानकारी	ऑडियो एनोटेशन / वाक् पहचान	Facebook AI बहुभाषी LibriSpeech (MLS), एक बड़े पैमाने पर, खुला स्रोत डेटा सेट है जिसे स्वचालित वाक् पहचान (ASR) में उन्नत अनुसंधान में मदद करने के लिए डिज़ाइन किया गया है। एमएलएस 50,000 भाषाओं में 8 घंटे से अधिक ऑडियो प्रदान करता है: अंग्रेजी, जर्मन, डच, फ्रेंच, स्पेनिश, इतालवी, पुर्तगाली और पोलिश।	संपर्क

डेटासेट खोलें

एआई/एमएल मॉडल के साथ शुरुआत करने के लिए ओपन सोर्स डेटासेट

एआई डेटा सेवाएँ

स्पेशलिटी

उद्योग

उत्पाद

कंपनी

उपयुक्त संसाधन चुनें

संपर्क करें