डेटासेट खोलें
ओपन सोर्स डेटासेट खोजें जो आपको एमएल मॉडल को प्रशिक्षित करने में मदद करता है
एआई/एमएल मॉडल के साथ शुरुआत करने के लिए ओपन सोर्स डेटासेट
आपके एआई और एमएल मॉडल का आउटपुट उतना ही अच्छा है जितना डेटा आप इसे प्रशिक्षित करने के लिए उपयोग करते हैं - इसलिए डेटा एकत्रीकरण और उस डेटा की टैगिंग और पहचान पर आप जो सटीकता लागू करते हैं वह महत्वपूर्ण है!
इसलिए यदि आप एक नई एआई/एमएल पहल शुरू करना चाहते हैं और अब आप जल्दी से महसूस कर रहे हैं कि उच्च-गुणवत्ता वाला प्रशिक्षण डेटा ढूंढना आपके प्रोजेक्ट के अधिक चुनौतीपूर्ण पहलुओं में से एक होगा क्योंकि उच्च-गुणवत्ता वाले डेटासेट वह ईंधन हैं जो एआई/ को बनाए रखते हैं। एमएल इंजन चल रहा है। हमने खुले डेटासेट की एक सूची जमा की है जो भविष्य के आपके एआई/एमएल मॉडल का उपयोग और प्रशिक्षण करने के लिए निःशुल्क हैं।
विशेषज्ञता | डाटा प्रकार | डेटासेट का नाम | उद्योग/विभाग | एनोटेशन/उपयोग मामला | विवरण | संपर्क |
---|---|---|---|---|---|---|
एनएलपी | टेक्स्ट | अमेज़न समीक्षा | ई - कॉमर्स | भावनाओं का विश्लेषण | उपयोगकर्ता और उत्पाद विवरण के साथ सादे पाठ में पिछले 35 वर्षों में 18 मिलियन समीक्षाओं और रेटिंग का एक सेट। | संपर्क |
एनएलपी | टेक्स्ट | विकिपीडिया लिंक डेटा | सामान्य जानकारी | 4 मिलियन से अधिक. 1.9 बीएन युक्त लेख। वह शब्द जिसमें शब्दों और वाक्यांशों के साथ-साथ पैराग्राफ भी शामिल हों। | संपर्क | |
एनएलपी | टेक्स्ट | स्टैंडफोर्ड सेंटीमेंट ट्रीबैंक | मनोरंजन | भावनाओं का विश्लेषण | HTML फ़ाइल स्वरूप में रॉटेन टोमाटोज़ की 10,000 से अधिक समीक्षाओं के लिए सेंटीमेंट एनोटेशन डेटासेट | संपर्क |
एनएलपी | टेक्स्ट | ट्विटर यूएस एयरलाइन भावना | एयरलाइन | भावनाओं का विश्लेषण | यूएस एयरलाइंस पर 2015 के ट्वीट्स सकारात्मक, नकारात्मक और तटस्थ स्वरों में विभाजित हैं | संपर्क |
CV | छवि | इमेजनेट | सामान्य जानकारी | 14 मिलियन से अधिक डेटासेट। वर्डनेट पदानुक्रम के अनुसार व्यवस्थित विभिन्न फ़ाइल स्वरूपों में छवियां। | संपर्क | |
CV | छवि | Google की खुली छवियां | सामान्य जानकारी | 9 मिलियन 6,000 से अधिक श्रेणियों में से सार्वजनिक छवियों को वर्गीकृत करने के लिए यूआरएल। | संपर्क | |
एनएलपी | टेक्स्ट | एमआईएमआईसी क्रिटिकल केयर डेटाबेस | हेल्थकेयर | 40,000 गंभीर देखभाल रोगियों से पहचाने गए डेटा के साथ कम्प्यूटेशनल फिजियोलॉजी डेटासेट। डेटासेट में जनसांख्यिकी, महत्वपूर्ण संकेत, दवाएं आदि जैसी जानकारी शामिल है। | संपर्क | |
CV | छवि | यूएस नेशनल ट्रैवल एंड टूरिज्म ऑफिस | पर्यटन | भरोसेमंद डेटाबेस के साथ पर्यटन उद्योग से व्यापक तस्वीरें प्रदान करता है, जिसमें इनबाउंड और आउटबाउंड यात्रा और अंतरराष्ट्रीय पर्यटक जानकारी जैसे विषयों को शामिल किया गया है। | संपर्क | |
एनएलपी | टेक्स्ट | परिवहन विभाग | पर्यटन | पर्यटन डेटासेट जिसमें राष्ट्रीय उद्यान, ड्राइवर रजिस्टर, पुल और रेल जानकारी आदि शामिल हैं। | संपर्क | |
एनएलपी | ऑडियो | फ़्लिकर ऑडियो कैप्शन कॉर्पस | सामान्य जानकारी | बिना पर्यवेक्षित भाषण पैटर्न के लिए डिज़ाइन की गई 40 तस्वीरों से 8,000 हजार से अधिक बोले गए कैप्शन | संपर्क | |
एनएलपी | ऑडियो | स्पीच कमांड डेटासेट | सामान्य जानकारी | वाक् पहचान, ऑडियो एनोटेशन | बुनियादी ध्वनि इंटरफ़ेस बनाने के लिए, हजारों व्यक्तियों के 1 सेकंड लंबे कथन। | संपर्क |
एनएलपी | ऑडियो | पर्यावरण ऑडियो डेटासेट | सामान्य जानकारी | पर्यावरण ऑडियो डेटासेट जिसमें इवेंट टेबल और ध्वनिक दृश्य टेबल की ध्वनि शामिल है। | संपर्क | |
एनएलपी | टेक्स्ट | COVID-19 ओपन रिसर्च डेटासेट | हेल्थकेयर | मेडिकल ए.आई | एक शोध डेटासेट जिसमें COVID-45,000 और वायरस के कोरोनोवायरस परिवार पर 19 विद्वानों के लेख शामिल हैं। | संपर्क |
CV | छवि | वेमो ओपन डेटासेट | मोटर वाहन | वेमो द्वारा जारी किए गए सबसे विविध स्वायत्त ड्राइविंग डेटासेट | संपर्क | |
CV | छवि | मुझे लेबल करो | सार्वजनिक सरकार. | लेबलमे मैटलैब के माध्यम से पहुंच योग्य एनोटेट छवियों का बड़ा सेट | संपर्क | |
CV | छवि | स्टैनफोर्ड डॉग्स डेटासेट | सामान्य जानकारी | 20,500 से अधिक छवियों को 120 विभिन्न कुत्तों की नस्लों के छवि सेट में वर्गीकृत किया गया है | संपर्क | |
CV | छवि | इनडोर दृश्य पहचान | सामान्य जानकारी | दृश्य पहचान | दृश्य पहचान मॉडल बनाने के लिए 15620 इनडोर श्रेणियों से 67 छवियों वाला एक विशिष्ट डेटासेट | संपर्क |
CV | छवि | विज़ुअलक्यूए | सामान्य जानकारी | एक डेटासेट जिसमें 265,016 फ़ोटो से संबंधित ओपन-एंडेड प्रश्न शामिल हैं जिनका उत्तर देने के लिए दृष्टि और भाषा की समझ की आवश्यकता होती है। | संपर्क | |
एनएलपी | टेक्स्ट | मल्टीडोमेन सेंटीमेंट विश्लेषण डेटासेट | ई - कॉमर्स | भावनाओं का विश्लेषण | डेटासेट जिसमें अमेज़ॅन से उत्पाद समीक्षाएं शामिल हैं | संपर्क |
एनएलपी | टेक्स्ट | IMDB समीक्षा | मनोरंजन | भावनाओं का विश्लेषण | भावना विश्लेषण के लिए 25000 मूवी समीक्षा वाला डेटासेट | संपर्क |
एनएलपी | टेक्स्ट | ब्लॉगर कॉर्पस | सामान्य जानकारी | कीप्रेज़ एनालिसिस | ब्लॉगर.कॉम के 681,288 ब्लॉग पोस्ट वाले डेटासेट में व्यापक रूप से उपयोग किए जाने वाले अंग्रेजी शब्दों की न्यूनतम 200 घटनाएं शामिल हैं। | संपर्क |
एनएलपी | टेक्स्ट | ख़तरा | सामान्य जानकारी | चैटबॉट प्रशिक्षण | 200,000 से अधिक प्रश्नों वाला डेटासेट जिसका उपयोग मशीन लर्निंग मॉडल को बुद्धिमानी से स्वचालित प्रतिक्रिया देने के लिए प्रशिक्षित करने के लिए किया जा सकता है | संपर्क |
एनएलपी | टेक्स्ट | अंग्रेजी में एसएमएस स्पैम संग्रह | दूरसंचार | स्पैम पहचान | एक स्पैम संदेश डेटासेट जिसमें 5,574 अंग्रेजी एसएमएस शामिल हैं | संपर्क |
एनएलपी | टेक्स्ट | Yelp समीक्षाएं | सामान्य जानकारी | भावनाओं का विश्लेषण | येल्प द्वारा प्रकाशित 5 मिलियन से अधिक समीक्षा वाला डेटासेट | संपर्क |
एनएलपी | टेक्स्ट | यूसीआई का स्पैमबेस | उद्यम | स्पैम पहचान | स्पैम ईमेल का एक बड़ा डेटासेट, स्पैम फ़िल्टरिंग के लिए उपयोगी। | संपर्क |
CV | वीडियो, छवि | बर्कले डीपड्राइव BDD100k | मोटर वाहन | स्वायत्त वाहन | सेल्फ-ड्राइविंग एआई के लिए सबसे बड़े डेटासेट में से एक, जिसमें न्यूयॉर्क और सैन फ्रांसिस्को क्षेत्र से दिन के अलग-अलग समय के 1,100 से अधिक वीडियो में 100,000 घंटे का ड्राइविंग अनुभव शामिल है। | संपर्क |
CV | वीडियो | अल्पविराम.एआई | मोटर वाहन | स्वायत्त वाहन | 7 घंटे का हाईवे ड्राइविंग डेटासेट जिसमें कार की गति, त्वरण, स्टीयरिंग कोण और जीपीएस निर्देशांक की जानकारी शामिल है | संपर्क |
CV | वीडियो, छवि | सिटीस्केप डेटासेट | मोटर वाहन | स्वायत्त वाहन के लिए सिमेंटिक लेबल | 5,000 पिक्सेल-स्तरीय एनोटेशन का एक डेटासेट और 20,000 अलग-अलग शहरों से रिकॉर्ड किए गए स्टीरियो वीडियो अनुक्रमों में 50 कमजोर एनोटेटेड फ़्रेमों का एक बड़ा सेट | संपर्क |
CV | छवि | केयूएल बेल्जियम ट्रैफिक साइन डेटासेट | मोटर वाहन | स्वायत्त वाहन | संपूर्ण बेल्जियम से भौतिक रूप से भिन्न ट्रैफ़िक संकेतों के आधार पर फ़्लैंडर्स क्षेत्र से 10000+ से अधिक ट्रैफ़िक संकेत एनोटेशन। | संपर्क |
CV | छवि | एलआईएसए: इंटेलिजेंट और सुरक्षित ऑटोमोबाइल के लिए प्रयोगशाला, यूसी सैन डिएगो डेटासेट | मोटर वाहन | स्वायत्त वाहन | एक समृद्ध डेटासेट जिसमें ट्रैफ़िक संकेत, वाहन का पता लगाना, ट्रैफ़िक लाइट और प्रक्षेपवक्र पैटर्न शामिल हैं। | संपर्क |
CV | छवि | सीआईएफएआर-10 | सामान्य जानकारी | वस्तु मान्यता | वस्तु पहचान के लिए 50,000 छवियों और 10,000 परीक्षण छवियों (यानी 60,000 वर्गों में 32 32×10 रंगीन छवियां) से युक्त एक डेटासेट। | संपर्क |
CV | छवि | फैशन एमएनआईएसटी | फैशन | एक छवि डेटासेट जिसमें 60,000 उदाहरण होते हैं और 10,000×28 ग्रेस्केल छवियों में 28 उदाहरणों का एक परीक्षण सेट होता है, जो 10 वर्गों के लेबल से जुड़ा होता है। | संपर्क | |
CV | छवि | आईएमडीबी-विकी डेटासेट | मनोरंजन | चेहरे की पहचान | लिंग और उम्र जैसे लेबल के साथ चेहरे की छवियों का एक बड़ा डेटासेट। कुल 523,051 चेहरे की छवियों में से, 460,723 छवियां IMDB से 20,284 मशहूर हस्तियों से और 62,328 विकिपीडिया से प्राप्त की गई हैं। | संपर्क |
CV | वीडियो | कैनेटीक्स-700 | सामान्य जानकारी | प्रत्येक एक्शन क्लास के लिए, उच्च-गुणवत्ता वाले डेटासेट में 650,000 वीडियो क्लिप होते हैं और इसमें कम से कम 700 वीडियो क्लिप के साथ 600 मानव एक्शन क्लास शामिल होते हैं। यहां, प्रत्येक क्लिप 10 सेकंड या उससे अधिक समय तक चलती है। | संपर्क | |
CV | छवि | एमएस कोको | सामान्य जानकारी | वस्तु का पता लगाना, विभाजन | डेटासेट में 328k छवियां हैं और बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और डेटा कैप्शनिंग संबंधित एमएल मॉडल को प्रशिक्षित करने के लिए कुल 2.5 मिलियन इंस्टेंस और 91 ऑब्जेक्ट छवियां हैं। | संपर्क |
CV | छवि | एमपीआईआई मानव मुद्रा डेटासेट | सामान्य जानकारी | डेटासेट में एनोटेट किए गए शरीर के जोड़ों के साथ 25K से अधिक व्यक्तियों की लगभग 40K तस्वीरें शामिल हैं, जिनका उपयोग मानव मुद्रा अनुमान को स्पष्ट करने के लिए किया जाता है। कुल मिलाकर डेटासेट में 410 मानवीय गतिविधियाँ शामिल हैं और प्रत्येक छवि को एक गतिविधि लेबल प्रदान किया गया है। | संपर्क | |
CV | छवि | छवियाँ खोलें | सामान्य जानकारी | ऑब्जेक्ट स्थान एनोटेशन | छवि-स्तरीय लेबल, ऑब्जेक्ट बाउंडिंग बॉक्स, ऑब्जेक्ट सेगमेंटेशन इत्यादि के साथ एनोटेटेड लगभग 9 मिलियन छवियों वाला छवि डेटासेट। डेटासेट में 16 मिलियन भी शामिल हैं। 600 मिलियन छवियों पर 1.9 ऑब्जेक्ट वर्गों के लिए बाउंडिंग बॉक्स। | संपर्क |
CV | वीडियो, छवि | अर्गो, अर्गो, यूएसए द्वारा | मोटर वाहन | बाउंडिंग बॉक्स, ऑप्टिकल फ्लो, बिहेवियरल लेबल, सिमेंटिक लेबल, लेन मार्किंग | एक स्व-ड्राइविंग डेटासेट जिसमें ज्यामितीय और सिमेंटिक मेटाडेटा यानी लेन सेंटरलाइन, लेन दिशा और ड्राइव करने योग्य क्षेत्र के साथ एचडी मानचित्र शामिल हैं। डेटासेट का उपयोग एमएल मॉडल को प्रशिक्षित करने, अधिक सटीक धारणा एल्गोरिदम बनाने के लिए किया जाता है, जो स्व-ड्राइविंग वाहनों को सुरक्षित रूप से नेविगेट करने में मदद करेगा। | संपर्क |
CV | वीडियो | बॉश नॉर्थ अमेरिका रिसर्च द्वारा बॉश स्मॉल ट्रैफिक लाइट्स | मोटर वाहन | आकार निर्धारक बॉक्स | दृष्टि-आधारित ट्रैफिक लाइट डिटेक्शन सिस्टम बनाने के लिए 13427*1280 रिज़ॉल्यूशन के साथ 720 कैमरा छवियों वाला एक डेटासेट। डेटासेट में 24000 से अधिक एनोटेटेड ट्रैफिक लाइटें हैं। | संपर्क |
CV | वीडियो | ब्रेन4कार्स, कॉर्नेल यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारा | मोटर वाहन | व्यवहार लेबल | ड्राइवर की सतर्कता के बारे में उपयोगी आँकड़े निकालने के लिए केबिन सेंसर (कैमरा, स्पर्श सेंसर, स्मार्ट डिवाइस इत्यादि) की एक श्रृंखला से युक्त एक डेटासेट। हमारे एल्गोरिदम उन ड्राइवरों का पता लगा सकते हैं जो नींद में हैं या विचलित हैं और सुरक्षा में सुधार के लिए आवश्यक अलार्म बढ़ा सकते हैं। | संपर्क |
CV | छवि | कुलेन, चीनी विश्वविद्यालय द्वारा। का A) हांगकांग B) बीजिंग D) चीन | मोटर वाहन | लेन मार्किंग | ट्रैफ़िक लेन का पता लगाने पर एक कंप्यूटर विज़न डेटासेट, जिसमें 55 घंटे के वीडियो शामिल थे, जिनमें से 133,235 (88880 प्रशिक्षण सेट, 9675 सत्यापन सेट और 34680 परीक्षण सेट) फ़्रेम निकाले गए थे। इसे बीजिंग में विभिन्न ड्राइवरों द्वारा संचालित छह अलग-अलग वाहनों पर लगे कैमरों द्वारा एकत्र किया गया है। | संपर्क |
CV | वीडियो | डेविस, विश्वविद्यालय द्वारा। का ज्यूरिख, ETH ¨ ज्यूरिख, जर्मनी, स्विट्जरलैंड | मोटर वाहन | एक एंड-टू-एंड वाहन ड्राइविंग प्रशिक्षण डेटासेट जो DAVIS इवेंट+फ़्रेम कैमरा का उपयोग करता है। कार डेटा जैसे स्टीयरिंग, थ्रॉटल, जीपीएस इत्यादि का उपयोग ऑटोमोटिव ऐप्स के लिए फ्रेम और इवेंट डेटा के संलयन का मूल्यांकन करने के लिए किया जाता है। | संपर्क | |
CV | वीडियो | डीबीनेट, शंघाई जिओ टोंग यूनिवर्सिटी, ज़ियामेन यूनिवर्सिटी, चीन द्वारा | मोटर वाहन | प्वाइंट क्लाउड, LiDAR | वास्तविक दुनिया का 1000 KM ड्राइविंग डेटा, जिसमें ड्राइविंग व्यवहार पर गहन शोध के लिए संरेखित वीडियो, पॉइंट क्लाउड, जीपीएस और ड्राइवर व्यवहार शामिल है। | संपर्क |
CV | वीडियो | डॉ. (नेत्र)वे, विश्वविद्यालय द्वारा। मोडेना और रेगियो एमिलिया, मोडेना, इटली के | मोटर वाहन | व्यवहार लेबल | डेटासेट में प्रत्येक 74 मिनट के 5 वीडियो अनुक्रम थे, जिन्हें 500,000 से अधिक फ़्रेमों में एनोटेट किया गया था। डेटासेट में भू-संदर्भित स्थान, ड्राइविंग गति, पाठ्यक्रम शामिल है, और ड्राइवरों को टकटकी निर्धारण और कार्य-विशिष्ट मानचित्र प्रदान करने वाले उनके अस्थायी एकीकरण को भी लेबल करता है। | संपर्क |
CV | वीडियो | ईटीएच पैदल यात्री (2009), ईटीएच ज्यूरिख, ज्यूरिख, स्विट्जरलैंड द्वारा | सामान्य जानकारी | आकार निर्धारक बॉक्स | प्रत्येक 74 मिनट के 5 वीडियो अनुक्रमों का एक डेटासेट, 500,000 से अधिक फ़्रेमों में एनोटेट किया गया। डेटासेट भू-संदर्भित स्थिति, ड्राइविंग गति, दिशा प्रदान करता है, और ड्राइवरों के लिए टकटकी निर्धारण और कार्य-विशिष्ट मानचित्रों सहित उनके अस्थायी एकीकरण को भी लेबल करता है। | संपर्क |
CV | वीडियो | फोर्ड (2009), यूनिवर्सिटी द्वारा। मिशिगन, मिशिगन, यू.एस. का | मोटर वाहन | बाउंडिंग बॉक्स, LiDAR | वेलोडाइन 3डी-लिडार स्कैनर, दो पुश-ब्रूम फॉरवर्ड-लुकिंग रीग लिडार, एक तकनीकी और उपभोक्ता जड़त्व माप इकाई (आईएमयू), और एक प्वाइंट ग्रे लेडीबग 3 सर्वदिशात्मक कैमरा सिस्टम से लैस एक स्वचालित भूमि वाहन द्वारा संकलित डेटासेट। | संपर्क |
CV | वीडियो | एचसीआई चैलेंजिंग स्टीरियो, बॉश कॉर्पोरेशन रिसर्च, हिल्डेशाइम, जर्मनी | सामान्य जानकारी | कैप्चर किए गए वीडियो दृश्यों से कई मिलियन फ़्रेमों का एक डेटासेट जिसमें विभिन्न मौसम स्थितियों की एक विस्तृत श्रृंखला, गति और गहराई की कई परतें शामिल हैं; शहर और ग्रामीण इलाकों में स्थितियाँ, आदि। | संपर्क | |
CV | वीडियो | जेएएडी, यॉर्क यूनिवर्सिटी, यूक्रेन, कनाडा द्वारा | मोटर वाहन | बाउंडिंग बॉक्स, व्यवहार लेबल | "JAAD स्वायत्त ड्राइविंग के संदर्भ में संयुक्त ध्यान का अध्ययन करने के लिए एक डेटासेट है। क्रॉसिंग के बिंदु पर पैदल यात्री और ड्राइवर के व्यवहार और उन्हें प्रभावित करने वाले कारकों पर ध्यान केंद्रित किया गया है। इस अंत तक, JAAD डेटासेट 346 लघु वीडियो का एक समृद्ध एनोटेटेड संग्रह प्रदान करता है क्लिप (5-10 सेकंड लंबी) उत्तरी अमेरिका और पूर्वी यूरोप के कई स्थानों से 240 घंटे से अधिक की ड्राइविंग फुटेज से निकाली गई हैं। रोड़ा टैग वाले बाउंडिंग बॉक्स का उपयोग सभी पैदल यात्रियों के लिए किया जाता है, जो इस डेटासेट को पैदल यात्री का पता लगाने के लिए उपयुक्त बनाता है। व्यवहार एनोटेशन पैदल चलने वालों के लिए व्यवहार निर्दिष्ट करते हैं जो ड्राइवर के साथ बातचीत करता है या उस पर ध्यान देने की आवश्यकता है। प्रत्येक वीडियो के लिए कई टैग (मौसम, स्थान, आदि) और टाइमस्टैम्प्ड व्यवहार लेबल (जैसे रुकना, चलना, देखना, आदि) हैं। इसके अलावा, जनसांख्यिकीय विशेषताओं की एक सूची है प्रत्येक पैदल यात्री (जैसे उम्र, लिंग, गति की दिशा, आदि) के साथ-साथ प्रत्येक फ्रेम में दृश्य यातायात दृश्य तत्वों (जैसे स्टॉप साइन, ट्रैफिक सिग्नल, आदि) की एक सूची प्रदान की जाती है।" | संपर्क |
CV | छवि | यूनिवर्सिटी द्वारा एलआईएसए ट्रैफिक साइन। कैलिफोर्निया, सैन डिएगो, संयुक्त राज्य अमेरिका के | मोटर वाहन | आकार निर्धारक बॉक्स | डेटासेट का सेट जिसमें वीडियो और एनोटेटेड फ़्रेम हैं जिनमें यूएस ट्रैफ़िक संकेत शामिल हैं। इसे दो चरणों में रिलीज़ किया जाता है, एक केवल चित्रों के साथ और दूसरा चित्र और वीडियो दोनों के साथ। | संपर्क |
CV | छवि | मैपिलरी विस्टा, मैपिलरी एबी, ग्लोबल द्वारा | मोटर वाहन | सिमेंटिक लेबल | पिक्सेल-सटीक और उदाहरण-विशिष्ट मानव एनोटेशन के साथ दुनिया भर के सड़क दृश्यों की व्याख्या के लिए एक सड़क-स्तरीय फोटोग्राफी डेटासेट। | संपर्क |
CV | वीडियो, छवि | सिमेंटिक KITTI, बॉन विश्वविद्यालय, कार्लज़ूए, जर्मनी द्वारा | मोटर वाहन | बाउंडिंग बॉक्स, सिमेंटिक लेबल, लेन मार्किंग | एक डेटासेट जिसमें सभी ओडोमेट्री बेंचमार्क अनुक्रमों के लिए सिमेंटिक एनोटेशन शामिल है। डेटासेट विभिन्न प्रकार के गतिशील और गैर-गतिशील ट्रैफ़िक की व्याख्या करता है: जिसमें कार, बाइक, साइकिल, पैदल यात्री और साइकिल चालक शामिल हैं, जिससे दृश्य में वस्तुओं का अध्ययन किया जा सकता है। | संपर्क |
CV | वीडियो | स्टैनफोर्ड यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारा स्टैनफोर्ड ट्रैक | मोटर वाहन | ऑब्जेक्ट डिटेक्शन/वर्गीकरण LiDAR, जीपीएस, कोड | एक डेटासेट जिसमें 14,000 लेबल वाले ऑब्जेक्ट ट्रैक शामिल हैं, जैसा कि प्राकृतिक सड़क दृश्यों में वेलोडाइन एचडीएल-64ई एस2 लिडार द्वारा देखा गया है, जिसका उपयोग 3डी ऑब्जेक्ट रिकग्निशन के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जा सकता है। | संपर्क |
CV | वीडियो, छवि | बॉश, संयुक्त राज्य अमेरिका द्वारा बॉक्सी डेटासेट | मोटर वाहन | बाउंडिंग बॉक्स/वाहन का पता लगाना | एक वाहन पहचान डेटा सेट जिसमें मोटरवे पर स्व-ड्राइविंग कारों के लिए ऑब्जेक्ट पहचान रणनीतियों के प्रशिक्षण और विश्लेषण के लिए 2 मिलियन एनोटेटेड वाहन शामिल हैं। | संपर्क |
CV | वीडियो | टीएमई मोटरवे, चेक टेक्निकल यूनिवर्सिटी, उत्तरी इटली द्वारा | मोटर वाहन | आकार निर्धारक बॉक्स | कुल 28 मिनट के लिए 27 क्लिप का एक डेटासेट 30,000+ वाहन एनोटेशन फ्रेम में विभाजित किया गया। लेजर स्कैनर से डेटा का उपयोग करके एनोटेशन अर्ध-स्वचालित रूप से तैयार किया गया था। इस डेटा संग्रह में परिवर्तनशील यातायात परिदृश्य, लेन की संख्या, सड़क की वक्रता और रोशनी शामिल है, जिसमें पूर्ण अधिग्रहण की अधिकांश शर्तें शामिल हैं। | संपर्क |
CV | वीडियो | बॉश, संयुक्त राज्य अमेरिका द्वारा अनसुपरवाइज्ड लामास | मोटर वाहन | लेन मार्किंग, LiDAR | अनसुपरवाइज्ड लामास डेटासेट को लिडार-आधारित लेन मार्करों सहित उच्च-परिभाषा स्वचालित ड्राइविंग मानचित्र तैयार करके एनोटेट किया गया था। स्वायत्त वाहन को इन मानचित्रों के अनुरूप संरेखित किया जा सकता है और लेन चिह्नों को कैमरे के फ्रेम में प्रक्षेपित किया जा सकता है। 3डी प्रक्षेपण को पहले से देखे गए और अनुमानित छवि मार्करों के बीच विसंगति को कम करके अनुकूलित किया गया है। | संपर्क |
एनएलपी | ऑडियो | फेसबुक एआई बहुभाषी लिब्रिस्पीच (एमएलएस) | सामान्य जानकारी | ऑडियो एनोटेशन / वाक् पहचान | Facebook AI बहुभाषी LibriSpeech (MLS), एक बड़े पैमाने पर, खुला स्रोत डेटा सेट है जिसे स्वचालित वाक् पहचान (ASR) में उन्नत अनुसंधान में मदद करने के लिए डिज़ाइन किया गया है। एमएलएस 50,000 भाषाओं में 8 घंटे से अधिक ऑडियो प्रदान करता है: अंग्रेजी, जर्मन, डच, फ्रेंच, स्पेनिश, इतालवी, पुर्तगाली और पोलिश। | संपर्क |