डेटासेट खोलें

ओपन सोर्स डेटासेट खोजें जो आपको एमएल मॉडल को प्रशिक्षित करने में मदद करता है

डेटासेट खोलें

एआई/एमएल मॉडल के साथ शुरुआत करने के लिए ओपन सोर्स डेटासेट

आपके एआई और एमएल मॉडल का आउटपुट उतना ही अच्छा है जितना डेटा आप इसे प्रशिक्षित करने के लिए उपयोग करते हैं - इसलिए डेटा एकत्रीकरण और उस डेटा की टैगिंग और पहचान पर आप जो सटीकता लागू करते हैं वह महत्वपूर्ण है!

इसलिए यदि आप एक नई एआई/एमएल पहल शुरू करना चाहते हैं और अब आप जल्दी से महसूस कर रहे हैं कि उच्च-गुणवत्ता वाला प्रशिक्षण डेटा ढूंढना आपके प्रोजेक्ट के अधिक चुनौतीपूर्ण पहलुओं में से एक होगा क्योंकि उच्च-गुणवत्ता वाले डेटासेट वह ईंधन हैं जो एआई/ को बनाए रखते हैं। एमएल इंजन चल रहा है। हमने खुले डेटासेट की एक सूची जमा की है जो भविष्य के आपके एआई/एमएल मॉडल का उपयोग और प्रशिक्षण करने के लिए निःशुल्क हैं।

विशेषज्ञताडाटा प्रकारडेटासेट का नामउद्योग/विभागएनोटेशन/उपयोग मामलाDescriptionसंपर्क
एनएलपीटेक्स्टअमेज़न समीक्षाई - कॉमर्सभावनाओं का विश्लेषणउपयोगकर्ता और उत्पाद विवरण के साथ सादे पाठ में पिछले 35 वर्षों में 18 मिलियन समीक्षाओं और रेटिंग का एक सेट।संपर्क
एनएलपीटेक्स्टविकिपीडिया लिंक डेटासामान्य जानकारी4 मिलियन से अधिक. 1.9 बीएन युक्त लेख। वह शब्द जिसमें शब्दों और वाक्यांशों के साथ-साथ पैराग्राफ भी शामिल हों।संपर्क
एनएलपीटेक्स्टस्टैंडफोर्ड सेंटीमेंट ट्रीबैंकमनोरंजनभावनाओं का विश्लेषणHTML फ़ाइल स्वरूप में रॉटेन टोमाटोज़ की 10,000 से अधिक समीक्षाओं के लिए सेंटीमेंट एनोटेशन डेटासेटसंपर्क
एनएलपीटेक्स्टट्विटर यूएस एयरलाइन भावनाएयरलाइनभावनाओं का विश्लेषणयूएस एयरलाइंस पर 2015 के ट्वीट्स सकारात्मक, नकारात्मक और तटस्थ स्वरों में विभाजित हैंसंपर्क
CVछवि जंगल में लेबल वाले चेहरेसामान्य जानकारीचेहरे की पहचानचेहरे की पहचान प्रशिक्षण के लिए दो अलग-अलग चित्रों के साथ 13,000 से अधिक कटे हुए चेहरों वाला डेटासेट।संपर्क
CVवीडियो, छवियूएमडीफ़ेस डेटासेटसामान्य जानकारीचेहरे की पहचानएनोटेटेड डेटासेट जिसमें 367,000 से अधिक विषयों के 8,000 से अधिक चेहरे हैं जिनमें स्थिर और वीडियो छवियां शामिल हैं।संपर्क
CVछवि इमेजनेटसामान्य जानकारी14 मिलियन से अधिक डेटासेट। वर्डनेट पदानुक्रम के अनुसार व्यवस्थित विभिन्न फ़ाइल स्वरूपों में छवियां।संपर्क
CVछवि Google की खुली छवियांसामान्य जानकारी9 मिलियन 6,000 से अधिक श्रेणियों में से सार्वजनिक छवियों को वर्गीकृत करने के लिए यूआरएल।संपर्क
एनएलपीटेक्स्टएमआईएमआईसी क्रिटिकल केयर डेटाबेसहेल्थकेयर40,000 गंभीर देखभाल रोगियों से पहचाने गए डेटा के साथ कम्प्यूटेशनल फिजियोलॉजी डेटासेट। डेटासेट में जनसांख्यिकी, महत्वपूर्ण संकेत, दवाएं आदि जैसी जानकारी शामिल है।संपर्क
CVछवियूएस नेशनल ट्रैवल एंड टूरिज्म ऑफिसपर्यटनभरोसेमंद डेटाबेस के साथ पर्यटन उद्योग से व्यापक तस्वीरें प्रदान करता है, जिसमें इनबाउंड और आउटबाउंड यात्रा और अंतरराष्ट्रीय पर्यटक जानकारी जैसे विषयों को शामिल किया गया है।संपर्क
एनएलपीटेक्स्टपरिवहन विभागपर्यटनपर्यटन डेटासेट जिसमें राष्ट्रीय उद्यान, ड्राइवर रजिस्टर, पुल और रेल जानकारी आदि शामिल हैं।संपर्क
एनएलपीऑडियोफ़्लिकर ऑडियो कैप्शन कॉर्पससामान्य जानकारीबिना पर्यवेक्षित भाषण पैटर्न के लिए डिज़ाइन की गई 40 तस्वीरों से 8,000 हजार से अधिक बोले गए कैप्शनसंपर्क
एनएलपीऑडियोस्पीच कमांड डेटासेटसामान्य जानकारीवाक् पहचान, ऑडियो एनोटेशनबुनियादी ध्वनि इंटरफ़ेस बनाने के लिए, हजारों व्यक्तियों के 1 सेकंड लंबे कथन।संपर्क
एनएलपीऑडियोपर्यावरण ऑडियो डेटासेटसामान्य जानकारीपर्यावरण ऑडियो डेटासेट जिसमें इवेंट टेबल और ध्वनिक दृश्य टेबल की ध्वनि शामिल है।संपर्क
एनएलपीटेक्स्टCOVID-19 ओपन रिसर्च डेटासेट हेल्थकेयरमेडिकल ए.आईएक शोध डेटासेट जिसमें COVID-45,000 और वायरस के कोरोनोवायरस परिवार पर 19 विद्वानों के लेख शामिल हैं।संपर्क
CVछविवेमो ओपन डेटासेट मोटर वाहनवेमो द्वारा जारी किए गए सबसे विविध स्वायत्त ड्राइविंग डेटासेटसंपर्क
CVछविदृश्य जीनोम सामान्य जानकारीछवि कैप्शनिंग100K से अधिक छवियों के विस्तृत कैप्शनिंग के साथ एक दृश्य ज्ञान का आधारसंपर्क
CVछविमुझे लेबल करो सार्वजनिक सरकार.लेबलमे मैटलैब के माध्यम से पहुंच योग्य एनोटेट छवियों का बड़ा सेटसंपर्क
CVछविकुंडल 100सामान्य जानकारी100 से अधिक विभिन्न वस्तुओं की कई कोणों (अर्थात 360 डिग्री) से तस्वीरें खींची गईंसंपर्क
CVछविस्टैनफोर्ड डॉग्स डेटासेटसामान्य जानकारी20,500 से अधिक छवियों को 120 विभिन्न कुत्तों की नस्लों के छवि सेट में वर्गीकृत किया गया हैसंपर्क
CVछविइनडोर दृश्य पहचानसामान्य जानकारीदृश्य पहचानदृश्य पहचान मॉडल बनाने के लिए 15620 इनडोर श्रेणियों से 67 छवियों वाला एक विशिष्ट डेटासेटसंपर्क
CVछविविज़ुअलक्यूएसामान्य जानकारीएक डेटासेट जिसमें 265,016 फ़ोटो से संबंधित ओपन-एंडेड प्रश्न शामिल हैं जिनका उत्तर देने के लिए दृष्टि और भाषा की समझ की आवश्यकता होती है।संपर्क
एनएलपीटेक्स्टमल्टीडोमेन सेंटीमेंट विश्लेषण डेटासेटई - कॉमर्सभावनाओं का विश्लेषणडेटासेट जिसमें अमेज़ॅन से उत्पाद समीक्षाएं शामिल हैंसंपर्क
एनएलपीटेक्स्टIMDB समीक्षामनोरंजनभावनाओं का विश्लेषणभावना विश्लेषण के लिए 25000 मूवी समीक्षा वाला डेटासेटसंपर्क
एनएलपीटेक्स्टभावना 140सामान्य जानकारीभावनाओं का विश्लेषणउच्च सटीकता के लिए पहले से हटाए गए इमोटिकॉन्स के साथ 160,000 ट्वीट्स वाला डेटासेटसंपर्क
एनएलपीटेक्स्टब्लॉगर कॉर्पससामान्य जानकारीकीप्रेज़ एनालिसिसब्लॉगर.कॉम के 681,288 ब्लॉग पोस्ट वाले डेटासेट में व्यापक रूप से उपयोग किए जाने वाले अंग्रेजी शब्दों की न्यूनतम 200 घटनाएं शामिल हैं।संपर्क
एनएलपीटेक्स्टख़तरासामान्य जानकारीचैटबॉट प्रशिक्षण200,000 से अधिक प्रश्नों वाला डेटासेट जिसका उपयोग मशीन लर्निंग मॉडल को बुद्धिमानी से स्वचालित प्रतिक्रिया देने के लिए प्रशिक्षित करने के लिए किया जा सकता हैसंपर्क
एनएलपीटेक्स्टअंग्रेजी में एसएमएस स्पैम संग्रहदूरसंचारस्पैम पहचानएक स्पैम संदेश डेटासेट जिसमें 5,574 अंग्रेजी एसएमएस शामिल हैंसंपर्क
एनएलपीटेक्स्टYelp समीक्षाएंसामान्य जानकारीभावनाओं का विश्लेषणयेल्प द्वारा प्रकाशित 5 मिलियन से अधिक समीक्षा वाला डेटासेटसंपर्क
एनएलपीटेक्स्टयूसीआई का स्पैमबेसउद्यमस्पैम पहचानस्पैम ईमेल का एक बड़ा डेटासेट, स्पैम फ़िल्टरिंग के लिए उपयोगी।संपर्क
CVवीडियो, छविबर्कले डीपड्राइव BDD100kमोटर वाहनस्वायत्त वाहनसेल्फ-ड्राइविंग एआई के लिए सबसे बड़े डेटासेट में से एक, जिसमें न्यूयॉर्क और सैन फ्रांसिस्को क्षेत्र से दिन के अलग-अलग समय के 1,100 से अधिक वीडियो में 100,000 घंटे का ड्राइविंग अनुभव शामिल है।संपर्क
CVवीडियोअल्पविराम.एआईमोटर वाहनस्वायत्त वाहन 7 घंटे का हाईवे ड्राइविंग डेटासेट जिसमें कार की गति, त्वरण, स्टीयरिंग कोण और जीपीएस निर्देशांक की जानकारी शामिल हैसंपर्क
CVवीडियो, छविसिटीस्केप डेटासेटमोटर वाहनस्वायत्त वाहन के लिए सिमेंटिक लेबल5,000 पिक्सेल-स्तरीय एनोटेशन का एक डेटासेट और 20,000 अलग-अलग शहरों से रिकॉर्ड किए गए स्टीरियो वीडियो अनुक्रमों में 50 कमजोर एनोटेटेड फ़्रेमों का एक बड़ा सेटसंपर्क
CVछविकेयूएल बेल्जियम ट्रैफिक साइन डेटासेटमोटर वाहनस्वायत्त वाहनसंपूर्ण बेल्जियम से भौतिक रूप से भिन्न ट्रैफ़िक संकेतों के आधार पर फ़्लैंडर्स क्षेत्र से 10000+ से अधिक ट्रैफ़िक संकेत एनोटेशन।संपर्क
CVछविएलआईएसए: इंटेलिजेंट और सुरक्षित ऑटोमोबाइल के लिए प्रयोगशाला, यूसी सैन डिएगो डेटासेटमोटर वाहनस्वायत्त वाहनएक समृद्ध डेटासेट जिसमें ट्रैफ़िक संकेत, वाहन का पता लगाना, ट्रैफ़िक लाइट और प्रक्षेपवक्र पैटर्न शामिल हैं।संपर्क
CVछविसीआईएफएआर-10सामान्य जानकारीवस्तु मान्यतावस्तु पहचान के लिए 50,000 छवियों और 10,000 परीक्षण छवियों (यानी 60,000 वर्गों में 32 32×10 रंगीन छवियां) से युक्त एक डेटासेट।संपर्क
CVछविफैशन एमएनआईएसटीफैशनएक छवि डेटासेट जिसमें 60,000 उदाहरण होते हैं और 10,000×28 ग्रेस्केल छवियों में 28 उदाहरणों का एक परीक्षण सेट होता है, जो 10 वर्गों के लेबल से जुड़ा होता है।संपर्क
CVछविआईएमडीबी-विकी डेटासेटमनोरंजनचेहरे की पहचानलिंग और उम्र जैसे लेबल के साथ चेहरे की छवियों का एक बड़ा डेटासेट। कुल 523,051 चेहरे की छवियों में से, 460,723 छवियां IMDB से 20,284 मशहूर हस्तियों से और 62,328 विकिपीडिया से प्राप्त की गई हैं।संपर्क
CVवीडियोकैनेटीक्स-700सामान्य जानकारीप्रत्येक एक्शन क्लास के लिए, उच्च-गुणवत्ता वाले डेटासेट में 650,000 वीडियो क्लिप होते हैं और इसमें कम से कम 700 वीडियो क्लिप के साथ 600 मानव एक्शन क्लास शामिल होते हैं। यहां, प्रत्येक क्लिप 10 सेकंड या उससे अधिक समय तक चलती है।संपर्क
CVछविएमएस कोकोसामान्य जानकारीवस्तु का पता लगाना, विभाजनडेटासेट में 328k छवियां हैं और बड़े पैमाने पर ऑब्जेक्ट डिटेक्शन, सेगमेंटेशन और डेटा कैप्शनिंग संबंधित एमएल मॉडल को प्रशिक्षित करने के लिए कुल 2.5 मिलियन इंस्टेंस और 91 ऑब्जेक्ट छवियां हैं।संपर्क
CVछविएमपीआईआई मानव मुद्रा डेटासेटसामान्य जानकारीडेटासेट में एनोटेट किए गए शरीर के जोड़ों के साथ 25K से अधिक व्यक्तियों की लगभग 40K तस्वीरें शामिल हैं, जिनका उपयोग मानव मुद्रा अनुमान को स्पष्ट करने के लिए किया जाता है। कुल मिलाकर डेटासेट में 410 मानवीय गतिविधियाँ शामिल हैं और प्रत्येक छवि को एक गतिविधि लेबल प्रदान किया गया है।संपर्क
CVछविछवियाँ खोलेंसामान्य जानकारीऑब्जेक्ट स्थान एनोटेशनछवि-स्तरीय लेबल, ऑब्जेक्ट बाउंडिंग बॉक्स, ऑब्जेक्ट सेगमेंटेशन इत्यादि के साथ एनोटेटेड लगभग 9 मिलियन छवियों वाला छवि डेटासेट। डेटासेट में 16 मिलियन भी शामिल हैं। 600 मिलियन छवियों पर 1.9 ऑब्जेक्ट वर्गों के लिए बाउंडिंग बॉक्स।संपर्क
CVवीडियोBaidu Inc, चीन द्वारा अपोलो ओपन प्लेटफ़ॉर्ममोटर वाहनबाउंडिंग बॉक्स, LiDARएक समृद्ध ऑटोनॉमस ड्राइविंग डेटासेट, जो डेवलपर्स को नवोन्वेषी पुनरावृत्ति की दक्षता में तेजी लाने के लिए स्वायत्त ड्राइविंग में आवश्यक डेटा प्रदान करता है।संपर्क
CVवीडियो, छविअर्गो, अर्गो, यूएसए द्वारामोटर वाहनबाउंडिंग बॉक्स, ऑप्टिकल फ्लो, बिहेवियरल लेबल, सिमेंटिक लेबल, लेन मार्किंगएक स्व-ड्राइविंग डेटासेट जिसमें ज्यामितीय और सिमेंटिक मेटाडेटा यानी लेन सेंटरलाइन, लेन दिशा और ड्राइव करने योग्य क्षेत्र के साथ एचडी मानचित्र शामिल हैं। डेटासेट का उपयोग एमएल मॉडल को प्रशिक्षित करने, अधिक सटीक धारणा एल्गोरिदम बनाने के लिए किया जाता है, जो स्व-ड्राइविंग वाहनों को सुरक्षित रूप से नेविगेट करने में मदद करेगा।संपर्क
CVवीडियोबॉश नॉर्थ अमेरिका रिसर्च द्वारा बॉश स्मॉल ट्रैफिक लाइट्समोटर वाहनआकार निर्धारक बॉक्सदृष्टि-आधारित ट्रैफिक लाइट डिटेक्शन सिस्टम बनाने के लिए 13427*1280 रिज़ॉल्यूशन के साथ 720 कैमरा छवियों वाला एक डेटासेट। डेटासेट में 24000 से अधिक एनोटेटेड ट्रैफिक लाइटें हैं।संपर्क
CVवीडियोब्रेन4कार्स, कॉर्नेल यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारामोटर वाहनव्यवहार लेबलड्राइवर की सतर्कता के बारे में उपयोगी आँकड़े निकालने के लिए केबिन सेंसर (कैमरा, स्पर्श सेंसर, स्मार्ट डिवाइस इत्यादि) की एक श्रृंखला से युक्त एक डेटासेट। हमारे एल्गोरिदम उन ड्राइवरों का पता लगा सकते हैं जो नींद में हैं या विचलित हैं और सुरक्षा में सुधार के लिए आवश्यक अलार्म बढ़ा सकते हैं।संपर्क
CVछविकुलेन, चीनी विश्वविद्यालय द्वारा। का A) हांगकांग B) बीजिंग D) चीनमोटर वाहनलेन मार्किंगट्रैफ़िक लेन का पता लगाने पर एक कंप्यूटर विज़न डेटासेट, जिसमें 55 घंटे के वीडियो शामिल थे, जिनमें से 133,235 (88880 प्रशिक्षण सेट, 9675 सत्यापन सेट और 34680 परीक्षण सेट) फ़्रेम निकाले गए थे। इसे बीजिंग में विभिन्न ड्राइवरों द्वारा संचालित छह अलग-अलग वाहनों पर लगे कैमरों द्वारा एकत्र किया गया है।संपर्क
CVवीडियोडेविस, विश्वविद्यालय द्वारा। का ज्यूरिख, ETH ¨ ज्यूरिख, जर्मनी, स्विट्जरलैंडमोटर वाहनएक एंड-टू-एंड वाहन ड्राइविंग प्रशिक्षण डेटासेट जो DAVIS इवेंट+फ़्रेम कैमरा का उपयोग करता है। कार डेटा जैसे स्टीयरिंग, थ्रॉटल, जीपीएस इत्यादि का उपयोग ऑटोमोटिव ऐप्स के लिए फ्रेम और इवेंट डेटा के संलयन का मूल्यांकन करने के लिए किया जाता है।संपर्क
CVवीडियोडीबीनेट, शंघाई जिओ टोंग यूनिवर्सिटी, ज़ियामेन यूनिवर्सिटी, चीन द्वारामोटर वाहनप्वाइंट क्लाउड, LiDARवास्तविक दुनिया का 1000 KM ड्राइविंग डेटा, जिसमें ड्राइविंग व्यवहार पर गहन शोध के लिए संरेखित वीडियो, पॉइंट क्लाउड, जीपीएस और ड्राइवर व्यवहार शामिल है।संपर्क
CVवीडियोडॉ. (नेत्र)वे, विश्वविद्यालय द्वारा। मोडेना और रेगियो एमिलिया, मोडेना, इटली केमोटर वाहनव्यवहार लेबलडेटासेट में प्रत्येक 74 मिनट के 5 वीडियो अनुक्रम थे, जिन्हें 500,000 से अधिक फ़्रेमों में एनोटेट किया गया था। डेटासेट में भू-संदर्भित स्थान, ड्राइविंग गति, पाठ्यक्रम शामिल है, और ड्राइवरों को टकटकी निर्धारण और कार्य-विशिष्ट मानचित्र प्रदान करने वाले उनके अस्थायी एकीकरण को भी लेबल करता है।संपर्क
CVवीडियोईटीएच पैदल यात्री (2009), ईटीएच ज्यूरिख, ज्यूरिख, स्विट्जरलैंड द्वारासामान्य जानकारीआकार निर्धारक बॉक्सप्रत्येक 74 मिनट के 5 वीडियो अनुक्रमों का एक डेटासेट, 500,000 से अधिक फ़्रेमों में एनोटेट किया गया। डेटासेट भू-संदर्भित स्थिति, ड्राइविंग गति, दिशा प्रदान करता है, और ड्राइवरों के लिए टकटकी निर्धारण और कार्य-विशिष्ट मानचित्रों सहित उनके अस्थायी एकीकरण को भी लेबल करता है।संपर्क
CVवीडियोफोर्ड (2009), यूनिवर्सिटी द्वारा। मिशिगन, मिशिगन, यू.एस. कामोटर वाहनबाउंडिंग बॉक्स, LiDARवेलोडाइन 3डी-लिडार स्कैनर, दो पुश-ब्रूम फॉरवर्ड-लुकिंग रीग लिडार, एक तकनीकी और उपभोक्ता जड़त्व माप इकाई (आईएमयू), और एक प्वाइंट ग्रे लेडीबग 3 सर्वदिशात्मक कैमरा सिस्टम से लैस एक स्वचालित भूमि वाहन द्वारा संकलित डेटासेट।संपर्क
CVवीडियोएचसीआई चैलेंजिंग स्टीरियो, बॉश कॉर्पोरेशन रिसर्च, हिल्डेशाइम, जर्मनीसामान्य जानकारीकैप्चर किए गए वीडियो दृश्यों से कई मिलियन फ़्रेमों का एक डेटासेट जिसमें विभिन्न मौसम स्थितियों की एक विस्तृत श्रृंखला, गति और गहराई की कई परतें शामिल हैं; शहर और ग्रामीण इलाकों में स्थितियाँ, आदि।संपर्क
CVवीडियोजेएएडी, यॉर्क यूनिवर्सिटी, यूक्रेन, कनाडा द्वारामोटर वाहनबाउंडिंग बॉक्स, व्यवहार लेबल"JAAD स्वायत्त ड्राइविंग के संदर्भ में संयुक्त ध्यान का अध्ययन करने के लिए एक डेटासेट है। क्रॉसिंग के बिंदु पर पैदल यात्री और ड्राइवर के व्यवहार और उन्हें प्रभावित करने वाले कारकों पर ध्यान केंद्रित किया गया है। इस अंत तक, JAAD डेटासेट 346 लघु वीडियो का एक समृद्ध एनोटेटेड संग्रह प्रदान करता है क्लिप (5-10 सेकंड लंबी) उत्तरी अमेरिका और पूर्वी यूरोप के कई स्थानों से 240 घंटे से अधिक की ड्राइविंग फुटेज से निकाली गई हैं। रोड़ा टैग वाले बाउंडिंग बॉक्स का उपयोग सभी पैदल यात्रियों के लिए किया जाता है, जो इस डेटासेट को पैदल यात्री का पता लगाने के लिए उपयुक्त बनाता है। व्यवहार एनोटेशन पैदल चलने वालों के लिए व्यवहार निर्दिष्ट करते हैं जो ड्राइवर के साथ बातचीत करता है या उस पर ध्यान देने की आवश्यकता है। प्रत्येक वीडियो के लिए कई टैग (मौसम, स्थान, आदि) और टाइमस्टैम्प्ड व्यवहार लेबल (जैसे रुकना, चलना, देखना, आदि) हैं। इसके अलावा, जनसांख्यिकीय विशेषताओं की एक सूची है प्रत्येक पैदल यात्री (जैसे उम्र, लिंग, गति की दिशा, आदि) के साथ-साथ प्रत्येक फ्रेम में दृश्य यातायात दृश्य तत्वों (जैसे स्टॉप साइन, ट्रैफिक सिग्नल, आदि) की एक सूची प्रदान की जाती है।"संपर्क
CVवीडियोKAIST अर्बन, KAIST, दक्षिण कोरिया द्वारासामान्य जानकारीLIDAR काडेटा संग्रह में LiDAR डेटा और बहुत जटिल शहरी क्षेत्र (जैसे महानगर क्षेत्र, जटिल इमारतें और आवासीय क्षेत्र) को लक्षित करने वाली स्टीरियो छवियों के लिए कई स्थान सेंसर शामिल हैं।संपर्क
CVछवियूनिवर्सिटी द्वारा एलआईएसए ट्रैफिक साइन। कैलिफोर्निया, सैन डिएगो, संयुक्त राज्य अमेरिका केमोटर वाहनआकार निर्धारक बॉक्सडेटासेट का सेट जिसमें वीडियो और एनोटेटेड फ़्रेम हैं जिनमें यूएस ट्रैफ़िक संकेत शामिल हैं। इसे दो चरणों में रिलीज़ किया जाता है, एक केवल चित्रों के साथ और दूसरा चित्र और वीडियो दोनों के साथ।संपर्क
CVछविमैपिलरी विस्टा, मैपिलरी एबी, ग्लोबल द्वारामोटर वाहनसिमेंटिक लेबलपिक्सेल-सटीक और उदाहरण-विशिष्ट मानव एनोटेशन के साथ दुनिया भर के सड़क दृश्यों की व्याख्या के लिए एक सड़क-स्तरीय फोटोग्राफी डेटासेट।संपर्क
CVवीडियो, छविसिमेंटिक KITTI, बॉन विश्वविद्यालय, कार्लज़ूए, जर्मनी द्वारामोटर वाहनबाउंडिंग बॉक्स, सिमेंटिक लेबल, लेन मार्किंगएक डेटासेट जिसमें सभी ओडोमेट्री बेंचमार्क अनुक्रमों के लिए सिमेंटिक एनोटेशन शामिल है। डेटासेट विभिन्न प्रकार के गतिशील और गैर-गतिशील ट्रैफ़िक की व्याख्या करता है: जिसमें कार, बाइक, साइकिल, पैदल यात्री और साइकिल चालक शामिल हैं, जिससे दृश्य में वस्तुओं का अध्ययन किया जा सकता है।संपर्क
CVवीडियोस्टैनफोर्ड यूनिवर्सिटी, संयुक्त राज्य अमेरिका द्वारा स्टैनफोर्ड ट्रैकमोटर वाहनऑब्जेक्ट डिटेक्शन/वर्गीकरण LiDAR, जीपीएस, कोडएक डेटासेट जिसमें 14,000 लेबल वाले ऑब्जेक्ट ट्रैक शामिल हैं, जैसा कि प्राकृतिक सड़क दृश्यों में वेलोडाइन एचडीएल-64ई एस2 लिडार द्वारा देखा गया है, जिसका उपयोग 3डी ऑब्जेक्ट रिकग्निशन के लिए मशीन लर्निंग मॉडल को प्रशिक्षित करने के लिए किया जा सकता है।संपर्क
CVवीडियो, छविबॉश, संयुक्त राज्य अमेरिका द्वारा बॉक्सी डेटासेटमोटर वाहनबाउंडिंग बॉक्स/वाहन का पता लगानाएक वाहन पहचान डेटा सेट जिसमें मोटरवे पर स्व-ड्राइविंग कारों के लिए ऑब्जेक्ट पहचान रणनीतियों के प्रशिक्षण और विश्लेषण के लिए 2 मिलियन एनोटेटेड वाहन शामिल हैं।संपर्क
CVवीडियोटीएमई मोटरवे, चेक टेक्निकल यूनिवर्सिटी, उत्तरी इटली द्वारामोटर वाहनआकार निर्धारक बॉक्सकुल 28 मिनट के लिए 27 क्लिप का एक डेटासेट 30,000+ वाहन एनोटेशन फ्रेम में विभाजित किया गया। लेजर स्कैनर से डेटा का उपयोग करके एनोटेशन अर्ध-स्वचालित रूप से तैयार किया गया था। इस डेटा संग्रह में परिवर्तनशील यातायात परिदृश्य, लेन की संख्या, सड़क की वक्रता और रोशनी शामिल है, जिसमें पूर्ण अधिग्रहण की अधिकांश शर्तें शामिल हैं।संपर्क
CVवीडियोबॉश, संयुक्त राज्य अमेरिका द्वारा अनसुपरवाइज्ड लामासमोटर वाहनलेन मार्किंग, LiDARअनसुपरवाइज्ड लामास डेटासेट को लिडार-आधारित लेन मार्करों सहित उच्च-परिभाषा स्वचालित ड्राइविंग मानचित्र तैयार करके एनोटेट किया गया था। स्वायत्त वाहन को इन मानचित्रों के अनुरूप संरेखित किया जा सकता है और लेन चिह्नों को कैमरे के फ्रेम में प्रक्षेपित किया जा सकता है। 3डी प्रक्षेपण को पहले से देखे गए और अनुमानित छवि मार्करों के बीच विसंगति को कम करके अनुकूलित किया गया है।संपर्क
एनएलपीऑडियोफेसबुक एआई बहुभाषी लिब्रिस्पीच (एमएलएस)सामान्य जानकारीऑडियो एनोटेशन / वाक् पहचानFacebook AI बहुभाषी LibriSpeech (MLS), एक बड़े पैमाने पर, खुला स्रोत डेटा सेट है जिसे स्वचालित वाक् पहचान (ASR) में उन्नत अनुसंधान में मदद करने के लिए डिज़ाइन किया गया है। एमएलएस 50,000 भाषाओं में 8 घंटे से अधिक ऑडियो प्रदान करता है: अंग्रेजी, जर्मन, डच, फ्रेंच, स्पेनिश, इतालवी, पुर्तगाली और पोलिश। संपर्क