Computer Vision

कंप्यूटर विज़न के लिए 22+ सर्वाधिक मांगे गए ओपन-सोर्स डेटासेट

एक एआई एल्गोरिदम केवल उतना ही अच्छा है जितना डेटा आप इसे खिलाते हैं।

यह न तो साहसिक है और न ही अपरंपरागत बयान। एआई कुछ दशक पहले दूर की कौड़ी लग सकता था, लेकिन तब से आर्टिफिशियल इंटेलिजेंस और मशीन लर्निंग ने वास्तव में एक लंबा सफर तय किया है।

कंप्यूटर दृष्टि कंप्यूटर को लेबल और छवियों को समझने और व्याख्या करने में सहायता करता है। जब आप अपने कंप्यूटर को सही प्रकार की छवियों का उपयोग करके प्रशिक्षित करते हैं, तो यह चेहरे की विभिन्न विशेषताओं का पता लगाने, समझने और पहचानने, बीमारियों का पता लगाने, स्वायत्त वाहन चलाने और बहु-आयामी अंग स्कैनिंग का उपयोग करके जीवन बचाने की क्षमता प्राप्त कर सकता है।

कंप्यूटर विजन मार्केट तक पहुंचने की उम्मीद है $ 144.46 बिलियन 2028 तक 7.04 में मामूली $2020 बिलियन से, 45.64 और 2021 के बीच 2028% के सीएजीआर से बढ़ रहा है।

कंप्यूटर दृष्टि के कुछ उपयोग मामले हैं:

  • चिकित्सा इमेजिंग
  • स्वायत्त वाहन
  • चेहरे और वस्तु की पहचान
  • दोष पहचान
  • दृश्य का पता लगाना

RSI छवि डेटासेट आप अपने मशीन लर्निंग को खिला रहे हैं और प्रशिक्षण दे रहे हैं और कंप्यूटर विज़न कार्य आपके AI प्रोजेक्ट की सफलता के लिए महत्वपूर्ण हैं। एक गुणवत्ता डेटासेट प्राप्त करना काफी कठिन है। आपके प्रोजेक्ट की जटिलता के आधार पर, कंप्यूटर विज़न उद्देश्यों के लिए विश्वसनीय और प्रासंगिक डेटासेट प्राप्त करने में कुछ दिनों से लेकर कुछ सप्ताह तक का समय लग सकता है।

यहां, हम आपको ओपन-सोर्स डेटासेट की एक श्रेणी (आपकी आसानी के लिए वर्गीकृत) प्रदान करते हैं जिसका आप तुरंत उपयोग कर सकते हैं।

कंप्यूटर विजन डेटासेट की व्यापक सूची

सामान्य:

  1. IMAGEnet (संपर्क)

    ImageNet एक व्यापक रूप से उपयोग किया जाने वाला डेटासेट है, और यह 1.2 श्रेणियों में वर्गीकृत 1000 मिलियन छवियों के साथ आता है। यह डेटासेट वर्ल्डनेट पदानुक्रम के अनुसार आयोजित किया जाता है और तीन भागों में वर्गीकृत किया जाता है - प्रशिक्षण डेटा, छवि लेबल और सत्यापन डेटा।

  2. काइनेटिक्स 700 (संपर्क)

    काइनेटिक्स 700 एक विशाल उच्च-गुणवत्ता वाला डेटासेट है जिसमें 650,000 विभिन्न मानव क्रिया वर्गों के 700 से अधिक क्लिप हैं। प्रत्येक क्लास एक्शन में लगभग 700 वीडियो क्लिप हैं। डेटासेट में क्लिप में मानव-वस्तु और मानव-मानव परस्पर क्रियाएं हैं, जो वीडियो में मानवीय क्रियाओं को पहचानने में काफी मददगार साबित हो रही हैं।

  3. सीआईएफएआर-10 (संपर्क)

    CIFAR 10 दस विभिन्न वर्गों का प्रतिनिधित्व करने वाली 60000 32 x 32 रंगीन छवियों का दावा करने वाले सबसे बड़े कंप्यूटर-विज़न डेटासेट में से एक है। प्रत्येक कक्षा में लगभग 6000 चित्र हैं जिनका उपयोग कंप्यूटर विज़न एल्गोरिदम और मशीन लर्निंग को प्रशिक्षित करने के लिए किया जाता है।

चेहरे की पहचान:

चेहरे की पहचान

  1. जंगल में लेबल वाले चेहरे (संपर्क)

    वाइल्ड में लेबल किया गया एक विशाल डेटासेट है जिसमें इंटरनेट से पता चला लगभग 13,230 लोगों की 5,750 से अधिक छवियां हैं। चेहरों के इस डेटासेट को अबाधित चेहरा पहचान का अध्ययन करना आसान बनाने के लिए डिज़ाइन किया गया है।

  2. कैसिया वेबफेस (संपर्क)

    CASIA वेब फेस एक अच्छी तरह से डिज़ाइन किया गया डेटासेट है जो बिना किसी बाधा के चेहरे की पहचान पर मशीन लर्निंग और वैज्ञानिक शोध में मदद करता है। लगभग 494,000 वास्तविक पहचान की 10,000 से अधिक छवियों के साथ, यह चेहरे की पहचान और सत्यापन कार्यों के लिए आदर्श है।

  3. यूएमडी फेस डेटासेट (संपर्क)

    UMD एक अच्छी तरह से एनोटेट किए गए डेटासेट का सामना करता है जिसमें दो भाग होते हैं - स्थिर चित्र और वीडियो फ़्रेम। डेटासेट में 367,800 से अधिक फेस एनोटेशन और विषयों के 3.7 मिलियन एनोटेट वीडियो फ्रेम हैं।

हस्तलिपि अभिज्ञान:

  1. एमएनआईएसटी डेटाबेस (संपर्क)

    MNIST एक डेटाबेस है जिसमें 0 से 9 तक हस्तलिखित अंकों के नमूने हैं, और इसमें 60,000 और 10,000 प्रशिक्षण और परीक्षण चित्र हैं। 1999 में जारी, MNIST ने डीप लर्निंग में इमेज प्रोसेसिंग सिस्टम का परीक्षण करना आसान बना दिया है।

  2. कृत्रिम वर्ण डेटासेट (संपर्क)

    कृत्रिम वर्ण डेटासेट, जैसा कि नाम से पता चलता है, कृत्रिम रूप से उत्पन्न डेटा है जो दस बड़े अक्षरों में अंग्रेजी भाषा की संरचना का वर्णन करता है। यह 6000 से अधिक छवियों के साथ आता है।

आइए आज आपकी एआई प्रशिक्षण डेटा आवश्यकता पर चर्चा करें।

वस्तु का पता लगाना:

  1. एमएस कोको (संपर्क)

    MS COCO या कॉमन ऑब्जेक्ट्स इन कॉन्टेक्स्ट एक ऑब्जेक्ट डिटेक्शन और कैप्शनिंग डेटासेट है।

    इसमें कीपॉइंट डिटेक्शन, मल्टी-ऑब्जेक्ट डिटेक्शन, कैप्शनिंग और सेगमेंटेशन मास्क एनोटेशन के साथ 328,000 से अधिक छवियां हैं। यह 80 वस्तु श्रेणियों और प्रति छवि पांच कैप्शन के साथ आता है।

  2. एलएसयूएन(संपर्क)

    एलएसयूएन, लार्ज-स्केल सीन अंडरस्टैंडिंग के लिए छोटा है, जिसमें 20 ऑब्जेक्ट और 10 दृश्य श्रेणियों में एक लाख से अधिक लेबल वाली छवियां हैं। कुछ श्रेणियों में करीब 300,000 छवियां हैं, जिनमें 300 छवियां विशेष रूप से सत्यापन के लिए और 1000 छवियां परीक्षण डेटा के लिए हैं।

  3. होम ऑब्जेक्ट्स(संपर्क)

    होम ऑब्जेक्ट्स डेटासेट में घर के आस-पास यादृच्छिक वस्तुओं की एनोटेट छवियां होती हैं - रसोईघर, रहने का कमरा और बाथरूम। इस डेटासेट में कुछ एनोटेट वीडियो और परीक्षण के लिए डिज़ाइन किए गए 398 अननोटेट फोटो भी हैं।

मोटर वाहन:

  1. सिटीस्केप डेटासेट (संपर्क)

    सिटीस्केप वह डेटासेट है जिस पर जाने के लिए कई साइट्स के सड़क दृश्यों से रिकॉर्ड किए गए विभिन्न वीडियो अनुक्रमों की तलाश की जाती है। इन छवियों को लंबे समय तक और अलग-अलग मौसम और प्रकाश स्थितियों में लिया गया था। एनोटेशन 30 वर्गों की छवियों के लिए हैं जिन्हें आठ अलग-अलग श्रेणियों में विभाजित किया गया है।

  2. बार्कले डीप ड्राइव (संपर्क)

    बार्कले डीपड्राइव विशेष रूप से स्वायत्त वाहन प्रशिक्षण के लिए डिज़ाइन किया गया है, और इसमें 100 हजार से अधिक एनोटेट वीडियो अनुक्रम हैं। यह बदलती सड़क और ड्राइविंग परिस्थितियों में स्वायत्त वाहनों के लिए सबसे उपयोगी प्रशिक्षण डेटा में से एक है।

  3. मेपिलरी (संपर्क)

    मैपिलरी के दुनिया भर में 750 मिलियन से अधिक सड़क दृश्य और यातायात संकेत हैं, जो मशीन सीखने और एआई एल्गोरिदम में दृश्य धारणा मॉडल को प्रशिक्षित करने में बहुत उपयोगी है। यह आपको स्वायत्त वाहन विकसित करने की अनुमति देता है जो विभिन्न प्रकाश व्यवस्था और मौसम की स्थिति और दृष्टिकोण को पूरा करता है।

चिकित्सीय इमेजिंग:

  1. कोविड-19 ओपन रिसर्च डेटासेट (संपर्क)

    इस मूल डेटासेट में AP/PA छाती के एक्स-रे के बारे में लगभग 6500 पिक्सेल-बहुभुज फेफड़े के विभाजन हैं। इसके अतिरिक्त, नाम, स्थान, प्रवेश विवरण, परिणाम, और अधिक वाले टैग के साथ कोविड-517 रोगी एक्स-रे की 19 छवियां उपलब्ध हैं।

  2. 100,000 चेस्ट एक्स-रे का एनआईएच डाटाबेस (संपर्क)

    NIH डेटाबेस सार्वजनिक रूप से उपलब्ध सबसे व्यापक डेटासेट में से एक है जिसमें 100,000 चेस्ट एक्स-रे इमेज और संबंधित डेटा वैज्ञानिक और अनुसंधान समुदाय के लिए उपयोगी है। इसमें उन्नत फेफड़े की स्थिति वाले रोगियों की छवियां भी हैं।

  3. डिजिटल पैथोलॉजी का एटलस (संपर्क)

    डिजिटल पैथोलॉजी का एटलस कई हिस्टोपैथोलॉजिकल पैच छवियां प्रदान करता है, कुल मिलाकर 17,000 से अधिक, विभिन्न अंगों की लगभग 100 एनोटेट स्लाइड्स से। यह डेटासेट कंप्यूटर विज़न और पैटर्न रिकग्निशन सॉफ़्टवेयर विकसित करने में उपयोगी है।

दृश्य पहचान:

दृश्य पहचान

  1. इनडोर दृश्य पहचान (संपर्क)

    इंडोर सीन रिकॉग्निशन एक उच्च श्रेणी का डेटासेट है जिसमें मशीन लर्निंग और डेटा ट्रेनिंग में इस्तेमाल होने वाली वस्तुओं और इनडोर दृश्यों की लगभग 15620 छवियां हैं। यह 65 से अधिक श्रेणियों के साथ आता है, और प्रत्येक श्रेणी में न्यूनतम 100 चित्र हैं।

  2. xदृश्य (संपर्क)

    सबसे प्रसिद्ध सार्वजनिक रूप से उपलब्ध डेटासेट में से एक के रूप में, xView में विभिन्न जटिल और बड़े दृश्यों से एनोटेटेड ओवरहेड इमेजरी शामिल है। लगभग 60 वर्ग और एक मिलियन से अधिक ऑब्जेक्ट इंस्टेंसेस होने के कारण, इस डेटासेट का उद्देश्य उपग्रह इमेजरी का उपयोग करके बेहतर आपदा राहत प्रदान करना है।

  3. गंतव्य (संपर्क)

    स्थान, एमआईटी द्वारा योगदान किए गए डेटासेट में 1.8 विभिन्न दृश्य श्रेणियों से 365 मिलियन से अधिक चित्र हैं। इनमें से प्रत्येक श्रेणी में सत्यापन के लिए लगभग 50 छवियां और परीक्षण के लिए 900 छवियां हैं। दृश्य पहचान या दृश्य पहचान कार्यों को स्थापित करने के लिए गहरे दृश्य सुविधाओं को सीखना संभव है।

मनोरंजन:

  1. आईएमडीबी विकी डेटासेट (संपर्क)

    आईएमडीबी - विकी उम्र, लिंग और नामों के साथ पर्याप्त रूप से लेबल किए गए चेहरों के सबसे लोकप्रिय सार्वजनिक डेटाबेसों में से एक है। इसमें सेलेब्रिटीज के करीब 20 हजार चेहरे और विकीपीडिया के 62 हजार चेहरे भी हैं।

  2. सेलेब चेहरे (संपर्क)

    सेलेब फ़ेस एक बड़े पैमाने का डेटाबेस है जिसमें मशहूर हस्तियों की 200,000 एनोटेट छवियां हैं। छवियां पृष्ठभूमि शोर और मुद्रा विविधताओं के साथ आती हैं, जो उन्हें कंप्यूटर दृष्टि कार्यों में प्रशिक्षण परीक्षण सेट के लिए मूल्यवान बनाती हैं। यह चेहरे की पहचान, संपादन, चेहरे के अंगों के स्थानीयकरण आदि में उच्च सटीकता प्राप्त करने के लिए बेहद फायदेमंद है।

अब जब आपके पास अपनी आर्टिफिशियल इंटेलिजेंस मशीनरी को ईंधन देने के लिए ओपन-सोर्स इमेज डेटासेट की एक विशाल सूची है। आपके एआई और मशीन लर्निंग मॉडल का परिणाम मुख्य रूप से आपके द्वारा फीड किए गए डेटासेट की गुणवत्ता पर निर्भर करता है और उन्हें प्रशिक्षित करता है। यदि आप चाहते हैं कि आपका AI मॉडल सटीक भविष्यवाणियां करे, तो इसके लिए गुणवत्ता वाले डेटासेट की आवश्यकता होती है, जो समग्र, टैग किए गए और पूर्णता के लिए लेबल किए गए हों। अपने कंप्यूटर विज़न सिस्टम की सफलता को बढ़ाने के लिए, आपको अपने प्रोजेक्ट विज़न के लिए प्रासंगिक गुणवत्ता वाले इमेज डेटाबेस का उपयोग करना चाहिए। यदि आप ऐसे और डेटासेट की तलाश कर रहे हैं यहाँ क्लिक करें

सामाजिक शेयर

आपको यह भी पसंद आ सकता हैं