ऑप्टिकल कैरेक्टर रिकग्निशन के उपयोग में वृद्धि को मुख्य रूप से स्वचालित पहचान प्रणालियों के उत्पादन में वृद्धि के लिए जिम्मेदार ठहराया जा सकता है। परिणामस्वरूप, OCR प्रौद्योगिकी का वैश्विक बाजार मूल्य आंका गया 8.93 $ अरब 2021 में, 15.4 और 2022 के बीच 2030% की सीएजीआर से बढ़ने की भविष्यवाणी की गई है।
लेकिन ओसीआर तकनीक वास्तव में क्या है? और कुशल एआई मॉडल विकसित करने वाले व्यवसायों के लिए यह गेम चेंजर क्यों है? चलो पता करते हैं।
OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) क्या है?
OCR एक ऐसी तकनीक है जो विभिन्न प्रकार के दस्तावेज़ों, जैसे स्कैन किए गए कागज़ी दस्तावेज़, PDF या टेक्स्ट की छवियों को संपादन योग्य और खोज योग्य डेटा में परिवर्तित करती है। यह इस प्रकार काम करता है:
- किसी छवि में पाठ की संरचना का विश्लेषण करना
- पाठ को पंक्तियों और वर्णों में विभाजित करना
- इन दृश्य वर्णों को मशीन-पठनीय पाठ में परिवर्तित करना
सामान्य उपयोगों में शामिल हैं:
- स्कैन किए गए दस्तावेज़ों को संपादन योग्य टेक्स्ट फ़ाइलों में परिवर्तित करना
- मुद्रित पुस्तकों का डिजिटलीकरण
- फ़ोटो से पाठ निकालना
- हस्तलिखित नुस्खों को डिजिटल पाठ में परिवर्तित करना
- लाइसेंस प्लेट मान्यता
ओपन-सोर्स डेटासेट के लाभ और चुनौतियाँ
व्यवसायों को यह समझने के लिए लाभ और चुनौतियों को एक-दूसरे के खिलाफ खड़ा करने की आवश्यकता है कि क्या उन्हें अपने एमएल अनुप्रयोगों के लिए फ्री-टू-यूज़ डेटा का विकल्प चुनना चाहिए।
लाभ
- एक्सेस करने के लिए डेटा आसानी से उपलब्ध है। डेटा उपलब्धता के कारण, एप्लिकेशन को विकसित करने की लागत काफी कम हो जाती है।
- एप्लिकेशन के लिए डेटा एकत्र करने में लगने वाला समय और प्रयास काफी कम हो जाता है क्योंकि डेटासेट आसानी से उपलब्ध होता है।
- सामुदायिक मंचों या सहायता समूहों की बहुतायत है जो डेटासेट को सीखने, अनुकूलित करने और अनुकूलित करने में मदद करते हैं।
- ओपन-सोर्स डेटासेट के प्रमुख लाभों में से एक यह है कि यह अनुकूलन पर कोई प्रतिबंध नहीं लगाता है।
- ओपन-सोर्स डेटा आबादी के एक बड़े हिस्से के लिए सुलभ है, जो मौद्रिक बाधाओं के बिना विश्लेषण और नवाचार को संभव बनाता है।
चुनौतियां
- परियोजना के लिए विशिष्ट डेटा प्राप्त करना मुश्किल है। इसके अतिरिक्त, लापता जानकारी और उपलब्ध डेटा के गलत उपयोग की संभावना है।
- मालिकाना डेटा प्राप्त करने में समय और प्रयास लगता है और यह महंगा है
- हालांकि डेटा प्राप्त करना आसान हो सकता है, ज्ञान और विश्लेषण लागत प्रारंभिक लाभ से अधिक हो सकती है।
- अन्य डेवलपर भी एप्लिकेशन विकसित करने के लिए उसी डेटा का उपयोग करते हैं।
- ये डेटासेट सुरक्षा उल्लंघनों, गोपनीयता और सहमति के लिए अत्यधिक संवेदनशील हैं।
मशीन सीखने के लिए 22 सर्वश्रेष्ठ लिखावट और ओसीआर डेटासेट
टेक्स्ट रिकग्निशन एप्लिकेशन डेवलपमेंट के लिए कई ओपन-सोर्स डेटासेट उपलब्ध हैं। सर्वश्रेष्ठ 22 में से कुछ हैं
एनआईएसटी डाटाबेस
एनआईएसटी या नेशनल इंस्टीट्यूट ऑफ साइंस 3600 से अधिक चरित्र छवियों के साथ 810,000 से अधिक हस्तलेखन नमूनों का उपयोग-में-मुक्त संग्रह प्रदान करता है।
एमएनआईएसटी डेटाबेस
NSIT के विशेष डेटाबेस 1 और 3 से व्युत्पन्न, MNIST डेटाबेस प्रशिक्षण सेट के लिए 60,000 हस्तलिखित संख्याओं और परीक्षण सेट के लिए 10,000 उदाहरणों का संकलित संग्रह है। यह ओपन-सोर्स डेटाबेस प्री-प्रोसेसिंग पर कम समय खर्च करते हुए ट्रेन मॉडल को पैटर्न पहचानने में मदद करता है।
पाठ का पता लगाना
एक ओपन-सोर्स डेटाबेस, टेक्स्ट डिटेक्शन डेटासेट में साइनबोर्ड्स, डोर प्लेट्स, सावधानी प्लेट्स और अन्य की लगभग 500 इनडोर और आउटडोर छवियां होती हैं।
स्टैनफोर्ड ओसीआर
स्टैनफोर्ड द्वारा प्रकाशित, यह फ्री-टू-यूज़ डेटासेट एमआईटी स्पोकन लैंग्वेज सिस्टम्स ग्रुप द्वारा हस्तलिखित शब्द संग्रह है।
सड़क दृश्य पाठ
Google स्ट्रीट व्यू छवियों से एकत्रित, इस डेटासेट में मुख्य रूप से बोर्डों और सड़क-स्तर के संकेतों के टेक्स्ट डिटेक्शन छवियां हैं।
दस्तावेज़ डेटाबेस
दस्तावेज़ डेटाबेस 941 हस्तलिखित दस्तावेज़ों का एक संग्रह है, जिसमें 189 लेखकों के टेबल, सूत्र, चित्र, आरेख, सूचियाँ और बहुत कुछ शामिल हैं।
गणित की अभिव्यक्तियाँ
गणित अभिव्यक्ति एक डेटाबेस है जिसमें 101 गणितीय प्रतीक और 10,000 अभिव्यक्तियाँ हैं।
स्ट्रीट व्यू हाउस नंबर
Google स्ट्रीट व्यू से प्राप्त, यह स्ट्रीट व्यू हाउस नंबर एक डेटाबेस है जिसमें 73257 स्ट्रीट हाउस नंबर अंक हैं।
प्राकृतिक पर्यावरण ओसीआर
प्राकृतिक पर्यावरण OCR, दुनिया भर में लगभग 660 छवियों और 5238 टेक्स्ट एनोटेशन का डेटासेट है।
गणित की अभिव्यक्तियाँ
10,000+ गणितीय प्रतीकों के साथ 101 से अधिक अभिव्यक्तियाँ।
हस्तलिखित चीनी अक्षर
909,818 हस्तलिखित चीनी अक्षर चित्रों का डेटासेट, जो लगभग 10 समाचार लेखों के बराबर है।
अरबी मुद्रित पाठ
113,284 अरबी फ़ॉन्टों का उपयोग करके 10 शब्दों का शब्दकोश।
हस्तलिखित अंग्रेजी पाठ
1700 से अधिक प्रविष्टियों के साथ एक व्हाइटबोर्ड पर हस्तलिखित अंग्रेजी पाठ।
3000 वातावरण छवियाँ
विभिन्न प्रकाश व्यवस्था के तहत बाहरी और भीतरी दृश्यों सहित विभिन्न वातावरणों से 3000 छवियां।
Chars74K डेटा
अंग्रेजी और कन्नड़ अंकों की 74,000 छवियां।
आईएएम (आईएएम हस्तलेखन)
आईएएम डाटाबेस में ब्रिटिश इंग्लिश के लैंकेस्टर-ओस्लो/बर्गन कॉर्पस के 13,353 लेखकों द्वारा 657 हस्तलिखित पाठ चित्र हैं।
FUNSD (शोर वाले स्कैन किए गए दस्तावेज़ों में फ़ॉर्म समझना)
FUNSD में 199 एनोटेट, स्कैन किए गए फॉर्म शामिल हैं, जिनमें विविधता है और जो फॉर्म को समझने में चुनौतीपूर्ण हैं।
पाठ ओसीआर
TextOCR प्राकृतिक छवियों में मनमाने आकार के दृश्य-पाठ पर पाठ पहचान का मानकीकरण करता है।
ट्विटर 100k
ट्विटर100k कमजोर पर्यवेक्षित क्रॉस-मीडिया पुनर्प्राप्ति के लिए एक बड़ा डेटासेट है।
SSIG-SegPlate – लाइसेंस प्लेट कैरेक्टर सेगमेंटेशन (LPCS)
यह डेटासेट 101 दिन के वाहन चित्रों के साथ लाइसेंस प्लेट कैरेक्टर सेगमेंटेशन (एलपीसीएस) का मूल्यांकन करता है।
105,941 छवियाँ प्राकृतिक दृश्य 12 भाषाओं का OCR डेटा
डेटा में 12 भाषाएँ (6 एशियाई, 6 यूरोपीय) और विभिन्न प्राकृतिक दृश्य और कोण शामिल हैं। इसमें लाइन-लेवल बाउंडिंग बॉक्स और टेक्स्ट ट्रांसक्रिप्शन की सुविधा है। यह बहु-भाषा OCR कार्यों के लिए उपयोगी है।
भारतीय साइनबोर्ड छवि डेटासेट
डेटासेट में वर्गीकरण और पहचान के लिए भारतीय यातायात संकेतों के चित्र हैं, जो दिन, शाम और रात के दौरान विभिन्न मौसम स्थितियों में लिए गए हैं।
टेक्स्ट डिटेक्शन एप्लिकेशन के लिए एमएल मॉडल के प्रशिक्षण के लिए ये कुछ शीर्ष ओपन-सोर्स डेटासेट थे। आपके व्यवसाय और एप्लिकेशन आवश्यकताओं के अनुरूप एक का चयन करने में समय और मेहनत लग सकती है। हालाँकि, आपको उपयुक्त डेटासेट पर निर्णय लेने से पहले इन डेटासेट के साथ प्रयोग करना चाहिए।
[ये भी पढ़ें: ओसीआर इन्फोग्राफिक – परिभाषा, लाभ, चुनौतियाँ और उपयोग के मामले]
विश्वसनीय और कुशल टेक्स्ट डिटेक्शन एप्लिकेशन की ओर बढ़ने में आपकी मदद करने के लिए शैप - उच्च रैंकिंग प्रौद्योगिकी समाधान प्रदाता है। हम विभिन्न क्लाइंट प्रोजेक्ट्स के लिए अनुकूलन योग्य, अनुकूलित और कुशल OCR प्रशिक्षण डेटासेट बनाने के लिए अपने तकनीकी अनुभव का लाभ उठाते हैं। हमारी क्षमताओं को पूरी तरह से समझने के लिए, आज ही हमसे संपर्क करें।