परिभाषा
टेक्स्ट पहचान से तात्पर्य छवियों या स्कैन किए गए दस्तावेज़ों में टेक्स्ट अक्षरों की पहचान से है। इसमें मुद्रित और हस्तलिखित पहचान शामिल है।
उद्देश्य
इसका उद्देश्य दृश्य प्रारूप में पाठ को सुलभ और खोज योग्य बनाना है।
महत्व
- अभिलेखागारों के डिजिटलीकरण को सक्षम बनाता है।
- सुगम्यता और स्वचालन के लिए महत्वपूर्ण।
- सटीकता छवि गुणवत्ता पर निर्भर करती है।
- ओसीआर प्रौद्योगिकियों से संबंधित।
यह कैसे काम करता है:
- स्कैन किए गए या फोटो खींचे गए दस्तावेज़ों को कैप्चर करें।
- स्पष्टता में सुधार के लिए छवियों को पूर्व-संसाधित करें।
- पाठ क्षेत्रों का पता लगाएं.
- मान्यता मॉडल लागू करें.
- मशीन-पठनीय पाठ आउटपुट करें.
उदाहरण (वास्तविक दुनिया)
- गूगल लेंस: फ़ोटो में टेक्स्ट पहचानता है.
- ABBYY FineReader: स्कैन किए गए दस्तावेज़ों को डिजिटल बनाता है।
- टेसेरैक्ट ओसीआर: ओपन-सोर्स टेक्स्ट रिकग्निशन इंजन।
संदर्भ / आगे पढ़ने के लिए
- स्मिथ, आर. “टेसेरैक्ट ओसीआर इंजन का अवलोकन।” आईसीडीएआर।
- आईएसओ/आईईसी 15938-4 मानक.
- पैटर्न एनालिसिस और मशीन इंटेलिजेंस पर आईईईई लेनदेन।