बैंक चेक डेटासेट (दस्तावेज़ एआई)
उदाहरण: ओसीआर
प्रारूप: Jpg.
गणना: 2023
एनोटेशन: नहीं
विवरण: बैंक चेक डेटासेट (दस्तावेज़ AI): सिंथेटिक बैंक चेक में कृत्रिम रूप से तैयार की गई चेक छवियाँ होती हैं, जिन्हें वास्तविक चेक की उपस्थिति और सामग्री को दोहराने के लिए डिज़ाइन किया गया है। इसमें भुगतानकर्ता के नाम, राशि, तिथियाँ, हस्ताक्षर और चेक नंबर जैसे विभिन्न तत्व शामिल हैं। इस डेटासेट का उपयोग ऑप्टिकल कैरेक्टर रिकग्निशन (OCR), चेक प्रोसेसिंग और स्वचालित डेटा निष्कर्षण जैसे कार्यों में दस्तावेज़ AI सिस्टम को प्रशिक्षित करने और उनका मूल्यांकन करने के लिए किया जाता है, जो वास्तविक चेक की गोपनीयता संबंधी चिंताओं के बिना मॉडल विकास के लिए एक नियंत्रित वातावरण प्रदान करता है।
रिकॉर्डिंग की स्थिति: - क्लिक की गई छवियां - स्कैन की गई - वेब स्क्रेपर
बैंक स्टेटमेंट डेटासेट (दस्तावेज़ एआई)
उदाहरण: ओसीआर
प्रारूप: .जेपीजी, पीएनजी
गणना: 5366
एनोटेशन: नहीं
विवरण: बैंक स्टेटमेंट डेटासेट (डॉक्यूमेंट AI): सिंथेटिक बैंक स्टेटमेंट में वास्तविक वित्तीय दस्तावेजों का अनुकरण करने के लिए डिज़ाइन किए गए कृत्रिम रूप से तैयार किए गए बैंक स्टेटमेंट शामिल हैं। इसमें विभिन्न लेन-देन रिकॉर्ड, तिथियां, राशि और खाता विवरण शामिल हैं, जो वास्तविक दुनिया के प्रारूपों और सामग्री को प्रतिबिंबित करने के लिए संरचित हैं। इस डेटासेट का उपयोग ऑप्टिकल कैरेक्टर रिकग्निशन (OCR), डेटा निष्कर्षण और दस्तावेज़ विश्लेषण जैसे कार्यों में दस्तावेज़ AI सिस्टम को प्रशिक्षित करने और मूल्यांकन करने के लिए किया जाता है, जो वास्तविक वित्तीय डेटा की गोपनीयता समस्याओं के बिना एक नियंत्रित वातावरण प्रदान करता है।
रिकॉर्डिंग की स्थिति: - स्कैन किया गया - Bank_Statement - वेब स्क्रैपर
चीनी बिल डेटासेट
उदाहरण: ओसीआर
प्रारूप: छवि
गणना: 6k
एनोटेशन: हाँ
विवरण: चीनी बिल डेटासेट में चीनी भाषा में लिखे गए विभिन्न प्रकार के बिलों, जैसे चालान, रसीदें और विवरण के चित्र या पाठ नमूने शामिल हैं। इसमें आइटम विवरण, राशि और तिथियों सहित विविध प्रारूप और सामग्री शामिल है। इस डेटासेट का उपयोग ऑप्टिकल कैरेक्टर रिकग्निशन (OCR), वित्तीय दस्तावेज़ प्रसंस्करण और स्वचालित डेटा निष्कर्षण जैसे कार्यों के लिए किया जाता है।
दस्तावेज़ / ओसीआर - अरबी और अंग्रेजी ओसीआर सामग्री डेटासेट
उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 1,321
एनोटेशन: नहीं
विवरण: अरबी और अंग्रेजी सामग्री छवि संग्रह: OCR के लिए छवि + एनोटेशन
दस्तावेज़ / ओसीआर - बारकोड वीडियो डेटासेट

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: वीडियो
गणना: 2,767
एनोटेशन: नहीं
विवरण: बारकोड वीडियो (कोड128, UPC/EAN, PDF417, एज़्टेक, मल्टी-कोड)
दस्तावेज़ / ओसीआर - घुमावदार मुद्रित पाठ डेटासेट

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 18,986
एनोटेशन: नहीं
विवरण: घुमावदार मुद्रित पाठ: घुमावदार पाठ या अरैखिक आधार रेखा वाले पाठ वाली छवियां एकत्रित करें
दस्तावेज़ / ओसीआर - वित्तीय दस्तावेज़ (बैंक, वेतन पर्ची, कर, यूएस)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 26,446
एनोटेशन: नहीं
विवरण: वित्तीय दस्तावेज़: बैंक स्टेटमेंट, चेक, वेतन पर्ची, कर, बंधक, बीमा दावे (अमेरिका)
दस्तावेज़ / ओसीआर - वित्तीय दस्तावेज़ (चरण 1 - बंधक)
उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 9,192
एनोटेशन: नहीं
विवरण: वित्तीय दस्तावेज़ (चरण 1) बंधक डेटासेट - प्रिंट, स्कैन, फोटोग्राफ
दस्तावेज़ / ओसीआर - वित्तीय दस्तावेज़ (चरण 2 - बीमा)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 7,636
एनोटेशन: नहीं
विवरण: वित्तीय दस्तावेज़ (चरण 2) बीमा डेटासेट - प्रिंट, स्कैन, फोटोग्राफ
दस्तावेज़ / ओसीआर - हस्तलिखित पाठ डेटासेट (जेपी/केआर/आरयू)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 106,313
एनोटेशन: नहीं
विवरण: हस्तलिखित पाठ: हस्तलिखित पाठ के साथ लाइवफ़ोटो (जापानी, कोरियाई, रूसी)
दस्तावेज़ / ओसीआर - बाउंडिंग बॉक्स एनोटेशन के साथ इनवॉइस डेटासेट

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 87
एनोटेशन: हाँ
विवरण: बाउंडिंग बॉक्स एनोटेशन के साथ इनवॉइस डेटासेट में स्कैन किए गए या डिजिटल इनवॉइस शामिल होते हैं, जहां इनवॉइस नंबर, दिनांक, विक्रेता विवरण, लाइन आइटम और कुल राशि जैसे प्रमुख फ़ील्ड बाउंडिंग बॉक्स के साथ लेबल किए जाते हैं, जिससे एआई मॉडल असंरचित दस्तावेजों से संरचित जानकारी का सटीक रूप से पता लगाने और निकालने में सक्षम होते हैं।
दस्तावेज़ / OCR – मुद्रित पाठ के साथ लाइव फ़ोटो (JP/KR/RU)
उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 4,944
एनोटेशन: नहीं
विवरण: मुद्रित पाठ के साथ लाइव फ़ोटो (जापानी, कोरियाई, रूसी)
दस्तावेज़ / ओसीआर - बहुभाषी रसीदें/चालान डेटासेट

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 8,961
एनोटेशन: नहीं
विवरण: बहुभाषी रसीदें और चालान डेटासेट में कई भाषाओं में विविध वित्तीय दस्तावेज शामिल होते हैं, जो एआई मॉडल को क्रॉस-लिंगुअल टेक्स्ट पहचान, प्रमुख फ़ील्ड निष्कर्षण और दस्तावेज़ समझ के लिए प्रशिक्षित करने में सक्षम बनाता है।
दस्तावेज़ / ओसीआर - सिंथेटिक बैंक स्टेटमेंट (40 टेम्पलेट)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 1,290
एनोटेशन: नहीं
विवरण: बैंक स्टेटमेंट - अद्वितीय टेम्पलेट - 40: सिंथेटिक बैंक स्टेटमेंट
दस्तावेज़ / ओसीआर - सिंथेटिक वेतन पर्चियां (60 टेम्पलेट)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 2,010
एनोटेशन: नहीं
विवरण: चेक - अद्वितीय टेम्पलेट - 60: सिंथेटिक वेतन पर्चियां
दस्तावेज़ / ओसीआर - सिंथेटिक पेस्लिप्स (130 टेम्पलेट्स)

उदाहरण: दस्तावेज़ / ओसीआर
प्रारूप: छावियां
गणना: 2,023
एनोटेशन: नहीं
विवरण: पेस्लिप्स - अद्वितीय टेम्पलेट - 130: सिंथेटिक बैंक चेक
भुगतान पर्ची डेटासेट (दस्तावेज़ एआई)

उदाहरण: ओसीआर
प्रारूप: Jpg.
गणना: 2010
एनोटेशन: नहीं
विवरण: पे स्लिप डेटासेट (डॉक्यूमेंट एआई): सिंथेटिक पे स्लिप में बिना किसी एनोटेशन के कृत्रिम रूप से तैयार की गई पे स्लिप की छवियां शामिल हैं। इसमें विभिन्न पे स्लिप प्रारूप और विवरण जैसे कि कर्मचारी के नाम, वेतन और तिथियां शामिल हैं, जिनका उपयोग OCR और दस्तावेज़ प्रसंस्करण जैसे कार्यों में डॉक्यूमेंट एआई सिस्टम के प्रशिक्षण और परीक्षण के लिए किया जाता है।
रिकॉर्डिंग की स्थिति: - स्कैन किया गया - वेब स्क्रेपर

