हिंदी डेटासेट
हिंदी डेटासेट
अवलोकन
शीर्षक
हिंदी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
Description
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
40
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडिया
भाषा
हिंदी
लिंग
महिला 30, पुरुष 49, अज्ञात 0
बोलने वालों की संख्या
79
आयु
18-50
अवलोकन
शीर्षक
हिंदी भाषा डेटासेट
डेटासेट प्रकार
मीडिया ऑडियो
Description
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
219
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडिया
भाषा
हिंदी
लिंग
महिला 83, पुरुष 309, अज्ञात 0
बोलने वालों की संख्या
392
आयु
18-50
अवलोकन
शीर्षक
हिंदी भाषा डेटासेट
डेटासेट प्रकार
टीटीएस
Description
एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की श्रेणी में आती हैं।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
2,867
नमूना दर
48 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडिया
भाषा
हिंदी
लिंग
महिला 1977, पुरुष 1864, अज्ञात 147
बोलने वालों की संख्या
3,988
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें