तेलुगु डेटासेट
తెలుగు डడేటాసెట్
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला तेलुगु सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
तेलुगु भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
553
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडिया
भाषा
तेलुगु
लिंग
महिला 574, पुरुष 564, अज्ञात 0
बोलने वालों की संख्या
1,138
आयु
18-50
अवलोकन
शीर्षक
तेलुगु भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
648
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडिया
भाषा
तेलुगु
लिंग
महिला 207, पुरुष 963, अज्ञात 2
बोलने वालों की संख्या
1,172
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें