स्वाहिली डेटासेट
हिफाधिदाता या किस्विली
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला स्वाहिली कॉल-सेंटर और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
स्वाहिली भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर
विवरण
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
230
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
स्वाहिली
भाषा
स्वाहिली
लिंग
महिला 611, पुरुष 833, अज्ञात 0
बोलने वालों की संख्या
1,444
आयु
18-50
अवलोकन
शीर्षक
स्वाहिली भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
265
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
स्वाहिली
भाषा
स्वाहिली
लिंग
महिला 118, पुरुष 493, अज्ञात 25
बोलने वालों की संख्या
636
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें