चीनी अंग्रेजी डेटासेट
यह एक अच्छा विचार है
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला चीनी अंग्रेजी कॉल-सेंटर और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
चीनी अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर
विवरण
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
169
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
चीन
भाषा
चीनी अंग्रेजी
लिंग
महिला 1790, पुरुष 523, अज्ञात 13
बोलने वालों की संख्या
2,326
आयु
18-50
अवलोकन
शीर्षक
चीनी अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
249
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
चीन
भाषा
चीनी अंग्रेजी
लिंग
महिला 126, पुरुष 346, अज्ञात 6
बोलने वालों की संख्या
478
आयु
18-50
अवलोकन
शीर्षक
वुहान भाषा डेटासेट
डेटासेट प्रकार
सहज संवाद
कुल घंटे
500
नमूना दर
16 kHz
चैनीस भाषा डेटासेट
टीटीएस
300
16 kHz
होक्किएनी भाषा डेटासेट
सहज संवाद
100
16 kHz
शंघाई भाषा डेटासेट
सहज संवाद
500
16 kHz
सिचुआन भाषा डेटासेट
सहज संवाद
500
16 kHz
अंग्रेज़ी (चीनी) भाषा डेटासेट
स्क्रिप्टेड स्वतःस्फूर्त
2,000
16 kHz
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें