चीनी डेटासेट
यह वास्तव में महत्वपूर्ण है
AI और स्पीच मॉडल के लिए उच्च-गुणवत्ता वाला चीनी डेटासेट
अवलोकन
शीर्षक (भाषा)
चीनी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर, संगीत, स्क्रिप्टेड मोनोलॉग, मीडिया डेटा (पॉडकास्ट डेटा)
देश
चीन
विवरण
इस डेटासेट में अनस्क्रिप्टेड सिंथेटिक एजेंट-ग्राहक टेलीफोनिक वार्तालाप (5-15 मिनट), प्राकृतिक मानव-से-मानव टेलीफोनिक वार्तालाप (15-60 मिनट), और ट्रांसक्रिप्शन के साथ गायन ऑडियो शामिल हैं, जो भाषण और भाषा प्रौद्योगिकियों के प्रशिक्षण और मूल्यांकन के लिए विविध भाषण डेटा प्रदान करते हैं।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
| भाषा | डेटासेट प्रकार | नमूना दर | वक्ता | चैनल | कुल घंटे | वक्ताओं की कुल संख्या |
|---|---|---|---|---|---|---|
| चीनी गायन | संगीत | 48 kHz | सिंगल स्पीकर | मोनो | 06:11:32 | 10 |
| चीनी पारंपरिक) | स्क्रिप्टेड मोनोलॉग | 48 kHz | सिंगल स्पीकर | मोनो | 1,499:00:00 | 1,805 |
| चीनी उच्चारण वाली अंग्रेजी | मीडिया डेटा | 16 kHz | एकाधिक वक्ता | मोनो | 306:04:58 | 2,130 |
| चीनी सरलीकृत | स्क्रिप्टेड मोनोलॉग | 48 kHz | सिंगल स्पीकर | मोनो | 2,761:00:00 | 3,725 |
| चीनी अमेरिकी उच्चारण वाली अंग्रेजी | कॉल सेंटर | 8 kHz | 2 वक्ताओं | दोहरी | 152:18:33 | 2,058 |
| चीनी अमेरिकी उच्चारण वाली अंग्रेजी | मीडिया डेटा | 16 kHz | एकाधिक वक्ता | मोनो | 245:55:15 | 468 |
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें