कोरियाई डेटासेट
यह एक अच्छा विचार है
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला कोरियाई कॉल-सेंटर, TTS और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
कोरियाई भाषा
डेटासेट
डेटासेट प्रकार
कॉल सेंटर
विवरण
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
107
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
कोरियाई
भाषा
कोरियाई
लिंग
महिला 1086, पुरुष 210, अज्ञात 4
बोलने वालों की संख्या
1,300
आयु
18-50
अवलोकन
शीर्षक
कोरियाई भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
204
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
कोरियाई
भाषा
कोरियाई
लिंग
महिला 70, पुरुष 303, अज्ञात 25
बोलने वालों की संख्या
398
आयु
18-50
अवलोकन
शीर्षक
कोरियाई भाषा डेटासेट
डेटासेट प्रकार
टीटीएस
विवरण
एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की श्रेणी में आती हैं।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
1,955
नमूना दर
48 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
कोरियाई
भाषा
कोरियाई
लिंग
महिला 1195, पुरुष 1134, अज्ञात 122
बोलने वालों की संख्या
2,351
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें