न्यूयॉर्क अंग्रेजी डेटासेट
अवलोकन
शीर्षक
न्यूयॉर्क अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर
वाम चैनल
सही चैनल
Description
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
103
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
अमेरिका
भाषा
न्यूयॉर्क अंग्रेजी
लिंग
महिला 610, पुरुष 532, अज्ञात 0
बोलने वालों की संख्या
1,142
आयु
18-50
अवलोकन
शीर्षक
न्यूयॉर्क अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
वाम चैनल
सही चैनल
Description
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
107
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
अमेरिका
भाषा
न्यूयॉर्क अंग्रेजी
लिंग
महिला 118, पुरुष 114, अज्ञात 0
बोलने वालों की संख्या
232
आयु
18-50
अवलोकन
Description
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
140
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
अमेरिका
भाषा
न्यूयॉर्क अंग्रेजी
लिंग
महिला 66, पुरुष 230, अज्ञात 11
बोलने वालों की संख्या
307
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें