बोस्टन अंग्रेजी डेटासेट
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला बोस्टन इंग्लिश कॉल-सेंटर, सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
बोस्टन अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर
विवरण
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
177
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
बोस्टन अंग्रेजी
भाषा
बोस्टन अंग्रेजी
लिंग
महिला: 605, पुरुष: 711, और अज्ञात: 0
बोलने वालों की संख्या
2,632
आयु
18-50
अवलोकन
शीर्षक
बोस्टन अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
32
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
बोस्टन अंग्रेजी
भाषा
बोस्टन अंग्रेजी
लिंग
महिला: 53, पुरुष: 83, और अज्ञात: 0
बोलने वालों की संख्या
136
आयु
18-50
अवलोकन
शीर्षक
बोस्टन अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
93
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
बोस्टन अंग्रेजी
भाषा
बोस्टन अंग्रेजी
लिंग
महिला: 43, पुरुष: 181, और अज्ञात: 2
बोलने वालों की संख्या
226
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें