न्यूयॉर्क अंग्रेजी डेटासेट
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला न्यूयॉर्क इंग्लिश कॉल-सेंटर, सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक (भाषा)
न्यूयॉर्क अंग्रेजी भाषा डेटासेट
डेटासेट प्रकार
कॉल सेंटर, सामान्य बातचीत, मीडिया (पॉडकास्ट)
देश
संयुक्त राज्य अमेरिका
विवरण
यह डेटासेट विविध भाषण और मीडिया सामग्री प्रदान करता है, जिसमें अनस्क्रिप्टेड सिंथेटिक एजेंट-ग्राहक वार्तालाप (5-15 मिनट), मानव-से-मानव टेलीफोनिक वार्तालाप (15-60 मिनट), ट्रांसक्रिप्शन के साथ गायन ऑडियो, साक्षात्कार, पॉडकास्ट और स्क्रिप्टेड मोनोलॉग शामिल हैं, जो भाषण और भाषा प्रौद्योगिकियों के प्रशिक्षण और मूल्यांकन का समर्थन करते हैं।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
| डेटासेट प्रकार | नमूना दर | वक्ता | चैनल | कुल घंटे | वक्ताओं की कुल संख्या |
|---|---|---|---|---|---|
| कॉल सेंटर | 8 kHz | 2 वक्ताओं | दोहरी | 117:40:09 | 1,388 |
| सामान्य बातचीत | 8 kHz | 2 वक्ताओं | दोहरी | 156:42:48 | 510 |
| संगीत | 16 kHz | सिंगल स्पीकर | मोनो | 135:14:18 | 288 |
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें