थाई डेटासेट
और पढ़ें
AI और स्पीच मॉडल के लिए उच्च-गुणवत्ता वाला थाई सामान्य वार्तालाप, स्क्रिप्टेड मोनोलॉग और मीडिया (पॉडकास्ट) डेटासेट
अवलोकन
शीर्षक (भाषा)
थाई भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत, मीडिया (पॉडकास्ट), स्क्रिप्टेड मोनोलॉग
देश
थाईलैंड
विवरण
इस डेटासेट में इजरायल के दो लोगों के बीच हिब्रू भाषा में अलिखित टेलीफोनिक वार्तालाप (15-60 मिनट), 1 से 5 प्रतिभागियों के साथ लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो या वीडियो फ़ाइलें (15-60 मिनट), और लिखित एकालाप शामिल हैं, जहां एक एकल वक्ता भाषण और भाषा मॉडल के प्रशिक्षण और मूल्यांकन के लिए पूर्वनिर्धारित सामग्री प्रस्तुत करता है।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
| डेटासेट प्रकार | नमूना दर | वक्ता | चैनल | कुल घंटे | वक्ताओं की कुल संख्या |
|---|---|---|---|---|---|
| सामान्य बातचीत | 8 kHz | 2 वक्ताओं | दोहरी | 211:48:42 | 170 |
| मीडिया डेटा | 16 kHz | सिंगल स्पीकर | मोनो | 249:14:31 | 670 |
| स्क्रिप्टेड मोनोलॉग | 24 kHz | सिंगल स्पीकर | मोनो | 500:00:00 | अनुरोध पर |
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें