मलयालम डेटासेट
माइगल डेबबस
AI और स्पीच मॉडल के लिए उच्च-गुणवत्ता वाला मलयालम सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक (भाषा)
मलयालम भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत, मीडिया (पॉडकास्ट) डेटा
देश
इंडिया
विवरण
इस डेटासेट में एक एजेंट और ग्राहक के बीच अनस्क्रिप्टेड सिंथेटिक टेलीफोनिक वार्तालाप (5-15 मिनट) और लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो या वीडियो फ़ाइलें शामिल हैं, जैसे कि 1 से 5 प्रतिभागियों के साथ साक्षात्कार और पॉडकास्ट (15-60 मिनट)।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
| डेटासेट प्रकार | नमूना दर | वक्ता | चैनल | कुल घंटे | वक्ताओं की कुल संख्या |
|---|---|---|---|---|---|
| सामान्य बातचीत | 8 kHz | 2 वक्ताओं | दोहरी | 70:46:30 | 576 |
| सामान्य बातचीत | 8 kHz | 2 वक्ताओं | दोहरी | 149:39:33 | 296 |
| मीडिया डेटा | 16 kHz | एकाधिक वक्ता | मोनो | 12:39:24 | 81 |
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें