इंडोनेशियाई डेटासेट
कुम्पुलान डेटा इंडोनेशिया
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला इंडोनेशियाई सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
इन्डोनेशियाई भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, बहासा इंडोनेशियाई।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
496
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडोनेशिया
भाषा
इन्डोनेशियाई
लिंग
महिला 524, पुरुष 454, अज्ञात 2
बोलने वालों की संख्या
980
आयु
18-50
अवलोकन
शीर्षक
इन्डोनेशियाई भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
643
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इंडोनेशिया
भाषा
इन्डोनेशियाई
लिंग
महिला 746, पुरुष 1507, अज्ञात 129
बोलने वालों की संख्या
2,382
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें