वियतनामी डेटासेट
Bộ dữ liệu tiếng Việt
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला वियतनामी सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
वियतनामी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
"एजेंट" और "ग्राहक" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, उत्तरी (जैसे, हनोई), मध्य और दक्षिणी (जैसे, हो ची मिन्ह सिटी)।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
295
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
वियतनामी
भाषा
वियतनामी
लिंग
महिला 400, पुरुष 380, अज्ञात 2
बोलने वालों की संख्या
782
आयु
18-50
अवलोकन
शीर्षक
वियतनामी भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
257
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
वियतनामी
भाषा
वियतनामी
लिंग
महिला 249, पुरुष 200, अज्ञात 45
बोलने वालों की संख्या
494
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें