दारी डेटासेट
दारी डेटासेट
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला दारी सामान्य वार्तालाप और TTS डेटासेट
अवलोकन
शीर्षक
दारी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
"स्पीकर 1" और "स्पीकर 2" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
राजनीति, समसामयिक मामले, स्थानीय समाचार, धर्म, अर्थशास्त्र और वित्त, और पर्यटन
डेटा सेट विवरण
कुल घंटे
100
नमूना दर
44 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
अफ़ग़ानिस्तान
भाषा
दारी
आयु
18-50
अवलोकन
शीर्षक
दारी भाषा डेटासेट
डेटासेट प्रकार
टीटीएस
विवरण
एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की श्रेणी में आती हैं।
उदाहरण
राजनीति, समसामयिक मामले, स्थानीय समाचार, धर्म, अर्थशास्त्र और वित्त, और पर्यटन
डेटा सेट विवरण
कुल घंटे
600
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
अफ़ग़ानिस्तान
भाषा
दारी
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें