सिंहली डेटासेट
सिंहली डेटासेट
अवलोकन
शीर्षक
सिंहली भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
Description
"स्पीकर 1" और "स्पीकर 2" के बीच अनस्क्रिप्टेड, सिंथेटिक टेलीफोनिक बातचीत, लगभग ऑडियो अवधि (रेंज) 5-15 मिनट।
उदाहरण
राजनीति, समसामयिक मामले, स्थानीय समाचार, धर्म, अर्थशास्त्र और वित्त, और पर्यटन
डेटा सेट विवरण
कुल घंटे
200
नमूना दर
44 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
श्री लंका
भाषा
लंका का
आयु
18-50
अवलोकन
शीर्षक
सिंहली भाषा डेटासेट
डेटासेट प्रकार
टीटीएस
Description
एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की श्रेणी में आती हैं।
उदाहरण
राजनीति, समसामयिक मामले, स्थानीय समाचार, धर्म, अर्थशास्त्र और वित्त, और पर्यटन
डेटा सेट विवरण
कुल घंटे
800
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
मोबाइल ऐप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
श्री लंका
भाषा
लंका का
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।
पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें