हिब्रू डेटासेट
ערכת נתונים עברית
AI और स्पीच मॉडल के लिए उच्च गुणवत्ता वाला हिब्रू सामान्य वार्तालाप और पॉडकास्ट डेटासेट
अवलोकन
शीर्षक
यहूदी भाषा डेटासेट
डेटासेट प्रकार
सामान्य बातचीत
विवरण
दो लोगों के बीच अनस्क्रिप्टेड टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, इज़राइल में हिब्रू।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
399
नमूना दर
8 kHz
ऑडियो चैनल
दोहरी
रिकॉर्डिंग प्लेटफार्म
डेस्कटॉप
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इजराइल
भाषा
यहूदी
लिंग
महिला 414, पुरुष 399, अज्ञात 1
बोलने वालों की संख्या
814
आयु
18-50
अवलोकन
शीर्षक
यहूदी भाषा डेटासेट
डेटासेट प्रकार
पॉडकास्ट
विवरण
लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट।
उदाहरण
एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
डेटा सेट विवरण
कुल घंटे
427
नमूना दर
16 kHz
ऑडियो चैनल
मोनो
रिकॉर्डिंग प्लेटफार्म
वेब सोर्सिंग
ऑडियो प्रारूप
वेवफ़ॉर्म
प्रतिलेखन प्रारूप
.json
WER (%)
5
डेटा सेट जनसांख्यिकी
देश
इजराइल
भाषा
यहूदी
लिंग
महिला 361, पुरुष 513, अज्ञात 13
बोलने वालों की संख्या
887
आयु
18-50
विशेष रुप से प्रदर्शित ग्राहक
विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

पता लगाने में सक्षम है जिसकी आपको तलाश है?
नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं
अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें