हिंदी डेटासेट

हिंदी डेटासेट

AI और ASR मॉडल के लिए उच्च-गुणवत्ता वाला हिंदी कॉल-सेंटर, सामान्य वार्तालाप और पॉडकास्ट डेटासेट

अवलोकन

शीर्षक (भाषा)

हिंदी भाषा डेटासेट

डेटासेट प्रकार

कॉल सेंटर, सामान्य बातचीत, मीडिया (पॉडकास्ट), स्क्रिप्टेड मोनोलॉग

देश

इंडिया

विवरण

दो लोगों के बीच 15 से 60 मिनट की अवधि वाली बिना स्क्रिप्ट वाली टेलीफोनिक बातचीत उपलब्ध है, साथ ही लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो या वीडियो फ़ाइलें, जैसे साक्षात्कार और पॉडकास्ट, जिनमें 1 से 5 प्रतिभागी शामिल हैं। इसके अतिरिक्त, एकल-वाक्य रिकॉर्डिंग आमतौर पर 5 से 30 सेकंड तक चलती हैं, और स्क्रिप्टेड मोनोलॉग डेटा भी उपलब्ध है।

उदाहरण

एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग

डेटा सेट विवरण

डेटासेट प्रकार नमूना दर वक्ता चैनल कुल घंटे वक्ताओं की कुल संख्या
कॉल सेंटर 8 kHz 2 वक्ताओं दोहरी 70:45:51 अनुरोध पर
कॉल सेंटर 8 kHz 2 वक्ताओं मोनो 20,000:00:00 अनुरोध पर
कॉल सेंटर 16 kHz 2 वक्ताओं मोनो 29:17:20 261
कॉल सेंटर 16 kHz 2 वक्ताओं दोहरी 400:27:10 1200
सामान्य बातचीत 8 kHz 2 वक्ताओं दोहरी 47:48:40 224
मीडिया डेटा 16 kHz एकाधिक वक्ता मोनो 227:57:43 438
स्क्रिप्टेड मोनोलॉग 48 kHz सिंगल स्पीकर मोनो 2,866:00:00 3,988
स्क्रिप्टेड मोनोलॉग 24 kHz सिंगल स्पीकर मोनो 29,000:00:00 अनुरोध पर

विशेष रुप से प्रदर्शित ग्राहक

विश्व-अग्रणी एआई उत्पाद बनाने के लिए टीमों को सशक्त बनाना।

वीरांगना
गूगल
माइक्रोसॉफ्ट
शेप हमसे संपर्क करें

पता लगाने में सक्षम है जिसकी आपको तलाश है?

नए ऑफ-द-शेल्फ डेटासेट सभी प्रकार के डेटा में एकत्र किए जा रहे हैं

अपने ऑडियो/भाषण प्रशिक्षण डेटा संग्रह संबंधी चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें

  • इस क्षेत्र सत्यापन उद्देश्यों के लिए है और अपरिवर्तित छोड़ दिया जाना चाहिए।
  • पंजीकरण करके, मैं शैप से सहमत हूं गोपनीयता नीति और सेवा की शर्तें और Shaip से B2B मार्केटिंग संचार प्राप्त करने के लिए अपनी सहमति प्रदान करता/करती हूँ।