आपके एआई के लिए सबसे भरोसेमंद भाषण डेटा संग्रह सेवाएं
हमारे ऑडियो और भाषण डेटा संग्रह सेवाओं के साथ अपने एनएलपी मॉडल, वीए, टीटीएस प्रोटोटाइप, और अधिक गुणवत्ता वाले संवादी डेटा के साथ प्रशिक्षित करें
बाधाओं के बिना ऑडियो डेटा पाइपलाइन खोजें।
विशेष रुप से प्रदर्शित ग्राहक
प्राकृतिक भाषा संसाधन के लिए वाक् प्रशिक्षण डेटासेट की आवश्यकता क्यों है?
क्या आपने कभी अपने स्मार्टफोन VA, यानी सिरी, बिक्सबी, या किसी और चीज को परस्पर क्रिया करते हुए देखा है? जिस तरह से वे हर सवाल का जवाब देते हैं और आपकी आवश्यकताओं के अनुसार विश्लेषण करते हैं और परिणाम प्रस्तुत करते हैं!
खैर, ये VA हमें जितना आकर्षित करते हैं, इन बुद्धिमान संसाधनों और कार्यक्रमों को सही ढंग से प्रतिक्रिया देने में सक्षम होने के लिए उत्तरोत्तर प्रशिक्षित करने की आवश्यकता है। यही कारण है कि आपको पेशेवर विशेषज्ञता को मान्य करने के साथ विशेष डेटा संग्रह कंपनियों को आउटसोर्सिंग भाषण/ऑडियो, और वॉयस डेटा संग्रह पर विचार करना चाहिए।
ऑडियो डेटा संग्रह में निवेश करने से आपके कथित एनएलपी को बहुभाषी श्रोताओं को पूरा करने के लिए तैयार किया जाता है। इतना ही नहीं, एनएलपी के लिए भाषण डेटा संग्रह, जब भी एक विशेषज्ञ द्वारा नियंत्रित किया जाता है, यहां तक कि इन-फील्ड संग्रह, सिमेंटिक विश्लेषण और ऑडियो ट्रांसक्रिप्शन को भी ध्यान में रखा जाता है। पेशेवर भाषण डेटा संग्रह समाधान के साथ, आप यह कर सकते हैं:
- सटीकता में सुधार के लिए उच्च-गुणवत्ता वाले ऑडियो डेटासेट प्राप्त करें
- विविध परिदृश्य सेटअप को लक्षित करें
- बहुभाषी एआई प्रशिक्षण डेटा एकत्र करें
- विविध जनसांख्यिकी और वर्टिकल के अनुरूप अपने एमएल मॉडल को स्केल करें
एनएलपी के लिए पेशेवर ऑडियो/आवाज डेटा संग्रह सेवाएं
कोई भी विषय। कोई भी परिदृश्य.
इंटेलिजेंट एनएलपी सिस्टम कुछ भी हो लेकिन सामान्य है। कार्यक्रम की कार्यक्षमता के आधार पर, आपको स्थानिक और बहुभाषी ऑडियो डेटा सेवाओं पर ध्यान केंद्रित करना पड़ सकता है, जो केवल प्रतिष्ठित आवाज/ऑडियो डेटा संग्रह कंपनियों द्वारा पेश की जा सकती हैं। यह वह जगह है जहाँ Shaip एक अत्यधिक विश्वसनीय डेटा कनेक्शन सेवा प्रदाता के रूप में चीजों की योजना में आता है जो आपके कथित बुद्धिमान AI के लिए भारी भार उठाने में गर्व महसूस करता है।
शैप में, हमारा प्राथमिक फोकस कम से कम संभव समय में कस्टम स्पीच सैंपल की उच्चतम संभव मात्रा के साथ फीडिंग मॉडल पर है। हमारे साथ बोर्ड पर, आप उम्मीद कर सकते हैं:
- एनएलपी के लिए क्यूरेटेड ऑडियो / वॉयस डेटा संग्रह
- दर्जी प्रोग्राम जो विशिष्ट उपयोग मामलों के अनुसार प्रतिक्रिया करते हैं
- ऑडियो डेटासेट माइनिंग तैयार करना
- पैटर्न-विशिष्ट और स्वचालित डेटा प्रोसेसिंग
- डोमेन विशिष्टता का उच्चतम संभव स्तर
- त्वरित एआई मॉडल के साथ बाजार में तेजी से समय
हमारी विशेषज्ञता
स्मार्ट एनएलपी मॉडल तैयार करने के लिए ऑडियो डेटा को संरेखित करें
शैप दुनिया भर में दर्शकों के विविध सेट को पूरा करने के लिए आवाज-सक्षम प्रौद्योगिकियों को सक्षम करने के लिए 100 से अधिक भाषाओं में एंड-टू-एंड स्पीच/ऑडियो डेटा संग्रह सेवाएं प्रदान करता है। हम किसी भी दायरे और आकार की परियोजनाओं पर काम कर सकते हैं; मौजूदा ऑफ-द-शेल्फ ऑडियो डेटासेट को लाइसेंस देने से लेकर कस्टम ऑडियो डेटा संग्रह को प्रबंधित करने से लेकर ऑडियो ट्रांसक्रिप्शन और एनोटेशन तक। इससे कोई फर्क नहीं पड़ता कि आपका भाषण डेटा संग्रह प्रोजेक्ट कितना बड़ा है, हम बोलियों, टोन और भाषाओं को लक्षित करने वाले उच्च-गुणवत्ता वाले एनएलपी डेटासेट बनाने के लिए आपकी आवश्यकताओं के अनुरूप ऑडियो संग्रह सेवाओं को अनुकूलित कर सकते हैं। वॉयस-सक्षम बुद्धिमान सेटअप के लिए हमारे विस्तृत भाषण डेटासेट और ऑडियो डेटा संग्रह संसाधनों में से चुनें।
एकालाप भाषण संग्रह
अपने टेक्स्ट-टू-स्पीड प्रोटोटाइप के लिए स्टैंडअलोन स्पीकर से संबंधित भाषण-आधारित आवश्यकताओं और स्क्रिप्टेड प्रॉम्प्ट फीडिंग के साथ ट्रांसक्रिप्शन-विशिष्ट आवश्यकताओं को सिंगल-चैनल फ़ाइलों के माध्यम से संभालें।
संवाद भाषण
पुस्तक संग्रह
दोहरी-चैनल फ़ाइलों और लिखित संसाधनों के माध्यम से बहुभाषी एक्सपोजर के साथ बुद्धिमान आभासी सहायक, गति-विशिष्ट चैटबॉट और स्वचालित वाक् पहचान मॉडल सेट करें।
ध्वनिक डेटा
पुस्तक संग्रह
हम व्यापक ध्वनिक रेंज को कवर करते हुए, अपने सहयोगियों के वैश्विक नेटवर्क के माध्यम से स्टूडियो-गुणवत्ता ऑडियो डेटा को पेशेवर रूप से रिकॉर्ड कर सकते हैं, चाहे वह रेस्तरां, कार्यालय, या घर या विभिन्न वातावरण और भाषाओं से हो।
प्राकृतिक भाषा उच्चारण संग्रह
एआई को समय के साथ अधिक स्वायत्त बनाने के लिए समान अर्थ वाले अलग-अलग ग्राहक वाक्यांशों की पहचान करने के लिए स्मार्ट वाणिज्यिक सेटअप को प्रशिक्षित करें
डिजिटल / वर्चुअल
सहायकों
मानव भाषण, बहुभाषी जोखिम, प्रासंगिक विश्लेषण और एनएलयू के कैवियट के साथ प्रशिक्षण मॉडल द्वारा अपने आगामी आभासी सहायक के निर्माण पर ध्यान दें।
स्वचालित वाक् पहचान (एएसआर)
जनसांख्यिकी की एक विस्तृत श्रृंखला से अत्याधुनिक विविध भाषण/ऑडियो डेटासेट तक पहुंच प्राप्त करके अपने स्वचालित भाषण पहचान (एएसआर) सिस्टम की सटीकता में सुधार करें।
बहुभाषी भाषण/ऑडियो प्रशिक्षण डेटा
दुनिया भर में हमारे अत्यधिक कुशल भाषा पेशेवर, अरबी, डेनिश, चीनी, अफ्रीकी, सिंगापुर, न्यूजीलैंड, हिब्रू, इंडोनेशियाई, आयरिश, कोरियाई, मलय, पोलिश, स्कॉटिश, स्वीडिश सहित कई भाषाओं और बोलियों में बहुभाषी ऑडियो/भाषण प्रशिक्षण डेटा प्रदान करते हैं। , फ्रेंच, जर्मन, वियतनामी, थाई, इतालवी, स्पेनिश और अधिक।
पाठ से भाषण
(टीटीएस)
टीटीएस के साथ एक बेहतर उपयोगकर्ता अनुभव प्रदान करने के लिए, प्राकृतिक ध्वनि के लिए एक प्रणाली विकसित करना महत्वपूर्ण है। हमारे वैश्विक कार्यबल की मदद से एक टेक्स्ट-टू-स्पीच (टीटीएस) बहुभाषी मॉडल बनाएं, जो आपके एआई मॉडल को इन-कार नियंत्रण से लेकर चैटबॉट और सीखने के समाधान तक उच्च- गुणवत्ता ऑडियो डेटा।
अपने भरोसेमंद भाषण डेटा संग्रह भागीदार के रूप में शैप को चुनने के कारण
स्टाफ़
समर्पित एवं प्रशिक्षित टीमें:
- डेटा निर्माण, लेबलिंग और क्यूए के लिए 30,000+ सहयोगी
- प्रमाणित परियोजना प्रबंधन टीम
- अनुभवी उत्पाद विकास टीम
- टैलेंट पूल सोर्सिंग एवं ऑनबोर्डिंग टीम
प्रक्रिया
उच्चतम प्रक्रिया दक्षता का आश्वासन दिया जाता है:
- मजबूत 6 सिग्मा स्टेज-गेट प्रक्रिया
- 6 सिग्मा ब्लैक बेल्ट की एक समर्पित टीम - मुख्य प्रक्रिया मालिक और गुणवत्ता अनुपालन
- सतत सुधार एवं फीडबैक लूप
मंच
पेटेंट किया गया प्लेटफ़ॉर्म लाभ प्रदान करता है:
- वेब-आधारित एंड-टू-एंड प्लेटफ़ॉर्म
- त्रुटिहीन गुणवत्ता
- तेज़ TAT
- निर्बाध वितरण
स्टाफ़
समर्पित एवं प्रशिक्षित टीमें:
- डेटा निर्माण, लेबलिंग और क्यूए के लिए 30,000+ सहयोगी
- प्रमाणित परियोजना प्रबंधन टीम
- अनुभवी उत्पाद विकास टीम
- टैलेंट पूल सोर्सिंग एवं ऑनबोर्डिंग टीम
प्रक्रिया
उच्चतम प्रक्रिया दक्षता का आश्वासन दिया जाता है:
- मजबूत 6 सिग्मा स्टेज-गेट प्रक्रिया
- 6 सिग्मा ब्लैक बेल्ट की एक समर्पित टीम - मुख्य प्रक्रिया मालिक और गुणवत्ता अनुपालन
- सतत सुधार एवं फीडबैक लूप
मंच
पेटेंट किया गया प्लेटफ़ॉर्म लाभ प्रदान करता है:
- वेब-आधारित एंड-टू-एंड प्लेटफ़ॉर्म
- त्रुटिहीन गुणवत्ता
- तेज़ TAT
- निर्बाध वितरण
भाषा: एकत्रित ऑडियो डेटासेट
ऑफ-द-शेल्फ स्पीच / ऑडियो डेटासेट
विवरण | कॉर्पस आईडी (अद्वितीय) | खोजशब्द | भाषा डेटासेट | भाषा कोड | नमूना दर | डेटासेट प्रकार | कुल ऑडियो घंटे | संक्षिप्त वर्णन | डेटासेट विवरण | ऑडियो चैनल | रिकॉर्डिंग प्लेटफार्म | WER (%) | ऑडियो प्रारूप | प्रतिलेखन प्रारूप | उदाहरण | बोलने वालों की संख्या | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | अफ़्रीकी अमेरिकी स्थानीय भाषा | अफ़्रीकी अमेरिकी स्थानीय भाषा | en_US | 8 kHz | कॉल सेंटर | 211 | अफ्रीकी अमेरिकी वर्नाक्युलर कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 612, पुरुष: 1242, और अज्ञात: 12 | संपर्क करें | |
en_US_MA_16 | अफ़्रीकी अमेरिकी स्थानीय भाषा | अफ़्रीकी अमेरिकी स्थानीय भाषा | en_US | 16 kHz | मीडिया ऑडियो | 154 | अफ्रीकी अमेरिकी वर्नाक्युलर मीडिया डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 151, पुरुष: 150, और अज्ञात: 10 | संपर्क करें | |
अफ्रीकी_जीसी_8 | अफ्रीकी | अफ्रीकी | af_ZA | 8 kHz | सामान्य बातचीत | 368 | अफ्रीकी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, अफ़्रीका में बोली जाने वाली अफ़्रीकी | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 502, पुरुष: 390, और अज्ञात: 2 | संपर्क करें | |
अफ्रीकी_MA_16 | अफ्रीकी | अफ्रीकी | af_ZA | 16 kHz | मीडिया ऑडियो | 658 | अफ्रीकी मीडिया फ़ाइलें | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 750, पुरुष: 1278, और अज्ञात: 52 | संपर्क करें | |
अरबी_जीसी_8 | अरबी भाषा | अरबी भाषा | ar_AE | 8 kHz | सामान्य बातचीत | 292 | अरबी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, खाड़ी देशों से अरबी | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 171, पुरुष: 534, और अज्ञात: 1 | संपर्क करें | |
अरबी_एसएम_48 | अरबी भाषा | अरबी भाषा | ए आर-SA | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,947 | अरबी लिपिबद्ध एकालाप | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 838 पुरुष 1209 अज्ञात 78 | संपर्क करें | |
असमिया_सीसी_8 | असमी | असमिया (पाइपलाइन में) | जैसे की | कॉल सेंटर | 60 | असमिया (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
असमिया_जीसी | असमी | असमिया (पाइपलाइन में) | जैसे की | सामान्य बातचीत | 100 | असमिया (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
असमिया_एम.ए | असमी | असमिया (पाइपलाइन में) | जैसे की | मीडिया ऑडियो | 40 | असमिया (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
बंगाली_सीसी_8 | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | कॉल सेंटर | 60 | बंगाली (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
बंगाली_जीसी | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | सामान्य बातचीत | 100 | बंगाली (पाइपलाइन में) सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
बंगाली_एम.ए | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | मीडिया ऑडियो | 40 | बंगाली (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
बोस्टन_सीसी_8 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 177 | बोस्टन कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 605, पुरुष: 711, और अज्ञात: 0 | संपर्क करें | |
बोस्टन_जीसी_8 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 8 kHz | सामान्य बातचीत | 32 | बोस्टन सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 53, पुरुष: 83, और अज्ञात: 0 | संपर्क करें | |
बोस्टन_एमए_16 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 93 | बोस्टन मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 43, पुरुष: 181, और अज्ञात: 2 | संपर्क करें | |
कैनेडियन_एसएम_48 | कनाडाई फ्रेंच | कनाडाई फ्रेंच | शनिवार-सीए | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,222 | कनाडाई फ्रेंच | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 974 पुरुष 631 अज्ञात 1 | संपर्क करें | |
चीनी_सीसी_8 | चीनी अंग्रेजी | चीनी अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 169 | चीनी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 1790, पुरुष: 523 और अज्ञात: 13 | संपर्क करें | |
चीनी_MA_16 | चीनी अंग्रेजी | चीनी अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 249 | चीनी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 126, पुरुष: 346 और अज्ञात: 6 | संपर्क करें | |
चीनी सरलीकृत_SM_48 | चीनी सरलीकृत | चीनी सरलीकृत | zh-CN | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,762 | चीनी सरलीकृत | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1920 पुरुष 1535 अज्ञात 270 | संपर्क करें | |
चीनी पारंपरिक_SM_48 | पारंपरिक चीनी | पारंपरिक चीनी | zh-TW | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,028 | पारंपरिक चीनी | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1069 पुरुष 262 अज्ञात 3 | संपर्क करें | |
डेनिश_जीसी_8 | डेनिश | डेनिश | दा_डीके | 8 kHz | सामान्य बातचीत | 372 | डेनिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 311, पुरुष: 417, अज्ञात: 0 | संपर्क करें | |
डेनिश_MA_16 | डेनिश | डेनिश | दा_डीके | 16 kHz | मीडिया ऑडियो | 664 | डेनिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 369, पुरुष: 864, अज्ञात: 27 | संपर्क करें | |
डेनिश_एसएम_48 | डेनिश | डेनिश | DA-डीके | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,579 | डेनिश स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं, डेनमार्क से डेनिश | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1551 पुरुष 1233 अज्ञात 42 | संपर्क करें | |
इंग्लिश डीप साउथ_CC_8 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 8 kHz | कॉल सेंटर | 151 | अंग्रेजी डीप साउथ कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 221, पुरुष 1004, अज्ञात 7 | संपर्क करें | |
इंग्लिश डीप साउथ_GC_8 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 8 kHz | सामान्य बातचीत | 56 | अंग्रेजी डीप साउथ सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 99, पुरुष 31, अज्ञात 0 | संपर्क करें | |
इंग्लिश डीप साउथ_MA_16 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 16 kHz | मीडिया ऑडियो | 266 | अंग्रेजी डीप साउथ मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 204, पुरुष 356, अज्ञात 21 | संपर्क करें | |
जर्मन_सीसी_8 | जर्मन | जर्मन | डे-डे | 8 kHz | कॉल सेंटर | 64 | जर्मन कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | मोनो | डेस्कटॉप | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 478 पुरुष 1440 अज्ञात 0 | संपर्क करें | ||
जर्मन_आईवीआर_8 | जर्मन | जर्मन | डे-डे | 8 kHz | आईवीआर | 200 | जर्मन आईवीआर डेटा | मानव से मशीन। एक आईवीआर प्रकार का प्रवाह जहां एक टीटीएस संकेत होता है (उदाहरण के लिए "मैं आपकी कैसे मदद कर सकता हूं") जिसके बाद एक सहज मानव प्रतिक्रिया होती है | मोनो | डेस्कटॉप | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 10115 पुरुष 8750 अज्ञात 0 | संपर्क करें | ||
गुजराती_सीसी_8 | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | कॉल सेंटर | 60 | गुजराती (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
गुजराती_जीसी | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | सामान्य बातचीत | 100 | गुजराती (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
गुजराती_एम.ए | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | मीडिया ऑडियो | 40 | गुजराती (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
हिब्रू_सामान्य वार्तालाप_8 | यहूदी | यहूदी | वह_आईएल | 8 kHz | सामान्य बातचीत | 399 | हिब्रू सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, इज़राइल में हिब्रू | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 414, पुरुष 399, अज्ञात 1 | संपर्क करें | |
हिब्रू_MA_16 | यहूदी | यहूदी | वह_आईएल | 16 kHz | मीडिया ऑडियो | 427 | हिब्रू मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 361, पुरुष 513, अज्ञात 13 | संपर्क करें | |
हिंदी_एमए_16 | हिंदी | हिंदी | हाय_इन | 16 kHz | मीडिया ऑडियो | 219 | हिंदी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 83, पुरुष 309, अज्ञात 0 | संपर्क करें | |
हिंदी_एसएम_48 | हिंदी | हिंदी | हाय-IN | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,867 | हिंदी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1977 पुरुष 1864 अज्ञात 147 | संपर्क करें | |
हिंग्लिश_सीसी_8 | हिंग्लिश | हिंग्लिश | hg_IN | 8 kHz | कॉल सेंटर | 208 | हिंग्लिश कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 822, पुरुष 1262, अज्ञात 0 | संपर्क करें | |
हिंग्लिश_एमए_16 | हिंग्लिश | हिंग्लिश | hg_IN | 16 kHz | मीडिया ऑडियो | 216 | हिंग्लिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 75, पुरुष 380, अज्ञात 0 | संपर्क करें | |
हिस्पैनिक_CC_8 | हिस्पैनिक अंग्रेजी | हिस्पैनिक अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 212 | हिस्पैनिक कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 822, पुरुष 1262, अज्ञात 0 | संपर्क करें | |
हिस्पैनिक_MA_16 | हिस्पैनिक अंग्रेजी | हिस्पैनिक अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 155 | हिस्पैनिक कॉल मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 140, पुरुष 219, अज्ञात 5 | संपर्क करें | |
इंडोनेशियाई_जीसी_8 | इन्डोनेशियाई | इन्डोनेशियाई | मैंने किया | 8 kHz | सामान्य बातचीत | 496 | इंडोनेशियाई सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, बहासा इंडोनेशियाई | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 524, पुरुष 454, अज्ञात 2 | संपर्क करें | |
इंडोनेशियाई_MA_16 | इन्डोनेशियाई | इन्डोनेशियाई | मैंने किया | 16 kHz | मीडिया ऑडियो | 643 | इंडोनेशियाई मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 746, पुरुष 1507, अज्ञात 129 | संपर्क करें | |
आयरिश_जीसी_8 | आयरिश | आयरिश | en_IE | 8 kHz | सामान्य बातचीत | 192 | आयरिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 213, पुरुष 153, अज्ञात 0 | संपर्क करें | |
जापानी_एसएम_48 | जापानी | जापानी | ja-जेपी | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,335 | जापानी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1460 पुरुष 1221 अज्ञात 194 | संपर्क करें | |
कन्नड़_सीसी_8 | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | कॉल सेंटर | 60 | कन्नड़ (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
कन्नड़_जीसी | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | सामान्य बातचीत | 100 | कन्नड़ (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
कन्नड़_एम.ए | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | मीडिया ऑडियो | 40 | कन्नड़ (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
कोरियाई_सीसी_8 | कोरियाई | कोरियाई | ko_KR | 8 kHz | कॉल सेंटर | 107 | कोरियाई कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1086, पुरुष 210, अज्ञात 4 | संपर्क करें | |
कोरियाई_MA_16 | कोरियाई | कोरियाई | ko_KR | 16 kHz | मीडिया ऑडियो | 204 | कोरियाई मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 70 पुरुष 303, अज्ञात 25 | संपर्क करें | |
कोरियाई_एसएम_48 | कोरियाई | कोरियाई | ko-के.आर. | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,955 | कोरियन स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1195 पुरुष 1134 अज्ञात 122 | संपर्क करें | |
मलय_जीसी_8 | मलायी | मलायी | ms_MY | 8 kHz | सामान्य बातचीत | 266 | मलय सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, मलेशिया में मलय | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 316, पुरुष 176, अज्ञात 0 | संपर्क करें | |
मलय_MA_16 | मलायी | मलायी | ms_MY | 16 kHz | मीडिया ऑडियो | 344 | मलय मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 236, पुरुष 626, अज्ञात 47 | संपर्क करें | |
मलयालम_सीसी_8 | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | कॉल सेंटर | 60 | मलयालम (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मलयालम_जीसी | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | सामान्य बातचीत | 100 | मलयालम (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मलयालम_एम.ए | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | मीडिया ऑडियो | 40 | मलयालम (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मराठी_सीसी_8 | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | कॉल सेंटर | 60 | मराठी (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मराठी_जीसी | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | सामान्य बातचीत | 100 | मराठी (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मराठी_एम.ए | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | मीडिया ऑडियो | 40 | मराठी (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
मेक्सिकन_एसएम_48 | स्पेनिश (मेक्सिको) | स्पेनिश (मेक्सिको) | es-एमएक्स | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,492 | मैक्सिकन स्पेनिश स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1016 पुरुष 1069 अज्ञात 95 | संपर्क करें | |
नीदरलैंड_SM_48 | डच | डच | NL-नाथन | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,205 | डच स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1285 पुरुष 531 अज्ञात 3 | संपर्क करें | |
न्यूयॉर्क अंग्रेजी_CC_8 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 103 | न्यूयॉर्क अंग्रेजी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 610, पुरुष 532, अज्ञात 0 | संपर्क करें | |
न्यू यॉर्क इंग्लिश_जीसी_8 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 8 kHz | सामान्य बातचीत | 107 | न्यूयॉर्क अंग्रेजी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 118, पुरुष 114, अज्ञात 0 | संपर्क करें | |
न्यूयॉर्क अंग्रेजी_MA_16 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 140 | न्यूयॉर्क अंग्रेजी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 66, पुरुष 230, अज्ञात 11 | संपर्क करें | |
न्यूज़ीलैंड_जीसी_8 | न्यूज़ीलैंड अंग्रेज़ी | न्यूज़ीलैंड अंग्रेज़ी | en_NZ | 8 kHz | सामान्य बातचीत | 148 | न्यूजीलैंड अंग्रेजी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 167, पुरुष 121, अज्ञात 4 | संपर्क करें | |
न्यूज़ीलैंड_MA_16 | न्यूज़ीलैंड अंग्रेज़ी | न्यूज़ीलैंड अंग्रेज़ी | en_NZ | 16 kHz | मीडिया ऑडियो | 400 | न्यूजीलैंड अंग्रेजी मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 367, पुरुष 678, अज्ञात 26 | संपर्क करें | |
उड़िया_सीसी_8 | उड़िया | उड़िया (पाइपलाइन में) | या_IN | कॉल सेंटर | 60 | उड़िया (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
उड़िया_जीसी | उड़िया | उड़िया (पाइपलाइन में) | या_IN | सामान्य बातचीत | 100 | उड़िया (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
उड़िया_एम.ए | उड़िया | उड़िया (पाइपलाइन में) | या_IN | मीडिया ऑडियो | 40 | उड़िया (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
पोलिश_MA_16 | पोलिश | पोलिश | pl_PL | 16 kHz | मीडिया ऑडियो | 269 | पोलिश मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 173 पुरुष 354 अज्ञात 6 | संपर्क करें | |
पोलिश पोलैंड_SM_48 | पोलिश (पोलैंड) | पोलिश (पोलैंड) | पी एल पी एल | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,482 | पोलिश पोलैंड - पटकथा वाला एकालाप | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1324 पुरुष 701 अज्ञात 24 | संपर्क करें | |
पंजाबी_सीसी_8 | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | कॉल सेंटर | 60 | पंजाबी (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
पंजाबी_जीसी | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | सामान्य बातचीत | 100 | पंजाबी (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
पंजाबी_एम.ए | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | मीडिया ऑडियो | 40 | पंजाबी (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
रूसी_एसएम_48 | रूसी | रूसी | आरयू आरयू | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,398 | रूसी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1689 पुरुष 1937 अज्ञात 214 | संपर्क करें | |
स्कॉटिश_जीसी_8 | स्कॉटिश (अंग्रेजी एक्सेंट) | स्कॉटिश (अंग्रेजी एक्सेंट) | en_AB | 8 kHz | सामान्य बातचीत | 292 | स्कॉटिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 285, पुरुष 260, अज्ञात 3 | संपर्क करें | |
सिंगापुर_सीसी_8 | सिंगापुर अंग्रेजी | सिंगापुर अंग्रेजी | en_SG | 8 kHz | कॉल सेंटर | 218 | सिंगापुर कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 2139, पुरुष 884, अज्ञात 21 | संपर्क करें | |
सिंगापुर_MA_16 | सिंगापुर अंग्रेजी | सिंगापुर अंग्रेजी | en_SG | 16 kHz | मीडिया ऑडियो | 247 | सिंगापुर मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 160, पुरुष 455, अज्ञात 37 | संपर्क करें | |
दक्षिण अफ़्रीकी अंग्रेज़ी_CC_8 | दक्षिण अफ़्रीकी अंग्रेजी | दक्षिण अफ़्रीकी अंग्रेजी | en_ZA | 8 kHz | कॉल सेंटर | 261 | दक्षिण अफ्रीकी अंग्रेजी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1274, पुरुष 935, अज्ञात 1 | संपर्क करें | |
दक्षिण अफ़्रीकी अंग्रेज़ी_MA_16 | दक्षिण अफ़्रीकी अंग्रेजी | दक्षिण अफ़्रीकी अंग्रेजी | en_ZA | 16 kHz | मीडिया ऑडियो | 251 | दक्षिण अफ्रीकी अंग्रेजी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 235, पुरुष 432, अज्ञात 36 | संपर्क करें | |
स्वाहिली_सीसी_8 | स्वाहिली | स्वाहिली | sw_KE | 8 kHz | कॉल सेंटर | 230 | स्वाहिली कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 611, पुरुष 833, अज्ञात 0 | संपर्क करें | |
स्वाहिली_एमए_16 | स्वाहिली | स्वाहिली | sw_KE | 16 kHz | मीडिया ऑडियो | 265 | स्वाहिली मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 118, पुरुष 493, अज्ञात 25 | संपर्क करें | |
स्वीडिश_सीसी_8 | स्वीडिश | स्वीडिश | sv_SE | 8 kHz | कॉल सेंटर | 250 | स्वीडिश कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1581, पुरुष 727, अज्ञात 2 | संपर्क करें | |
स्वीडिश_MA_16 | स्वीडिश | स्वीडिश | sv_SE | 16 kHz | मीडिया ऑडियो | 278 | स्वीडिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 195, पुरुष 500, अज्ञात 21 | संपर्क करें | |
तमिल_सीसी_8 | तामिल | तमिल (पाइपलाइन में) | ta_IN | कॉल सेंटर | 60 | तमिल (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
तमिल_जीसी | तामिल | तमिल (पाइपलाइन में) | ta_IN | सामान्य बातचीत | 100 | तमिल (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
तमिल_एम.ए | तामिल | तमिल (पाइपलाइन में) | ta_IN | मीडिया ऑडियो | 40 | तमिल (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
तेलुगु_जीसी_8 | तेलुगु | तेलुगु | te_IN | 8 kHz | सामान्य बातचीत | 553 | तेलुगु सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 574, पुरुष 564, अज्ञात 0 | संपर्क करें | |
तेलुगु_MA_16 | तेलुगु | तेलुगु | te_IN | 16 kHz | मीडिया ऑडियो | 648 | तेलुगु मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 207, पुरुष 963, अज्ञात 2 | संपर्क करें | |
तेलुगू_सीसी_8 | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | कॉल सेंटर | 30 | तेलुगु (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
तेलुगु_जीसी | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | सामान्य बातचीत | 50 | तेलुगु (पाइपलाइन में) सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
तेलुगु_एमए | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | मीडिया ऑडियो | 20 | तेलुगु (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | संपर्क करें | ||||
थाई_जीसी_8 | थाई | थाई | वें_टीएच | 8 kHz | सामान्य बातचीत | 183 | थाई सामान्य बातचीत | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोस्तों के बीच इस्तेमाल किया जाने वाला एक अनौपचारिक रजिस्टर | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 338, पुरुष 96, अज्ञात 8 | संपर्क करें | |
थाई_MA_8 | थाई | थाई | वें_टीएच | 16 kHz | मीडिया ऑडियो | 173 | थाई मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 143, पुरुष 502, अज्ञात 26 | संपर्क करें | |
तुर्की टर्की_SM_48 | तुर्की टर्की | तुर्की टर्की | TR-टी.आर. | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,027 | तुर्की टर्की | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1561 पुरुष 1241 अज्ञात 31 | संपर्क करें | |
वियतनामी_GC_8 | वियतनामी | वियतनामी | vi_VN | 8 kHz | सामान्य बातचीत | 295 | वियतनामी सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, उत्तरी (उदाहरण के लिए, हनोई), मध्य और दक्षिणी (उदाहरण के लिए, हो ची मिन्ह सिटी)। | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 400, पुरुष 380, अज्ञात 2 | संपर्क करें | |
वियतनामी_MA_16 | वियतनामी | वियतनामी | vi_VN | 16 kHz | मीडिया ऑडियो | 257 | वियतनामी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 249, पुरुष 200, अज्ञात 45 | संपर्क करें | |
वेल्श_जीसी_8 | वेल्श (अंग्रेजी एक्सेंट) | वेल्श (अंग्रेजी एक्सेंट) | en_WL | 8 kHz | सामान्य बातचीत | 278 | वेल्श सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 270, पुरुष 324, अज्ञात 0 | संपर्क करें | |
यूके अंग्रेजी_WW_16 | यूके अंग्रेजी | यूके अंग्रेजी | en_uk | 16 kHz | वेक वर्ड | 200 वक्ताओं | वेक वर्ड यूके इंग्लिश | कुंजी वाक्यांश डेटा का संग्रह
| 1 चैनल | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | लिंग: 50% पुरुष, 50% महिला, +/- 10%। | संपर्क करें |
सेवाएं दी गईं
व्यापक एआई सेटअप के लिए विशेषज्ञ ऑडियो डेटा संग्रह पूरी तरह से डेक पर नहीं है। शेप में, आप मॉडल को सामान्य से अधिक व्यापक बनाने के लिए निम्नलिखित सेवाओं पर भी विचार कर सकते हैं:
पाठ डेटा संग्रह
सेवाएँ
Shaip संज्ञानात्मक डेटा संग्रह सेवाओं का सही मूल्य यह है कि यह संगठनों को असंरचित डेटा के भीतर पाई जाने वाली महत्वपूर्ण जानकारी को अनलॉक करने की कुंजी देती है
छवि डेटा संग्रह सेवाएँ
सुनिश्चित करें कि आपका कंप्यूटर विज़न मॉडल भविष्य के अगले-जीन एआई मॉडल को मूल रूप से प्रशिक्षित करने के लिए हर छवि की सटीक पहचान करता है
वीडियो डेटा संग्रहण सेवाएँ
अब वस्तुओं, व्यक्तियों, बाधाओं और अन्य दृश्य तत्वों की पूर्णता की पहचान करने के लिए अपने मॉडलों को प्रशिक्षित करने के लिए एनएलपी के साथ-साथ कंप्यूटर दृष्टि पर ध्यान केंद्रित करें।
अनुशंसित संसाधन
की पेशकश
इंटेलिजेंट एआई के लिए ऑडियो एनोटेशन
ऑडियो एनोटेशन सेवाएं शुरू से ही Shaip की विशेषता रही हैं। हमारी अत्याधुनिक ऑडियो एनोटेशन सेवाओं के साथ संवादात्मक एआई, चैटबॉट्स और वाक् पहचान इंजनों का विकास, प्रशिक्षण और सुधार करें।
क्रेता गाइड
क्रेता गाइड: संवादी एआई के लिए पूरी गाइड
आपने जिस चैटबॉट के साथ बातचीत की, वह एक उन्नत संवादी AI सिस्टम पर चलता है, जिसे प्रशिक्षित, परीक्षण और टन वाक् पहचान डेटासेट का उपयोग करके बनाया गया है।
डेटा कैटलॉग
ऑफ-द-शेल्फ स्पीच डेटा कैटलॉग और लाइसेंसिंग
एआई परियोजनाओं में स्पीच डेटा के लिए कई प्रकार के सामान्य अनुप्रयोग हैं। हम आपको आपकी ध्वनि पहचान के लिए तैयार बड़ी मात्रा में उच्च-गुणवत्ता वाला डेटा प्रदान करते हैं।
अपना खुद का ऑडियो डेटासेट बनाना चाहते हैं?
एक ऑडियो रिपॉजिटरी स्थापित करने के लिए हमारे इन-हाउस स्पीच डेटा कलेक्शन विशेषज्ञ से जुड़ें जो आपकी आवश्यकता के अनुकूल हो
अक्सर पूछे जाने वाले प्रश्न (FAQ)
एमएल मॉडल के लिए भाषण डेटा संग्रह, बोली जाने वाली भाषा की ऑडियो रिकॉर्डिंग इकट्ठा करने की प्रक्रिया को संदर्भित करता है। यह संग्रह मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने और परिष्कृत करने में सहायता करता है, विशेष रूप से वे जो मानव आवाज़ों को समझने और संसाधित करने पर केंद्रित हैं।
स्वचालित वाक् पहचान (एएसआर) के लिए ऑडियो डेटा एकत्र करने का लक्ष्य रखते समय, आपको वांछित भाषा, उच्चारण और भाषण के प्रकार सहित अपने प्रोजेक्ट की विशिष्ट आवश्यकताओं को परिभाषित करके शुरू करना चाहिए। इन मापदंडों को सेट करने के बाद, सुनिश्चित करें कि आपने उपयोगकर्ता की गोपनीयता का सम्मान करने के लिए सभी आवश्यक अनुमतियाँ प्राप्त कर ली हैं। फिर, स्पष्ट ऑडियो नमूने कैप्चर करने के लिए उपयुक्त रिकॉर्डिंग डिवाइस या सॉफ़्टवेयर का उपयोग करें। प्रत्येक रिकॉर्डिंग को उसके प्रतिलेखन या अन्य प्रासंगिक मेटाडेटा के साथ सावधानीपूर्वक एनोटेट किया जाना चाहिए और सहज पहुंच के लिए व्यवस्थित रूप से संग्रहीत किया जाना चाहिए।
मशीन लर्निंग में एक स्पीच डेटासेट बोली जाने वाली भाषा को पहचानने, ट्रांसक्राइब करने या व्याख्या करने के लिए तैयार किए गए मॉडल के प्रशिक्षण, परीक्षण और सत्यापन के लिए महत्वपूर्ण है। ऐसे डेटासेट वॉयस असिस्टेंट और ट्रांसक्रिप्शन सेवाओं से लेकर वॉयस बायोमेट्रिक्स तक असंख्य अनुप्रयोगों के लिए मार्ग प्रशस्त करते हैं।
विविध भाषाओं और उच्चारणों से सटीक डेटा एकत्र करने के लिए, वांछित भाषाई पृष्ठभूमि के मूल वक्ताओं के साथ सहयोग महत्वपूर्ण है। जनसांख्यिकीय बारीकियों के व्यापक स्पेक्ट्रम को कवर करने के लिए एक विविध और प्रतिनिधि नमूने का लक्ष्य रखें। ऑडियो स्थिरता सुनिश्चित करने के लिए समान वातावरण में मानकीकृत रिकॉर्डिंग उपकरण नियोजित करें। और महत्वपूर्ण बात यह है कि प्रत्येक डेटा टुकड़े को विशिष्ट भाषा और उच्चारण को दर्शाते हुए विस्तृत ट्रांसक्रिप्शन और मेटाडेटा के साथ एनोटेट करें।