आपके एआई के लिए सबसे भरोसेमंद भाषण डेटा संग्रह सेवाएं
हमारे ऑडियो और भाषण डेटा संग्रह सेवाओं के साथ अपने एनएलपी मॉडल, वीए, टीटीएस प्रोटोटाइप, और अधिक गुणवत्ता वाले संवादी डेटा के साथ प्रशिक्षित करें
बाधाओं के बिना ऑडियो डेटा पाइपलाइनों की खोज करें
विशेष रुप से प्रदर्शित ग्राहक
व्यावसायिक ऑडियो/वॉयस डेटा संग्रह सेवाएँ
कोई भी विषय। कोई भी परिदृश्य.
शेप में, हमारी विशेषज्ञता विभिन्न एआई/एमएल आवश्यकताओं के लिए डिज़ाइन किए गए उच्च गुणवत्ता वाले भाषण डेटासेट बनाने में निहित है। हम अपने डेटासेट को व्यापक और अनुकूलनीय बनाते हुए विभिन्न सेटिंग्स में भाषाओं और रिकॉर्ड की एक विस्तृत श्रृंखला प्रदान करते हैं। हेआपका ध्यान कम से कम संभव समय में कस्टम स्पीच डेटा की उच्चतम मात्रा वाले मॉडलों को खिलाने पर है। हमारे साथ बोर्ड पर, आप उम्मीद कर सकते हैं:
- सटीकता में सुधार के लिए क्यूरेटेड उच्च गुणवत्ता वाले बहुभाषी ऑडियो / वॉयस डेटा
- टी के लिए डोमेन विशिष्टता का उच्चतम संभव स्तरविविध परिदृश्य प्राप्त करें व्यवस्था
- विविध जनसांख्यिकी और वर्टिकल के अनुरूप अपने एमएल मॉडल को स्केल करें
- रिकॉर्डिंग वातावरण: स्टूडियो गुणवत्ता, न्यूनतम पृष्ठभूमि शोर के साथ क्रिस्टल-स्पष्ट ऑडियो की विशेषता, और प्राकृतिक वातावरण, जहां रिकॉर्डिंग में वास्तविक दुनिया की स्थितियों की नकल करने के लिए परिवेशी ध्वनियों को शामिल किया जाता है।
100 +
55K +
भाषण के घंटे डेटा
250 +
परियोजनाओं
60 +
भाषाएँ (100+ बोलियाँ)
8 / 16 / 44 / 48 kHz
नमूना दर
हमारी विशेषज्ञता
स्मार्ट एनएलपी मॉडल के लिए ऑडियो डेटा को संरेखित करें
शैप दुनिया भर में दर्शकों के विविध सेट को पूरा करने के लिए आवाज-सक्षम प्रौद्योगिकियों को सक्षम करने के लिए 100 से अधिक भाषाओं में एंड-टू-एंड स्पीच/ऑडियो डेटा संग्रह सेवाएं प्रदान करता है। हम किसी भी दायरे और आकार की परियोजनाओं पर काम कर सकते हैं; मौजूदा ऑफ-द-शेल्फ ऑडियो डेटासेट को लाइसेंस देने से लेकर कस्टम ऑडियो डेटा संग्रह को प्रबंधित करने से लेकर ऑडियो ट्रांसक्रिप्शन और एनोटेशन तक। इससे कोई फर्क नहीं पड़ता कि आपका भाषण डेटा संग्रह प्रोजेक्ट कितना बड़ा है, हम बोलियों, टोन और भाषाओं को लक्षित करने वाले उच्च-गुणवत्ता वाले एनएलपी डेटासेट बनाने के लिए आपकी आवश्यकताओं के अनुरूप ऑडियो संग्रह सेवाओं को अनुकूलित कर सकते हैं। वॉयस-सक्षम बुद्धिमान सेटअप के लिए हमारे विस्तृत भाषण डेटासेट और ऑडियो डेटा संग्रह संसाधनों में से चुनें।
एकालाप भाषण संग्रह
यह एकल वक्ता के भाषण को संसाधित करने पर केंद्रित है। एकल-चैनल ऑडियो फ़ाइलों में फ़ीड करने के लिए स्क्रिप्टेड संकेतों का उपयोग करें, जिससे उस व्यक्ति के लिए विशिष्ट भाषण पैटर्न, टोन और बारीकियों को कैप्चर करना सुनिश्चित हो सके।
संवाद भाषण
पुस्तक संग्रह
दो व्यक्तियों की बातचीत, दोहरे चैनल फ़ाइलों और लिखित संसाधनों के माध्यम से बहुभाषी प्रदर्शन के साथ वास्तविक दुनिया की बातचीत और संवादों की नकल करना।
समूह/विद्रोही दल
बात चिट
बहु-व्यक्ति चर्चाएँ, समूह की गतिशीलता, ओवरलैप्स और विविध स्वरों को कैप्चर करना ताकि भाषण मॉडल को सटीक रूप से प्रशिक्षित किया जा सके।
प्राकृतिक भाषा उच्चारण संग्रह
उन्नत प्राकृतिक भाषा प्रसंस्करण और समझ के लिए विविध, समृद्ध और प्रामाणिक उच्चारणों का उपयोग करके वाक्यांशों की पहचान करने या समान अर्थ वाले शब्दों को जागृत करने के लिए एआई को प्रशिक्षित करें।
ध्वनिक डेटा
पुस्तक संग्रह
हम व्यापक ध्वनिक रेंज (व्यापक ध्वनि डेटासेट) को कवर करते हुए पेशेवर रूप से स्टूडियो-गुणवत्ता ऑडियो डेटा रिकॉर्ड कर सकते हैं, चाहे वह रेस्तरां, कार्यालय, या घर या विभिन्न वातावरण और भाषाओं से हो।
स्वचालित वाक् पहचान (एएसआर)
जनसांख्यिकी की एक विस्तृत श्रृंखला से अत्याधुनिक विविध भाषण/ऑडियो डेटासेट तक पहुंच प्राप्त करके अपने स्वचालित भाषण पहचान (एएसआर) सिस्टम की सटीकता में सुधार करें।
बहुभाषी भाषण/ऑडियो प्रशिक्षण डेटा
दुनिया भर में हमारे कुशल भाषा पेशेवर विभिन्न भाषाओं और बोलियों में बहुभाषी ऑडियो/भाषण डेटा प्रदान करते हैं। यह प्रयास वैश्विक संचार को बढ़ावा देता है और भाषा की बाधाओं को दूर करता है, अधिक समावेशी और प्रभावी एआई समाधानों में योगदान देता है।
पाठ से भाषण
(टीटीएस)
हमारे वैश्विक कार्यबल की सहायता से एक टेक्स्ट-टू-स्पीच (टीटीएस) बहुभाषी मॉडल बनाएं, जो आपके एआई मॉडल को इन-कार नियंत्रण से लेकर चैटबॉट और उच्च-शिक्षण समाधानों तक बढ़ाने के लिए 150+ भाषाओं और बोलियों में भाषण डेटा एकत्र करने में आपकी सहायता करता है। गुणवत्ता ऑडियो डेटा.
कॉल सेंटर
रिकॉर्डिंग
एजेंटों और ग्राहकों के बीच वास्तविक आदान-प्रदान, स्पेनिश, जर्मन, अमेरिकी अंग्रेजी, बंगाली, जापानी, चीनी और हिंदी जैसी कई भाषाओं का समर्थन करता है।
सफलता की कहानियां
3 भाषाओं में 8 हजार घंटे से अधिक डेटा के साथ संवादात्मक एआई डेटासेट
भारतीय भाषाओं के लिए एक बहुभाषी मंच बनाने की तलाश में, क्लाइंट ने कई भारतीय भाषाओं में बड़े डेटासेट को इकट्ठा करने, विभाजित करने और ट्रांसक्रिप्ट करने के लिए शेप के साथ साझेदारी की। इससे प्रभावी भाषण मॉडल विकसित करने में मदद मिलेगी जो ग्राहक के नवोन्मेषी नए मंच को शक्ति प्रदान कर सकता है।
समस्या: स्वचालित वाक् पहचान विकसित करने के लिए 3,000 भारतीय भाषाओं में 8 घंटे से अधिक का ऑडियो डेटा एकत्र किया गया, खंडित और प्रतिलेखित किया गया।
उपाय: हमने डेटा संग्रह, विभाजन, प्रतिलेखन प्रदान किया और मेटाडेटा के साथ JSON फ़ाइलें वितरित कीं। हमने क्लाइंट के स्पीच टेक्नोलॉजी प्रोजेक्ट के लिए 3000 भारतीय भाषाओं में 8 घंटे का ऑडियो डेटा एकत्र किया।
अपने भरोसेमंद भाषण डेटा संग्रह भागीदार के रूप में शैप को चुनने के कारण
स्टाफ़
समर्पित एवं प्रशिक्षित टीमें:
- डेटा निर्माण, लेबलिंग और क्यूए के लिए 30,000+ सहयोगी
- प्रमाणित परियोजना प्रबंधन टीम
- अनुभवी उत्पाद विकास टीम
- टैलेंट पूल सोर्सिंग एवं ऑनबोर्डिंग टीम
प्रक्रिया
उच्चतम प्रक्रिया दक्षता का आश्वासन दिया जाता है:
- मजबूत 6 सिग्मा स्टेज-गेट प्रक्रिया
- 6 सिग्मा ब्लैक बेल्ट की एक समर्पित टीम - मुख्य प्रक्रिया मालिक और गुणवत्ता अनुपालन
- सतत सुधार एवं फीडबैक लूप
मंच
पेटेंट किया गया प्लेटफ़ॉर्म लाभ प्रदान करता है:
- वेब-आधारित एंड-टू-एंड प्लेटफ़ॉर्म
- त्रुटिहीन गुणवत्ता
- तेज़ TAT
- निर्बाध वितरण
स्टाफ़
समर्पित एवं प्रशिक्षित टीमें:
- डेटा निर्माण, लेबलिंग और क्यूए के लिए 30,000+ सहयोगी
- प्रमाणित परियोजना प्रबंधन टीम
- अनुभवी उत्पाद विकास टीम
- टैलेंट पूल सोर्सिंग एवं ऑनबोर्डिंग टीम
प्रक्रिया
उच्चतम प्रक्रिया दक्षता का आश्वासन दिया जाता है:
- मजबूत 6 सिग्मा स्टेज-गेट प्रक्रिया
- 6 सिग्मा ब्लैक बेल्ट की एक समर्पित टीम - मुख्य प्रक्रिया मालिक और गुणवत्ता अनुपालन
- सतत सुधार एवं फीडबैक लूप
मंच
पेटेंट किया गया प्लेटफ़ॉर्म लाभ प्रदान करता है:
- वेब-आधारित एंड-टू-एंड प्लेटफ़ॉर्म
- त्रुटिहीन गुणवत्ता
- तेज़ TAT
- निर्बाध वितरण
ऑफ-द-शेल्फ स्पीच / ऑडियो डेटासेट
विवरण | कॉर्पस आईडी (अद्वितीय) | खोजशब्द | भाषा डेटासेट | भाषा कोड | नमूना दर | डेटासेट प्रकार | कुल ऑडियो घंटे | संक्षिप्त वर्णन | डेटासेट विवरण | ऑडियो चैनल | रिकॉर्डिंग प्लेटफार्म | WER (%) | ऑडियो प्रारूप | प्रतिलेखन प्रारूप | उदाहरण | बोलने वालों की संख्या | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
en_US_CC_8 | अफ़्रीकी अमेरिकी स्थानीय भाषा | अफ़्रीकी अमेरिकी स्थानीय भाषा | en_US | 8 kHz | कॉल सेंटर | 211 | अफ्रीकी अमेरिकी वर्नाक्युलर कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 612, पुरुष: 1242, और अज्ञात: 12 | Contact | |
en_US_MA_16 | अफ़्रीकी अमेरिकी स्थानीय भाषा | अफ़्रीकी अमेरिकी स्थानीय भाषा | en_US | 16 kHz | मीडिया ऑडियो | 154 | अफ्रीकी अमेरिकी वर्नाक्युलर मीडिया डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 151, पुरुष: 150, और अज्ञात: 10 | Contact | |
अफ्रीकी_जीसी_8 | अफ्रीकी | अफ्रीकी | af_ZA | 8 kHz | सामान्य बातचीत | 368 | अफ्रीकी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, अफ़्रीका में बोली जाने वाली अफ़्रीकी | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 502, पुरुष: 390, और अज्ञात: 2 | Contact | |
अफ्रीकी_MA_16 | अफ्रीकी | अफ्रीकी | af_ZA | 16 kHz | मीडिया ऑडियो | 658 | अफ्रीकी मीडिया फ़ाइलें | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 750, पुरुष: 1278, और अज्ञात: 52 | Contact | |
अरबी_जीसी_8 | अरबी भाषा | अरबी भाषा | ar_AE | 8 kHz | सामान्य बातचीत | 292 | अरबी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, खाड़ी देशों से अरबी | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 171, पुरुष: 534, और अज्ञात: 1 | Contact | |
अरबी_एसएम_48 | अरबी भाषा | अरबी भाषा | ए आर-SA | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,947 | अरबी लिपिबद्ध एकालाप | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 838 पुरुष 1209 अज्ञात 78 | Contact | |
असमिया_सीसी_8 | असमी | असमिया (पाइपलाइन में) | जैसे की | कॉल सेंटर | 60 | असमिया (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
असमिया_जीसी | असमी | असमिया (पाइपलाइन में) | जैसे की | सामान्य बातचीत | 100 | असमिया (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
असमिया_एम.ए | असमी | असमिया (पाइपलाइन में) | जैसे की | मीडिया ऑडियो | 40 | असमिया (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
बंगाली_सीसी_8 | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | कॉल सेंटर | 60 | बंगाली (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
बंगाली_जीसी | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | सामान्य बातचीत | 100 | बंगाली (पाइपलाइन में) सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
बंगाली_एम.ए | बंगाली | बंगाली (पाइपलाइन में) | बीएन_आईएन | मीडिया ऑडियो | 40 | बंगाली (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
बोस्टन_सीसी_8 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 177 | बोस्टन कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 605, पुरुष: 711, और अज्ञात: 0 | Contact | |
बोस्टन_जीसी_8 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 8 kHz | सामान्य बातचीत | 32 | बोस्टन सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 53, पुरुष: 83, और अज्ञात: 0 | Contact | |
बोस्टन_एमए_16 | बोस्टन अंग्रेजी | बोस्टन अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 93 | बोस्टन मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 43, पुरुष: 181, और अज्ञात: 2 | Contact | |
कैनेडियन_एसएम_48 | कनाडाई फ्रेंच | कनाडाई फ्रेंच | शनिवार-सीए | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,222 | कनाडाई फ्रेंच | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 974 पुरुष 631 अज्ञात 1 | Contact | |
चीनी_सीसी_8 | चीनी अंग्रेजी | चीनी अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 169 | चीनी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 1790, पुरुष: 523 और अज्ञात: 13 | Contact | |
चीनी_MA_16 | चीनी अंग्रेजी | चीनी अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 249 | चीनी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 126, पुरुष: 346 और अज्ञात: 6 | Contact | |
चीनी सरलीकृत_SM_48 | चीनी सरलीकृत | चीनी सरलीकृत | zh-CN | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,762 | चीनी सरलीकृत | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1920 पुरुष 1535 अज्ञात 270 | Contact | |
चीनी पारंपरिक_SM_48 | पारंपरिक चीनी | पारंपरिक चीनी | zh-TW | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,028 | पारंपरिक चीनी | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1069 पुरुष 262 अज्ञात 3 | Contact | |
डेनिश_जीसी_8 | डेनिश | डेनिश | दा_डीके | 8 kHz | सामान्य बातचीत | 372 | डेनिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 311, पुरुष: 417, अज्ञात: 0 | Contact | |
डेनिश_MA_16 | डेनिश | डेनिश | दा_डीके | 16 kHz | मीडिया ऑडियो | 664 | डेनिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला: 369, पुरुष: 864, अज्ञात: 27 | Contact | |
डेनिश_एसएम_48 | डेनिश | डेनिश | DA-डीके | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,579 | डेनिश स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं, डेनमार्क से डेनिश | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1551 पुरुष 1233 अज्ञात 42 | Contact | |
इंग्लिश डीप साउथ_CC_8 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 8 kHz | कॉल सेंटर | 151 | अंग्रेजी डीप साउथ कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 221, पुरुष 1004, अज्ञात 7 | Contact | |
इंग्लिश डीप साउथ_GC_8 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 8 kHz | सामान्य बातचीत | 56 | अंग्रेजी डीप साउथ सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 99, पुरुष 31, अज्ञात 0 | Contact | |
इंग्लिश डीप साउथ_MA_16 | इंग्लिश डीप साउथ | इंग्लिश डीप साउथ | en_US | 16 kHz | मीडिया ऑडियो | 266 | अंग्रेजी डीप साउथ मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 204, पुरुष 356, अज्ञात 21 | Contact | |
जर्मन_सीसी_8 | जर्मन | जर्मन | डे-डे | 8 kHz | कॉल सेंटर | 64 | जर्मन कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | मोनो | डेस्कटॉप | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 478 पुरुष 1440 अज्ञात 0 | Contact | ||
जर्मन_आईवीआर_8 | जर्मन | जर्मन | डे-डे | 8 kHz | आईवीआर | 200 | जर्मन आईवीआर डेटा | मानव से मशीन। एक आईवीआर प्रकार का प्रवाह जहां एक टीटीएस संकेत होता है (उदाहरण के लिए "मैं आपकी कैसे मदद कर सकता हूं") जिसके बाद एक सहज मानव प्रतिक्रिया होती है | मोनो | डेस्कटॉप | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 10115 पुरुष 8750 अज्ञात 0 | Contact | ||
गुजराती_सीसी_8 | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | कॉल सेंटर | 60 | गुजराती (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
गुजराती_जीसी | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | सामान्य बातचीत | 100 | गुजराती (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
गुजराती_एम.ए | गुजराती | गुजराती (पाइपलाइन में) | gu_IN | मीडिया ऑडियो | 40 | गुजराती (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
हिब्रू_सामान्य वार्तालाप_8 | यहूदी | यहूदी | वह_आईएल | 8 kHz | सामान्य बातचीत | 399 | हिब्रू सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, इज़राइल में हिब्रू | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 414, पुरुष 399, अज्ञात 1 | Contact | |
हिब्रू_MA_16 | यहूदी | यहूदी | वह_आईएल | 16 kHz | मीडिया ऑडियो | 427 | हिब्रू मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 361, पुरुष 513, अज्ञात 13 | Contact | |
हिंदी_एमए_16 | हिंदी | हिंदी | हाय_इन | 16 kHz | मीडिया ऑडियो | 219 | हिंदी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 83, पुरुष 309, अज्ञात 0 | Contact | |
हिंदी_एसएम_48 | हिंदी | हिंदी | हाय-IN | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,867 | हिंदी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1977 पुरुष 1864 अज्ञात 147 | Contact | |
हिंग्लिश_सीसी_8 | हिंग्लिश | हिंग्लिश | hg_IN | 8 kHz | कॉल सेंटर | 208 | हिंग्लिश कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 822, पुरुष 1262, अज्ञात 0 | Contact | |
हिंग्लिश_एमए_16 | हिंग्लिश | हिंग्लिश | hg_IN | 16 kHz | मीडिया ऑडियो | 216 | हिंग्लिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 75, पुरुष 380, अज्ञात 0 | Contact | |
हिस्पैनिक_CC_8 | हिस्पैनिक अंग्रेजी | हिस्पैनिक अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 212 | हिस्पैनिक कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 822, पुरुष 1262, अज्ञात 0 | Contact | |
हिस्पैनिक_MA_16 | हिस्पैनिक अंग्रेजी | हिस्पैनिक अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 155 | हिस्पैनिक कॉल मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 140, पुरुष 219, अज्ञात 5 | Contact | |
इंडोनेशियाई_जीसी_8 | इन्डोनेशियाई | इन्डोनेशियाई | मैंने किया | 8 kHz | सामान्य बातचीत | 496 | इंडोनेशियाई सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, बहासा इंडोनेशियाई | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 524, पुरुष 454, अज्ञात 2 | Contact | |
इंडोनेशियाई_MA_16 | इन्डोनेशियाई | इन्डोनेशियाई | मैंने किया | 16 kHz | मीडिया ऑडियो | 643 | इंडोनेशियाई मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 746, पुरुष 1507, अज्ञात 129 | Contact | |
आयरिश_जीसी_8 | आयरिश | आयरिश | en_IE | 8 kHz | सामान्य बातचीत | 192 | आयरिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 213, पुरुष 153, अज्ञात 0 | Contact | |
जापानी_एसएम_48 | जापानी | जापानी | ja-जेपी | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,335 | जापानी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1460 पुरुष 1221 अज्ञात 194 | Contact | |
कन्नड़_सीसी_8 | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | कॉल सेंटर | 60 | कन्नड़ (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
कन्नड़_जीसी | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | सामान्य बातचीत | 100 | कन्नड़ (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
कन्नड़_एम.ए | कन्नड़ | कन्नड़ (पाइपलाइन में) | kn_IN | मीडिया ऑडियो | 40 | कन्नड़ (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
कोरियाई_सीसी_8 | कोरियाई | कोरियाई | ko_KR | 8 kHz | कॉल सेंटर | 107 | कोरियाई कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1086, पुरुष 210, अज्ञात 4 | Contact | |
कोरियाई_MA_16 | कोरियाई | कोरियाई | ko_KR | 16 kHz | मीडिया ऑडियो | 204 | कोरियाई मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 70 पुरुष 303, अज्ञात 25 | Contact | |
कोरियाई_एसएम_48 | कोरियाई | कोरियाई | ko-के.आर. | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,955 | कोरियन स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1195 पुरुष 1134 अज्ञात 122 | Contact | |
मलय_जीसी_8 | मलायी | मलायी | ms_MY | 8 kHz | सामान्य बातचीत | 266 | मलय सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, मलेशिया में मलय | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 316, पुरुष 176, अज्ञात 0 | Contact | |
मलय_MA_16 | मलायी | मलायी | ms_MY | 16 kHz | मीडिया ऑडियो | 344 | मलय मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 236, पुरुष 626, अज्ञात 47 | Contact | |
मलयालम_सीसी_8 | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | कॉल सेंटर | 60 | मलयालम (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मलयालम_जीसी | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | सामान्य बातचीत | 100 | मलयालम (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मलयालम_एम.ए | मलयालम | मलयालम (पाइपलाइन में) | ml_IN | मीडिया ऑडियो | 40 | मलयालम (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मराठी_सीसी_8 | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | कॉल सेंटर | 60 | मराठी (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मराठी_जीसी | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | सामान्य बातचीत | 100 | मराठी (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मराठी_एम.ए | मराठी | मराठी (पाइपलाइन में) | श्री_आईएन | मीडिया ऑडियो | 40 | मराठी (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
मेक्सिकन_एसएम_48 | स्पेनिश (मेक्सिको) | स्पेनिश (मेक्सिको) | es-एमएक्स | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,492 | मैक्सिकन स्पेनिश स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1016 पुरुष 1069 अज्ञात 95 | Contact | |
नीदरलैंड_SM_48 | डच | डच | NL-नाथन | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,205 | डच स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1285 पुरुष 531 अज्ञात 3 | Contact | |
न्यूयॉर्क अंग्रेजी_CC_8 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 8 kHz | कॉल सेंटर | 103 | न्यूयॉर्क अंग्रेजी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 610, पुरुष 532, अज्ञात 0 | Contact | |
न्यू यॉर्क इंग्लिश_जीसी_8 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 8 kHz | सामान्य बातचीत | 107 | न्यूयॉर्क अंग्रेजी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 118, पुरुष 114, अज्ञात 0 | Contact | |
न्यूयॉर्क अंग्रेजी_MA_16 | न्यूयॉर्क अंग्रेजी | न्यूयॉर्क अंग्रेजी | en_US | 16 kHz | मीडिया ऑडियो | 140 | न्यूयॉर्क अंग्रेजी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 66, पुरुष 230, अज्ञात 11 | Contact | |
न्यूज़ीलैंड_जीसी_8 | न्यूज़ीलैंड अंग्रेज़ी | न्यूज़ीलैंड अंग्रेज़ी | en_NZ | 8 kHz | सामान्य बातचीत | 148 | न्यूजीलैंड अंग्रेजी सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 167, पुरुष 121, अज्ञात 4 | Contact | |
न्यूज़ीलैंड_MA_16 | न्यूज़ीलैंड अंग्रेज़ी | न्यूज़ीलैंड अंग्रेज़ी | en_NZ | 16 kHz | मीडिया ऑडियो | 400 | न्यूजीलैंड अंग्रेजी मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 367, पुरुष 678, अज्ञात 26 | Contact | |
उड़िया_सीसी_8 | उड़िया | उड़िया (पाइपलाइन में) | या_IN | कॉल सेंटर | 60 | उड़िया (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
उड़िया_जीसी | उड़िया | उड़िया (पाइपलाइन में) | या_IN | सामान्य बातचीत | 100 | उड़िया (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
उड़िया_एम.ए | उड़िया | उड़िया (पाइपलाइन में) | या_IN | मीडिया ऑडियो | 40 | उड़िया (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
पोलिश_MA_16 | पोलिश | पोलिश | pl_PL | 16 kHz | मीडिया ऑडियो | 269 | पोलिश मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 173 पुरुष 354 अज्ञात 6 | Contact | |
पोलिश पोलैंड_SM_48 | पोलिश (पोलैंड) | पोलिश (पोलैंड) | पी एल पी एल | 48 kHz | स्क्रिप्टेड मोनोलॉग | 1,482 | पोलिश पोलैंड - पटकथा वाला एकालाप | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1324 पुरुष 701 अज्ञात 24 | Contact | |
पंजाबी_सीसी_8 | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | कॉल सेंटर | 60 | पंजाबी (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
पंजाबी_जीसी | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | सामान्य बातचीत | 100 | पंजाबी (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
पंजाबी_एम.ए | पंजाबी | पंजाबी (पाइपलाइन में) | पंजाबी | मीडिया ऑडियो | 40 | पंजाबी (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
रूसी_एसएम_48 | रूसी | रूसी | आरयू आरयू | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,398 | रूसी स्क्रिप्टेड मोनोलॉग | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1689 पुरुष 1937 अज्ञात 214 | Contact | |
स्कॉटिश_जीसी_8 | स्कॉटिश (अंग्रेजी एक्सेंट) | स्कॉटिश (अंग्रेजी एक्सेंट) | en_AB | 8 kHz | सामान्य बातचीत | 292 | स्कॉटिश सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 285, पुरुष 260, अज्ञात 3 | Contact | |
सिंगापुर_सीसी_8 | सिंगापुर अंग्रेजी | सिंगापुर अंग्रेजी | en_SG | 8 kHz | कॉल सेंटर | 218 | सिंगापुर कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 2139, पुरुष 884, अज्ञात 21 | Contact | |
सिंगापुर_MA_16 | सिंगापुर अंग्रेजी | सिंगापुर अंग्रेजी | en_SG | 16 kHz | मीडिया ऑडियो | 247 | सिंगापुर मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 160, पुरुष 455, अज्ञात 37 | Contact | |
दक्षिण अफ़्रीकी अंग्रेज़ी_CC_8 | दक्षिण अफ़्रीकी अंग्रेजी | दक्षिण अफ़्रीकी अंग्रेजी | en_ZA | 8 kHz | कॉल सेंटर | 261 | दक्षिण अफ्रीकी अंग्रेजी कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1274, पुरुष 935, अज्ञात 1 | Contact | |
दक्षिण अफ़्रीकी अंग्रेज़ी_MA_16 | दक्षिण अफ़्रीकी अंग्रेजी | दक्षिण अफ़्रीकी अंग्रेजी | en_ZA | 16 kHz | मीडिया ऑडियो | 251 | दक्षिण अफ्रीकी अंग्रेजी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 235, पुरुष 432, अज्ञात 36 | Contact | |
स्वाहिली_सीसी_8 | स्वाहिली | स्वाहिली | sw_KE | 8 kHz | कॉल सेंटर | 230 | स्वाहिली कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 611, पुरुष 833, अज्ञात 0 | Contact | |
स्वाहिली_एमए_16 | स्वाहिली | स्वाहिली | sw_KE | 16 kHz | मीडिया ऑडियो | 265 | स्वाहिली मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 118, पुरुष 493, अज्ञात 25 | Contact | |
स्वीडिश_सीसी_8 | स्वीडिश | स्वीडिश | sv_SE | 8 kHz | कॉल सेंटर | 250 | स्वीडिश कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1581, पुरुष 727, अज्ञात 2 | Contact | |
स्वीडिश_MA_16 | स्वीडिश | स्वीडिश | sv_SE | 16 kHz | मीडिया ऑडियो | 278 | स्वीडिश मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 195, पुरुष 500, अज्ञात 21 | Contact | |
तमिल_सीसी_8 | तामिल | तमिल (पाइपलाइन में) | ta_IN | कॉल सेंटर | 60 | तमिल (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
तमिल_जीसी | तामिल | तमिल (पाइपलाइन में) | ta_IN | सामान्य बातचीत | 100 | तमिल (पाइपलाइन में) सामान्य बातचीत डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
तमिल_एम.ए | तामिल | तमिल (पाइपलाइन में) | ta_IN | मीडिया ऑडियो | 40 | तमिल (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
तेलुगु_जीसी_8 | तेलुगु | तेलुगु | te_IN | 8 kHz | सामान्य बातचीत | 553 | तेलुगु सामान्य वार्तालाप डेटा | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 574, पुरुष 564, अज्ञात 0 | Contact | |
तेलुगु_MA_16 | तेलुगु | तेलुगु | te_IN | 16 kHz | मीडिया ऑडियो | 648 | तेलुगु मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 207, पुरुष 963, अज्ञात 2 | Contact | |
तेलुगू_सीसी_8 | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | कॉल सेंटर | 30 | तेलुगु (पाइपलाइन में) कॉल-सेंटर डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
तेलुगु_जीसी | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | सामान्य बातचीत | 50 | तेलुगु (पाइपलाइन में) सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
तेलुगु_एमए | तेलुगु | तेलुगु (पाइपलाइन में) | te_IN | मीडिया ऑडियो | 20 | तेलुगु (पाइपलाइन में) मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | Contact | ||||
थाई_जीसी_8 | थाई | थाई | वें_टीएच | 8 kHz | सामान्य बातचीत | 183 | थाई सामान्य बातचीत | दो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोस्तों के बीच इस्तेमाल किया जाने वाला एक अनौपचारिक रजिस्टर | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 338, पुरुष 96, अज्ञात 8 | Contact | |
थाई_MA_8 | थाई | थाई | वें_टीएच | 16 kHz | मीडिया ऑडियो | 173 | थाई मीडिया ऑडियो | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 143, पुरुष 502, अज्ञात 26 | Contact | |
तुर्की टर्की_SM_48 | तुर्की टर्की | तुर्की टर्की | TR-टी.आर. | 48 kHz | स्क्रिप्टेड मोनोलॉग | 2,027 | तुर्की टर्की | एकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं | मोनो | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 1561 पुरुष 1241 अज्ञात 31 | Contact | |
वियतनामी_GC_8 | वियतनामी | वियतनामी | vi_VN | 8 kHz | सामान्य बातचीत | 295 | वियतनामी सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, उत्तरी (उदाहरण के लिए, हनोई), मध्य और दक्षिणी (उदाहरण के लिए, हो ची मिन्ह सिटी)। | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 400, पुरुष 380, अज्ञात 2 | Contact | |
वियतनामी_MA_16 | वियतनामी | वियतनामी | vi_VN | 16 kHz | मीडिया ऑडियो | 257 | वियतनामी मीडिया ऑडियो डेटा | लाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनट | मोनो | वेब सोर्सिंग | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 249, पुरुष 200, अज्ञात 45 | Contact | |
वेल्श_जीसी_8 | वेल्श (अंग्रेजी एक्सेंट) | वेल्श (अंग्रेजी एक्सेंट) | en_WL | 8 kHz | सामान्य बातचीत | 278 | वेल्श सामान्य वार्तालाप डेटा | "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, | दोहरी | डेस्कटॉप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | महिला 270, पुरुष 324, अज्ञात 0 | Contact | |
यूके अंग्रेजी_WW_16 | यूके अंग्रेजी | यूके अंग्रेजी | en_uk | 16 kHz | वेक वर्ड | 200 वक्ताओं | वेक वर्ड यूके इंग्लिश | कुंजी वाक्यांश डेटा का संग्रह
| 1 चैनल | मोबाइल ऐप | 5.0 | वेवफ़ॉर्म | .json | एएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग | लिंग: 50% पुरुष, 50% महिला, +/- 10%। | Contact |
सेवाएं दी गईं
व्यापक एआई सेटअप के लिए विशेषज्ञ ऑडियो डेटा संग्रह पूरी तरह से डेक पर नहीं है। शेप में, आप मॉडल को सामान्य से अधिक व्यापक बनाने के लिए निम्नलिखित सेवाओं पर भी विचार कर सकते हैं:
पाठ डेटा संग्रह
सेवाएँ
Shaip संज्ञानात्मक डेटा संग्रह सेवाओं का सही मूल्य यह है कि यह संगठनों को असंरचित डेटा के भीतर पाई जाने वाली महत्वपूर्ण जानकारी को अनलॉक करने की कुंजी देती है
छवि डेटा संग्रह सेवाएँ
सुनिश्चित करें कि आपका कंप्यूटर विज़न मॉडल भविष्य के अगले-जीन एआई मॉडल को मूल रूप से प्रशिक्षित करने के लिए हर छवि की सटीक पहचान करता है
वीडियो डेटा संग्रहण सेवाएँ
अब वस्तुओं, व्यक्तियों, बाधाओं और अन्य दृश्य तत्वों की पूर्णता की पहचान करने के लिए अपने मॉडलों को प्रशिक्षित करने के लिए एनएलपी के साथ-साथ कंप्यूटर दृष्टि पर ध्यान केंद्रित करें।
अनुशंसित संसाधन
की पेशकश
इंटेलिजेंट एआई के लिए ऑडियो एनोटेशन
ऑडियो एनोटेशन सेवाएं शुरू से ही Shaip की विशेषता रही हैं। हमारी अत्याधुनिक ऑडियो एनोटेशन सेवाओं के साथ संवादात्मक एआई, चैटबॉट्स और वाक् पहचान इंजनों का विकास, प्रशिक्षण और सुधार करें।
क्रेता गाइड
क्रेता गाइड: संवादी एआई के लिए पूरी गाइड
आपने जिस चैटबॉट के साथ बातचीत की, वह एक उन्नत संवादी AI सिस्टम पर चलता है, जिसे प्रशिक्षित, परीक्षण और टन वाक् पहचान डेटासेट का उपयोग करके बनाया गया है।
डेटा कैटलॉग
ऑफ-द-शेल्फ स्पीच डेटा कैटलॉग और लाइसेंसिंग
एआई परियोजनाओं में स्पीच डेटा के लिए कई प्रकार के सामान्य अनुप्रयोग हैं। हम आपको आपकी ध्वनि पहचान के लिए तैयार बड़ी मात्रा में उच्च-गुणवत्ता वाला डेटा प्रदान करते हैं।
अपना खुद का ऑडियो डेटासेट बनाना चाहते हैं?
एक ऑडियो रिपॉजिटरी स्थापित करने के लिए हमारे इन-हाउस स्पीच डेटा कलेक्शन विशेषज्ञ से जुड़ें जो आपकी आवश्यकता के अनुकूल हो
अक्सर पूछे जाने वाले प्रश्न (FAQ)
एमएल मॉडल के लिए भाषण डेटा संग्रह, बोली जाने वाली भाषा की ऑडियो रिकॉर्डिंग इकट्ठा करने की प्रक्रिया को संदर्भित करता है। यह संग्रह मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने और परिष्कृत करने में सहायता करता है, विशेष रूप से वे जो मानव आवाज़ों को समझने और संसाधित करने पर केंद्रित हैं।
स्वचालित वाक् पहचान (एएसआर) के लिए ऑडियो डेटा एकत्र करने का लक्ष्य रखते समय, आपको वांछित भाषा, उच्चारण और भाषण के प्रकार सहित अपने प्रोजेक्ट की विशिष्ट आवश्यकताओं को परिभाषित करके शुरू करना चाहिए। इन मापदंडों को सेट करने के बाद, सुनिश्चित करें कि आपने उपयोगकर्ता की गोपनीयता का सम्मान करने के लिए सभी आवश्यक अनुमतियाँ प्राप्त कर ली हैं। फिर, स्पष्ट ऑडियो नमूने कैप्चर करने के लिए उपयुक्त रिकॉर्डिंग डिवाइस या सॉफ़्टवेयर का उपयोग करें। प्रत्येक रिकॉर्डिंग को उसके प्रतिलेखन या अन्य प्रासंगिक मेटाडेटा के साथ सावधानीपूर्वक एनोटेट किया जाना चाहिए और सहज पहुंच के लिए व्यवस्थित रूप से संग्रहीत किया जाना चाहिए।
मशीन लर्निंग में एक स्पीच डेटासेट बोली जाने वाली भाषा को पहचानने, ट्रांसक्राइब करने या व्याख्या करने के लिए तैयार किए गए मॉडल के प्रशिक्षण, परीक्षण और सत्यापन के लिए महत्वपूर्ण है। ऐसे डेटासेट वॉयस असिस्टेंट और ट्रांसक्रिप्शन सेवाओं से लेकर वॉयस बायोमेट्रिक्स तक असंख्य अनुप्रयोगों के लिए मार्ग प्रशस्त करते हैं।
विविध भाषाओं और उच्चारणों से सटीक डेटा एकत्र करने के लिए, वांछित भाषाई पृष्ठभूमि के मूल वक्ताओं के साथ सहयोग महत्वपूर्ण है। जनसांख्यिकीय बारीकियों के व्यापक स्पेक्ट्रम को कवर करने के लिए एक विविध और प्रतिनिधि नमूने का लक्ष्य रखें। ऑडियो स्थिरता सुनिश्चित करने के लिए समान वातावरण में मानकीकृत रिकॉर्डिंग उपकरण नियोजित करें। और महत्वपूर्ण बात यह है कि प्रत्येक डेटा टुकड़े को विशिष्ट भाषा और उच्चारण को दर्शाते हुए विस्तृत ट्रांसक्रिप्शन और मेटाडेटा के साथ एनोटेट करें।