आपके एआई के लिए सबसे भरोसेमंद भाषण डेटा संग्रह सेवाएं

हमारे ऑडियो और भाषण डेटा संग्रह सेवाओं के साथ अपने एनएलपी मॉडल, वीए, टीटीएस प्रोटोटाइप, और अधिक गुणवत्ता वाले संवादी डेटा के साथ प्रशिक्षित करें

ऑडियो डेटा संग्रह

बाधाओं के बिना ऑडियो डेटा पाइपलाइनों की खोज करें

विशेष रुप से प्रदर्शित ग्राहक

व्यावसायिक ऑडियो/वॉयस डेटा संग्रह सेवाएँ

कोई भी विषय। कोई भी परिदृश्य.

शेप में, हमारी विशेषज्ञता विभिन्न एआई/एमएल आवश्यकताओं के लिए डिज़ाइन किए गए उच्च गुणवत्ता वाले भाषण डेटासेट बनाने में निहित है। हम अपने डेटासेट को व्यापक और अनुकूलनीय बनाते हुए विभिन्न सेटिंग्स में भाषाओं और रिकॉर्ड की एक विस्तृत श्रृंखला प्रदान करते हैं। हेआपका ध्यान कम से कम संभव समय में कस्टम स्पीच डेटा की उच्चतम मात्रा वाले मॉडलों को खिलाने पर है। हमारे साथ बोर्ड पर, आप उम्मीद कर सकते हैं: 

भाषण संग्रह
  • सटीकता में सुधार के लिए क्यूरेटेड उच्च गुणवत्ता वाले बहुभाषी ऑडियो / वॉयस डेटा
  • टी के लिए डोमेन विशिष्टता का उच्चतम संभव स्तरविविध परिदृश्य प्राप्त करें व्यवस्था
  •  विविध जनसांख्यिकी और वर्टिकल के अनुरूप अपने एमएल मॉडल को स्केल करें
  • रिकॉर्डिंग वातावरण: स्टूडियो गुणवत्ता, न्यूनतम पृष्ठभूमि शोर के साथ क्रिस्टल-स्पष्ट ऑडियो की विशेषता, और प्राकृतिक वातावरण, जहां रिकॉर्डिंग में वास्तविक दुनिया की स्थितियों की नकल करने के लिए परिवेशी ध्वनियों को शामिल किया जाता है।

100 +

देशों

55K +

भाषण के घंटे डेटा

250 +

परियोजनाओं

60 +

भाषाएँ (100+ बोलियाँ)

8 / 16 / 44 / 48 kHz

नमूना दर

हमारी विशेषज्ञता

स्मार्ट एनएलपी मॉडल के लिए ऑडियो डेटा को संरेखित करें

शैप दुनिया भर में दर्शकों के विविध सेट को पूरा करने के लिए आवाज-सक्षम प्रौद्योगिकियों को सक्षम करने के लिए 100 से अधिक भाषाओं में एंड-टू-एंड स्पीच/ऑडियो डेटा संग्रह सेवाएं प्रदान करता है। हम किसी भी दायरे और आकार की परियोजनाओं पर काम कर सकते हैं; मौजूदा ऑफ-द-शेल्फ ऑडियो डेटासेट को लाइसेंस देने से लेकर कस्टम ऑडियो डेटा संग्रह को प्रबंधित करने से लेकर ऑडियो ट्रांसक्रिप्शन और एनोटेशन तक। इससे कोई फर्क नहीं पड़ता कि आपका भाषण डेटा संग्रह प्रोजेक्ट कितना बड़ा है, हम बोलियों, टोन और भाषाओं को लक्षित करने वाले उच्च-गुणवत्ता वाले एनएलपी डेटासेट बनाने के लिए आपकी आवश्यकताओं के अनुरूप ऑडियो संग्रह सेवाओं को अनुकूलित कर सकते हैं। वॉयस-सक्षम बुद्धिमान सेटअप के लिए हमारे विस्तृत भाषण डेटासेट और ऑडियो डेटा संग्रह संसाधनों में से चुनें।

एकालाप भाषण

एकालाप भाषण संग्रह

यह एकल वक्ता के भाषण को संसाधित करने पर केंद्रित है। एकल-चैनल ऑडियो फ़ाइलों में फ़ीड करने के लिए स्क्रिप्टेड संकेतों का उपयोग करें, जिससे उस व्यक्ति के लिए विशिष्ट भाषण पैटर्न, टोन और बारीकियों को कैप्चर करना सुनिश्चित हो सके।

संवाद भाषण

संवाद भाषण
पुस्तक संग्रह

दो व्यक्तियों की बातचीत, दोहरे चैनल फ़ाइलों और लिखित संसाधनों के माध्यम से बहुभाषी प्रदर्शन के साथ वास्तविक दुनिया की बातचीत और संवादों की नकल करना।

बहुदलीय बातचीत

समूह/विद्रोही दल
बात चिट

बहु-व्यक्ति चर्चाएँ, समूह की गतिशीलता, ओवरलैप्स और विविध स्वरों को कैप्चर करना ताकि भाषण मॉडल को सटीक रूप से प्रशिक्षित किया जा सके।

प्राकृतिक भाषा का उच्चारण

प्राकृतिक भाषा उच्चारण संग्रह

उन्नत प्राकृतिक भाषा प्रसंस्करण और समझ के लिए विविध, समृद्ध और प्रामाणिक उच्चारणों का उपयोग करके वाक्यांशों की पहचान करने या समान अर्थ वाले शब्दों को जागृत करने के लिए एआई को प्रशिक्षित करें।

ध्वनिक भाषण

ध्वनिक डेटा
पुस्तक संग्रह

हम व्यापक ध्वनिक रेंज (व्यापक ध्वनि डेटासेट) को कवर करते हुए पेशेवर रूप से स्टूडियो-गुणवत्ता ऑडियो डेटा रिकॉर्ड कर सकते हैं, चाहे वह रेस्तरां, कार्यालय, या घर या विभिन्न वातावरण और भाषाओं से हो।

स्वचालित भाषण मान्यता

स्वचालित वाक् पहचान (एएसआर)

जनसांख्यिकी की एक विस्तृत श्रृंखला से अत्याधुनिक विविध भाषण/ऑडियो डेटासेट तक पहुंच प्राप्त करके अपने स्वचालित भाषण पहचान (एएसआर) सिस्टम की सटीकता में सुधार करें।

प्राकृतिक भाषा का उच्चारण

बहुभाषी भाषण/ऑडियो प्रशिक्षण डेटा

दुनिया भर में हमारे कुशल भाषा पेशेवर विभिन्न भाषाओं और बोलियों में बहुभाषी ऑडियो/भाषण डेटा प्रदान करते हैं। यह प्रयास वैश्विक संचार को बढ़ावा देता है और भाषा की बाधाओं को दूर करता है, अधिक समावेशी और प्रभावी एआई समाधानों में योगदान देता है।

डिजिटल आभासी सहायक

पाठ से भाषण
(टीटीएस)

हमारे वैश्विक कार्यबल की सहायता से एक टेक्स्ट-टू-स्पीच (टीटीएस) बहुभाषी मॉडल बनाएं, जो आपके एआई मॉडल को इन-कार नियंत्रण से लेकर चैटबॉट और उच्च-शिक्षण समाधानों तक बढ़ाने के लिए 150+ भाषाओं और बोलियों में भाषण डेटा एकत्र करने में आपकी सहायता करता है। गुणवत्ता ऑडियो डेटा.

कॉल सेंटर रिकॉर्डिंग

कॉल सेंटर
रिकॉर्डिंग

एजेंटों और ग्राहकों के बीच वास्तविक आदान-प्रदान, स्पेनिश, जर्मन, अमेरिकी अंग्रेजी, बंगाली, जापानी, चीनी और हिंदी जैसी कई भाषाओं का समर्थन करता है।

सफलता की कहानियां

3 भाषाओं में 8 हजार घंटे से अधिक डेटा के साथ संवादात्मक एआई डेटासेट

भारतीय भाषाओं के लिए एक बहुभाषी मंच बनाने की तलाश में, क्लाइंट ने कई भारतीय भाषाओं में बड़े डेटासेट को इकट्ठा करने, विभाजित करने और ट्रांसक्रिप्ट करने के लिए शेप के साथ साझेदारी की। इससे प्रभावी भाषण मॉडल विकसित करने में मदद मिलेगी जो ग्राहक के नवोन्मेषी नए मंच को शक्ति प्रदान कर सकता है।

समस्या: स्वचालित वाक् पहचान विकसित करने के लिए 3,000 भारतीय भाषाओं में 8 घंटे से अधिक का ऑडियो डेटा एकत्र किया गया, खंडित और प्रतिलेखित किया गया।

उपाय: हमने डेटा संग्रह, विभाजन, प्रतिलेखन प्रदान किया और मेटाडेटा के साथ JSON फ़ाइलें वितरित कीं। हमने क्लाइंट के स्पीच टेक्नोलॉजी प्रोजेक्ट के लिए 3000 भारतीय भाषाओं में 8 घंटे का ऑडियो डेटा एकत्र किया।

भाषण डेटा संग्रह मामले का अध्ययन

अपने भरोसेमंद भाषण डेटा संग्रह भागीदार के रूप में शैप को चुनने के कारण

स्टाफ़

स्टाफ़

समर्पित एवं प्रशिक्षित टीमें:

  • डेटा निर्माण, लेबलिंग और क्यूए के लिए 30,000+ सहयोगी
  • प्रमाणित परियोजना प्रबंधन टीम
  • अनुभवी उत्पाद विकास टीम
  • टैलेंट पूल सोर्सिंग एवं ऑनबोर्डिंग टीम
प्रक्रिया

प्रक्रिया

उच्चतम प्रक्रिया दक्षता का आश्वासन दिया जाता है:

  • मजबूत 6 सिग्मा स्टेज-गेट प्रक्रिया
  • 6 सिग्मा ब्लैक बेल्ट की एक समर्पित टीम - मुख्य प्रक्रिया मालिक और गुणवत्ता अनुपालन
  • सतत सुधार एवं फीडबैक लूप
मंच

मंच

पेटेंट किया गया प्लेटफ़ॉर्म लाभ प्रदान करता है:

  • वेब-आधारित एंड-टू-एंड प्लेटफ़ॉर्म
  • त्रुटिहीन गुणवत्ता
  • तेज़ TAT
  • निर्बाध वितरण

ऑफ-द-शेल्फ स्पीच / ऑडियो डेटासेट

विवरणभाषा डेटासेटनमूना दरडेटासेट प्रकारकुल ऑडियो घंटेसंक्षिप्त वर्णनडेटासेट विवरणऑडियो चैनलरिकॉर्डिंग प्लेटफार्मWER (%)ऑडियो प्रारूपप्रतिलेखन प्रारूपउदाहरणबोलने वालों की संख्याCTA
भाषणen_US_CC_8अफ़्रीकी अमेरिकी स्थानीय भाषाअफ़्रीकी अमेरिकी स्थानीय भाषाen_US8 kHzकॉल सेंटर211अफ्रीकी अमेरिकी वर्नाक्युलर कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 612, पुरुष: 1242, और अज्ञात: 12
भाषणen_US_MA_16अफ़्रीकी अमेरिकी स्थानीय भाषाअफ़्रीकी अमेरिकी स्थानीय भाषाen_US16 kHzमीडिया ऑडियो154अफ्रीकी अमेरिकी वर्नाक्युलर मीडिया डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 151, पुरुष: 150, और अज्ञात: 10
भाषणअफ्रीकी_जीसी_8अफ्रीकीअफ्रीकीaf_ZA8 kHzसामान्य बातचीत368अफ्रीकी सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, अफ़्रीका में बोली जाने वाली अफ़्रीकीदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 502, पुरुष: 390, और अज्ञात: 2
भाषणअफ्रीकी_MA_16अफ्रीकीअफ्रीकीaf_ZA16 kHzमीडिया ऑडियो658अफ्रीकी मीडिया फ़ाइलेंलाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 750, पुरुष: 1278, और अज्ञात: 52
भाषणअरबी_जीसी_8अरबी भाषाअरबी भाषाar_AE8 kHzसामान्य बातचीत292अरबी सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, खाड़ी देशों से अरबीदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 171, पुरुष: 534, और अज्ञात: 1
भाषणअरबी_एसएम_48अरबी भाषाअरबी भाषाए आर-SA48 kHzस्क्रिप्टेड मोनोलॉग1,947अरबी लिपिबद्ध एकालापएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 838 पुरुष 1209 अज्ञात 78
भाषणअसमिया_सीसी_8असमीअसमिया (पाइपलाइन में) जैसे कीकॉल सेंटर60असमिया (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणअसमिया_जीसीअसमीअसमिया (पाइपलाइन में) जैसे कीसामान्य बातचीत100असमिया (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणअसमिया_एम.एअसमीअसमिया (पाइपलाइन में) जैसे कीमीडिया ऑडियो40असमिया (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणबंगाली_सीसी_8बंगालीबंगाली (पाइपलाइन में) बीएन_आईएनकॉल सेंटर60बंगाली (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणबंगाली_जीसीबंगालीबंगाली (पाइपलाइन में) बीएन_आईएनसामान्य बातचीत100बंगाली (पाइपलाइन में) सामान्य वार्तालाप डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणबंगाली_एम.एबंगालीबंगाली (पाइपलाइन में) बीएन_आईएनमीडिया ऑडियो40बंगाली (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणबोस्टन_सीसी_8बोस्टन अंग्रेजीबोस्टन अंग्रेजीen_US8 kHzकॉल सेंटर177बोस्टन कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 605, पुरुष: 711, और अज्ञात: 0
भाषणबोस्टन_जीसी_8बोस्टन अंग्रेजीबोस्टन अंग्रेजीen_US8 kHzसामान्य बातचीत32बोस्टन सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 53, पुरुष: 83, और अज्ञात: 0
भाषणबोस्टन_एमए_16बोस्टन अंग्रेजीबोस्टन अंग्रेजीen_US16 kHzमीडिया ऑडियो93बोस्टन मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 43, पुरुष: 181, और अज्ञात: 2
भाषणकैनेडियन_एसएम_48कनाडाई फ्रेंचकनाडाई फ्रेंचशनिवार-सीए48 kHzस्क्रिप्टेड मोनोलॉग1,222कनाडाई फ्रेंचएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 974 पुरुष 631 अज्ञात 1
भाषणचीनी_सीसी_8चीनी अंग्रेजीचीनी अंग्रेजीen_US8 kHzकॉल सेंटर169चीनी कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 1790, पुरुष: 523 और अज्ञात: 13
भाषणचीनी_MA_16चीनी अंग्रेजीचीनी अंग्रेजीen_US16 kHzमीडिया ऑडियो249चीनी मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 126, पुरुष: 346 और अज्ञात: 6
भाषणचीनी सरलीकृत_SM_48चीनी सरलीकृतचीनी सरलीकृतzh-CN48 kHzस्क्रिप्टेड मोनोलॉग2,762चीनी सरलीकृतएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1920 पुरुष 1535 अज्ञात 270
भाषणचीनी पारंपरिक_SM_48पारंपरिक चीनीपारंपरिक चीनीzh-TW48 kHzस्क्रिप्टेड मोनोलॉग1,028पारंपरिक चीनीएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1069 पुरुष 262 अज्ञात 3
भाषणडेनिश_जीसी_8डेनिशडेनिशदा_डीके8 kHzसामान्य बातचीत372डेनिश सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 311, पुरुष: 417, अज्ञात: 0
भाषणडेनिश_MA_16डेनिशडेनिशदा_डीके16 kHzमीडिया ऑडियो664डेनिश मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला: 369, पुरुष: 864, अज्ञात: 27
भाषणडेनिश_एसएम_48डेनिशडेनिशDA-डीके48 kHzस्क्रिप्टेड मोनोलॉग2,579डेनिश स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैं, डेनमार्क से डेनिशमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1551 पुरुष 1233 अज्ञात 42
भाषणइंग्लिश डीप साउथ_CC_8इंग्लिश डीप साउथइंग्लिश डीप साउथen_US8 kHzकॉल सेंटर151अंग्रेजी डीप साउथ कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 221, पुरुष 1004, अज्ञात 7
भाषणइंग्लिश डीप साउथ_GC_8इंग्लिश डीप साउथइंग्लिश डीप साउथen_US8 kHzसामान्य बातचीत56अंग्रेजी डीप साउथ सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 99, पुरुष 31, अज्ञात 0
भाषणइंग्लिश डीप साउथ_MA_16इंग्लिश डीप साउथइंग्लिश डीप साउथen_US16 kHzमीडिया ऑडियो266अंग्रेजी डीप साउथ मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 204, पुरुष 356, अज्ञात 21
भाषणजर्मन_सीसी_8जर्मनजर्मनडे-डे8 kHzकॉल सेंटर64जर्मन कॉल-सेंटर डेटा "एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,मोनोडेस्कटॉपवेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 478 पुरुष 1440 अज्ञात 0
भाषणजर्मन_आईवीआर_8जर्मनजर्मनडे-डे8 kHz आईवीआर200जर्मन आईवीआर डेटामानव से मशीन। एक आईवीआर प्रकार का प्रवाह जहां एक टीटीएस संकेत होता है (उदाहरण के लिए "मैं आपकी कैसे मदद कर सकता हूं") जिसके बाद एक सहज मानव प्रतिक्रिया होती हैमोनोडेस्कटॉपवेवफ़ॉर्म .jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग महिला 10115 पुरुष 8750 अज्ञात 0
भाषणगुजराती_सीसी_8गुजरातीगुजराती (पाइपलाइन में) gu_INकॉल सेंटर60गुजराती (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणगुजराती_जीसीगुजरातीगुजराती (पाइपलाइन में) gu_INसामान्य बातचीत100गुजराती (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणगुजराती_एम.एगुजरातीगुजराती (पाइपलाइन में) gu_INमीडिया ऑडियो40गुजराती (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणहिब्रू_सामान्य वार्तालाप_8यहूदीयहूदीवह_आईएल8 kHzसामान्य बातचीत399हिब्रू सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, इज़राइल में हिब्रूदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 414, पुरुष 399, अज्ञात 1
भाषणहिब्रू_MA_16यहूदीयहूदीवह_आईएल16 kHzमीडिया ऑडियो427हिब्रू मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 361, पुरुष 513, अज्ञात 13
भाषणहिंदी_एमए_16हिंदीहिंदीहाय_इन16 kHzमीडिया ऑडियो219हिंदी मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 83, पुरुष 309, अज्ञात 0
भाषणहिंदी_एसएम_48हिंदीहिंदीहाय-IN48 kHzस्क्रिप्टेड मोनोलॉग2,867हिंदी स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1977 पुरुष 1864 अज्ञात 147
भाषणहिंग्लिश_सीसी_8हिंग्लिशहिंग्लिशhg_IN8 kHzकॉल सेंटर208हिंग्लिश कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 822, पुरुष 1262, अज्ञात 0
भाषणहिंग्लिश_एमए_16हिंग्लिशहिंग्लिशhg_IN16 kHzमीडिया ऑडियो216हिंग्लिश मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 75, पुरुष 380, अज्ञात 0
भाषणहिस्पैनिक_CC_8हिस्पैनिक अंग्रेजीहिस्पैनिक अंग्रेजीen_US8 kHzकॉल सेंटर212हिस्पैनिक कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 822, पुरुष 1262, अज्ञात 0
भाषणहिस्पैनिक_MA_16हिस्पैनिक अंग्रेजीहिस्पैनिक अंग्रेजीen_US16 kHzमीडिया ऑडियो155हिस्पैनिक कॉल मीडिया ऑडियोलाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 140, पुरुष 219, अज्ञात 5
भाषणइंडोनेशियाई_जीसी_8इन्डोनेशियाईइन्डोनेशियाईमैंने किया8 kHzसामान्य बातचीत496इंडोनेशियाई सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, बहासा इंडोनेशियाईदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 524, पुरुष 454, अज्ञात 2
भाषणइंडोनेशियाई_MA_16इन्डोनेशियाईइन्डोनेशियाईमैंने किया16 kHzमीडिया ऑडियो643इंडोनेशियाई मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 746, पुरुष 1507, अज्ञात 129
भाषणआयरिश_जीसी_8आयरिशआयरिशen_IE8 kHzसामान्य बातचीत192आयरिश सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 213, पुरुष 153, अज्ञात 0
भाषणजापानी_एसएम_48जापानीजापानीja-जेपी48 kHzस्क्रिप्टेड मोनोलॉग2,335जापानी स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1460 पुरुष 1221 अज्ञात 194
भाषणकन्नड़_सीसी_8कन्नड़कन्नड़ (पाइपलाइन में) kn_INकॉल सेंटर60कन्नड़ (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणकन्नड़_जीसीकन्नड़कन्नड़ (पाइपलाइन में) kn_INसामान्य बातचीत100कन्नड़ (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणकन्नड़_एम.एकन्नड़कन्नड़ (पाइपलाइन में) kn_INमीडिया ऑडियो40कन्नड़ (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणकोरियाई_सीसी_8कोरियाईकोरियाईko_KR8 kHzकॉल सेंटर107कोरियाई कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1086, पुरुष 210, अज्ञात 4
भाषणकोरियाई_MA_16कोरियाईकोरियाईko_KR16 kHzमीडिया ऑडियो204कोरियाई मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 70 पुरुष 303, अज्ञात 25
भाषणकोरियाई_एसएम_48कोरियाईकोरियाईko-के.आर.48 kHzस्क्रिप्टेड मोनोलॉग1,955कोरियन स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1195 पुरुष 1134 अज्ञात 122
भाषणमलय_जीसी_8मलायीमलायीms_MY8 kHzसामान्य बातचीत266मलय सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, मलेशिया में मलयदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 316, पुरुष 176, अज्ञात 0
भाषणमलय_MA_16मलायीमलायीms_MY16 kHzमीडिया ऑडियो344मलय मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 236, पुरुष 626, अज्ञात 47
भाषणमलयालम_सीसी_8मलयालममलयालम (पाइपलाइन में) ml_INकॉल सेंटर60मलयालम (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमलयालम_जीसीमलयालममलयालम (पाइपलाइन में) ml_INसामान्य बातचीत100मलयालम (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमलयालम_एम.एमलयालममलयालम (पाइपलाइन में) ml_INमीडिया ऑडियो40मलयालम (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमराठी_सीसी_8मराठीमराठी (पाइपलाइन में) श्री_आईएनकॉल सेंटर60मराठी (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमराठी_जीसीमराठीमराठी (पाइपलाइन में) श्री_आईएनसामान्य बातचीत100मराठी (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमराठी_एम.एमराठीमराठी (पाइपलाइन में) श्री_आईएनमीडिया ऑडियो40मराठी (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणमेक्सिकन_एसएम_48स्पेनिश (मेक्सिको)स्पेनिश (मेक्सिको)es-एमएक्स48 kHzस्क्रिप्टेड मोनोलॉग1,492मैक्सिकन स्पेनिश स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1016 पुरुष 1069 अज्ञात 95
भाषणनीदरलैंड_SM_48डचडचNL-नाथन48 kHzस्क्रिप्टेड मोनोलॉग1,205डच स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1285 पुरुष 531 अज्ञात 3
भाषणन्यूयॉर्क अंग्रेजी_CC_8न्यूयॉर्क अंग्रेजीन्यूयॉर्क अंग्रेजीen_US8 kHzकॉल सेंटर103न्यूयॉर्क अंग्रेजी कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 610, पुरुष 532, अज्ञात 0
भाषणन्यू यॉर्क इंग्लिश_जीसी_8न्यूयॉर्क अंग्रेजीन्यूयॉर्क अंग्रेजीen_US8 kHzसामान्य बातचीत107न्यूयॉर्क अंग्रेजी सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 118, पुरुष 114, अज्ञात 0
भाषणन्यूयॉर्क अंग्रेजी_MA_16न्यूयॉर्क अंग्रेजीन्यूयॉर्क अंग्रेजीen_US16 kHzमीडिया ऑडियो140न्यूयॉर्क अंग्रेजी मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 66, पुरुष 230, अज्ञात 11
भाषणन्यूज़ीलैंड_जीसी_8न्यूज़ीलैंड अंग्रेज़ी न्यूज़ीलैंड अंग्रेज़ी en_NZ8 kHzसामान्य बातचीत148न्यूजीलैंड अंग्रेजी सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 167, पुरुष 121, अज्ञात 4
भाषणन्यूज़ीलैंड_MA_16न्यूज़ीलैंड अंग्रेज़ी न्यूज़ीलैंड अंग्रेज़ी en_NZ16 kHzमीडिया ऑडियो400न्यूजीलैंड अंग्रेजी मीडिया ऑडियोलाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 367, पुरुष 678, अज्ञात 26
भाषणउड़िया_सीसी_8उड़ियाउड़िया (पाइपलाइन में) या_INकॉल सेंटर60उड़िया (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणउड़िया_जीसीउड़ियाउड़िया (पाइपलाइन में) या_INसामान्य बातचीत100उड़िया (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणउड़िया_एम.एउड़ियाउड़िया (पाइपलाइन में) या_INमीडिया ऑडियो40उड़िया (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणपोलिश_MA_16पोलिशपोलिशpl_PL16 kHzमीडिया ऑडियो269पोलिश मीडिया ऑडियोलाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 173 पुरुष 354 अज्ञात 6
भाषणपोलिश पोलैंड_SM_48पोलिश (पोलैंड)पोलिश (पोलैंड)पी एल पी एल48 kHzस्क्रिप्टेड मोनोलॉग1,482पोलिश पोलैंड - पटकथा वाला एकालापएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1324 पुरुष 701 अज्ञात 24
भाषणपंजाबी_सीसी_8पंजाबीपंजाबी (पाइपलाइन में) पंजाबीकॉल सेंटर60पंजाबी (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणपंजाबी_जीसीपंजाबीपंजाबी (पाइपलाइन में) पंजाबीसामान्य बातचीत100पंजाबी (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणपंजाबी_एम.एपंजाबीपंजाबी (पाइपलाइन में) पंजाबी मीडिया ऑडियो40पंजाबी (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणरूसी_एसएम_48रूसीरूसीआरयू आरयू48 kHzस्क्रिप्टेड मोनोलॉग2,398रूसी स्क्रिप्टेड मोनोलॉगएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1689 पुरुष 1937 अज्ञात 214
भाषणस्कॉटिश_जीसी_8स्कॉटिश (अंग्रेजी एक्सेंट)स्कॉटिश (अंग्रेजी एक्सेंट)en_AB8 kHzसामान्य बातचीत292स्कॉटिश सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 285, पुरुष 260, अज्ञात 3
भाषणसिंगापुर_सीसी_8सिंगापुर अंग्रेजीसिंगापुर अंग्रेजीen_SG8 kHzकॉल सेंटर218सिंगापुर कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 2139, पुरुष 884, अज्ञात 21
भाषणसिंगापुर_MA_16सिंगापुर अंग्रेजीसिंगापुर अंग्रेजीen_SG16 kHzमीडिया ऑडियो247सिंगापुर मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 160, पुरुष 455, अज्ञात 37
भाषणदक्षिण अफ़्रीकी अंग्रेज़ी_CC_8दक्षिण अफ़्रीकी अंग्रेजीदक्षिण अफ़्रीकी अंग्रेजीen_ZA8 kHzकॉल सेंटर261दक्षिण अफ्रीकी अंग्रेजी कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1274, पुरुष 935, अज्ञात 1
भाषणदक्षिण अफ़्रीकी अंग्रेज़ी_MA_16दक्षिण अफ़्रीकी अंग्रेजीदक्षिण अफ़्रीकी अंग्रेजीen_ZA16 kHzमीडिया ऑडियो251दक्षिण अफ्रीकी अंग्रेजी मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 235, पुरुष 432, अज्ञात 36
भाषणस्वाहिली_सीसी_8स्वाहिलीस्वाहिलीsw_KE8 kHzकॉल सेंटर230स्वाहिली कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 611, पुरुष 833, अज्ञात 0
भाषणस्वाहिली_एमए_16स्वाहिलीस्वाहिलीsw_KE16 kHzमीडिया ऑडियो265स्वाहिली मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 118, पुरुष 493, अज्ञात 25
भाषणस्वीडिश_सीसी_8स्वीडिशस्वीडिशsv_SE8 kHzकॉल सेंटर250स्वीडिश कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1581, पुरुष 727, अज्ञात 2
भाषणस्वीडिश_MA_16स्वीडिशस्वीडिशsv_SE16 kHzमीडिया ऑडियो278स्वीडिश मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 195, पुरुष 500, अज्ञात 21
भाषणतमिल_सीसी_8तामिलतमिल (पाइपलाइन में) ta_INकॉल सेंटर60तमिल (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणतमिल_जीसीतामिलतमिल (पाइपलाइन में) ta_INसामान्य बातचीत100तमिल (पाइपलाइन में) सामान्य बातचीत डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणतमिल_एम.एतामिल तमिल (पाइपलाइन में) ta_INमीडिया ऑडियो40तमिल (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणतेलुगु_जीसी_8तेलुगुतेलुगुte_IN8 kHzसामान्य बातचीत553तेलुगु सामान्य वार्तालाप डेटादो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 574, पुरुष 564, अज्ञात 0
भाषणतेलुगु_MA_16तेलुगुतेलुगुte_IN16 kHzमीडिया ऑडियो648तेलुगु मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 207, पुरुष 963, अज्ञात 2
भाषणतेलुगू_सीसी_8तेलुगुतेलुगु (पाइपलाइन में) te_INकॉल सेंटर30तेलुगु (पाइपलाइन में) कॉल-सेंटर डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणतेलुगु_जीसीतेलुगुतेलुगु (पाइपलाइन में) te_INसामान्य बातचीत50तेलुगु (पाइपलाइन में) सामान्य वार्तालाप डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,डेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणतेलुगु_एमएतेलुगुतेलुगु (पाइपलाइन में) te_INमीडिया ऑडियो20तेलुगु (पाइपलाइन में) मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंग
भाषणथाई_जीसी_8थाईथाईवें_टीएच8 kHzसामान्य बातचीत183थाई सामान्य बातचीतदो लोगों के बीच अलिखित टेलीफोनिक बातचीत। लगभग। ऑडियो अवधि (रेंज) - 15-60 मिनट, दोस्तों के बीच इस्तेमाल किया जाने वाला एक अनौपचारिक रजिस्टरदोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 338, पुरुष 96, अज्ञात 8
भाषणथाई_MA_8थाईथाईवें_टीएच16 kHzमीडिया ऑडियो173थाई मीडिया ऑडियोलाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 143, पुरुष 502, अज्ञात 26
भाषणतुर्की टर्की_SM_48तुर्की टर्कीतुर्की टर्कीTR-टी.आर.48 kHzस्क्रिप्टेड मोनोलॉग2,027तुर्की टर्कीएकल-उच्चारण रिकॉर्डिंग, जो 5 से 30 सेकंड की सीमा में आती हैंमोनोमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 1561 पुरुष 1241 अज्ञात 31
भाषणवियतनामी_GC_8वियतनामीवियतनामीvi_VN8 kHzसामान्य बातचीत295वियतनामी सामान्य वार्तालाप डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट, उत्तरी (उदाहरण के लिए, हनोई), मध्य और दक्षिणी (उदाहरण के लिए, हो ची मिन्ह सिटी)।दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 400, पुरुष 380, अज्ञात 2
भाषणवियतनामी_MA_16वियतनामीवियतनामीvi_VN16 kHzमीडिया ऑडियो257वियतनामी मीडिया ऑडियो डेटालाइसेंस योग्य सार्वजनिक डोमेन ऑडियो/वीडियो फ़ाइलें जैसे साक्षात्कार, पॉडकास्ट आदि - 1 से 5 लोग। लगभग। ऑडियो अवधि (रेंज) 15-60 मिनटमोनोवेब सोर्सिंग5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 249, पुरुष 200, अज्ञात 45
भाषणवेल्श_जीसी_8वेल्श (अंग्रेजी एक्सेंट)वेल्श (अंग्रेजी एक्सेंट)en_WL8 kHzसामान्य बातचीत278वेल्श सामान्य वार्तालाप डेटा"एजेंट" और "ग्राहक" के बीच अलिखित, सिंथेटिक टेलीफोनिक बातचीत, लगभग। ऑडियो अवधि (रेंज) 5-15 मिनट,दोहरीडेस्कटॉप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगमहिला 270, पुरुष 324, अज्ञात 0
भाषणयूके अंग्रेजी_WW_16यूके अंग्रेजीयूके अंग्रेजीen_uk16 kHzवेक वर्ड200 वक्ताओंवेक वर्ड यूके इंग्लिशकुंजी वाक्यांश डेटा का संग्रह
  • 200 वक्ताओं
  • प्रति वक्ता 4 अद्वितीय कुंजी वाक्यांश
  • अद्वितीय कीफ्रेज प्रति 25-30 बार-बार कीफ्रेज रिकॉर्डिंग
  • 25-30 ऑडियो फ़ाइलें प्रति अद्वितीय कीफ़्रेज़
  • प्रति वक्ता 120 कुल रिकॉर्ड किए गए उच्चारण
1 चैनलमोबाइल ऐप5.0वेवफ़ॉर्म.jsonएएसआर, वर्चुअल असिस्टेंट, चैटबॉट, कन्वर्सेशनल एआई, स्पीच एनालिटिक्स, टीटीएस, लैंग्वेज मॉडलिंगलिंग: 50% पुरुष, 50% महिला, +/- 10%।

सेवाएं दी गईं

व्यापक एआई सेटअप के लिए विशेषज्ञ ऑडियो डेटा संग्रह पूरी तरह से डेक पर नहीं है। शेप में, आप मॉडल को सामान्य से अधिक व्यापक बनाने के लिए निम्नलिखित सेवाओं पर भी विचार कर सकते हैं:

पाठ डेटा संग्रह

पाठ डेटा संग्रह
सेवाएँ

Shaip संज्ञानात्मक डेटा संग्रह सेवाओं का सही मूल्य यह है कि यह संगठनों को असंरचित डेटा के भीतर पाई जाने वाली महत्वपूर्ण जानकारी को अनलॉक करने की कुंजी देती है

छवि डेटा संग्रह

छवि डेटा संग्रह सेवाएँ

सुनिश्चित करें कि आपका कंप्यूटर विज़न मॉडल भविष्य के अगले-जीन एआई मॉडल को मूल रूप से प्रशिक्षित करने के लिए हर छवि की सटीक पहचान करता है

वीडियो डेटा संग्रह

वीडियो डेटा संग्रहण सेवाएँ

अब वस्तुओं, व्यक्तियों, बाधाओं और अन्य दृश्य तत्वों की पूर्णता की पहचान करने के लिए अपने मॉडलों को प्रशिक्षित करने के लिए एनएलपी के साथ-साथ कंप्यूटर दृष्टि पर ध्यान केंद्रित करें।

शेप हमसे संपर्क करें

अपना खुद का ऑडियो डेटासेट बनाना चाहते हैं?

एक ऑडियो रिपॉजिटरी स्थापित करने के लिए हमारे इन-हाउस स्पीच डेटा कलेक्शन विशेषज्ञ से जुड़ें जो आपकी आवश्यकता के अनुकूल हो

  • पंजीकरण करके, मैं शैप से सहमत हूं Privacy Policy और सेवा की शर्तें और Shaip से B2B मार्केटिंग संचार प्राप्त करने के लिए अपनी सहमति प्रदान करता/करती हूँ।

एमएल मॉडल के लिए भाषण डेटा संग्रह, बोली जाने वाली भाषा की ऑडियो रिकॉर्डिंग इकट्ठा करने की प्रक्रिया को संदर्भित करता है। यह संग्रह मशीन लर्निंग एल्गोरिदम को प्रशिक्षित करने और परिष्कृत करने में सहायता करता है, विशेष रूप से वे जो मानव आवाज़ों को समझने और संसाधित करने पर केंद्रित हैं।

स्वचालित वाक् पहचान (एएसआर) के लिए ऑडियो डेटा एकत्र करने का लक्ष्य रखते समय, आपको वांछित भाषा, उच्चारण और भाषण के प्रकार सहित अपने प्रोजेक्ट की विशिष्ट आवश्यकताओं को परिभाषित करके शुरू करना चाहिए। इन मापदंडों को सेट करने के बाद, सुनिश्चित करें कि आपने उपयोगकर्ता की गोपनीयता का सम्मान करने के लिए सभी आवश्यक अनुमतियाँ प्राप्त कर ली हैं। फिर, स्पष्ट ऑडियो नमूने कैप्चर करने के लिए उपयुक्त रिकॉर्डिंग डिवाइस या सॉफ़्टवेयर का उपयोग करें। प्रत्येक रिकॉर्डिंग को उसके प्रतिलेखन या अन्य प्रासंगिक मेटाडेटा के साथ सावधानीपूर्वक एनोटेट किया जाना चाहिए और सहज पहुंच के लिए व्यवस्थित रूप से संग्रहीत किया जाना चाहिए।

मशीन लर्निंग में एक स्पीच डेटासेट बोली जाने वाली भाषा को पहचानने, ट्रांसक्राइब करने या व्याख्या करने के लिए तैयार किए गए मॉडल के प्रशिक्षण, परीक्षण और सत्यापन के लिए महत्वपूर्ण है। ऐसे डेटासेट वॉयस असिस्टेंट और ट्रांसक्रिप्शन सेवाओं से लेकर वॉयस बायोमेट्रिक्स तक असंख्य अनुप्रयोगों के लिए मार्ग प्रशस्त करते हैं।

विविध भाषाओं और उच्चारणों से सटीक डेटा एकत्र करने के लिए, वांछित भाषाई पृष्ठभूमि के मूल वक्ताओं के साथ सहयोग महत्वपूर्ण है। जनसांख्यिकीय बारीकियों के व्यापक स्पेक्ट्रम को कवर करने के लिए एक विविध और प्रतिनिधि नमूने का लक्ष्य रखें। ऑडियो स्थिरता सुनिश्चित करने के लिए समान वातावरण में मानकीकृत रिकॉर्डिंग उपकरण नियोजित करें। और महत्वपूर्ण बात यह है कि प्रत्येक डेटा टुकड़े को विशिष्ट भाषा और उच्चारण को दर्शाते हुए विस्तृत ट्रांसक्रिप्शन और मेटाडेटा के साथ एनोटेट करें।