स्वास्थ्य सेवा AI के लिए HIPAA-अनुपालक चिकित्सक श्रुतलेख ऑडियो डेटा

गोपनीयता और HIPAA विनियमों के अनुरूप चिकित्सक श्रुतलेख ऑडियो डेटा का उपयोग करके स्वास्थ्य सेवा AI नवाचार में तेजी लाना।

चिकित्सक श्रुतलेख ऑडियो डेटा डेटासेट

स्मार्ट एआई मॉडल के लिए उच्च-गुणवत्ता वाले मेडिकल ऑडियो डेटासेट

हमारे बिना पहचान वाले स्वास्थ्य सेवा डेटासेट में 31 विविध विशेषज्ञताओं से संबंधित ऑडियो फ़ाइलें शामिल हैं, जिन्हें चिकित्सकों द्वारा सावधानीपूर्वक तैयार किया गया है। ये रिकॉर्डिंग अस्पताल और नैदानिक ​​स्थितियों में वास्तविक दुनिया के चिकित्सक-रोगी संवादों से प्राप्त, रोगियों की नैदानिक ​​स्थितियों और देखभाल योजनाओं का विस्तृत विवरण प्रस्तुत करती हैं। गोपनीयता नियमों का पूरी तरह से पालन करते हुए, यह डेटासेट उन्नत स्वास्थ्य सेवा AI मॉडलों के प्रशिक्षण के लिए आदर्श है।

लिंग के आधार पर मेडिकल ऑडियो डेटा
स्पेशलिटी रोगी ऑडियो फ़ाइलें (समय घंटों में) ऑडियो फ़ाइलों की कुल संख्या
कुल257,9775,172,766
नर58,8502,444,910
महिला113,4061,290,900
अज्ञात85,7211,436,956
विशेषता के अनुसार चिकित्सा ऑडियो डेटा
स्पेशलिटी रोगी ऑडियो फ़ाइलें (समय घंटों में) ऑडियो फ़ाइलों की कुल संख्या
कुल257,9775,172,766
दुर्घटना एवं आपातकाल9359
एलर्जी और इम्यूनोलॉजी115222202
एनेस्थिसियोलॉजी67722280
Anesthetics19
एपीआरएन1631693
हृदयरोगविज्ञान675041566721
कार्डियोथोरेसिक17122
कार्डियोथोरेसिक शल्य - चिकित्सा110
क्लिनिकल हेमेटोलॉजी02
कोलोन और रेक्टल सर्जरी7162
कोलोरेक्टल सर्जन45984
गंभीर देखभाल की दवा2204328
दंत चिकित्सक165
त्वचा विज्ञान77123014
आहार विशेषज्ञ और पोषण विशेषज्ञ44736
आपातकालीन दवा4911112518
Endocrinology2057052
ईएनटी7010175477
पारिवार की दवा1767106733
गैस्ट्रोएंटरोलॉजी145840365
आम दवाई1405757
सामान्य अभ्यास411318
जनरल सर्जरी203871744
प्रसूतिशास्र3269103370
हाथ की सर्जरी245
रुधिर2588125
Hospitalist5931142529
संक्रामक रोग49314001
आंतरिक चिकित्सा15410445591
हस्तक्षेप कार्डियोलॉजी151143035
मातृ-भ्रूण चिकित्सा511355
नयूरोलोजी104524760
नेफ्रोलॉजी73520334
तंत्रिका-विज्ञान226963774
न्यूरोसर्जरी46211990
नाभिकीय औषधि223
प्रसूति एवं स्त्रीरोग विशेषज्ञ3562122303
अर्बुदविज्ञान293882996
ऑपथैल्मोलॉजी131641047
ओप्टामीटर331066
अस्थियों5665164483
ओटोलर्यनोलोजी3433100811
पैथोलोजी1664097
बाल चिकित्सा पल्मोनोलॉजी440
बाल चिकित्सा विशेषता35682
बाल चिकित्सा सर्जरी223
बच्चों की दवा करने की विद्या8779271
शारीरिक चिकित्सा और पुनर्वास134723523
भौतिक चिकित्सक1141713
चिकित्सक सहायक।638
पोडियाट्रिक सर्जरी424
पादचिकित्सा47312296
प्राथमिक देखभाल65120120
मानसिक रोगों की चिकित्सा212060381
पल्मोनोलॉजी129035290
विकिरण कैंसर विज्ञान2396558
रेडियोलोजी334599641
संधिवातीयशास्त्र2938729
एसआईसीयू125
भाषा निदान328
सर्जिकल ऑन्कोलॉजी2175758
वक्ष शल्य चिकित्सा1073336
प्रत्यारोपण सर्जरी611535
मूत्रविज्ञान317096934
ऊपरी गैस्ट्रोइंटेस्टाइनल सर्जरी458
संवहनी सर्जरी19156
संवहनी / सामान्य9268
घाव की देखभाल15211
डिवाइस के अनुसार मेडिकल ऑडियो डेटा
स्पेशलिटी रोगी ऑडियो फ़ाइलें (समय घंटों में) ऑडियो फ़ाइलों की कुल संख्या
कुल257,9775,172,766
आई - फ़ोन66632,382
डिजिटल रिकॉर्डर1,65922,377
मिश्रित प्रकार69,8181,408,679
लीक51,5331,306,405
स्पीचमाइक10,329257,730
टेलीफोन डिक्टेशन120,8672,071,557
अज्ञात3,10473,636

हम सभी प्रकार के डेटा लाइसेंसिंग यानी पाठ, ऑडियो, वीडियो या छवि से निपटते हैं। डेटासेट में ML के लिए मेडिकल डेटासेट होते हैं: फिजिशियन डिक्टेशन डेटासेट, फिजिशियन क्लिनिकल नोट्स, मेडिकल कन्वर्सेशन डेटासेट, मेडिकल ट्रांसक्रिप्शन डेटासेट, डॉक्टर-रोगी वार्तालाप, मेडिकल टेक्स्ट डेटा, मेडिकल इमेज - CT स्कैन, MRI, अल्ट्रा साउंड (एकत्रित आधार कस्टम आवश्यकताएं) .

शेप हमसे संपर्क करें

पता लगाने में सक्षम है जिसकी आपको तलाश है?

सभी प्रकार के डेटा में नए ऑफ-द-शेल्फ मेडिकल डेटासेट एकत्र किए जा रहे हैं

अपनी स्वास्थ्य देखभाल प्रशिक्षण डेटा संग्रह की चिंताओं से छुटकारा पाने के लिए अभी हमसे संपर्क करें

  • पंजीकरण करके, मैं शैप से सहमत हूं गोपनीयता नीति और सेवा की शर्तें और Shaip से B2B मार्केटिंग संचार प्राप्त करने के लिए अपनी सहमति प्रदान करता/करती हूँ।

चिकित्सक श्रुतलेख ऑडियो डेटा में ऑडियो फ़ाइलें शामिल होती हैं, जिनमें चिकित्सक परामर्श या अस्पताल दौरे के दौरान रोगी की नैदानिक ​​स्थिति, उपचार योजना या चिकित्सा इतिहास का वर्णन करते हैं।

यह डेटा भाषण पहचान, प्राकृतिक भाषा प्रसंस्करण (एनएलपी) और नैदानिक ​​दस्तावेज़ीकरण स्वचालन में एआई मॉडल को प्रशिक्षित करने के लिए महत्वपूर्ण है। यह हेल्थकेयर डॉक्यूमेंटेशन वर्कफ़्लो को ट्रांसक्राइब करने, विश्लेषण करने और सुधारने के लिए सिस्टम बनाने में मदद करता है।

डेटासेट में 257,977 चिकित्सा विशेषज्ञताओं से वास्तविक दुनिया के चिकित्सक द्वारा लिखे गए 31 घंटे शामिल हैं। ऑडियो को विभिन्न उपकरणों का उपयोग करके रिकॉर्ड किया जाता है, जिसमें टेलीफोन, डिजिटल रिकॉर्डर, स्मार्टफोन और स्पीच माइक्रोफोन शामिल हैं।

हां, रोगी की गोपनीयता सुनिश्चित करने के लिए व्यक्तिगत पहचान योग्य जानकारी (PII) को हटाने के लिए सभी ऑडियो फाइलों की पहचान हटा दी जाती है।

हां, डेटासेट अन्य वैश्विक गोपनीयता मानकों के साथ-साथ HIPAA और सेफ हार्बर दिशानिर्देशों का पालन करते हैं।

हां, डेटासेट को परियोजना आवश्यकताओं के आधार पर विशिष्ट विशेषताओं, जनसांख्यिकी या रिकॉर्डिंग डिवाइस प्रकारों के अनुरूप बनाया जा सकता है।

बिल्कुल। डेटासेट व्यापक हैं, जिनमें लाखों ऑडियो फ़ाइलें हैं, जो उन्हें छोटे और बड़े पैमाने पर AI/ML परियोजनाओं के लिए उपयुक्त बनाती हैं।

चिकित्सा ऑडियो डेटा और संबंधित प्रतिलेख मानक प्रारूपों में प्रदान किए जाते हैं जिन्हें वाक् पहचान और प्राकृतिक भाषा प्रसंस्करण (एनएलपी) मॉडल में सहजतापूर्वक एकीकृत किया जा सकता है।

ऑडियो डेटा की कठोर गुणवत्ता जांच की जाती है, तथा डोमेन विशेषज्ञ सटीकता और विश्वसनीयता सुनिश्चित करने के लिए एनोटेशन को मान्य करते हैं।

लागत डेटा की मात्रा, अनुकूलन और परियोजना के दायरे जैसे कारकों पर निर्भर करती है। हम अनुरोध करते हैं कि आप सर्वोत्तम उद्धरण प्राप्त करने के लिए अपनी आवश्यकताओं के साथ "हमसे संपर्क करें" फ़ॉर्म भरें।

डिलीवरी की समय-सीमा परियोजना के आकार और जटिलता के आधार पर अलग-अलग होती है, लेकिन इसे समय-सीमा को कुशलतापूर्वक पूरा करने के लिए संरचित किया जाता है।

ये डेटासेट नैदानिक ​​दस्तावेज़ीकरण को स्वचालित करने, प्रतिलेखन सटीकता में सुधार करने और स्वास्थ्य सेवा प्रदाताओं के लिए बेहतर निर्णय लेने में एआई क्षमताओं को बढ़ाते हैं।