केस स्टडी: कंटेंट मॉडरेशन

सामग्री मॉडरेशन के लिए 30K+ डॉक्स वेब को स्क्रैप और एनोटेट किया गया

Content moderation - banner
एआई-पावर्ड कंटेंट मॉडरेशन की मांग बढ़ रही है
जो ऑनलाइन स्पेस को सुरक्षित करने का प्रयास करते हैं जहां हम कनेक्ट और संचार करते हैं।

जैसे-जैसे सोशल मीडिया का उपयोग बढ़ता जा रहा है,
साइबरबुलिंग की समस्या एक के रूप में सामने आई है
करने का प्रयास कर रहे प्लेटफार्मों के लिए महत्वपूर्ण बाधा
एक सुरक्षित ऑनलाइन स्थान सुनिश्चित करें। एक चौंका देने वाला
38% लोग इसका सामना करते हैं
दैनिक आधार पर हानिकारक आचरण,
आविष्कारशील के लिए तत्काल मांग पर जोर देना
सामग्री मॉडरेशन दृष्टिकोण।
संगठन आज के उपयोग पर भरोसा करते हैं
टिकाऊ को संबोधित करने के लिए कृत्रिम बुद्धि
सक्रिय रूप से साइबरबुलिंग की समस्या।

साइबर सुरक्षा:

Facebook की Q4 सामुदायिक मानक प्रवर्तन रिपोर्ट से पता चला - 6.3% की सक्रिय पहचान दर के साथ धमकाने और उत्पीड़न सामग्री के 49.9 मिलियन टुकड़ों पर कार्रवाई

शिक्षा:

2021 अध्ययन में पाया गया कि 36.5% तक संयुक्त राज्य अमेरिका में छात्रों का% आयु के बीच 12 और 17 वर्षों से अपनी स्कूली शिक्षा के दौरान किसी न किसी समय साइबरबुलिंग का अनुभव किया है।

2020 की एक रिपोर्ट के अनुसार, वैश्विक सामग्री मॉडरेशन समाधान बाजार का मूल्य 4.07 में 2019 बिलियन अमेरिकी डॉलर था और 11.94% सीएजीआर के साथ 2027 तक 14.7 बिलियन अमेरिकी डॉलर तक पहुंचने की उम्मीद थी।

वास्तविक विश्व समाधान

डेटा जो वैश्विक वार्तालापों को मॉडरेट करता है

ग्राहक एक मजबूत स्वचालित विकसित कर रहा था
सामग्री मॉडरेशन मशीन लर्निंग
इसकी क्लाउड पेशकश के लिए मॉडल, जिसके लिए वे
डोमेन-विशिष्ट विक्रेता की तलाश कर रहे थे जो
सटीक प्रशिक्षण डेटा के साथ उनकी सहायता कर सकता है।

प्राकृतिक भाषा प्रसंस्करण (एनएलपी) में हमारे व्यापक ज्ञान का लाभ उठाते हुए, हमने क्लाइंट को अंग्रेजी और स्पेनिश दोनों में 30,000 से अधिक दस्तावेज़ों को इकट्ठा करने, वर्गीकृत करने और व्याख्या करने में सहायता की ताकि स्वचालित सामग्री मॉडरेशन मशीन लर्निंग मॉडल को विषाक्त, परिपक्व या यौन रूप से स्पष्ट सामग्री में विभाजित किया जा सके। श्रेणियाँ।

Real world solution

मुसीबत

  • प्राथमिकता वाले डोमेन से स्पेनिश और अंग्रेजी दोनों में 30,000 दस्तावेजों को वेब स्क्रैप करना
  • एकत्रित सामग्री को छोटे, मध्यम और लंबे खंडों में वर्गीकृत करना
  • संकलित डेटा को विषाक्त, परिपक्व या यौन रूप से स्पष्ट सामग्री के रूप में लेबल करना
  • न्यूनतम 90% सटीकता के साथ उच्च-गुणवत्ता वाले एनोटेशन सुनिश्चित करना।

उपाय

  • वेब ने बीएफएसआई, हेल्थकेयर, मैन्युफैक्चरिंग, रिटेल से स्पेनिश और अंग्रेजी के लिए 30,000 दस्तावेजों को खत्म कर दिया। सामग्री को आगे छोटे, मध्यम और लंबे दस्तावेज़ों में विभाजित किया गया था 
  • सामग्री को विषाक्त, परिपक्व या स्पष्ट यौन सामग्री के रूप में सफलतापूर्वक लेबल करना
  • 90% गुणवत्ता प्राप्त करने के लिए, Shaip ने दो स्तरीय गुणवत्ता नियंत्रण प्रक्रिया लागू की:
    »स्तर 1: गुणवत्ता आश्वासन जांच: 100% फाइलों को मान्य किया जाना है।
    » स्तर 2: महत्वपूर्ण गुणवत्ता विश्लेषण जांच: पूर्वव्यापी नमूनों के 15% -20% का आकलन करने के लिए Shaips की CQA टीम।

परिणाम

प्रशिक्षण डेटा ने स्वचालित सामग्री मॉडरेशन एमएल मॉडल बनाने में मदद की जो सुरक्षित ऑनलाइन वातावरण बनाए रखने के लिए कई लाभकारी परिणाम दे सकता है। कुछ प्रमुख परिणामों में शामिल हैं:

  • डेटा की विशाल मात्रा को संसाधित करने की क्षमता
  • मॉडरेशन नीतियों के समान प्रवर्तन को सुनिश्चित करने में निरंतरता
  • बढ़ते उपयोगकर्ता आधार और सामग्री की मात्रा के अनुकूल होने की मापनीयता
  • रीयल-टाइम मॉडरेशन पहचान कर सकता है और
    उत्पन्न होने वाली संभावित रूप से हानिकारक सामग्री को हटा दें
  • मानव मध्यस्थों पर निर्भरता कम करके लागत-प्रभावशीलता

सामग्री मॉडरेशन के उदाहरण

Examples of content moderation

अपने संवादी एआई को तेज़ करें
अनुप्रयोग विकास 100%

हमें बताएं कि हम आपकी अगली एआई पहल में कैसे मदद कर सकते हैं।