परिभाषा
सिमेंटिक सेगमेंटेशन एक कंप्यूटर विज़न कार्य है, जिसमें किसी छवि के प्रत्येक पिक्सेल को एक श्रेणी में वर्गीकृत किया जाता है, जैसे सड़क, भवन या पैदल यात्री।
उद्देश्य
इसका उद्देश्य स्व-ड्राइविंग, मेडिकल इमेजिंग और रोबोटिक्स में एआई अनुप्रयोगों के लिए विस्तृत दृश्य समझ प्रदान करना है।
महत्व
- सुरक्षा-महत्वपूर्ण प्रणालियों में पिक्सेल-स्तर की धारणा के लिए आवश्यक।
- बाउंडिंग बॉक्स की तुलना में सटीक ऑब्जेक्ट सीमाओं को सक्षम करता है।
- बड़े एनोटेटेड डेटासेट की आवश्यकता है.
- उच्च रिजोल्यूशन पर कम्प्यूटेशनल रूप से गहन।
यह कैसे काम करता है:
- पिक्सेल-स्तरीय एनोटेटेड छवियों को एकत्रित करें और लेबल करें।
- पूर्णतः कन्वोल्यूशनल नेटवर्क की तरह गहन शिक्षण मॉडल को प्रशिक्षित करें।
- इनपुट छवि को पिक्सेल-स्तरीय पूर्वानुमानों में संसाधित किया जाता है।
- आउटपुट मास्क प्रत्येक पिक्सेल को एक वर्ग प्रदान करता है।
- इंटरसेक्शन ओवर यूनियन (IoU) जैसे मेट्रिक्स के साथ मूल्यांकन करें।
उदाहरण (वास्तविक दुनिया)
- सिटीस्केप्स डेटासेट: शहरी दृश्यों के लिए अर्थपूर्ण विभाजन।
- टेस्ला ऑटोपायलट: सड़क नेविगेशन के लिए पिक्सेल-स्तरीय विभाजन।
- मेडिकल इमेजिंग: एमआरआई स्कैन में ट्यूमर का विभाजन।
संदर्भ / आगे पढ़ने के लिए
- लॉन्ग एट अल. “सिमेंटिक सेगमेंटेशन के लिए पूरी तरह से कन्वोल्यूशनल नेटवर्क।” सीवीपीआर 2015.
- सिटीस्केप्स डेटासेट.
- मेडिकल इमेजिंग पर आईईईई व्यवहार।