मशीनी अधिगम/गहन अधिगम की प्रक्रिया
मशीनी
अधिगम और गहन अधिगम (DL) की प्रक्रिया विशाल
डेटा से मशीन को प्रशिक्षित करने की प्रक्रिया है। अतः इसके लिए आवश्यक डेटा का
प्रयोग तीन चरणों में किया जाता है: ‘प्रशिक्षण, परीक्षण और प्रमाणन’। इन्हें निम्नलिखित प्रकार से
प्रदशित किया जाता है –
प्रशिक्षण
(Training) à परीक्षण
(Testing) à
प्रमाणन
(Validation)
इनमें
मशीनी अधिगम एल्गोरिद्म को सबसे पहले ‘प्रशिक्षण’ के अंतर्गत अत्यधिक मात्रा में डेटा प्रदान किया जाता है। उस डेटा के
आधार पर एल्दोरिद्म डेटा में प्राप्त अभिलक्षणों के आधार पर पैटर्न प्राप्त करता
है और सीखता है। इसके पश्चात ‘परीक्षण’
के अंतर्गत डेटा के छोटे से हिस्से से यह देखा जाता है कि एग्लोरिद्म कितना सीख
चुका है? तथा यह कितनी शुद्धता तक आउटपुट प्रदान कर पा रहा
है। प्रशिक्षण और परीक्षण के लिए विकासकर्ता द्वारा अपने मूल डेटा के ही एक
निश्चित अनुपात में दो भाग कर लिए जाते हैं। सामान्यतः यह अनुपात 70 : 30 या 80 :
20 का होता है। अर्थात प्रशिक्षण के लिए 70 से 80% डेटा और परीक्षण के लिए 20
से 30% डेटा का प्रयोग किया जाता है।
अंत
में ‘प्रमाणन’ के माध्यम से आवश्यक संशोधन-परिवर्धन करते
हुए एल्गोरिद्म को एकदम नए डेटा पर काम करने के योग्य बनाया जाता है।
No comments:
Post a Comment