रैखिक अनुवर्धन (Linear
Regression-LR)
यह मशीनी अधिगम की एक प्रमुख विधि है, जिसमें पूर्व निर्धारित डेटा के आधार पर मशीन को नवीन परिस्थितियों में
रैखिक क्रम में पूर्वानुमान करने के योग्य बनाया जाता है। यह Supervised ML
के अंतर्गत आता है। इस संबंध में https://www.ibm.com/in-en/topics/linear-regression
(28-11-2022) पर निम्नलिखित कथन दिया गया है-
"Linear regression analysis is used to
predict the value of a variable based on the value of another variable. The
variable you want to predict is called the dependent variable. The variable you
are using to predict the other variable's value is called the independent
variable."
रैखिक अनुवर्धन(Linear Regression) में
प्रयुक्त किए जाने वाले चरों के दो प्रकार के जाते हैं-
स्वतंत्र चर (Independent Variable)
इसके अंतर्गत वे चर आते हैं जो एल्गोरिद्म को
पूर्व डेटा के आधार पर दिए जाते हैं। इनके आधार पर मशीनी प्रणाली द्वारा अपने
आउटपुट से संबंधित निर्णय लिया जाता है। ये इनपुट चर होते हैं तथा मशीन को ये
सीखने में तथा निर्णय लेने में सहायता करते हैं अथवा आधार का कार्य करते हैं।
आश्रित चर (Dependent Variable)
यह मशीनी प्रणाली का आउटपुट चर होता है, जिसका मूल्य स्वतंत्र चर अथवा चरों के मूल्य पर आधारित होता है। अर्थात
स्वतंत्र चरों में जिस प्रकार से बढ़ोत्तरी या घटोत्तरी होती है, उसी प्रकार से आश्रित चर के मूल्य में भी बढ़ोत्तरी या घटोत्तरी होती है।
इस प्रकार के एल्गोरिद्म में स्वतंत्र चर या
चरों के मूल्यों के अनुसार ही आश्रित चर के मूल्य में बढ़ोत्तरी या घटोत्तरी होती
है। यह बढ़ोत्तरी या घटोत्तरी रैखिक रूप से दर्शाई जाती है। इसी कारण इसे रैखिक
अनुवर्धन कहते हैं।
रैखिक अनुवर्धन का सूत्र कई प्रकार से प्रस्तुत
किया जाता है। इसका सबसे सरल रूप इस प्रकार है-
Y = b0 + mX + e
इस सूत्र में प्रयुक्त चिन्हों को निम्नलिखित प्रकार से समझ सकते
हैं-
Y = response (dependent) variable
X = predictor (independent) variable
b0 = estimated intercept
m = estimated slope
e = estimated error
वैसे और अधिक सरलीकरण करने के लिए इसमें से ‘e’ भी हटा सकते हैं-
Y = b0 + mX
किंतु सामान्यतः इसे पूरा ही दिया जाता है, जिससे शुद्धता को अधिकाधिक स्तर पर प्राप्त किया जा सके।
रैखिक अनुवर्धन को चित्र रूप में इस प्रकार से दर्शाया जा सकता है-
(चित्र स्रोत- https://data-science-blog.com/wp-content/uploads/2022/05/linear-regression-error-term.png,
28-11-2022)
रैखिक अनुवर्धन (Linear Regression) का अनुप्रयोग
रैखिक अनुवर्धन (Linear Regression) पद्धति का
प्रयोग एक या एकाधिक चरों के कुछ मूल्यों के आधार पर किसी दूसरे चर विशेष के
क्रमशः घटने या बढ़ने वाली स्थिति के परीक्षण के लिए
किया जाता है, जिन्हें तकनीकी रूप से सतत/निरंतर चर (Continuous
variable) कहाते हैं। इसके अनुप्रयोग संबंधी कुछ कार्यों के उदाहरण
इस प्रकार से दिए जा सकते हैं-
§ किसी कर्मचारी के अनुभव
पर बढ़ने की स्थिति में उसके वेतन में बढ़ोतरी का अनुमान व्यक्त करना।
§ सेंसेक्स में होने वाली
बढ़त या घटाव की स्थिति में निफ्टी में होने वाली बढ़त किया घटाव का अनुमान व्यक्त
करना।
§ वैश्विक स्तर पर डॉलर की
स्थिति मजबूत या कमजोर होने की स्थिति में उसकी तुलना में रुपए की स्थिति के मजबूत
या कमजोर होने का अनुमान व्यक्त करना।
§ डालर, तेल और
रुपए की स्थितियों के आधार पर सोने चांदी के मूल्य में होने वाली बढ़त या घटाव का अनुमान व्यक्त करना।