अध्याय 13 सांख्यिकी
“सांख्यिकी को औसतों और उनके अनुमानों की वैज्ञानिक विज्ञान कहा जा सकता है।” - ए.एल. बाउली एवं ए.एल. बॉड्डिंगटन
परिचय
हम जानते हैं कि सांख्यिकी विशिष्ट उद्देश्यों के लिए एकत्रित डेटा से संबंधित है। हम डेटा के विश्लेषण और व्याख्या के माध्यम से उस डेटा के बारे में निर्णय ले सकते हैं। पिछले कक्षाओं में, हमने डेटा को आलेखी रूप और तालिका रूप में प्रदर्शित करने के तरीकों का अध्ययन किया है। इस प्रतिनिधित्व से डेटा के कुछ प्रमुख विशेषताओं या विशेषताओं का पता चलता है। हमने दिए गए डेटा के लिए प्रतिनिधित्वी मान पाने के तरीकों का भी अध्ययन किया है। इस मान को केंद्रीय प्रवृत्ति का माप कहते हैं। याद करें कि माध्य (अंकगणितीय माध्य), मध्यिका और मोड केंद्रीय प्रवृत्ति के तीन माप हैं। केंद्रीय प्रवृत्ति का माप हमें डेटा बिंदुओं के कितने केंद्रित हैं या उनकी गणना करने के लिए एक सरल विचार देता है। लेकिन, डेटा से बेहतर व्याख्या करने के लिए,
कार्ल पीयरसन (1857-1936 ई.पू.)
डेटा के बारे में हमें यह भी एक विचार होना चाहिए कि डेटा कैसे बिखरे हुए हैं या कितने केंद्रित हैं केंद्रीय प्रवृत्ति के चारों ओर।
अब दो बल्लेबाजों के अंतिम दस मैचों में बट्टियों की गणना देखते हैं:
बल्लेबाज ए : $30,91,0,64,42,80,30,5,117,71$
बल्लेबाज बी : $53,46,48,50,53,53,58,60,57,52$
स्पष्ट है कि डेटा का माध्य और मध्यिका
| बल्लेबाज ए | बल्लेबाज बी | |
|---|---|---|
| माध्य | 53 | 53 |
| मध्यिका | 53 | 53 |
याद करें कि, हम एक डेटा का माध्य ($\bar{x}$ के रूप में निर्दिष्ट) अधिग्रहणों के योग को अधिग्रहणों की संख्या से विभाजित करके गणना करते हैं, अर्थात्
$ \bar{x}=\frac{1}{n} \sum\limits_{i=1}^{n} x_i $
इसके अतिरिक्त, मध्यिका को पहले डेटा को आरोही या अवरोही क्रम में व्यवस्थित करके और फिर निम्नलिखित नियम का अनुप्रयोग करके प्राप्त किया जाता है।
अगर अधिग्रहणों की संख्या विषम है, तो मध्यिका $(\frac{n+1}{2})^{\text{th }}$ अधिग्रहण है।
अगर अधिग्रहणों की संख्या सम है, तो मध्यिका $(\frac{n}{2})^{\text{th }}$ और $(\frac{n}{2}+1)^{\text{th }}$ अधिग्रहणों के माध्य है।
हम पाता है कि दोनों बल्लेबाजों $A$ और बी द्वारा बट्टियों के माध्य और मध्यिका एक समान हैं, अर्थात् 53। क्या हम कह सकते हैं कि दोनों खिलाड़ियों का प्रदर्शन समान है? स्पष्ट रूप से नहीं, क्योंकि बल्लेबाज ए के अंकों में चरम $=117-0=117$ और बल्लेबाज बी के बट्टियों का श्रेणी $=60-46=14$ से $>$ तक है। $B$ के बट्टियों का श्रेणी $=$ से $x$ तक है।
अब अभी उपरोक्त अंकों को संख्या रेखा पर बिंदुओं के रूप में रेखांकित करते हैं। हम निम्नलिखित आकृतियों को पाते हैं:
बल्लेबाज ए के लिए
आरेख 13.1
बल्लेबाज बी के लिए
आरेख 13.2
हम देख सकते हैं कि बल्लेबाज बी के अनुरूप बिंदु एक दूसरे के पास हैं और केंद्रीय प्रवृत्ति (माध्य और मध्यिका) के चारों ओर एकत्रित हैं, जबकि बल्लेबाज ए के अनुरूप बिंदु बिखरे हुए हैं या अधिक फैले हुए हैं।
इस प्रकार, केंद्रीय प्रवृत्ति के माप एक दिए गए डेटा के बारे में पूरी जानकारी देने में पर्याप्त नहीं हैं। सांख्यिकी के अंतर्गत अध्ययन करने की आवश्यकता है विचलन का भी एक और कारक। ‘केंद्रीय प्रवृत्ति के माप’ के समान, हमें विचलन को वर्णित करने के लिए एक अलग संख्या चाहिए। इस एकल संख्या को ‘वितरण का माप’ कहते हैं। इस अध्याय में, हम वितरण के कुछ महत्वपूर्ण मापों और उनके अनुयोगी और समूहीकृत डेटा के लिए उनकी गणना के तरीकों का अध्ययन करेंगे।
13.2 वितरण के माप
एक डेटा में वितरण या बिखराव के आधार पर अधिग्रहणों और केंद्रीय प्रवृत्ति के मापों के प्रकार पर मापा जाता है। वितरण के माप निम्नलिखित हैं:
(अ) श्रेणी, (बी) क्वार्टाइल विचलन, (ची) औसत विचलन, (छ) मानक विचलन।
इस अध्याय में, हम इन सभी वितरण के मापों का अध्ययन करेंगे जबकि क्वार्टाइल विचलन को छोड़कर।
13.3 श्रेणी
डेटा के बारे में याद करें कि, बल्लेबाज ए और बी द्वारा बट्टियों के उदाहरण में, हम प्रत्येक श्रृंखला में न्यूनतम और अधिकतम बट्टियों के आधार पर अंकों में वितरण के बारे में कुछ विचार रखते हैं। इसे एकल संख्या में प्राप्त करने के लिए, हम प्रत्येक श्रृंखला के अधिकतम और न्यूनतम मानों के अंतर को प्राप्त करते हैं। यह अंतर ‘डेटा की श्रेणी’ कहलाता है।
बल्लेबाज ए के मामले में, श्रेणी $=117-0=117$ और बल्लेबाज बी के लिए, श्रेणी $=60-46=14$। स्पष्ट है कि ए की श्रेणी $>$ श्रेणी की $B$। इस प्रकार, ए के मामले में अंक बिखरे हुए हैं या वितरित हैं जबकि बी के लिए ये एक दूसरे के पास हैं।
इस प्रकार, एक श्रृंखला की श्रेणी $=$ अधिकतम मान - न्यूनतम मान।
डेटा की श्रेणी हमें वितरण या बिखराव के बारे में एक सरल विचार देती है लेकिन केंद्रीय प्रवृत्ति के माप से डेटा के वितरण के बारे में नहीं बताती। इस उद्देश्य के लिए, हमें वितरण का कोई अन्य माप चाहिए। स्पष्ट है कि, ऐसा माप जो केंद्रीय प्रवृत्ति से मानों के अंतर (या विचलन) पर निर्भर करना चाहिए।
केंद्रीय प्रवृत्ति से अधिग्रहणों के विचलनों पर निर्भर वितरण के महत्वपूर्ण माप औसत विचलन और मानक विचलन हैं। चलिए उन दोनों के विस्तृत चर्चा करते हैं।
13.4 औसत विचलन
याद करें कि एक अधिग्रहण $x$ का एक निश्चित मान ’ $a$ ’ से विचलन $x-a$ के अंतर है। $x$ के मानों के $a$ के चारों ओर वितरण को पाने के लिए, हम $a$ के चारों ओर विचलन पा लेते हैं। वितरण का एक निरपेक्ष माप इन विचलनों का औसत है। औसत पाने के लिए, हमें विचलनों के योग प्राप्त करना चाहिए। लेकिन, हम जानते हैं कि केंद्रीय प्रवृत्ति का माप अधिग्रहणों के समूह के अधिकतम और न्यूनतम मानों के बीच होता है। इस प्रकार, कुछ विचलन नकारात्मक होंगे और कुछ सकारात्मक होंगे। इस प्रकार, विचलनों का योग शून्य हो सकता है। इसके अतिरिक्त, माध्य से विचलनों का योग $(\bar{x})$ है शून्य।
इसके अतिरिक्त $\quad \quad \quad $ विचलनों का औसत $=\frac{\text{ Sum of deviations }}{\text{ Number of observations }}=\frac{0}{n}=0$
इस प्रकार, वितरण के माप के संदर्भ में केंद्रीय प्रवृत्ति के चारों ओर विचलनों का औसत पाना हमारे लिए किसी भी उपयोग के लिए नहीं है, क्योंकि यह शून्य हो जाता है।
याद रखें कि, उचित वितरण के माप पाने में, हमें प्रत्येक मान की केंद्रीय प्रवृत्ति या एक निश्चित संख्या ’ $a$ ’ से दूरी की आवश्यकता है। याद करें, कि दो संख्याओं के अंतर का निरपेक्ष मान उन संख्याओं के बीच की दूरी देता है जब उन्हें संख्या रेखा पर प्रतिनिधित्व किया जाता है। इस प्रकार, एक निश्चित संख्या ’ $a$ ’ से वितरण के माप को पाने के लिए हम केंद्रीय मान से विचलनों के निरपेक्ष मानों के औसत ले सकते हैं। यह औसत ‘औसत विचलन’ कहलाता है। इस प्रकार केंद्रीय मान ’ $a$ ’ के चारों ओर औसत विचलन $a$ के अधिग्रहणों से ’ $a$ ’ के विचलनों के निरपेक्ष मानों का औसत है। ’ $a$ ’ से औसत विचलन को M.D. (ए) के रूप में निर्दिष्ट किया जाता है। इस प्रकार,
$ \text{ M.D. }(a)=\frac{\text{ ’ } a \text{ ’ से विचलनों के निरपेक्ष मानों का योग }}{\text{ अधिग्रहणों की संख्या }} . $
टिप्पणी औसत विचलन को किसी भी केंद्रीय प्रवृत्ति के माप से प्राप्त किया जा सकता है। हालांकि, सांख्यिकीय अध्ययनों में औसत विचलन के माध्य और मध्यिका से अधिक आम उपयोग किया जाता है।
13.4.1 असमूहीकृत डेटा के लिए औसत विचलन
$n$ अधिग्रहणों को $x_1, x_2, x_3, \ldots ., x_n$ कहा जाए। औसत विचलन के औसत या मध्यिका के चारों ओर इसकी गणना करने में निम्नलिखित चरण शामिल हैं:
चरण 1 उस केंद्रीय प्रवृत्ति के माप को गणना करें जिसके चारों ओर हम औसत विचलन पाना चाहते हैं। उसे ’ $a$ ’ कहा जाए।
चरण 2 $x_i$ के प्रत्येक $a$ से विचलन पाएं, अर्थात् $x_1-a, x_2-a, x_3-a, \ldots, x_n-a$
चरण 3 विचलनों के निरपेक्ष मान पाएं, अर्थात् यदि उनमें ऋणात्मक चिह्न (-) है, तो उसे हटा दें, अर्थात् $|x_1-a|,|x_2-a|,|x_3-a|, \ldots .,|x_n-a|$
चरण 4 विचलनों के निरपेक्ष मानों का औसत पाएं। यह औसत $a$ के चारों ओर औसत विचलन है, अर्थात्
$ \text{ M.D. }(a)=\frac{\sum\limits_{i=1}^{n}|x_i-a|}{n} $
इस प्रकार $\quad\quad\quad$ M.D. $(\bar{x})=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-\bar{x}|$, जहां $\bar{x}=$ माध्य
और $\quad\quad\quad$ M.D. $(M)=\frac{1}{n} \sum\limits_{i=1}^{n}|x_i-M|$, जहां $M=$ मध्यिका
नोट - इस अध्याय में, हम मध्यिका को निर्दिष्ट करने के लिए प्रतीक M का उपयोग करेंगे जब तक कि किसी अन्य बात का उल्लेख न किया जाए। अब अपने ऊपर दिए गए तरीके के चरणों को निम्नलिखित उदाहरणों में स्पष्ट करते हैं।
उदाहरण 1 निम्नलिखित डेटा के लिए औसत के चारों ओर औसत विचलन पाएं:
$ 6,7,10,12,13,4,8,12 $
समाधान हम चरण-दर-चरण आगे बढ़ते हैं और निम्नलिखित प्राप्त करते हैं:
चरण 1 दिए गए डेटा का माध्य है
$ \bar{x}=\frac{6+7+10+12+13+4+8+12}{8}=\frac{72}{8}=9 $
चरण 2 प्रत्येक अधिग्रहणों के माध्य $\bar{x}$ से विचलन,