Dispersijos priemonės

Perskaitę šį straipsnį, sužinosite apie įvairias socialinio tyrimo priemones.

Socialiniuose tyrimuose dažnai norime žinoti respondentų homogeniškumo ir nevienalytiškumo laipsnį atsižvelgiant į tam tikrą charakteristiką. Bet koks socialinių duomenų rinkinys turi vertybių, kurios gali apibūdinti heterogeniškumą. Socialinių duomenų rinkinį paprastai apibūdina vertybių nevienalytiškumas.

Iš tiesų statistikos požiūriu labai svarbu, kiek jie yra nevienalytės ar skirtingi. Vidutinės tendencijos priemonės paprastai apibūdina vieną svarbią duomenų rinkinio charakteristiką, tačiau jos nieko nesako apie šią kitą pagrindinę charakteristiką.

Todėl mums reikalingi heterogeniškumo matavimo būdai - tai, kokiu mastu duomenys yra išsklaidyti. Šios aprašymo priemonės vadinamos dispersijos arba kintamumo matavimais. Toliau pateikti trys paskirstymai, parodyti 18.4 pav., Parodys statistinių duomenų sklaidos matavimo svarbą.

Vidutinių skirtingų dydžių verčių pasiskirstymas :

Matyti, kad visų trijų kreivių aritmetinis vidurkis aukščiau pateiktame paveiksle yra tas pats, bet vertybių pasiskirstymas pagal A kreivę rodo mažesnį kintamumą (dispersiją), negu parodė B kreivė, o B kreivė yra mažesnė. lyginant su kreive C.

Jei apsvarstysime tik centrinės tendencijos tendenciją, praleisime svarbų skirtumą tarp trijų kreivių. Norint geriau suprasti duomenų modelį, mes taip pat turime gauti jos dispersijos ar kintamumo matą, dabar kreipiame dėmesį į įvairias dispersijos priemones.

Diapazonas:

Diapazonas apibrėžiamas kaip skirtumas tarp didžiausių ir mažiausių verčių: matematiškai,

R (diapazonas) = ​​M n - M L

kur M n ir M l atitinka didžiausią ir mažiausią vertę. Taigi duomenų rinkiniui: 10, 22, 20, 14 ir 14 diapazonas būtų skirtumas tarp 22 ir 10, ty, 12. Jei grupuojami duomenys, mes laikomės ribos, kaip skirtumo tarp kraštutinių taškų. klasės. Taigi, jei mažiausio intervalo vidurio taškas yra 150, o didžiausias - 850, diapazonas bus 700.

Vienintelis diapazono pranašumas, kuris yra retai naudojamas, yra tai, kad jis gali būti lengvai apskaičiuojamas ir lengvai suprantamas. Nepaisant šio pranašumo, paprastai tai nėra labai naudinga sklaidos priemonė; jos pagrindinis trūkumas yra tai, kad ji nieko nekalbama apie vertybių, kurios yra tarp dviejų kraštutinumų, sklaidą.

Pusiau pusiau kvartero diapazonas arba kvartilinis nuokrypis:

Kitas dispersijos matas yra pusiau kvartilinis diapazonas, paprastai žinomas kaip kvartilinis nukrypimas. Kvartilai yra taškai, kurie padalija masyvą arba vertybių seriją į keturias lygias dalis, kurių kiekvienoje yra 25 procentai paskirstymo elementų. Kvartilės yra didžiausios kiekvienoje iš šių keturių dalių. Tarp kvartilių diapazonas yra skirtumas tarp pirmojo ir trečiojo kvartilių verčių.

Taigi, kur ir Q 1 ir Q 3 reiškia pirmąjį ir trečiąjį kvartilus, pusiau kvartilių diapazonas arba kvartilinis nuokrypis apskaičiuojamas pagal formulę = Q 3 –Q 1/2

Kvartilio nuokrypio apskaičiavimas:

Kvartilinis nuokrypis yra absoliutus dispersijos matas. Jei serijinių dispersijų palyginimui turi būti naudojamas kvartilinis nuokrypis, absoliučią priemonę reikia konvertuoti į kvartilinio nuokrypio koeficientą.

Vidutinis nuokrypis :

Diapazonas ir kvartilinis nuokrypis kenčia nuo didelių trūkumų, ty jie skaičiuojami atsižvelgiant į tik dvi serijos vertes. Taigi šios dvi dispersijos priemonės nėra pagrįstos visais serijos stebėjimais. Todėl serijos sudėtis visiškai ignoruojama. Siekiant išvengti šio defekto, dispersija gali būti apskaičiuojama atsižvelgiant į visas serijos pastabas, susijusias su centrine verte.

Dispersijos apskaičiavimo metodas vadinamas vidutinių nuokrypių skaičiavimo metodu. Kaip aiškiai rodo pavadinimas, tai yra įvairių elementų nukrypimų nuo centrinės tendencijos matavimo vidurkis.

Kaip gerai žinome, nukrypimų nuo centrinės vertės suma visada būtų lygi nuliui. Tai rodo, kad norint gauti vidutinį nuokrypį (apie vidutinę ar bet kurią iš centrinių vertybių), turime kažkaip ar kitaip atsikratyti jokių neigiamų ženklų. Tai daroma ignoruojant ženklus ir atsižvelgiant į absoliučią skirtumų vertę.

Mūsų hipotetiniame pavyzdyje 12, 14, 15, 16 ir 18 vidurkis yra 15. Tai reiškia, kad 15 skirtumų nuo kiekvieno iš šių numerių, ignoruojant visus ženklus ir tada pridėjus rezultatus, mes gausime bendrą sumą nuokrypis.

Skiriant jį 5, gauname:

= 1, 6 (kur | d | reiškia absoliučių nukrypimų sumą).

Todėl galime teigti, kad vidutiniškai balai skiriasi nuo vidurkio 1, 6.

Vidutinio nukrypimo skaičiavimas grupuotoje datoje (individualios pastabos):

Vidutinio nuokrypio skaičiavimas nepertraukiamoje serijoje:

Vidutinio nuokrypio koeficientas :

Palyginti vidutinį serijos nuokrypį, apskaičiuojamas vidutinio nuokrypio arba santykinio vidutinio nuokrypio koeficientas. Tai gaunama padalinus vidutinį nukrypimą nuo tos centrinės tendencijos, iš kurios buvo apskaičiuoti nukrypimai, matavimo. Taigi,

Vidutinis vidurkis. Nukrypimas / X

Taikant šią formulę ankstesniam pavyzdžiui, turime,

Vidutinio nuokrypio koeficientas = 148/400 = 0, 37

Standartinis nuokrypis :

Naudingiausias ir dažniausiai naudojamas dispersijos matas yra standartinis nuokrypis arba vidutinis kvadratinis nuokrypis nuo vidurkio. Standartinis nuokrypis yra apibrėžiamas kaip kvadratinė šaknų iš vidurkio nuokrypių kvadrato vidurkio. Simboliškai

σ = √Σd 2 / N

kur σ (graikų raidė „Sigma“) reiškia standartinį nuokrypį, Σd 2 nukrypimų kvadrato sumai, išmatuotai nuo vidurkio ir N vienetų skaičiui.

Standartinio nuokrypio apskaičiavimas atskirų stebėjimų serijoje:

Trumpojo pjovimo metodas:

Standartinių nuokrypių skaičiavimas diskretinėse serijose :

Atskirose serijose pirmiausia apskaičiuojami nukrypimai nuo prielaidos vidurkio ir dauginami iš atitinkamų daiktų dažnių. Nukrypimai yra kvadratiniai ir dauginami iš atitinkamų daiktų dažnių. Šie produktai yra susumuojami ir padalyti iš visų dažnių. Standartinis nuokrypis apskaičiuojamas pagal šią formulę:

Šioje iliustracijoje paaiškinama formulė:

Standartinio nuokrypio skaičiavimas nepertraukiamoje serijoje :

Nuolatinėje serijoje klasių intervalai pateikiami jų vidurio taškuose. Tačiau dažniausiai klasės intervalai yra vienodo dydžio, todėl nukrypimai nuo prielaidos vidurkio yra išreikšti klasės intervalo vienetais. Alternatyviai, žingsnių nuokrypiai gaunami dalijant nukrypimus nuo klasės intervalo dydžio.

Taigi, standartinio nuokrypio skaičiavimo formulė parašyta taip:

kur i reiškia bendrąjį veiksnį arba klasės intervalo dydį.

Šis pavyzdys iliustruoja šią formulę:

Variacijos koeficientas:

Standartinis nuokrypis yra absoliutus dispersijos matas. Taip pat būtina išmatuoti dviejų ar daugiau paskirstymų santykinę dispersiją. Kai standartinis nuokrypis yra susijęs su jo vidurkiu, jis matuoja santykinę dispersiją. Karl Pearson sukūrė paprastą santykinės dispersijos matą, paprastai vadinamą variacijos koeficientu.

18.47 lentelės problemos variacijos koeficientas yra: