Koreliacija: priemonės, skaičiavimas ir metodas

Perskaitę šį straipsnį, sužinosite apie: - 1. Koreliacijos priemones 2. Koreliacijos apskaičiavimas 3. Metodai.

Koreliacijos priemonės:

Karl Pearson koreliacijos koeficientas (individualios pastabos) :

Norint apskaičiuoti koreliacijos ir koreliacijos krypties laipsnį ar mastą, Karlo Pearsono metodas yra labiausiai patenkinamas.

Simboliškai jos formuluotė yra tokia:

kur dx yra įvairių pirmojo kintamojo elementų nuokrypis nuo prielaidos vidurkio ir dy, atitinkami antrojo kintamojo nuokrypiai nuo prielaidos vidurkio ir N jungia elementų porų skaičių.

Formulės taikymas paaiškinamas atsižvelgiant į šiuos hipotetinius duomenis:

Koreliacijos efektyvumo apskaičiavimas tęstinėje serijoje:

Nuolatinių serijų atveju duomenys klasifikuojami dvipusio dažnio lentelėje. Koreliacinio koeficiento skaičiavimas grupuotiems duomenims grindžiamas prielaida, kad kiekvienas elementas, kuris patenka į tam tikrą klasės intervalą, manoma, kad jis prilygtų tos klasės vidutinei vertei.

Kaip pavyzdį, mes apskaičiuojame koeficientą arba koreliaciją pagal šiuos duomenis:

Koreliacijos koeficiento apskaičiavimo formulė šiuo atveju bus tokia:

Vienintelis pirmiau minėtos formulės pakeitimas, palyginti su ankstesniu, yra f, kuris reiškia dažnį.

Taikant formulę 18.50 lentelėje, mes gauname:

Skirtumo korekcijos metodas:

Kai tiesioginis aptariamo reiškinio matavimas neįmanomas, pavyzdžiui, charakteristikos, pvz., Efektyvumas, sąžiningumas, intelektas ir pan., Koreliacijos mastui nustatyti taikomas rango skirtumo metodas.

Reitingų koreliacijos skaičiavimo formulė yra:

kur R žymi koreliacijos koeficientą tarp poruotų gretimų, D reiškia skirtumus tarp suporuotų gretų ir N reiškia porų skaičių.

Toliau pateiktame pavyzdyje mes iliustruosime pirmiau pateiktos formulės taikymą:

Koreliacijos koeficiento apskaičiavimas pagal rango skirtumo metodą :

(Kai yra du ar daugiau elementų, turinčių tą pačią vertę) :

Jei yra daugiau nei vienas vienodos vertės elementas, tokiems elementams suteikiamas bendras rangas. Šis reitingas yra vidurkis, kurį būtų pasiekę šie elementai, jei jų vertės būtų šiek tiek skirtingos. Tarkime, kad penkių studentų gauti ženklai yra atitinkamai 70, 66, 66, 65, 63.

Jei šie ženklai yra išdėstyti mažėjančia tvarka, skaičius 70 būtų pirmasis, 66 - antrasis, 65 - trečiasis ir 63 - ketvirtas. Kadangi du šio pavyzdžio studentai yra lygūs, jų reitingas yra 2. Dabar jiems bus suteiktas vidutinis tų gretasčių reitingas, kuriuos šie studentai būtų užtikrinę, jei jie šiek tiek skyrėsi vienas nuo kito.

Remiantis šia prielaida, abiejų elementų rangas būtų 2 + 3/2. ty 2, 5 ir kito elemento (65) rangas būtų 4. Taigi rango koreliacijos koeficientui reikia korekcijos, nes pirmiau pateikta formulė [R = 1 6ΣD 2 / N (N 2 -1] yra pagrįsta darant prielaidą, kad įvairių daiktų eilės skiriasi.

Kai yra daugiau nei vienas elementas, turintis tą pačią vertę, koregavimo koeficientas 1/12 (t 3 -t) pridedamas prie zd 2 vertės, kur t. reiškia daiktų, kurių eilės yra įprastos, skaičių. Šis korekcijos koeficientas pridedamas tiek kartų, kiek atsiranda daiktų, turinčių bendrus gretas, skaičių.

Tai paaiškinta sekančiame pavyzdyje:

Duomenų ir vertimo analizė

Pavyzdys:

Apskaičiuokite rango koreliacijos koeficientą iš šių duomenų:

Pirmiau pateiktame X serijos duomenų rinkinyje skaičius 60 įvyksta tris kartus. Visų trijų elementų rangas yra 5, kuris yra 4, 5 ir 6 vidurkis, o šios eilutės, kurias šie elementai būtų užtikrinę, jei jie šiek tiek skyrėsi vienas nuo kito. Kiti skaičiai 68 X serijoje ir 70 Y serijoje, įvyko du kartus. Jų gretas yra atitinkamai 2, 5 ir 1, 5.

Taigi:

Taigi pakeista rango koreliacijos koeficiento formulė būtų:

kur n reiškia pakartotinų elementų skaičių. Atsižvelgiant į pirmiau pateiktą pavyzdį, formulė bus:

Labai pateisinamas atsargumas, susijęs su koreliacijos koeficiento reikšme ir reikšme. Koreliacijos koeficientas, pats savaime labai naudingas santykių įvertinimas, neturėtų būti laikomas absoliučiu atitinkamų kintamųjų sąsajų įrodymu, nes jo aiškinimas labai priklauso nuo tyrimo atrinkto mėginio dydžio, kaip taip pat apie surinktų duomenų pobūdį.

Atrodo, kad aukštas koreliacijos koeficientas, pvz., 0, 80 (+), gali būti gana klaidinantis, jei standartinė paklaida, rodanti mėginių svyravimus, yra santykinai didelė, arba, priešingai, gali būti, kad, atrodo, mažas koeficientas, ty 0, 45 (+), gali pasiūlyti kad kintamųjų santykis gali būti ignoruojamas, bet realybės plokštumoje ši indikacija vėl gali būti klaidinga, nes tam tikrų kintamųjų koreliacijos koeficientas paprastai gali būti toks mažas, kad pirmiau minėtas koreliacijos koeficientas, ty 0, 45, turėtų būti atitinkamų duomenų grupių atžvilgiu yra gana didelis.

Tačiau statistikos konvencija nurodo, kad koreliacijos koeficientas nuo 1 iki 0, 7 (+) laikomas „didelio“ arba reikšmingo koreliacijos rodikliu, kuris svyruoja nuo 0, 7 iki 0, 4 (+) kaip reikšmingas, tarp 0, 4 ir 0, 2 (+ ) yra mažas ir mažesnis nei 0, 2 (+).

Taip pat reikia pabrėžti, kad didelė koreliacija tarp dviejų kintamųjų savaime nėra įrodymas, kad jie yra atsitiktinai susiję. Žymi koreliacija tarp kintamųjų, pvz., Tarp pajamų ir šeimos dydžio ar švietimo įstaigos dydžio ir studentų veiklos, beveik nesuteikia jokios nuorodos į atsitiktinius santykius tarp jų.

Tarkime, kad mes nustatėme, jog didesnės pajamos yra atvirkščiai koreliuoja su problemų (vaikų) skaičiumi, ty didesnė tėvų pajamos, tuo mažesnis jų skaičius (koreliacijos koeficientas, tarkim, 0, 8, kuris yra statistiškai gana aukštas), mes būsime neteisingi ir nepagrįsti sakydami, kad didesnės pajamos yra žemesnio vaisingumo priežastis.

Anksčiau buvo pabrėžta, kad priežastinio ryšio išvadą galima pateisinti tik tuo atveju, jei galima užtikrinti trijų rūšių įrodymus, kartu atsirandančius skirtumus, laiko tvarką ir bet kokio kito kintamojo pašalinimą kaip sąlyginę hipotezinio poveikio sąlygą.

Šiuo atveju galbūt galima daryti išvadas, kad būtų visiškai atsižvelgta į ryškią koreliaciją tarp pajamų ir vaikų skaičiaus:

a) Vienas gali sukelti kitą,

(b) abu kintamieji gali būti kitos priežasties ar priežasties padariniai;

c) Asociacija gali būti tik atsitiktinis įvykis. Priežastiniai išvados, be abejo, gali būti labai patikimi eksperimentinėje situacijoje.

Tai apsvarstėme sprendžiant eksperimentinius projektus. Socialiniuose moksluose labai sunku atlikti eksperimentus, todėl tyrimas turi būti ne eksperimentinis. Tačiau buvo parengtos analitinės procedūros, leidžiančios daryti išvadas apie priežastinį ryšį ne eksperimentiniuose tyrimuose.

Socialinis tyrinėtojas yra gana dažnai suinteresuotas įvertinti ryšį tarp atributų, ty tarp kokybiškai apibrėžtų kintamųjų; pavyzdžiui, jis gali norėti išsiaiškinti, koks yra ryšys tarp seksualinės savybės ir politinio pasirinkimo arba tarp gimimo ir požiūrio į tam tikrą socialinę problemą.

Iš esmės asociacijos problema yra koreliacinė problema, tačiau ryšys tarp atributų negali būti lengvai pritaikomas matematiniam gydymui, kaip ir kintamųjų kiekybinių matavimų atveju. Tokio ryšio tarp savybių matas yra santykinio nuspėjamumo koeficientas (RP), kuris iš tikrųjų yra kokybinis koreliacijos koeficientas.