Tyrimo pastabos apie „Chi-Square“ testą

Šiame straipsnyje pateikiamas tyrimas apie „chi-square“ testą.

X 2 (graikų raidė X 2 išreikštas kaip Ki kvadratas) yra būdas įvertinti, ar empiriškai pastebėti dažniai skiriasi nuo tų, kurie tikėtini pagal tam tikras teorines prielaidas. Pvz., Tarkime, kad politiniai prioritetai ir gyvenamoji vieta arba gimstamumas yra suskirstyti į kitą grupę, o duomenys apibendrinti toliau pateiktoje 2 × 3 nenumatytų atvejų lentelėje.

Lentelėje matyti, kad miesto gyventojų dalis yra 38/48 = 0, 79, 20/46 = 0, 34, o 12/18 = 0, 67 (suapvalinus iki dviejų dešimtainių) trijų šalies politinių partijų. Tada norėtume sužinoti, ar šie skirtumai yra statistiškai reikšmingi.

Šiuo tikslu galime pasiūlyti nulinę hipotezę, kurioje daroma prielaida, kad tarp trijų politinių partijų nėra skirtumų dėl gimimo. Tai reiškia, kad kiekvienos iš trijų politinių partijų miestų ir kaimo gyventojų proporcijos turėtų būti tokios pačios.

Remiantis prielaida, kad nulinė hipotezė yra teisinga, galime apskaičiuoti dažnių rinkinį, kuris būtų tikėtinas, atsižvelgiant į šias ribines sumas. Kitaip tariant, mes galime apskaičiuoti asmenų, kurie pirmenybę teikia Kongreso partijai, kurią mes tikėtume, remdamiesi pirmiau pateikta prielaida, skaičiumi ir palyginkite šį skaičių su faktiniu stebimu.

Jei nulinė hipotezė yra teisinga, mes galime apskaičiuoti bendrą proporciją kaip:

38 + 20 + 12/48 + 46 + 18 = 70/112 = 0, 625

Šią numatomą proporciją tikimės 48 x (0, 625) = 30 su Kongresu susijusių asmenų, 46 x (0, 625) = 28, 75 asmenys, priklausantys Janata partijai ir 18 x (0, 625) = 11, 25 asmenys, priklausantys Lok Dal iš 70 urbanitai. Iš šių rodiklių atimant atitinkamus rodiklius iš atitinkamų trijų mėginių dydžių, randame 48 - 30 = 18, susijusių su kongresu, 46 - 28, 75 = 17, 25 priklausantys Janatai ir 18 - 11, 25 = 6, 25 asmenys, priklausantys Lok Dal nuo 42 asmenų kaimo vietovėse.

Šie rezultatai parodyti toliau pateiktoje lentelėje, kur tikėtini dažniai yra. skliausteliuose.

Norėdami išbandyti nulinės hipotezės tinkamumą, palyginame laukiamus ir pastebėtus dažnius. Palyginimas grindžiamas šiais X 2 statistiniais duomenimis.

X2 = Σ (O- E) 2 / E

kur O reiškia stebimus dažnius ir E - numatomus dažnius.

Laisvės laipsniai :

Laisvės laipsnių skaičius reiškia nepriklausomų suvaržymų skaičių, nustatytą nenumatytų atvejų lentelėje.

Šis pavyzdys iliustruos šią sąvoką:

Tarkime, kad du atributai A ir B yra nepriklausomi, tokiu atveju

tikėtinas dažnis arba ląstelė AB būtų 40 × 30/60 = 20. Kai tai bus nustatyta, likusių trijų ląstelių dažniai bus automatiškai nustatyti. Taigi, ląstelėje αB tikėtinas dažnis turi būti 40 - 20 = 20, panašiai, ir ląstelėje AB jis turi būti 30 - 20 = 10, o αB - 10.

Tai reiškia, kad 2 × 2 stalo mes turime tik vieną savo pasirinkimą, o mes neturime laisvės likusiuose trijuose langeliuose. Taigi laisvės laipsnius (df) galima apskaičiuoti pagal formulę:

df - (c - 1) (r - 1)

kur df reiškia laisvės laipsnius, c stulpelių skaičiui ir r eilių skaičiui.

Taigi, 2 x 3 lentelėje (18.54 lentelė)

df = (3 - 1) (2 - 1) = 2 x 1 = 2

Reikšmingumo lygis :

Kaip minėta anksčiau, chi kvadrato testas naudojamas siekiant nustatyti, ar skirtumas tarp stebimų ir laukiamų dažnių atsiranda dėl mėginių ėmimo svyravimų ir kaip nereikšmingas arba priešingai, ar skirtumas atsirado dėl kitos priežasties ir dėl to labai reikšmingo.

Prieš pradedant daryti išvadą, kad skirtumas yra reikšmingas tyrėjas, nustatė hipotezę, dažnai vadinamą nulinės hipotezės (simbolizuojamos kaip H o ), priešingai nei hipotezė (H 1 ), kuri yra nustatyta kaip alternatyva H o .

Paprastai, nors ne visada, nulinė hipotezė teigia, kad nėra skirtumo tarp kelių grupių ar jokio ryšio tarp kintamųjų, o mokslinių tyrimų hipotezė gali numatyti teigiamus arba neigiamus santykius.

Kitaip tariant, nulinė hipotezė daro prielaidą, kad nėra mėginių ėmimo klaidų, o skirtumas yra vien tik dėl atsitiktinės atrankos. Tada nustatomas tokio skirtumo atsiradimo tikimybė.

Tikimybė rodo, kokio masto pasitikėjimą mes galime įdėti į padarytą išvadą. Chi kvadrato lentelės reikšmės yra skirtingais tikimybės lygiais. Šie lygiai vadinami reikšmingumo lygiais. Iš lentelės matome chi kvadrato reikšmes tam tikru reikšmingumo lygiu.

Paprastai (socialinių mokslų problemoje) iš lentelės matoma chi kvadrato reikšmė nuo 0, 05 arba 0, 01 reikšmingumo lygių nuo nurodyto laisvės laipsnio ir palyginama su stebima chi kvadrato verte. Jei stebima reikšmė arba y 1 yra didesnė už lentelės vertę esant 0, 05, tai reiškia, kad skirtumas yra reikšmingas.

Laisvės laipsnis :

Norėdami naudoti „chi-square“ testą, kitas žingsnis yra apskaičiuoti laisvės laipsnius: Tarkime, kad mes turime 2 x 2 nenumatytų atvejų lentelę, panašią į 1 pav.

Žinome eilutę, o stulpelio sumos r t 1 ir r t 2 - ir c t 1 ir c t 2 . Laisvės laipsnių skaičius gali būti apibrėžiamas kaip ląstelių vertybių, kurias mes galime laisvai nurodyti, skaičius.

1 paveiksle, kai mes nurodome vieną 1 eilutės reikšmę (pažymėta čekiu paveiksle), antroji vertė toje eilutėje ir antrosios eilės reikšmės (žymimos X) jau yra nustatytos; mes negalime jų nurodyti, nes žinome eilutės sumas ir stulpelių sumas. Tai rodo, kad 2 x 2 nenumatytų atvejų lentelėje galime nurodyti tik vieną vertę.

Procedūra :

Chi kvadrato skaičiavimas:

„Chi-square“ - tai tinkamo testo testas:

Ankstesniame skyriuje chi kvadratas buvo naudojamas kaip nepriklausomumo testas; tai yra ar priimti arba atmesti nulinę hipotezę. X ~ testai taip pat gali būti naudojami nuspręsti, ar yra reikšmingas skirtumas tarp pastebėto dažnio pasiskirstymo ir teorinio dažnio pasiskirstymo.

Tokiu būdu galime nustatyti, kaip gerai pastebimi ir laukiami dažniai. Tai reiškia, kad tinkamumas būtų laikomas geru, jei nėra reikšmingų skirtumų tarp stebimų ir laukiamų duomenų, kai stebimų dažnių kreivė yra super nustatoma tikėtinų dažnių kreivei.

Tačiau turime nepamiršti, kad net jei proporcijos ląstelėse lieka nepakitusios, chi kvadrato vertė tiesiogiai skiriasi nuo bendro atvejų skaičiaus (N). Jei dvigubai padidinsime atvejų skaičių, chi kvadratinė vertė bus padvigubinta; jei trigubai padidinsime atvejų skaičių, mes taip pat trigubai padidiname chi kvadratą ir pan.

Šio fakto pasekmes galima iliustruoti toliau pateiktu pavyzdžiu:

Šiame pavyzdyje chi kvadratinė vertė yra 3, 15. Tuo remiantis mes, be abejo, nuspręstume, kad santykiai nėra reikšmingi.

Dabar, tarkime, duomenys buvo renkami 500 bylų su šiais rezultatais:

Chi kvadrato reikšmė, apskaičiuota iš figūrų, dabar yra 6, 30, o tai yra dvigubai didesnė už ankstesniame pavyzdyje gautą vertę. 6.30 reikšmė yra statistiškai reikšminga. Jeigu mes išreiškėme rezultatus procentais, nebūtų buvę skirtingo aiškinimo.

Pirmiau pateikti pavyzdžiai iliustruoja labai svarbų dalyką, ty, kad kvadratas yra tiesiogiai proporcingas N. Taigi, mums reikės priemonės, kurios neturi įtakos tik atvejų skaičiaus pasikeitimui. Priemonė phi (ǿ) suteikia šią priemonę, ty turtą, kurį mes norime savo priemonėje. Ši priemonė yra tik santykis tarp chi kvadratinės vertės ir išnagrinėtų atvejų skaičiaus.

Priemonė phi (ø) apibrėžiama kaip:

Ø = √x 2 / n

tai yra chi kvadrato šaknis, padalytas iš atvejų skaičiaus.

Taigi, taikydami šią formulę dviem pirmiau minėtiems pavyzdžiams, pirmuoju atveju:

Taigi matas ø, skirtingai nei chi kvadratas, duoda tą patį rezultatą, kai proporcijos palyginamose ląstelėse yra identiškos.

G. Udny Yule pasiūlė dar vieną asociacijos koeficientą, paprastai vadinamą „Q“ (labiau žinomas kaip „Yule“ Q), kuris matuoja asociaciją? x 2 lentelė. Asociacijos koeficientas (Q) apskaičiuojamas apskaičiuojant santykį tarp įstrižinių ląstelių skirtumo ir kryžminių produktų sumos, jei 2 × 2 lentelės ląstelės yra pažymėtos taip, kaip nurodyta šioje lentelėje:

ac / bc / skelbimas + būti

kur a, b, c ir d reiškia ląstelių dažnį.

Asociacijos koeficientas Q svyruoja nuo minus vieno iki plius vieno (+1) yra mažesnis arba didesnis už skelbimą. Q pasiekia +1 ribas, kai bet kuri iš ląstelių yra nulinė, ty asociacija yra baigta (koreliacija yra tobula). Q yra nulis, kai kintamieji yra nepriklausomi (ty kai nėra asociacijos), ty kai skelbimas. = būti ir. Q = 0.

Minėtos formulės taikymas iliustruojamas sekančiame pavyzdyje:

Apskaičiuokime „Yule“ asociacijos koeficientą tarp šeimyninės padėties ir veiklos rezultatų, atsižvelgiant į toliau pateiktoje lentelėje pateiktus duomenis:

Pakeičiant aukščiau nurodytas reikšmes Yule formulėje:

Taigi yra nedidelis neigiamas ryšys tarp šeimyninės padėties ir egzaminų.

Mes taip pat galime pažvelgti į šią problemą.

Sutuoktinių, kurie nepavyko, procentas yra = 60 × 100/150 = 40.

Nepavykusių nesusituokusių studentų procentinė dalis yra = 100 × 100/350 = 28, 57 (apytiksl.)

Taigi 40 proc. Susituokusių studentų ir beveik 29 proc. Nesusituokusių studentų nepavyko atlikti egzaminų. Todėl prastas studentų pasiekimas gali būti susijęs su šeimynine padėtimi.

Priežastinės išvados gali būti labai patikimos eksperimentinėse situacijose. Mes svarstėme šią problemą sprendžiant eksperimentinius projektus. Socialiniuose moksluose labai sunku sukurti eksperimentą, todėl dauguma tyrimų yra ne eksperimentiniai. Tačiau buvo parengtos analitinės procedūros, leidžiančios daryti išvadas apie priežastinius ryšius ne eksperimentiniuose tyrimuose.

Tiek, kiek daugelis socialinių tyrimų atlieka iš „gyventojų“ paimtų mėginių tyrimą ir siekia apibendrinti šios „populiacijos“, būtina, kad mokslas būtų žinomas, kokiu mastu tokie apibendrinimai yra: pateisinama.

Tarkime, atlikdami tyrimus su vyrų ir moterų pavyzdžiais, mūsų rezultatai rodo didelius skirtumus tarp dviejų pavyzdžių, atsižvelgiant į valandų skaičių, kurį jie skiria studijoms.

Galime paklausti, ar pastebėti skirtumai atspindi tikrus vyrų ir moterų studentų skirtumus, ar abu „studentų“ gyventojai iš tikrųjų yra panašūs į valandas, kurias jie skiria studijoms, bet iš šių „populiacijų“ paimtų pavyzdžių tyrimui galėjo skirtis „šansas“.

Buvo parengta keletas statistinių procedūrų, leidžiančių mums atsakyti į tokį klausimą dėl tikimybės pareiškimų.

Palygindami mėginius arba tiriant skirtumus tarp eksperimentinių ir kontrolinių grupių, mes paprastai norime išbandyti tam tikrą hipotezę apie tikrojo skirtumo tarp „populiacijų“, kurios turėtų būti reprezentuojamos tiriamuose mėginiuose, pobūdį.

Socialiniuose moksluose dažniausiai kalbama apie santykinai neapdorotą hipotezę (pavyzdžiui, moterys studentai daugiau laiko skiria studijoms, nei vyrai).

Paprastai mes negalime apsvarstyti tikslesnės ar tikslesnės hipotezės (pvz., Tiksliai apibrėžiant skirtumą tarp dviejų „populiacijų“). Tarkime, mūsų duomenys rodo, kad moterų studentų pavyzdžiai studijoms skiria vidutiniškai keturias valandas, o vyrų studentų pavyzdys - tik dvi valandos.

Akivaizdu, kad mūsų mėginių rezultatai sutampa su hipoteze, ty moterys studentai skiria daugiau laiko studijoms, nei jų vyrai. Tačiau mes turime nuolat nepamiršti, kad mūsų pavyzdžiu paremtos išvados gali būti ne tokios pačios kaip išvados, kurias galėjome gauti, jei ištirtume dvi „populiacijas“ toto.

Dabar norime įvertinti, ar mes vis dar būtų praleidę daugiau laiko studijoms tarp moterų studentų, jei ištirtume bendrą „gyventojų“ skaičių. Toks įvertinimas yra įmanomas, jei išbandome „nulinę hipotezę“.

„Nulinė hipotezė“ teigia, kad „populiacijos“ nesiskiria pagal nagrinėjamą charakteristiką. Šiuo atveju „nulinė hipotezė“ teigia, kad didesnėje „studentų“ grupėje, kaip visuma, moterų ir vyrų studentų pogrupiai nesiskiria nuo laiko, kurį jie skiria studijoms.

Buvo sukurti įvairūs statistiniai metodai, vadinami reikšmingų bandymų rezultatais, kurie padeda įvertinti tikimybę, kad mūsų du pavyzdžiai galėjo skirtis, kiek jie, atsitiktinai, net jei iš tikrųjų nėra skirtumo tarp dviejų atitinkamų vyrų „populiacijų“. studentams ir studijoms skirtu laiku.

Tarp įvairių testavimo svarbos metodų sprendimas, kokiam metodui bus tinkamas konkretus tyrimas, priklauso nuo naudojamų matavimų pobūdžio ir charakteristikų pasiskirstymo (pvz., Studijų valandų, vaikų skaičiaus, darbo užmokesčio lūkesčių ir kt.). ).

Dauguma šių reikšmingumo testų daro prielaidą, kad matavimai yra intervalo skalė ir kad charakteristikos pasiskirstymas yra artimas normaliai kreivei. Socialiniuose tyrimuose šios prielaidos retai atitinka tikrovę. Vis dėlto naujausi statistikos pokyčiai išsprendė tam tikrą sprendimą, kuris buvo atliekamas ne parametriniais tyrimais, kurie nėra pagrįsti šiomis prielaidomis.

Šiuo metu turėtume pabandyti suprasti priežastį, kodėl „nulinė hipotezė“ turėtų būti išbandyta, kai mūsų tikrasis interesas yra išbandyti hipotezę (alternatyvi hipotezė, kaip ji vadinama), kurioje teigiama, kad yra skirtumas tarp dviejų „gyventojų“. atstovauja pavyzdžiai.

Priežastis yra lengva įvertinti. Kadangi mes nežinome tikrosios „gyventojų“ įvaizdžio, tai, ką galime padaryti, yra padaryti išvadas apie tai, remiantis mūsų atrinkta atranka.

Jei lyginame du pavyzdžius, žinoma, yra dvi galimybės:

(1) Pavyzdžiui, atrinktos populiacijos yra panašios arba

(2) Jie skiriasi.

Mūsų pavyzdžiai iš dviejų „populiacijų“ yra skirtingi kai kurių požymių atžvilgiu; valandų, skirtų mūsų pavyzdžių tyrimams. Akivaizdu, kad tai gali atsitikti, jei dvi „populiacijos“, kurių pavyzdžiai atstovauja, iš tikrųjų skiriasi minėto atributo atžvilgiu.

Tačiau tai nėra galutinis įrodymas, kad šios „populiacijos“ skiriasi, nes visada yra galimybė, kad mėginiai neatitinka „populiacijų“, kurias jie nori atstovauti.

Todėl turime leisti galimybę, kad atrankos metu dalyvaujantys atsitiktinumo elementai galėjo mums suteikti pavyzdžių, kurie skiriasi vienas nuo kito, nors dvi „populiacijos“, iš kurių jos sudarytos, iš tikrųjų nesiskiria.

Todėl klausimas, kurį galime prašyti, yra:

„Ar galėtume turėti pavyzdžių, kurie skiriasi vienas nuo kito tiek, kiek jie daro, net jei„ populiacijos “, iš kurių jie buvo paimti, nesiskyrė?“ Tai yra klausimas, į kurį atsako „nulinės hipotezės“.

„Nulinė hipotezė“ padeda mums įvertinti, kas yra tikimybė, kad du tokiu mastu skirtingi mėginiai būtų paimti iš dviejų „populiacijų“, kurios iš tikrųjų yra panašios: 5 iš 100? 1 iš 100? ar koks skirtumas.

Jei statistinis reikšmingumo tyrimas rodo, kad neįtikėtina, jog iš dviejų populiacijų, kurios iš tikrųjų yra panašios, būtų galima paimti du skirtingus pavyzdžius, galime daryti išvadą, kad dvi „populiacijos“ tikriausiai skiriasi viena nuo kitos.

Reikia atkreipti dėmesį į tai, kad visi statistiniai reikšmingumo testai ir tokiu būdu visi apibendrinimai iš mėginių į populiacijas remiasi prielaida, kad mėginiai nepasirenkami taip, kad įpročiai galėtų būti imami imant mėginius.

Kitaip tariant, daroma prielaida, kad atrinktas mėginys buvo sudarytas taip, kad visi „gyventojų“ atvejai ar daiktai turėjo vienodą ar konkrečią galimybę būti įtrauktiems į mėginį.

Jei ši prielaida nėra pagrįsta, reikšmingumo testai tampa beprasmiški ir netinkami. Kitaip tariant, reikšmingumo testai taikomi tik tada, kai atrenkant mėginį buvo naudojamas tikimybės principas.

Norint grįžti prie mūsų iliustracijos, manome, kad mūsų rezultatai nerodo skirtumo tarp dviejų pavyzdžių: tai reiškia, kad ir mūsų vyrų, ir moterų studentai vienodai laiko studijoms.

Ar galime tada pasakyti, kad dvi „vyrų ir moterų“ moksleivių populiacijos yra panašios pagal šį atributą? Žinoma, mes negalime tai pasakyti jokiu būdu, nes yra tikimybė, kad mėginiai gali būti panašūs, kai populiacijos iš tiesų skiriasi.

Bet norėdami grįžti į atvejį, kai du pavyzdžiai skiriasi, galime patvirtinti, kad dvi jų atstovaujamos populiacijos tikriausiai skiriasi, jei galime atmesti „nulinę hipotezę“; tai yra, jei galime parodyti, kad skirtumas tarp dviejų pavyzdžių yra mažai tikėtinas, jei minėtos „populiacijos“ nesiskirtų.

Bet vėlgi, yra tam tikra tikimybė, kad mes galime neteisingai atmesti „nulinę hipotezę“, nes tikėtina, kad kartais gali įvykti net labai neįtikėtini įvykiai.

Taip pat yra ir kita pusė. Kaip ir galime neteisingai atmesti „nulinę hipotezę“, taip pat tikėtina, kad mes galime neteisingai priimti „nulinę hipotezę“. Tai reiškia, kad net jei mūsų statistinis reikšmingumo testas rodo, kad imties skirtumai gali lengvai atsirasti atsitiktinai, nors „populiacijos“ yra panašios, vis dėlto gali būti tiesa, kad „populiacijos“ iš tikrųjų skiriasi.

Kitaip tariant, mes visada susiduriame su rizika, kad padarysime vieną iš dviejų klaidų tipų:

(1) Mes galime atmesti „nulinę hipotezę“, kai iš tikrųjų tai tiesa,

(2) Mes galime priimti „nulinę hipotezę“, kai iš tikrųjų tai yra klaidinga.

Pirmoji klaidų rūšis, galime vadinti I tipo klaidą. Tai reiškia, kad abu „gyventojai“ skiriasi, kai iš tikrųjų jie yra panašūs.

Antrasis klaidų tipas gali būti vadinamas II tipo klaida. Tai reiškia, kad abi „populiacijos“ yra vienodos, nors iš tikrųjų jos skiriasi.

I tipo klaidos riziką lemia reikšmingumo lygis, kurį mes esame pasiruošę priimti mūsų statistiniuose bandymuose, pvz., 0, 05, 0, 01, 0, 001 ir tt (ty 5 iš 100, 1 iš 100 ir 1 iš 1000) Taigi, jei, pavyzdžiui, nuspręstume, kad populiacijos tikrai skiriasi, kai reikšmingumo testas rodo, kad skirtumas tarp šių dviejų mėginių tikimasi atsitiktinai ne daugiau kaip 5 kartus iš 100.

Tai reiškia, kad jei dvi „atrinktos“ populiacijos iš tikrųjų yra panašios (pagal tam tikrą atributą), tuomet priimame 5 galimybes 100, kad mes neteisingai atmesime „nulinę hipotezę“. Žinoma, mes galime sumažinti I tipo klaidų riziką, nes mūsų kriterijus, kuriuo atmetama nulinė hipotezė, yra griežtesnė ir griežtesnė.

Pavyzdžiui, mes galime nuspręsti, kiek reikšmingumo lygis yra 0, 01, ty atmestume „nulinę hipotezę“ tik tada, jei bandymas parodys, kad dviejų „mėginių“ skirtumas galėjo atsirasti atsitiktinai tik vieną kartą per šimtą.

Iš esmės, mes sakome, kad mes atmesime „nulinę hipotezę“, jei bandymas parodys, kad iš šimto mėginių, išrinktų iš atitinkamų „populiacijų“, naudojant tikimybės principą, tik vienas pavyzdys parodys skirtumą pagal atributus, kiek tai matyti dviejuose tiriamuose mėginiuose.

„Nulinės hipotezės“ atmetimo kriterijus gali būti dar griežtesnis dar labiau didinant reikšmingumo lygį. Tačiau sunku tai, kad I ir II tipo klaidos yra susijusios viena su kita, kad kuo labiau apsisaugosime nuo I tipo klaidos, tuo labiau pažeidžiamas turime padaryti II tipo klaidą.

Nustačius I tipo klaidų rizikos mastą, kurį norime paleisti, vienintelis būdas sumažinti II tipo klaidų galimybę yra imtis didesnių mėginių ir naudoti statistinius bandymus, kurie maksimaliai išnaudotų turimą atitinkamą informaciją.

Situaciją, susijusią su II tipo klaida, galima labai tiksliai iliustruoti naudojant „atidarymo charakteristikos kreivę“ . Šios kreivės elgesys priklauso nuo mėginio dydžio. Kuo didesnis pavyzdys, tuo mažiau tikėtina, kad mes priimsime hipotezę, kuri rodo, kad padėtis yra labai toli nuo realybės būklės.

Jei ryšys tarp I ir II tipo klaidų yra atvirkštinis, būtina rasti pagrįstą šių dviejų rūšių rizikos pusiausvyrą.

Socialiniuose moksluose beveik tapo nusistovėjusi praktika ar konvencija, kuria atmetama „nulinė hipotezė“, kai testas rodo, kad skirtumai tarp mėginių nebūtų atsitiktinai daugiau nei 5 kartus iš 100. Tačiau konvencijos yra naudingos, kai yra nėra kito pagrįsto vadovo.

Mokslininkas turi priimti sprendimą dėl to, kaip turėtų būti padaryta pusiausvyra tarp dviejų klaidų rūšių. Kai kuriais atvejais yra svarbiau būti tikri, kad atsisakysite hipotezės, kai ji yra klaidinga, nei nepriimtina, kai tai tiesa. Kitais atvejais atvirkštinis gali būti teisingas.

Pavyzdžiui, kai kuriose šalyse manoma, kad svarbiau yra atmesti kaltės hipotezę, kai yra klaidinga nei nepriimti šios hipotezės, kai ji yra tiesa, ty asmuo laikomas kaltu tol, kol yra pagrįstų abejonių apie jo kaltę. Kai kuriose kitose šalyse nusikaltimu kaltinamas asmuo laikomas kaltu iki tol, kol jis įrodo savo kaltės trūkumą.

Daugelyje tyrimų, žinoma, nėra aiškaus pagrindo nuspręsti, ar I ar II tipo klaida būtų brangesnė, todėl tyrėjas statistikos reikšmingumui nustatyti naudoja įprastinį lygį. Tačiau gali būti keletas tyrimų, kuriuose vienos rūšies klaida akivaizdžiai būtų brangesnė ir kenksmingesnė už kitą.

Tarkime, organizacijoje buvo pasiūlyta, kad naujas darbo pasidalijimo metodas būtų veiksmingesnis, ir manau, kad šis metodas reikalauja daug išlaidų.

Jei bandymas sudarytas iš dviejų personalo grupių - vieno, veikiančio kaip eksperimentinė grupė, o kitas - kaip kontrolinė grupė, bando patikrinti, ar naujasis metodas tikrai naudingas organizaciniams tikslams ir ar tikimasi, kad naujasis metodas reikštų daug išlaidų, organizacija nenorėtų jos priimti, nebent būtų užtikrintas didelis jo pranašumas.

Kitaip tariant, būtų brangu padaryti 1 tipo klaidą, ty daryti išvadą, kad naujasis metodas yra geresnis, kai tai nėra taip.

Jei naujasis metodas apimtų išlaidas, kurios buvo panašios į senąjį metodą, II tipo klaida būtų nepageidautina ir dar labiau pakenktų, nes dėl to vadovybė negalėtų priimti naujo metodo, kai jis iš tikrųjų yra pranašesnis ir tokia organizacija turi ilgalaikę naudą.

Bet koks apibendrinimas iš mėginio į „populiaciją“ yra tik statistinės tikimybės pareiškimas. Sakykime, mes nusprendėme dirbti su 0, 05 reikšmės lygiu. Tai reiškia, kad mes atmesime „nulinę hipotezę“ tik tuomet, kai tikimės, kad mūsų pastebėto dydžio imties skirtumas, atsitiktinai ne daugiau kaip 5 kartus iš 100.

Žinoma, mes priimsime „nulinę hipotezę“, jei tikimasi, kad toks skirtumas atsiras atsitiktinai daugiau nei 5 kartus iš 100. Dabar kyla klausimas: ar mūsų atradimas yra vienas iš penkių kartų, kai toks skirtumas gali būti atsirado atsitiktinai?

Šis klausimas negali būti galutinai atsakytas remiantis atskira išvada. Vis dėlto gali būti įmanoma pasakyti kažką apie tai, kai nagrinėjame mūsų išvadų modelius.

Tarkime, kad esame suinteresuoti išbandyti filmo poveikį požiūriui į konkrečią vyriausybės programą, pvz., Šeimos planavimą. Sakykime, visiškai pasirūpinome, kad maksimaliai išlaikytume norimas eksperimentavimo sąlygas.

Dabar manau, kad mes naudojame vieną požiūrį į programą, tik vieną elementą, t. Y. Požiūrį į vaikus tarp vaikų ir nustatome, kad tie, kurie matė filmą, yra labiau linkę link šio klausimo nei tie, kurie filmo nematė.

Dabar manau, kad statistinis testas rodo, kad skirtumas nebūtų atsitiktinai pasireiškęs dėl atsitiktinių atrankos svyravimų daugiau nei kartą per dvidešimt. Logiškai, tai taip pat reiškia, kad ji galėjo atsirasti atsitiktinai kartą per dvidešimt (arba 5 kartus iš 100). Kaip jau minėjome, mes neturime jokio aiškaus būdo žinoti, ar mūsų pavyzdys yra vienas iš penkių iš 100. Dabar, ką geriausiai galime padaryti?

Sakykime, respondentams paklausėme 40 skirtingų klausimų, kurie yra pagrįsti požiūris į šeimos gerovės vyriausybės programą. Jei mes naudojame 5% pasikliovimo lygį ir jeigu mes uždavėme 100 klausimų, galime tikėtis, kad 5 iš jų bus statistiškai reikšmingų skirtumų, susijusių su atsitiktinumu.

Taigi iš mūsų 40 klausimų, susijusių su įvairiais klausimais, galime tikėtis rasti statistiškai reikšmingų skirtumų 2 iš jų. Bet, tarkime, mes iš tikrųjų pastebime, kad 25 iš 40 klausimų tiems, kurie matė filmą, buvo palankesnis požiūris, palyginti su tais, kurie filmo nematė.

Esant tokiai situacijai, galime pasijusti daug saugesni, kai darome išvadą, kad egzistuoja tikras skirtumų požiūris (nors statistinis testas rodo, kad skirtumas galėjo atsirasti atsitiktinai kiekviename klausime po penkis kartus per 100).

Darytume prielaidą, kad iš 40 klausimų atsakymai tik į vieną, ty apie tarpą tarp vaikų, parodė statistiškai reikšmingą skirtumą tarp dviejų grupių, veikiančių filme ir ne. Šis skirtumas taip pat galėjo atsirasti atsitiktinai.

Kita vertus, gali būti, kad filmo turinys iš tikrųjų paveikė nuomones šiuo klausimu, bet ne dėl kitų (pvz., Dėl sterilumo operacijų). Tačiau, nebent mūsų hipotezė iš anksto numatė, kad filmas greičiausiai paveiktų požiūrį į vaikų atstumą, nei požiūris į bet kurį iš 39 kitų klausimų, mes nepagrįstai aiškiname.

Toks aiškinimas, t. Y. Vienas, kuriuo remiamasi paaiškinant išvadas po jų paviršiaus, yra vadinamas „post-factum“ interpretacija, nes tai susiję su paaiškinimais, kurie pateisina išvadas, nepaisant jų buvimo. Tai priklauso nuo tyrėjo išradingumo, apie kokį paaiškinimą jis gali išaiškinti. Todėl jis gali pateisinti net priešingus rezultatus.

Mertonas labai aiškiai nurodė, kad po faktų gautos interpretacijos yra skirtos „paaiškinti“ pastabas. Post-factum paaiškinimo metodas yra visiškai lankstus. Jei tyrėjas nustato, kad bedarbiai linkę skaityti mažiau knygų nei anksčiau, tai gali „paaiškinti“ hipotezė, kad nedarbas, kylantis dėl nedarbo, daro įtaką koncentracijai, todėl skaitymas tampa sudėtingas.

Tačiau, jei pastebima, kad bedarbiai skaito daugiau knygų nei anksčiau (kai dirba), galima remtis nauju paaiškinimu dėl faktų; paaiškinimas, kad bedarbiai turi daugiau laisvalaikio ir todėl skaito daugiau knygų.

Kritinis „gautų santykių (tarp kintamųjų) tyrimas“ nėra post-factum loginis pagrindas ir jo paaiškinimas; tai yra gebėjimas prognozuoti arba numatyti kitus santykius pagal jį. Taigi, mūsų anksčiau nenuspėjamas požiūris į skirtingą požiūrį į vaikų atstumą, nors ir statistiškai reikšmingas, negali būti laikomas atliktu tyrimu.

Kadangi statistinės ataskaitos yra tikimybės pareiškimai, mes niekada negalime visiškai pasikliauti vien tik statistiniais įrodymais, kad nuspręstume, ar priimsime hipotezę kaip teisingą.

Pasitikėjimas tyrimo rezultato interpretavimu reikalauja ne tik statistinio pasitikėjimo išvados patikimumu (ty, kad skirtumai nėra tikėtini atsitiktinai), bet ir tam tikri įrodymai apie tyrimų prielaidų pagrįstumą.

Šie įrodymai nebūtinai yra netiesioginiai. Jis kyla iš pateiktų mokslinių tyrimų rezultatų suderinimo su kitomis žiniomis, kurios atlaikė laiko patikrinimą ir dėl to yra daug patikimumo.

Netgi griežčiausiai kontroliuojamame tyrime, pasitikėjimo rezultatų interpretavimu ar priežastinių ryšių priskyrimu, reikia pakartoti tyrimus ir išvadas, susijusias su kitų tyrimų rezultatais.

Reikia pažymėti, kad net jei statistiniai bandymai ir daugelio tyrimų rezultatai rodo, kad iš tiesų egzistuoja nuoseklus skirtumas tarp dviejų grupių arba nuoseklus ryšys tarp dviejų kintamųjų, tai vis dar nėra įrodymų apie santykius priežastis.

Jei norime padaryti priežastines išvadas (pvz., X gamina Y), turime atitikti prielaidas, viršijančias tas, kurios reikalingos santykių egzistavimui nustatyti. Taip pat verta paminėti, kad rezultatas nėra socialiai ar psichologiškai svarbus tik todėl, kad jis yra statistiškai reikšmingas. Praktinėje socialinėje kalboje daugelis statistiškai reikšmingų skirtumų gali būti nereikšmingi.

Pavyzdžiui, vidutinis skirtumas tarp mažiau nei vieno IQ taško tarp miesto ir kaimo žmonių gali būti statistiškai reikšmingas, bet ne taip, kaip ir praktiniame kasdieniame gyvenime. Priešingai, yra atvejų, kai mažas, bet patikimas skirtumas turi didelę praktinę reikšmę.

Pavyzdžiui, didelio masto apklausoje pusė ar vienas procentas skiriasi nuo šimtų tūkstančių žmonių, o skirtumai gali būti svarbūs priimant svarbius politinius sprendimus. Todėl mokslininkas, be to, kad rūpinasi savo statistinių duomenų reikšmingumu, taip pat turi būti susijęs su jų socialinėmis ir psichologinėmis reikšmėmis.

Išvardyti priežastinius ryšius:

Dėl akivaizdžių sunkumų tokie griežti eksperimentiniai projektai retai gali būti parengti socialiniuose moksliniuose tyrimuose. Dauguma socialinių mokslų tyrimų yra ne eksperimentiniai.

Tokiuose tyrimuose yra tam tikrų empirinių kliūčių nustatyti, ar kintamųjų ryšys yra priežastinis. Pakartotinai paminėta, kad viena iš sudėtingiausių užduočių analizuojant socialinio elgesio duomenis yra priežastinio ryšio nustatymas.

Problemiška situacija priklauso nuo jo atsiradimo ir tapimo, o ne tik į vieną veiksnį, bet į įvairių veiksnių ir sekų kompleksą.

Šių elementų atskyrimo procesas kelia didelį iššūkį sociologinei vaizduotei ir išbando tyrėjų įgūdžius. Pavojinga sekti „vieno takelio“ paaiškinimą, kuris sukelia priežastį. Būtina ieškoti visos priežastinių veiksnių baterijos, kurios paprastai vaidina svarbų vaidmenį kuriant sudėtingas socialines situacijas.

Kaip pastebi Karlas Pearsonas, „nė vienas reiškinys ar seka nėra vienintelė priežastis; visi ankstesni etapai yra nuoseklios priežastys; kai moksliškai teigiame priežastis, mes iš tikrųjų apibūdiname eilinius patirties rutinos etapus. “

„Yule“ ir „Kendall“ pripažino, kad statistika „turi būti priimta analizei, duomenys priklauso nuo daugelio priežasčių ir turi stengtis atrasti iš pačių duomenų, kurie yra svarbūs priežastys ir kiek pastebėto poveikio sukelia kiekvieno veikimo. “

Paulius Lazarsfeldas sekė metodus, kuriuos jis vadina „atidus“. Jis pasisako už jo naudojimą nustatant priežastinius kintamųjų ryšius. Lazarsfeldas nustato šią procedūrą:

a) tariamo įvykio patikrinimas pagal:

Siekiant patikrinti šį įvykį, būtina įsitikinti, ar asmuo iš tikrųjų patyrė tariamas situacijas. Jei taip, kaip įvykis pasireiškia ir kokiomis sąlygomis, jo tiesioginiame gyvenime?

Kokios yra priežastys, dėl kurių manoma, jog egzistuoja konkretus dviejų kintamųjų tarpusavio ryšys, pvz., Darbo netekimas ir įgaliojimų praradimas? Ar teisingas yra šio asmens argumentavimas šiuo konkrečiu atveju?

(b) bandymas sužinoti, ar įtariama sąlyga atitinka objektyvius faktus apie šio asmens praeitį.

(c) visų galimų paaiškintų būsenos paaiškinimų bandymas.

d) išaiškinti tuos paaiškinimus, kurie neatitinka įvykių modelio.

Labai suprantama, kad dauguma sunkumų ar kliūčių nustatyti priežastinius ryšius labiausiai nukenčia ne eksperimentinius tyrimus. Ne eksperimentiniuose tyrimuose, kai susidomėjimas yra priežastinių ryšių tarp dviejų kintamųjų nustatymas, tyrėjas turi rasti apsaugos priemonių, kurios yra akivaizdžiai įtrauktos į eksperimentinius tyrimus, pakaitalus.

Daugelis šių apsaugos priemonių įvedamos planuojant duomenų rinkimą, numatant galimybę rinkti informaciją apie keletą kintamųjų, kurie gali būti alternatyvios hipotezinio poveikio sąlygos.

Įvedus tokius papildomus kintamuosius į tyrimą, tyrėjas priartina kai kuriuos eksperimentams būdingus valdiklius. Nepaisant to, priežastinio ryšio išvadų sudarymas ne eksperimentiniuose tyrimuose visada lieka pavojingas.

Dabar aptarsime kai kurias problemas ir jų įveikimo strategijas, susijusias su išvadomis apie priežastinį ryšį ne eksperimentiniuose tyrimuose. Jei ne eksperimentinis tyrimas rodo ryšį ar ryšį tarp dviejų kintamųjų, pvz., X ir Y, ir jei mokslinių tyrimų interesas yra priežastinis ryšys, o ne paprastas faktų susiejimas tarp kintamųjų, analizė buvo atlikta tik pirmuoju žingsniu.

Mokslininkas turi apsvarstyti (be X ir Y susiejimo), ar Y (efektas) galėjo atsirasti prieš X (hipotezė), tokiu atveju Y negali būti X.

Be to, tyrėjas turi apsvarstyti, ar kiti veiksniai, išskyrus X (hipotezė), galėjo sukelti Y (hipotezinį poveikį). Paprastai tai rūpinama įvedant papildomus kintamuosius į analizę ir išnagrinėjus, kaip šie kintamieji įtakoja santykį tarp X ir Y.

Jei santykis tarp X ir Y išlieka net ir tada, kai įvedami kiti tikėtinai efektyvūs ir galbūt alternatyvūs kintamieji, hipotezė, kad X yra Y priežastis, išlieka išlieka.

Pavyzdžiui, jei santykis tarp valgymo sezoninių vaisių (X) ir šalčio (Y) nesikeičia net tada, kai į analizę įtraukiami kiti kintamieji, pvz., Amžius, temperatūra, virškinimo būklė ir pan. hipotezė, kad X veda į Y kaip ilgalaikį.

Tačiau kai kuriais atvejais negalima nustatyti, kad kitų papildomų kintamųjų įvedimas gali pakeisti X ir Y santykius. Jis gali sumažinti, kad visiškai pašalintų ryšį tarp X ir Y, arba gali sustiprinti santykius vienoje grupėje ir sumažinti kitame.

Jei X (sezoninių vaisių valgymas) ir Y (šaltojo) santykis padidėja pogrupyje, kuriam būdingas Z (bloga virškinimo būsena) ir sumažėjęs pogrupyje, kuriam nėra būdingas Z (normalus virškinimo būdas), mes gali daryti išvadą, kad Z yra sąlyginė sąlyga santykiui tarp X ir Y.

Kitaip tariant, tai reiškia, kad mes galėjome nurodyti sąlygą (Z), pagal kurią yra ryšys tarp X ir Y. Dabar, jei Z įvedimas analizėje sumažina arba visiškai pašalina santykį tarp X ir Y, mes galime padaryti išvadą, kad X nėra Y gamintojas, tai yra, santykis tarp X ir Y yra „netikras“ arba kad mes atsekome procesą, kuriuo X veda į Y (ty per Z).

Leiskite mums apsvarstyti situaciją, kurioje galime teisėtai daryti išvadą, kad santykis tarp X ir Y yra neteisingas.

Manoma, kad akivaizdus ryšys tarp dviejų kintamųjų X ir Y yra neteisingas, jei jų tarpusavio kitimas kyla ne dėl jų tarpusavio ryšio, bet iš to, kad kiekvienas iš jų (X ir Y) yra susijęs su trečiuoju kintamuoju (Z) arba deriniu kintamųjų, kurie nesuteikia nuorodos į procesą, kuriuo X veda į Y.

Neteisingų santykių apibūdinimas gali būti pavaizduotas kaip:

Čia siekiama nustatyti Y, priklausomo kintamojo priežastį (tarkim, koledžo absolventų lūkesčius). Analizuojant duomenis buvo pastebėtas ryšys (sulaužyta linija) tarp X nepriklausomo kintamojo (tarkim, studentų gautų klasių) ir absolventų (Y) piniginių lūkesčių.

Taip pat įvedamas kitas kintamasis (Z), kad pamatytume, kaip santykis tarp X ir Y veikia kartu su šio trečiojo veiksnio įvedimu. Z yra trečiasis veiksnys (tarkim, mokinių tėvų pajamų lygis). Mes nustatėme, kad šio veiksnio įvedimas sumažina santykį tarp X ir Y.

Tai reiškia, kad ryšys tarp aukštesnio lygio egzamino ir aukštesnių pinigų lūkesčių neatsiranda, bet žymiai sumažėja, kai įvedame trečiąjį kintamąjį, ty tėvų pajamų lygį.

Toks Z įvadas atskleidžia faktą, kad ne X, bet Z gali būti lemiamas Y faktorius. Taigi santykis tarp X ir Y (parodyta diagramoje taškuota linija) yra klaidingas, o santykis tarp Z ir Y yra tikras. Parodykime tai hipotetinių duomenų pagalba.

Tarkime, analizuojant tyrime pateiktus duomenis, buvo pastebėta, kad egzistuoja reikšmingas ryšys tarp egzaminą užtikrinančių studentų ir I (II, III) lygių ir darbo užmokesčio, kurio jie tikisi už darbą, jie gali būti paskirti.

Pvz., Buvo matyti, kad paprastai pirmieji studentų pasiskirstytojai tikėjosi didesnio atlyginimo, lyginant su antraisiais padaliniais, o antrasis dalintojas tikėjosi daugiau, palyginti su trimis daly- vojais.

Toliau pateiktoje lentelėje parodyta hipotetinė padėtis:

Iš lentelės aiškiai matyti, kad yra pagrindas hipotezei, jog studentų lygiai nustato jų lūkesčius dėl atlyginimų. Darytume prielaidą, kad tyrėjas kažkaip nukreipia į idėją, kad tėvų pajamų lygis (X) galėtų būti vienas iš svarbių kintamųjų, lemiančių ar įtakojančių studentų lūkesčius dėl atlyginimų (Y). Taigi į analizę įtraukiamas Z.

Tarkime, ši lentelė rodo santykį tarp kintamųjų:

Pastaba:

Horizontalioje eilutėje esanti HML, padalijantį kiekvieną studentų klasių kategoriją, atitinkamai atitinka aukštą tėvų pajamų lygį, vidutinį tėvų pajamų lygį ir mažą tėvų pajamų lygį. Pirmiau pateikta lentelė aiškiai rodo, kad santykis tarp X ir Y tapo mažiau reikšmingas, palyginti su santykiu tarp Z ir Y.

To get a clearer picture, let us see the following table (a version of Table B omitting the categories of X) showing the relationship between Z and, ie, parental income level and students' monetary expectations:

We can very clearly see from the table that, irrespective of their grades, the students' monetary expectations are very strongly affected by the parental levels of income (Z).

We see that an overwhelming number of students (ie, 91.5%) having high monetary expectations are from the high parental income group, 92% having moderate monetary expectations are from moderate parental income group and lastly, 97% having low monetary expectations are from the low parental income group.

Comparing this picture with the picture represented by Table A, we may say that the relation between X and Y is spurious, that is, the grade of the students did not primarily determine the level of the monetary expectations of the students.

It is noted in Table A that students getting a higher grade show a significant tendency toward higher monetary expectations whereas the lower grade students have a very marked concentration in the lower monetary expectation bracket.

But when we introduce the third variable of parental income, the emerging picture becomes clear enough to warrant the conclusion that the real factor responsible differential levels of monetary expectations is the level of parental income.

C lentelėje matome labai stiprią ir didžiulę studentų grupių koncentraciją, atitinkančią tris minėtus derinius, ty didesnius piniginius lūkesčius ir didesnes tėvų pajamas, vidutinius pinigų lūkesčius ir vidutines tėvų pajamas bei mažesnius pinigų lūkesčius ir mažesnės tėvų pajamos, ty atitinkamai 5%, 92, 1% ir 1%.

Susijusio proceso stebėjimas ir kintamųjų ryšys: Kaip buvo nurodyta anksčiau, jei trečiasis veiksnys Z sumažina arba pašalina nepriklausomo kintamojo X ir priklausomo kintamojo Y santykį, galime daryti išvadą, kad santykis tarp X ir Y yra neteisingas, arba kad mes galėjome atsekti procesą, kuriuo X veda į Y.

Dabar apsvarstysime aplinkybes, dėl kurių būtų galima daryti išvadą, kad X ir Y santykių procesas atsekamas per trečiąjį veiksnį Z.

Tarkime, tyrime tyrėjai nustatė, kad mažesnės bendruomenės turi didesnį vidinį intymumo balą, o intymumo rezultatas - tai asociacijos intymumo tarp bendruomenės narių, atvykusių naudojant intymumo skalę, matas.

Tarkime, jie taip pat nustatė, kad vidutinio dydžio bendruomenės turėjo mažiau intymumo balų, palyginti su mažomis bendruomenėmis, o didelių bendruomenių vidurkis buvo mažiausias. Tokia išvada leidžia manyti, kad bendruomenės dydis lemia asociacijos intymumą bendruomenės narių atžvilgiu.

Kitaip tariant, pastabos leidžia daryti išvadą, kad nedidelio dydžio bendruomenėje gyvenantys nariai turi didesnį asociacijos intymumą, o didelių bendruomenių nariams būdingas mažesnis susivienijimas.

Šioje lentelėje pateikiami hipotetiniai duomenys:

Antroje lentelės stulpelyje buvo parodyti kiekvienos bendruomenės pavyzdžiai.

Antroje lentelės stulpelyje buvo parodyti kiekvienos bendruomenės pavyzdžiai. 3 skiltyje parodytas vidutinis intymumo balas, atitinkantis bendruomenių tipus, apskaičiuotus remiantis atsakymais, pateiktais tam tikriems punktams, susijusiems su kasdienėmis narių asociacijomis.

Iš lentelės matyti, kad vidutinis intymumo balas skiriasi atvirkščiai su bendruomenės dydžiu, ty mažesnis dydis, tuo didesnis intymumo balas ir, atvirkščiai, didesnis dydis, tuo mažesnis intymumo balas.

Dabar manau, kad tyrėjai įgijo idėją, kad trijų tipų bendruomenės skiriasi savo teikiamomis galimybėmis sąveikai tarp narių, tiek, kiek gyvenamoji aplinka, gyvenamoji aplinka, bendrai naudojamos komunalinės paslaugos ir kt.

Taigi tyrėjai įvardija trečiąjį veiksnį sąveikos potencialo analizėje, ty, kokiu mastu aplinkybės, kuriomis gyvena asmenys, gali suteikti galimybę tarpusavyje bendrauti.

Siekiant patikrinti hipotezę, kad trijų bendruomenių tipų skirtumai buvo susiję su bendruomenės narių tarpusavio sąveika, tyrėjai, atsižvelgdami į gyvenamųjų namų modeliavimo, gyvenimo sąlygų, bendrai naudojamų patogumų ir pan. sąveikos potencialas kartu su vidutiniu intymumo rezultatu.

Taigi pažeidimo potencialas yra trečiasis kintamasis Z, įtrauktas į analizę. Sąveikos potencialas klasifikuojamas kaip mažas sąveikos potencialas (b) vidutinės sąveikos potencialas ir (c) aukštas sąveikos potencialas.

Šioje lentelėje pateikiami hipotetiniai duomenys:

Skaitydami lentelėje esančias eilutes matome, kad sąveikos potencialas yra glaudžiai susijęs su bendruomenės narių intymumo rezultatu, neatsižvelgiant į bendruomenės dydį.

Tai yra, ar svarstome eilutę mažoms bendruomenėms, vidutinėms bendruomenėms, ar didelėms bendruomenėms, kiekvienu atveju padidėja vidutinis intymumo balas ir padidėja sąveikos potencialas. Be to, skaitydami įrašus eilėse, tampa aišku, kad bendruomenės dydis ir sąveikos potencialas turi reikšmingą koreliaciją.

Pavyzdžiui, maždaug du trečdaliai mažos bendruomenės respondentų gyvena esant dideliam sąveikos potencialui; taip pat pastebime, kad daug mažesnė vidutinio dydžio bendruomenių gyventojų dalis gyvena esant didelėms sąveikos-potencialo sąlygoms ir labai mažai didelių bendruomenių gyventojų, esant didelėms sąveikos-potencialo sąlygoms.

Dabar mes perskaitome intymumą, kuris nustato stulpelius tik tam, kad būtų nustatyta, jog ryšys tarp bendruomenės tipo ir asociacijos intymumo yra gerokai sumažintas. Tiesą sakant, žmonėms, gyvenantiems didelės sąveikos potencialo sąlygomis, nėra aiškaus ryšio tarp bendruomenės dydžio ir intymumo balo.

Iš šio santykių rinkinio tyrėjai gali daryti išvadą, kad atvirkštinis ryšys tarp bendruomenės dydžio ir intymumo rezultato yra geras, bet vienas iš pagrindinių būdų, kuriais tam tikras bendruomenės tipas skatina savo narių intymumą, yra pasiūlyti galimybes, didinančias jų tarpusavio sąveiką.

Kitaip tariant, mažoms bendruomenėms būdingas didesnis vidutinis intymumo balas, nes jų mažas dydis suteikia daug galimybių daugeliui narių sąveikos. Kita vertus, didelėms bendruomenėms būdingas santykinai mažesnis intymumo balas.

Tačiau mažesnis intymumo rezultatas priskirtinas ne pačios bendruomenės dydžiui, bet tai, kad didelė bendruomenė negali pasiūlyti didesnės narių sąveikos tarp mažų bendruomenių.

Taigi, tyrėjai, o ne išvados, kad ryšys tarp bendruomenės dydžio ir vidutinis intymumo balas tarp narių yra klaidingas, gali daryti išvadą, kad jie sugebėjo atsekti procesą, kuriuo X (ty bendruomenės tipas) daro įtaką Y (intymumo balas).

Pirmasis leido daryti išvadą, kad santykis tarp kintamųjų X ir Y buvo klaidingas, o pastaroji - išvada, kad procesas nuo X iki Y gali būti atsekamas per Z (X iki Z iki Y). Abiem atvejais trečiojo kintamojo Z įvedimas sumažino arba pašalino jų ryšį (X ir Y).

Tačiau galima pastebėti vieną skirtumą. Pirmajame pavyzdyje Z kintamasis (t. Y. Tėvų pajamų lygis) buvo akivaizdžiai anksčiau laiko kitiems dviem kintamiesiems (studentų laipsnis egzaminuose ir studentų lūkesčiai).

Antruoju pavyzdžiu trečiasis kintamasis Z (sąveikos potencialas, kurį suteikia bendruomenės) nepasireiškė prieš numatomą priežastinį kintamąjį (bendruomenės dydį). Jis buvo kartu su juo ir gali būti laikomas pradedančiu po jo.

Taigi kintamųjų laiko seka yra svarbus aspektas sprendžiant, ar akivaizdus priežastinis ryšys yra klaidingas. Tai reiškia, kad jei trečiasis kintamasis Z, kuris pašalina arba pašalina ryšį tarp pradžių susijusių kintamųjų X ir Y, mes paprastai darome išvadą, kad akivaizdus priežastinis ryšys tarp kintamųjų X ir Y yra neteisingas.

Tačiau, jei žinomas arba manoma, kad trečiasis kintamasis Z įvyko tuo pačiu metu kaip X arba po X, galima daryti išvadą, kad procesas, kuriuo X veda į Y, yra atsekamas. pasitikėjimas priežastiniu ryšiu, išplaukiantis iš tyrimų, kurių pobūdis nėra eksperimentinis, būtina juos kritiškai išbandyti, kad būtų pašalinti kiti galimai svarbūs kintamieji.

Dėl šios priežasties svarbu surinkti studijų metu duomenis apie tokius galimai įtakingus kintamuosius, išskyrus tuos, su kuriais susijusi hipotezė.

Anksčiau buvo teigiama, kad trečiojo kintamojo įvedimas į analizę gali sustiprinti santykius vienoje pogrupyje ir sumažinti tą patį kitame pogrupyje. Tokiu atveju mes sakome, kad nurodėme sąlygą (Z), pagal kurią santykiai tarp X ir Y yra.

Leiskite mums iliustruoti specifikacijos procesą. Tarkime, bendruomenės tyrime nustatome ryšį tarp pajamų ir išsilavinimo lygio.

Tai parodyta toliau pateiktoje lentelėje:

Lentelėje matome, kad santykis tarp švietimo ir pajamų yra gana pažymėtas. Aukštasis išsilavinimo lygis apskritai didesnis tuo atveju, kai procentų atvejų uždirba kasmetinis Rs.5000 / - ir daugiau pajamų. Tačiau mes galime nuspręsti, kad santykiams reikia daugiau specifikacijų.

Tai yra, mes galime daugiau sužinoti apie sąlygas, kuriomis šis santykis pasiekiamas. Tarkime, manoma, kad miesto ir pramonės bendruomenėje gyvenančių respondentų faktas gali teigiamai paveikti išsilavinimo privalumus už atlyginamą darbą ir dėl to atspindėti pajamas.

Remdamiesi šia prielaida, į analizę pristatome trečiąjį veiksnį Z, ty tuos respondentus, kurie gyvena miesto pramoninėje bendruomenėje, ir tuos, kurie gyvena kaimo pramonėje, ir mato, kaip jis veikia pradinį X ir Y santykį ( ty švietimas ir pajamos).

Tarkime, mes gauname paveikslėlį, kaip parodyta šioje lentelėje:

Aiškiai matome, kad B lentelė atspindi labai skirtingą ryšį tarp kaimo ir ne pramonės bendruomenės gyventojų pajamų ir išsilavinimo, palyginti su miesto ir pramonės bendruomenės gyventojais. Matome, kad pramonės miestuose gyvenančių asmenų santykis tarp švietimo ir pajamų yra šiek tiek didesnis už pradinius santykius.

Tačiau tiems, kurie gyvena ne pramoninėse bendruomenėse, santykiai pirmiau pateiktoje lentelėje yra gerokai mažesni už pradinius santykius.

Taigi trečiojo veiksnio įvedimas ir pradinio santykio suskirstymas remiantis trečiuoju veiksniu (Z) padėjo nustatyti sąlygą, pagal kurią santykis tarp X ir Y yra ryškesnis, kaip ir sąlyga, pagal kurią santykis yra mažiau ryškus.

Panašiai manome, kad tyrimo metu matome, kad žmonės, priklausantys aukštesnėms pajamoms, paprastai turi mažesnį vaikų skaičių, palyginti su mažesnes pajamas gaunančiomis kategorijomis. Tarkime, mes manome (remiantis teorine orientacija), kad miesto būsto veiksnys gali būti svarbus santykiams.

Pristatydami šį veiksnį, manome, kad mieste atsiranda pirminis ryšys tarp pajamų lygio ir vaikų skaičiaus, ir kad jis tampa mažiau ryškus tarp kaimo žmonių, nei nustatėme sąlygą Z (ty miesto gyvenamąją vietą) ), pagal kurį santykis tampa ryškiai sustiprintas arba išreikštas.

Studijos išvadų aiškinimas:

Iki šiol mes daugiausia rūpinomės procedūromis, kurias kartu sudaro tai, ką vadiname įprastai, duomenų analizė. Tačiau tyrėjo užduotis yra neišsami, jei jis sustoja pateikdamas savo išvadas empirinių apibendrinimų, kuriuos jis gali gauti analizuodamas duomenis, forma.

Mokslininkas, kuris, pavyzdžiui, baigia savo mokslinius tyrimus, tiesiog nurodydamas, kad „nesusituokę žmonės turi didesnę savižudybę, lyginant su vedusiais žmonėmis“, beveik neįvykdo savo bendrojo įsipareigojimo moksliniams tyrimams, nors empirinis apibendrinimas, kurį jis nurodė ji turi tam tikrą vertę.

Didesnio mokslo intereso tyrinėtojas taip pat turi stengtis parodyti, kad jo stebėjimas rodo tam tikrus santykius ir procesus, kurie iš pradžių buvo paslėpti akiai. Kitaip tariant, mokslininkas turi parodyti, kad jo stebėjimas turi prasmę, daug platesnę ir gilesnę, negu jis atrodo paviršiaus lygmenyje.

Norėdami grįžti prie mūsų savižudybės pavyzdžio, tyrėjas turėtų parodyti, kad jo pastaba, kad „nesusituokę žmonės pasižymi savižudybe“, iš tikrųjų atspindi gilesnį socialinės sanglaudos ir savižudybės tempo ryšį (Durkheimo teorija).

Kai tyrėjas gali atskleisti santykius ir procesus, kuriais grindžiami jo konkretūs faktai, jis gali nustatyti abstrakčius ryšius tarp jo išvadų ir kitų.

Iš esmės, tyrėjo darbas gerokai viršija duomenų rinkimą ir analizę. Jo užduotis - interpretuoti jo tyrimo rezultatus. Būtent aiškinant mokslininkas gali suprasti tikrąją jo išvadų reikšmę, ty jis gali suprasti, kodėl išvados yra tai, kas jos yra.

Kaip jau buvo minėta, aiškinimas yra platesnių ir abstraktesnių tyrimų rezultatų reikšmių paieška. Ši paieška apima mokslinių tyrimų rezultatų peržiūrą atsižvelgiant į kitas žinomas žinias, teoriją ar principą. Ši paieška turi du pagrindinius aspektus.

Pirmasis aspektas apima pastangas nustatyti mokslinių tyrimų tęstinumą, susiejant konkretaus tyrimo rezultatus su kitų tyrimų rezultatais. Būtent aiškinant mokslininkas gali atskleisti arba suvokti abstraktų principą, esantį po konkrečių empirinių pastabų.

Šis abstraktus bendrasis vardiklis, su kuriuo buvo atpažįstamas, tyrėjas gali lengvai susieti savo išvadas su kitais tyrimais, atliktais įvairiuose nustatymuose, įvairiais detaliais, bet atspindintį tą patį abstraktų principą išvadų lygiu.

Nereikia nė sakyti, kad tyrėjas, remdamasis abstrakčiu teoriniu principu, kuriuo grindžiamas jo atradimas, gali padaryti įvairias prognozes apie konkretų įvykių pasaulį, kuris, atrodo, nėra susijęs su jo išvadų sritimi. Taigi, nauji tyrimai gali būti inicijuoti, kad būtų galima išbandyti prognozes ir suprantama, kad tokie tyrimai turėtų ryšį su tyrėjo pradiniu tyrimu.

Šiek tiek kitokia prasme aiškinimas būtinai dalyvauja pereinant nuo tiriamojo prie eksperimentinio tyrimo. Ankstesnės tyrimų kategorijos išvadų aiškinimas dažnai lemia pastarosios hipotezes.

Kadangi tiriamojo tyrimo pradžioje nėra hipotezės, tokio tyrimo išvados ar išvados turi būti aiškinamos remiantis „post-factum“ interpretacija dažnai yra pavojingas žaidimas, kuriam būdingas pavojingas poveikis. Toks aiškinimas apima krikštatėlio paiešką tam tikros teorijos ar principo, kuris patvirtintų (ty paaiškintų) tyrimo rezultatus, pobūdžiu.

Šis tyrimas dažnai pasirodo esąs tyrėjo užduotis pagrįsti savo išvadas, surandant tam tikrą teoriją, atitinkančią jo išvadas. Dėl to gana dažnai prieštaringos išvados savo „krikštatėvius“ gali rasti įvairiose teorijose.

Vykdant šį procesą, reikia aiškiai atsižvelgti į šį post-factum aiškinimo aspektą, apimantį bandymus racionalizuoti tyrimų rezultatus. Tačiau kartais nėra kitos alternatyvos.

Antra, aiškinimas sukuria aiškinamąsias sąvokas. Kaip jau buvo minėta, išvadų aiškinimas apima pastangas paaiškinti, kodėl pastabos ar išvados yra, kas jos yra. Vykdydama šią užduotį, teorija yra svarbiausia.

Tai yra jautrinimo priemonė ir pagrindiniai veiksniai ir procesai (aiškinamieji pagrindai) po atradimais. Mokslininko pastabose tyrimo metu yra veiksnių ir procesų rinkinys, galintis paaiškinti savo empirinio pasaulio pastabas. Teorinis aiškinimas atskleidžia šiuos veiksnius.

Mokslininko užduotis - paaiškinti ryšius, kuriuos jis pastebėjo savo studijų metu, atskleidžiant pagrindinius procesus, kurie suteikia jam gilesnį šių santykių supratimą, ir nurodo tam tikrų pagrindinių veiksnių, veikiančių problemos srityje, vaidmenį.

Taigi vertimas yra dvigubas. Pirma, ji supranta bendruosius veiksnius, kurie, atrodo, paaiškina, kas buvo pastebėta tyrimo metu, ir, antra, ji suteikia teorinę koncepciją, kuri savo ruožtu gali tapti tolesnių tyrimų vadovu.

Tokiu būdu mokslas ateina sėkmingiau atverti pagrindinius procesus, kurie formuoja empirinio pasaulio dalį, su kuria susijęs mokslo darbuotojas.

Vertimas yra taip neatskiriamai susietas su analize, kad jis turėtų būti tinkamai suprantamas kaip specialus analizės aspektas, o ne atskira ar atskira operacija. Baigdamas norime cituoti prof. C. Wright Mills, kuris pareiškė esmę, ką visi dalyvauja analizuojant (įskaitant interpretavimą) duomenis.

„Mills“ sako: „Taigi, jūs atrasite ir apibūdinsite, nustatysite užsakymų tipus, sužinoję, sutelkdami dėmesį ir organizuodami patirtį, išskirdami elementus pagal pavadinimą. Ši užsakymo paieška sukels jums ieškoti modelių ir tendencijų ir surasti santykius, kurie gali būti tipiški ir priežastiniai. Trumpai ieškosite, ką reiškia, ką jūs atėjote, ar ką galima aiškinti kaip matomą kažką, kas atrodo, kad tai susiję su tuo, ką bandote suprasti; jūs suprasite jį iki esminių dalykų; tada atidžiai ir sistemingai susieti juos vienas su kitu, kad galėtumėte sukurti tam tikrą darbo modelį… “

„Visada tarp visų detalių ieškosite rodiklių, kurie gali būti nukreipti į pagrindinį dreifą, pagrindines visuomenės įvairovės formas ir tendencijas tam tikru laikotarpiu.“ Baigus tyrimą, pareiškimas tai kelia naujų klausimų ir problemų.

Kai kurie nauji klausimai yra naujų mokslinių tyrimų įmonių pagrindas ir naujų teorijų formulavimas, kurios pakeis arba pakeis senąsias. Iš tikrųjų tai yra mokslinių tyrimų priemonės. Jis padeda atverti naujas ir platesnes intelektinės nuotykių galimybes ir imituoja daugiau žinių bei didesnio išminties jo naudojimui.