Pavyzdžio dydis: problema ir matematika

Perskaitę šį straipsnį sužinosite apie mėginio dydžio problemą ir matematiką.

Mėginio dydžio problema:

Dabar mes apsvarstysime vieną iš sudėtingiausių problemų, susijusių su atranka, ty imties dydį. „Koks turėtų būti tinkamas imties dydis, palyginti su gyventojų skaičiumi?“ „Kokie turėtų būti pavyzdžiai?“ - tai klausimai, kuriuos dažnai klausia moksleiviai. Galima atsakyti į šį klausimą.

Taip yra todėl, kad į klausimą dėl dydžio galima atsakyti tik tada, kai esame mėginių ėmimo elementai gyventojams tokiu būdu, kad kiekvienas elementas turi tokią pačią galimybę būti įtrauktam į imtį, ty kai priimame mėginių ėmimo tikimybę.

Tik tikimybės projektas leidžia formuluoti reprezentatyvius mėginių ėmimo planus. Todėl galima sudaryti tipinius atrankos planus.

Vadinasi, klausimas, „kokio dydžio pavyzdys turėtų būti tam, kad būtų atstovaujamas nustatyto dydžio gyventojais“, reiškia tikimybės atrankos procedūrą. Jei ši procedūra nebus vykdoma, imties reprezentatyvumas, nesvarbu, koks didelis, gali būti tik vilties ir prielaidos klausimas.

Bendros klaidos, susijusios su imties dydžiu, yra tai, kad visatos dydis, iš kurio imamas mėginys, nustato atvejų, reikalingų tam, kad būtų gautas tinkamas ar reprezentatyvus tos visatos pavyzdys, skaičius.

Mes darysime gerai, kad galėtume atkreipti dėmesį, kad dėmesys turėtų būti skiriamas ne visatos atvejų skaičiui, o jų skaičiui imtyje.

Mėginio dydžio matematika:

Pagrindinis praktinis klausimas „Kaip nustatyti mėginio dydį, kuris duos norimą tikslumo laipsnį, kurį nustatė tyrėjas tam tikram tyrimui?“ Visuose tyrimuose, žinoma, yra tokia pati atrankos problema, kaip: nuspėti kažką apie gyventojus, remiantis žiniomis apie pavyzdį.

Mokslininkas privalo žinoti, kokios rūšies statistiniai duomenys bus naudojami tokiam tikslui, pvz., Procentams, vidurkiams, standartiniam nuokrypiui ir kt. Tai svarbu, nes įvairūs statistiniai duomenys yra naudingi, atsižvelgiant į pageidaujamą mėginių grąžinimo tikslumo laipsnį, kurį savo ruožtu suteikia skirtingi mėginių dydžiai.

Vidutiniškai ir procentiniai dydžiai yra dažniau pageidaujami statistiniai duomenys, todėl konkrečiai atsižvelgsime į mėginių dydžius, atitinkančius norimą tikslumo laipsnį pagal vidurkius ir procentus.

Kadangi tyrėjo paimtas pavyzdys yra tik vienas iš daugelio galimų visatos pavyzdžių, kuriuos jis galėjo pasirinkti, jis turi žinoti, kiek jis gali pasitikėti pavyzdžiu kaip „visatos“, apie kurią jis nori sužinoti ką nors arba su kuria jis nori apibendrinti.

Jis turi žinoti, kokio dydžio mėginys turėtų būti toks, kad jam būtų suteiktas patenkinamas tikslumo lygis. Šis skaičiavimas galimas naudojant matematiką, nes atsitiktinės atrankos būdu (tikimybės atrankos planas), kai kiekvienas visatos elementas turi konkrečią tikimybę įtraukti į mėginį, prognozavimo ar įvertinimo tikslumas yra susijęs su elementų skaičiaus kvadratine šaknimi mėginyje.

Prieš pradedant skaičiuoti reikiamo dydžio mėginį tam tikram tyrimui, praktiškai būtina užtikrinti tam tikrą preliminarią informaciją apie gyventojus ar visatą.

Jei tyrėjas ketina panaudoti mėginį, kad įvertintų vidutinės konkrečios charakteristikos matą visatoje, jis turi turėti tam tikrą preliminarią standartinio nuokrypio (dispersijos) vertę elementų vertybių pasiskirstymo visatoje atžvilgiu. pagal nurodytą charakteristiką.

Mokslininkas, kuris atpažįsta reikšmių diapazoną (plitimą) tam tikros ypatybės atžvilgiu visatoje, gali gauti preliminarų standartinio nuokrypio įvertinimą, dalydamas šį intervalą 6, nes (baigtinės) visatos standartinis nuokrypis gali būti visais praktiniais tikslais laikoma, kad tai yra maždaug 1/6 visų variantų.

Kitaip tariant, pasiskirstymo diapazonas gali apimti 6 standartinius nuokrypius. Preliminari informacija apie visatą gali būti atliekama bandomojo tyrimo, ankstesnių tyrimų rezultatų, statistikos biurų paskelbtų ataskaitų, šios srities ekspertų skaičiavimo ir kt.

Mokslininkas, prieš pradėdamas apskaičiuoti mėginio dydį, turi nuspręsti, kokio tikslumo lygis yra numatytas. Ši lūkesčiai iš esmės yra pagrįsti tyrimo tikslu.

Kitaip tariant, tyrėjas turi nuspręsti:

(a) Kiek klaidos įvertinime, kuris turi būti gautas iš mėginio (lyginant su tikrąja verte, ty „visatos“ verte), gali būti toleruojamas (vadinamas paklaidos riba arba tikslumo riba) ir

b) Kiek galima patikinti, kad įverčiai pateks į šią klaidų ribą (vadinamasis patikimumo lygis arba tikimybė).

Tačiau tikslinga juos išsamiau apsvarstyti, šiuo metu:

(a) Klaidos arba tikslumo ribos:

Pagrindinis klausimas yra toks: „Kiek procentas ar vidurkis turi būti užtikrintas iš mėginio tyrimo, kuris gali skirtis nuo tikrojo vidurkio (gyventojų) ir gali būti toleruojamas?“. Mokslininkas gali toleruoti 5% klaidą arba jam gali prireikti 2% ribos.

Viskas priklauso nuo to, kaip tiksliai ar tiksliai jis nori žinoti tam tikrus faktus. Tarkime, kad mokslininkas iš anksto nori sužinoti, kuris iš dviejų kandidatų, kurie ginčija rinkimus, laimės vietą. Jei balsavimas bus artimas, mokslininkas gali sau leisti toleruoti tik mažesnę klaidą, jei jis praktiškai yra tikras.

Pavyzdžiui, jis gali nustatyti leistiną paklaidą, mažesnę kaip 2%. Kita vertus, jei rinkimai atrodo vienašališki ir gana šališki tam tikro kandidato naudai, tyrėjas gali numatyti rezultatus netgi turėdamas daug didesnę klaidos vertę.

Jei atrinkta apklausa parodė, kad 60% balsų būtų naudingi kandidatui, gali būti toleruojama 9% klaida. Šiuo atveju, net jei mėginių apklausa atvedė labiausiai nesėkmingą pavyzdį, nukrypstantį nuo 9% nuo tikrosios vertės, tikroji vertė vis tiek būtų 51%, ty 1% viršija 50%, kuris yra kritinis taškas.

Taigi tiek apskaičiuota 60% vertė, tiek tikroji 51% vertė būtų didesnė už kritinį tašką (ty 50%) ir prognozė būtų patikima.

b) Tikimybės arba pasitikėjimo lygis:

Be tikslumo ribos, tyrėjas taip pat turi nuspręsti, remdamasis savo tyrimu, kiek pasitikėjimo jis norėtų įdėti į mėginių sąmatas taip, kad būtų artimas tikram skaičiui, kad atitiktų tolerancijos ar tikslumo ribas, nustatytas jam už tyrimą.

Tam tikromis aplinkybėmis jis gali būti labai įsitikinęs, kad jo apskaičiavimai (pagal atranką) neviršys 51% tikrosios vertės, o kai kuriose kitose situacijose jis gali būti patenkintas šiek tiek mažesniu patikinimu.

Socialinių mokslų tyrimuose yra labai gerai žinomi ir dažnai naudojami du tikimybės ar pasitikėjimo laipsniai.

Vienas iš jų yra 0, 95 tikimybės lygis, ty iš 100 bus 95 tikimybės, kad mėginio sąmata neviršys tolerancijos ar klaidų ribos, o antrasis lygis - 0, 99, tikimybė, ty tikėtina, kad iš 99 tikimybių iš 100, apskaičiuota atranka neviršys numatytos klaidos.

Pasitikėjimo lygis netgi gali būti nustatytas iki 0, 999, tai yra, mėginio sąmata neatitinka tikrosios visatos vertės, viršijančios tolerancijos ribas, iš 999 tikimybių iš 1000. Tam tikrais tikslais tyrėjas gali siekti mažo ir nustatyti tikimybės lygį 0, 67 (ty 2 iš 3).

Tikimybė, kad tam tikras tyrimui paimtas mėginys suteiks visatos vertę, kuri yra klaidos ribose, priklauso nuo pavyzdžių, kurie gali būti imami iš visatos, variacijos. Jei iš mėginių apsaugotos vertės linkusios gerokai nukrypti nuo tikrosios vertės, tada bet kurios mėginio vertės, esančios leistinose klaidų ribose, yra prastos.

Standartinė klaida - tai priemonė, kuri nurodo, kokie yra tikimybė, kad mėginys išliks leistinose ribose. Tai yra ėminių įvertinimo skirtumo matas, kurį galima tikėtis atsitiktinės atrankos būdu. Atsitiktiniai mėginiai linkę laikytis tikimybės įstatymų, o mėginių sąmatos linkusios susikurti tikrąją visatos vertę.

Šie skaičiavimai gali būti pateikiami varpine arba normalia kreive. Šios kreivės vidurio taškas reiškia tikrąją visatos vertę, o atsitiktinės atrankos įvertinimo didžiausias variacijos ar nukrypimas nuo šios tikrosios vertės yra maždaug tris kartus didesnis už standartinę paklaidą.

Taigi standartinė paklaida yra apie 1/6 visos visos atsitiktinės atrankos variantų. Tačiau visais praktiniais tikslais standartinė paklaida laikoma 1/4 t .

Tikimybių lentelėse matyti, kad tikimasi, jog 95 iš 100 mėginių įvertinimų pateks į ribines +2 ir -2 standartines klaidas. Tai reiškia, kad jei nustatysime savo pasitikėjimo ar tikimybės lygį 0, 95, mūsų problema bus parengti atsitiktinę imtį su standartine paklaida, kuri yra maždaug ½ (pusė) mūsų klaidos ribos.

Dėl didesnio tikimybės lygio, mes turėtume parengti standartinę paklaidą, tai yra dar mažesnė klaidų ribos dalis.

Pažymėtina, kad standartinė paklaida sumažėja (didesnis tikslumas), nes mėginiai tampa didesni. Norėdami dvigubinti tikslumą, mėginio dydis turi būti padaugintas iš 4, ty keturis kartus; norint jį padidinti, mėginio dydis turi būti padaugintas iš 9; keturis kartus, 16 ir pan.

Tai reiškia tik tai, kad tikslumas didėja kaip pavyzdžių skaičiaus kvadratinis šaknis. Statistikai parengė lenteles, kuriose parodoma, kaip tikėtina, jog imties įverčiai atitiks įvairias standartines klaidų ribas.

Šios ribos paprastai nurodomos kaip + (plius) ir - (minus). Tokiose lentelėse galima lengvai parodyti, kad, pavyzdžiui, 95% atsitiktinių imčių įvertinimų patenka į +1, 96 ir -1, 96 standartinių klaidų ribą, apie 68% įvertinimų patenka į 1 ir -1 standartinių klaidų ir 99% ribų. įvertinimai patenka į +2, 57 ir -2, 57 standartinių klaidų intervalą ir pan.

Visiškai atsižvelgdama į (1) klaidų ribą ir (2) tikimybės ar pasitikėjimo lygį, tyrėjas gali tęsti norimo mėginio dydžio apskaičiavimą. Mildredas Partenas pateikė tokią formulę, skirtą apskaičiuoti imties dydį, kai apskaičiuojamas statistikos procentas. Akivaizdu, kad tai yra perkeltas standartinių klaidų formulės variantas.

Mėginio dydis = PC (100-PC) Z 2 / T 2

Pirmiau pateiktoje formulėje PC reiškia preliminarų procentinės dalies (iš visatos) įvertinimą.

Z - standartinių klaidų vienetų skaičius, kuris randamas (iš normalios tikimybės lentelės), kad atitiktų reikiamą tikimybės lygį.

T - paklaida, kurią galima toleruoti (5% arba 2%).

Parten apskaičiavo imties dydį apskaičiuodama arba įvertindama visatos vidutinę vertę, susijusią su tam tikra savybe tam tikru pasitikėjimo lygiu ir siekdama tam tikros atsargos ar paklaidos ar tolerancijos ribos.

Mėginio dydis = (δ + Z / T) 2

Kur 8 reiškia preliminarų visatos standartinio nuokrypio įvertinimą.

Z reiškia standartinių klaidų vienetų skaičių, atitinkantį reikalaujamą tikimybės arba patikimumo lygį.

Paimkime konkretų pavyzdį ir parengsime pavyzdžio dydį. Tarkime, mes norime įvertinti vidutines metines šeimų, gyvenančių tam tikroje „viduriniosios klasės“ vietovėje, pajamas mieste.

Tarkime, mes nustatėme savo klaidų ribą Rs.100 / -, ty mes toleruosime mėginio sąmatą plius arba minus 100 nuo tikrosios gyventojų skaičiaus pajamų atžvilgiu. Tarkime, mes nustatėme tikimybės ar pasitikėjimo lygį 0, 95.

Tarkime, kad po kelerių metų atlikto tyrimo, mes apskaičiuojame standartinį nuokrypį, susijusį su gyventojų (vietovių) metinėmis pajamomis Rs.500 / -. Z vertė, ty standartinė paklaidos vienetas, atitinkantis 0, 95 tikimybę, yra 1, 96.

Šias vertes pakeičiame aukščiau pateiktoje formulėje

Paprasto dydžio = (500 × 1, 96 / 100) 2

= (9.8) 2

= 95

Tai reiškia, kad atsitiktinis 95 atvejų (šeimų, kurios yra imties vienetai) atranka turėtų pateikti mums apskaičiuotą tam tikros „visatos“ vidurkį per nustatytą paklaidos ribą ir reikiamu pasitikėjimo ar tikimybės lygiu, Rs. 100 / - ir 0, 95.

Jei sugriežtinsime klaidos ribą ir nustatysime ją Rs. 50 / -, pavyzdžių skaičius, ty reikalingas mėginio dydis bus keturis kartus didesnis (ty 380) kaip dydis, reikalingas ankstesnei paklaidai (Rs. 100 / -).

Jei kitai vietovei būdingas didesnis homogeniškumas pajamų atžvilgiu, ir manau, kad standartinis nuokrypis pajamų požiūriu yra tik 100, pirmiau minėtos klaidos ribos imties dydis bus daug mažesnis.

Kitaip tariant, formulės vartojimas iliustruoja pamoką, būtent, kad didesnis homogeniškumas mažesnis už reikalaujamą mėginį ir didesnis tikslumo siekimas, didesnis mėginio dydis.

Pakartotinai vartojant tokius terminus kaip klaidų riba ir pasitikėjimo lygis bei kitos skaitmeninės tikimybių ir imties dydžių išraiškos, gali atsirasti įspūdis, kad pagal formulę apskaičiuotas mėginio dydis garantuos norimą tikslumą.

Tačiau reikia nepamiršti, kad tikimybių statistinėse lentelėse parodyti santykiai yra normalūs lūkesčiai idealioje atsitiktinėje atrankoje. Tačiau tiek, kiek tikrasis mėginių ėmimas yra retai idealus, negalima tikėtis, kad lentelėse palaikomi santykiai.

Bendras sunkumų ir retumo idealus mėginių ėmimasis turėtų suprasti skeptiškai vertinti rezultatus, kurie tiksliai atitinka lūkesčius.

Tačiau tai nereiškia, kad tyrėjas neturėtų naudoti ar pageidautų tikslaus imties dydžio, apskaičiuoto pagal tikimybės formulę. Tiesą sakant, būtent tai jis turėtų padaryti, nes jis yra geriausias. Tačiau jis neturėtų primygtinai reikalauti tokio tikslaus dydžio, jei dėl praktinių sumetimų jis netikslingas.

Iš esmės skirtingas požiūris į norimo mėginio dydžio nustatymo problemą yra „stabilumo bandymas“. Tai reiškia, kad renkami duomenys apie santykinai mažus mėginius ir palaikomi grįžtamojo ryšio paskirstymo duomenys.

Kai po tam tikro momento, jei papildomas papildomas mėginys nepakeičia rezultatų, tyrėjas gali daryti prielaidą, kad bendras iki šiol paimtas mėginys tapo tinkamas, išmintingas. Tačiau ši procedūra gali būti laikoma laiko švaistymu, nes ji faktiškai prilygsta mokslo darbuotojui, dalyvaujančiam daugelyje atskirų apklausų, išplatintų per daug laiko.

Buvo teigiama, kad ši procedūra yra neekonomiška, nes surenkama daugiau tvarkaraščių nei iš tikrųjų reikia, nes mažėjantis iki apytikslio stabilumo taško negali būti užtikrintas iki tol, kol kreivė tam tikrą laiką išlaikys savo lygį.

Tačiau, atrodo, tai nėra rimtas apribojimas, palyginti su konservatyvia daugelio gerbiamų tyrimų praktika, kuri surenka daugiau nei būtinas / minimalus pavyzdžių skaičius.

Pagrindinis šio tipo stabilumo bandymo privalumas yra tas, kad vietoj skaičiavimų, pagrįstų preliminaria informacija, paprasčiausiai padidėja bendras mėginio dydžio vienetas, kuris yra pakankamas. Empirinis patikrinimas, ar stebimas grįžimas ir stabdymas, kai jie stabilizuojasi, atrodo paprastas ir įtikinantis.

Pagrindinis šios procedūros pavojus kyla dėl to, kad iš eilės paimti papročiai nėra tikėtina, kad jie paplitę visatoje. Rezultatai gali stabilizuotis, nors jie neatstovauja gyventojams.

Iš tiesų, kuo mažiau reprezentatyvus yra imties pavyzdys, tuo didesnė tikimybė, kad bus pridėta daugiau atvejų, kad būtų gautas tas pats rezultatas ir būtų išvesta stabilizavimo išvaizda. Išskyrus atvejus, kai dalinis pavyzdys yra visatos skerspjūvis, nebus supersensyvaus mėginio, kuriuo būtų galima stebėti artėjančią stabilizaciją.

Pagrindinis šios procedūros reikalavimas yra tas, kad būtų galima stebėti augantį reprezentatyvų mėginį. Pagrindinės priežastys, dėl kurių tai greičiausiai nebus reprezentatyvi, yra išlaidos ir sunkumai, susiję su visais visame pasaulyje paplitusių paeiliui paimtų pavyzdžių rinkimu.

Tačiau empirinis stabilumo tyrimas gali būti labai veiksmingas, kai sub mėginiai yra tinkamai parengti ir surinkti. Šis metodas yra tinkamiausias interviu tyrimams, apimantiems gana mažas teritorijas ar bendruomenę, pvz., Miestą ar miestą, nes tada ne taip sunku ar brangu padaryti kiekvieną pavyzdį atsitiktine gyventojų grupe.

Išsamesnė empirinės kontrolės forma, palyginti su stabilumo testu, yra palyginti nauja plėtra, vadinama seka. Bendroji procedūra, susijusi su šiuo atveju, yra išlaikyti pridėjimą prie mėginio ir tuo pačiu metu toliau tirti reikšmingą mėginį, kol bus sukauptas minimalus mėginys, kuris suteiks reikiamą reikšmės lygį.