Duomenų analizė: 4 etapai

Šiame straipsnyje aptariami keturi pagrindiniai duomenų analizės etapai. Šie etapai yra: 1. Kategorijų nustatymas arba duomenų klasifikavimas 2. Kodavimas 3. Lentelė 4. Statistinė duomenų analizė.

# 1 žingsnis. Kategorijų ar duomenų klasifikavimas :

Socialinių mokslų tyrimai paprastai apima daug įvairių atsakymų į įvairius klausimus ar paskatas, pateikiamas respondentams arba jų respondentams. Šie atsakymai gali būti verbaliniai arba neverbaliniai.

Akivaizdu, kad jei reikia organizuoti daug įvairių rūšių atsakymų, kad juos būtų galima panaudoti atsakant į mokslinių tyrimų klausimus arba apibendrinant, jie turi būti suskirstyti į ribotą kategorijų ar klasių skaičių. Pavyzdžiui, norėtume pasakyti, kad respondentams pateikiami klausimai: „Ar esate už objektyvų kolegijos studentų egzaminą?“.

Respondentų atsakymai gali būti suskirstyti į keturias plačias kategorijas:

a) „Taip“ atsakymai.

b) atsakymai „ne“.

(d) „Neatsakė“.

Tarkime, kad kitas respondentams pateiktas klausimas yra toks: „Kuriai socialinei klasei jūs sakote, kad priklausote?“

Respondentų atsakymai gali būti suskirstyti į šias kategorijas:

a) Viršutinė klasė.

b) Vidurinė klasė.

c) Mažesnė klasė.

(d) „Negaliu pasakyti“.

(e) Kiti atsakymai (pvz., „aš netikiu socialinėmis klasėmis“. „Tai vargu ar svarbu, kur aš priklausau“ ir tt).

Būtina sąlyga priimant sprendimą dėl kategorijų, kurios turi būti įvestos duomenų grupavimui, yra ta, kad tyrėjas turi pasirinkti tinkamą klasifikavimo principą. Tyrimo klausimas ar hipotezė, jei tokia buvo suformuluota, suteikia gerą loginį pagrindą pasirinkimui klasifikavimo principu.

Tarkime, tyrimo hipotezė yra:

„Studentai, turintys patirties mokytis bendrojo lavinimo mokyklose, turės palankesnį požiūrį į bendrojo lavinimo sistemą.“

Akivaizdu, kad vienas iš atsakymų klasifikavimo principų bus tas, ar respondentas turi ankstesnę bendro švietimo sistemos patirtį. Kitas atsakymų klasifikavimo pagrindas būtų palankumo ar nepalankumo laipsnis, išreikštas bendrojo ugdymo sistemoje. Taip pat gali būti remiamasi kitais klasifikavimo pagrindais, atsižvelgiant į tai, kokias tolesnes asociacijas reikia tikrinti.

Pirmasis klasifikavimo pagrindas suteiktų dvi atsakymų kategorijas:

a) sakė, kad jie turėjo ankstesnę bendro švietimo patirtį;

b) sakė, kad jie neturėjo jokios ankstesnės bendro švietimo patirties.

Šiose dviejose kategorijose yra visi atsakymai (žinoma, daroma prielaida, kad nė vienas respondentas neatsakė atsakyti arba neatsakė arba davė „kitą atsakymą“.) Nėra atsakymų dėl minėtos prielaidos ne šių dviejų kategorijų kompaso. Šios dvi kategorijos kartu sudaro vadinamąjį „kategorijų rinkinį“.

„Kategorijos rinkinys“ turi atitikti šiuos tris reikalavimus:

(1) Kategorijų rinkinys turėtų būti nustatomas pagal vieną klasifikavimo principą. Šis reikalavimas yra gana suprantamas, nes jei taikomas daugiau nei vienas klasifikavimo principas, vieną atsakymą gali pareikalauti daugiau nei viena kategorija.

Taigi kategorijos nebus viena nuo kitos nepriklausomos. Pavyzdžiui, jei mes turime tris kategorijas, sudarančias kategoriją, pvz., Vyrą, moterį, vaiką, išplaukiančią iš dviejų klasifikavimo principų, ty lytį ir amžių, tada bet kuris atvejis (respondentas) gali būti taikomas daugiau nei viena kategorija kategorijoje.

Pavyzdžiui, vaikas taip pat gali būti vyras, taip pat gali būti ir vaikas, ir pan. Tačiau klasifikavimo principas gali būti junginys, ty sudarytas iš dviejų ar daugiau kriterijų, ty vaikiškas vaikinas, vaikas ir pan.

(2) Antrasis reikalavimas yra tas, kad kategorijų rinkinys turėtų būti išsamus, ty turėtų būti įmanoma kiekvieną atsakymą pateikti vienoje iš rinkinių kategorijų. „Nėra atsakymo“ turėtų būti palikta norint, kad rinkinyje būtų tinkama kategorija, į kurią bus įtraukta.

Kad ir koks būtų atsakymas, jis turi būti įtrauktas į tam tikrą rinkinį. Pavyzdžiui, jei pasaulio žmonės būtų klasifikuojami remiantis jų rasine išraiška, kategorijų rinkinys sudarytas iš trijų kategorijų: a) Kaukazoidas, b) Negroidas ir (c) Mongoloidas, akivaizdžiai nebūtų būti išsamus kategorija, atitinkanti pirmiau nurodytą reikalavimą, nes jame nėra vienos kategorijos, kurioje daugelis Indijos žmonių (ir kai kurie kiti) gali rasti vietą.

(3) Paskutinis reikalavimas yra pirmosios, ty, rinkinio kategorijos turi būti tarpusavyje nesuderinamos; tai reiškia, kad kategorijos neturėtų sutapti. Taigi daugiau nei vienos kategorijos rinkinio atsakymai nebus pateikti.

Socialiniams mokslams būdingų duomenų kategorijų nustatymas ne visada yra lengva užduotis. Klasifikavimo principas dažnai gali būti junginys (o ne paprastas, vieningas). Visų tarpusavyje nesuderinamų kategorijų, kurios kartu išnaudotų bendrą atsakymų visumą, užduotis, remiantis sudėtinio klasifikavimo principu, iš tiesų yra griežta, reikalaujanti vaizduotės.

Tokiais atvejais labai naudinga sumažinti atributus, sudarančius sudėtinį klasifikavimo principą į simbolius ar kodus, ir panaudoti Būlio išplėtimo metodu visą kategoriją, apimančią kategoriją.

Paimkime labai paprastą pavyzdį. Tarkime, kad tyrėjas vertina tris atributus, pvz., Lytį (moterišką lytį), amžių (jaunesnius nei 21 metų amžiaus ar vyresnius nei 21 metų) ir šeimyninę padėtį (susituokusius ar vienišius) kaip jo vieno (bet junginio) klasifikavimo principo sudedamąsias dalis. ir sumažina šiuos simbolius kaip:

Vyras = S, patelė = S̅

Mažiau nei 21 metų amžiaus = A, virš 21 metų = A̅

Vedęs = M, Single = M̅

Gautas kategorijų rinkinys bus išsamus visuma, susidedanti iš visų galimų šių trijų atributų derinių, apimančių junginio klasifikavimo principą. Galimi deriniai, ty kategorijos, bus 2 ³ = 2 x 2 x 2 = 8.

Tai yra taip:

(1) SAM

(2) S̅ AM

(3) S A̅ M

(4) SA M̅

(5) S̅A̅ M

(6) S̅A M̅

(7) S A̅ M̅

(8) S̅ A̅ M̅

Dekodavimas, ty tikrųjų simbolių pakeitimų pakeitimas, gauname aštuonias tarpusavyje nesusijusias kategorijas, kurios skaitomos taip:

(1) Vyrai iki 21 metų ir vedę.

(2) Moterys iki 21 metų ir vedusios.

(3) Vyrai, vyresni nei 21 metų ir vedę.

(4) Vyrai iki 21 metų ir nesusituokę.

(5) Moterys virš 21 metų ir vedusios.

(6) Moterys iki 21 metų ir nesusituokusios.

(7) Vyresni nei 21 metų ir nesusituokę vyrai.

(8) Moterys, vyresnės nei 21 metų ir nesusituokusios.

Tuo pačiu atveju, jei junginio klasifikavimo principas susideda iš keturių atributų, turėsime 2 ⁴ = 2x 2 x 2 x 2, ty 16 tarpusavyje nesuderinamų kategorijų. Dabar turėtų būti aišku, kaip šis kategorijų nustatymo metodas, o ne intuicija, daro klasifikavimo užduotį daug paprastesnį ir kvailesnį.

Akivaizdu, kad kategorijų rinkinio sukūrimas yra gana lengvas, jei respondentų tyrimo metu gauti atsakymai yra gana paprasti ir aiškūs, todėl kategorijos gali būti lengvai apibrėžtos nedviprasmiškai. Nors tokiu būdu visada turėtų būti apibrėžtos kategorijos, tam tikros rūšies turinys yra daug sudėtingesnis.

Tarkime tyrime tyrinėtojas paprašė vyrų mokinių: „Kaip, jūsų nuomone, studentai jaustųsi mokytis tame pačiame kolegijoje su vyriškais studentais?“ Atsakymai greičiausiai svyruos nuo labai palankių požiūrių požymių (priskirtini moterims) ) labai neigiamo požiūrio priskyrimui. Tarkime, tai yra keletas atsakymų, gautų iš respondentų.

Jie mėgsta idėją.

(2) „Nemanau, kad jie galvoja“.

(3) „Jie mano, kad jie juos mažina“.

(4) Aš su jais nesiliečiu, todėl nežinau.

(5) „Jie nekenčia“.

(6) „Kai kurie iš jų patinka, kai kurie ne.“

(7) „Jie nori čia studijuoti, kad galėtų pasakyti, kad jie yra ne mažiau nei vyrai.“

(8) „Grynai ponios koledže jie praleidžia daug, todėl jie atrodo čia.“ \ T

Atsižvelgiant į pirmiau minėtus atsakymus, nebūtų sunku sukurti paprastą kategorijų rinkinį, grindžiamą klasifikuojančiu palankių ir nepalankių požiūrių, priskirtų mergaičių studentams, principu. Tačiau mes matome, kad ir palankūs, ir nepalankūs atsakymai perteikia skirtingus reikšmių atspalvius.

Vyras studentas, sakantis: „Jie (mergaičių studentai) nori studijuoti čia, kad galėtų pasakyti, kad jie yra ne mažiau kaip vyrai“, perteikia kažką kitokio nei tas, kuris sako: „Jie mėgsta idėją“. „Jie mano, kad jie juos mažina“, dar kartą sako kažką kitokio nei tas, kuris sako: „Jie nekenčia“.

Taigi matome, kad du atributai:

(1) palankių ar nepalankių požiūrių į mergaites įvedimas; \ t

(2) Aiški nuoroda į nuorodą į naudą ar žalą, remiančią palankias ar nepalankias nuostatas, yra dvi svarbios sudedamosios klasifikavimo principo sudedamosios dalys.

Kategorijos kategorijos, atitinkančios pirmiau aptartų kategorijų rinkinio idealus reikalavimus, gali būti išdėstytos taip:

(1) Palankus požiūris į mergaičių mokinius, paaiškinamas naudos, kurią jie gauna mokydamiesi toje pačioje kolegijoje su vyrų mokiniais (pvz., 7 ir 8 atsakymai).

(2) Palanki mergaičių prielaida be aiškios nuorodos į išmokas, gautas mokantis tame pačiame kolegijoje su vyrais (pvz., Pareiškimas Nr. 1).

(3) Neutralus arba palankus požiūris, priskirtas merginoms (pvz., Pareiškimas Nr. 1).

(4) Nepalanki mergaičių prielaida, paaiškinta atsižvelgiant į trūkumus (neigiamą naudą), kurią jie gauna mokydamiesi toje pačioje kolegijoje su vyrų mokiniais.

(5) Nepalankus požiūris, priskirtas mergaitėms be aiškios nuorodos į trūkumus ar nuostolius, atsirandančius dėl bendro švietimo (pvz., Pareiškimas Nr. 5).

(6) Kiti atsakymai, negali pasakyti, jokio atsakymo, nežinau (pvz., Pareiškimas Nr. 4).

Pirmiau pateikta iliustracija suteiks idėją, kaip labai sudėtinga klasifikacija socialiniame moksle. Dirbant su tokiomis sudėtingomis kategorijomis reikia didelės priežiūros ir pastangų klasifikuoti. Net jei kategorijos buvo kruopščiai parengtos, jų naudojimas sukels daugiau problemų nei kategorijų naudojimas siauriau ir tiksliau.

Jei vyresnis studentas pirmiau pateiktame pavyzdyje sako: „Jie mėgsta tai gerai, jie žino, kodėl“ tai yra ginčytinas klausimas, ar šis teiginys reiškia naudą. Taigi tokiems atsakymams spręsti reikėtų nustatyti papildomas taisykles.

Net pasikartojant, reikia pasakyti, kad, nors iš esmės galima naudoti daugybę atsakymų į kategorijų rinkinių atributus, tai praktiškai tai dažnai yra nereikalinga, neekonomiška ir nepagrįsta, nes ne visi šie klasifikavimo principai tyrimo tikslą.

Dabar pereikime prie problemos, susijusios su nestruktūrizuotos medžiagos klasifikavimo principo pasirinkimu (ty informacija, surinkta nestruktūrizuotais įrankiais).

Tyrimuose, kuriuose naudojami struktūrizuoti instrumentai, skirti rinkti duomenis, susijusius su aiškiai suformuluotais mokslinių tyrimų klausimais arba hipoteze, tinkamas atsakymų klasifikavimo principas yra aiškiai apibrėžtas pagal klausimų pobūdį ir užtikrintas atsakas.

Tačiau dirbant su nestruktūrizuota medžiaga ar duomenimis, pirmoji problema yra priimti sprendimus, kurie medžiagos aspektai turi būti suskirstyti į kategorijas, ty kokie klasifikavimo principai turi būti naudojami kuriant kategorijas.

Tiriamuosiuose tyrimuose, kuriuose apibrėžta problema ar aiški hipotezė neapibrėžta, sunku rasti sprendimą dėl klasifikavimo principų. Duomenų rinkimo metu tyrėjas nežino, kurie aspektai gali būti svarbiausi.

Todėl jis turi rinkti daug nestruktūrinio tipo duomenų. Analizės metu tyrėjas susiduria su problema, susijusi ne tik su nestruktūrinėmis medžiagomis, bet ir su dideliu jų kiekiu.

Išanalizavus tiriamojo tyrimo duomenis, patartina parengti darbo hipotezę, kuri leistų atlikti tinkamus patenkinamus klasifikavimo principus. Mokslininkas privalo atidžiai perskaityti visą savo medžiagą, visą laiką įspėjęs apie paslėptus duomenų įkalčius. Tokie įkalčiai dažnai užtikrinami studijuojant medžiagas temomis ar situacijomis, kurios prieštarauja studijoms.

Toks tyrimas padeda tyrėjui pamatyti svarbius skirtumus tarp dviejų situacijų. Kita procedūra, kaip gauti tokius įkalčius, yra sujungti savo bylas į grupes, kurios, atrodo, turi artimą giminystę arba atrodo, kad jos yra kartu, ir tada paklausti savęs, kas paskatino jį jaustis, kad atvejai, kuriuos jis įtraukė į vieną grupę, yra panašūs.

Dar vienas požiūris, galintis paskatinti darbo hipotezės formulavimą, yra atkreipti dėmesį į dalykus, kurie atrodo netikėtai, atsižvelgiant į tam tikrus teorinius lūkesčius arba sveikas protas, o tada ieškoti galimo nenuostabu ar nenumatytų reiškinių paaiškinimo.

Vis dėlto reikėtų nepamiršti, kad net ir aiškios hipotezės atveju nestruktūrizuotos medžiagos analizė kelia ypatingų problemų. Pirma, visada yra galimybė, kad kai kuriuose dokumentuose gali trūkti informacijos apie tam tikrą tašką.

Taip pat yra tikimybė, kad nemaža dalis medžiagos neturės tiesioginės įtakos hipotezei. Be to, yra problema, dėl kurios nuspręsta dėl medžiagos, kuriai bus taikomos kategorijos, vienetų dydžio.

Pavyzdžiui, jei tyrėjas naudojasi gerovės agentūrų tvarkomais įrašais, jis turi nuspręsti, kuris padalinys (pvz., Klientai, pareiškimai, veiksmai, socialiniai darbuotojai, sesijos su klientu ar visas įrašas) yra tinkamiausias atsakant į jo konkrečius mokslinių tyrimų klausimus.

# 2 veiksmas. Kodavimas:

Kodavimas susideda iš simbolių, paprastai skaitmenų priskyrimo kiekvienam atsakymui, kuris patenka į iš anksto nustatytą klasę. Kitaip tariant, kodavimas gali būti laikomas klasifikavimo procesu, būtinu vėlesnėms lentelėms. Naudojant kodavimą, neapdoroti duomenys paverčiami simboliais, kurie gali būti skaičiuojami ir skaičiuojami.

Tačiau šis transformavimas nėra automatinis, jis susijęs su daugybe koduotės sprendimų. „Coder“ - tai oficialus asmens, kuriam priskirta atsakomybė suteikti atsakymus po to, kai į raštą įrašyti užrašai pateikiami atsakymai, pavadinimas.

Tačiau reikia nepamiršti, kad dažnai sprendimą, kuriuo atsakymu turėtų būti priskiriamas konkretus kodas, atlieka kitas asmuo, nei tas, kuris eina pagal oficialų koduotės pavadinimą.

Kodavimas gali vykti trijuose skirtinguose tyrimo taškuose, iš kurių kiekvienas gali būti atsakingas už kodų priskyrimą neapdorotiems duomenims. Daugelyje tyrimų respondentas gali būti paprašytas priskirti savo reakcijos ar situacijos kodus.

Tai pasakytina apie daugelį apklausos tipo ir atsakymų į klausimus. Pavyzdžiui, kai respondentas prašomas nurodyti, kuri klasė (pvz., Pajamų grupės) priklauso, pvz., (A) žemiau 3000 rupijų pm, b) R. 3001 / - į Rs. 6000 / - pm, c) R. 6001 / - į Rs. 9000 / - pm, d) R. 9001 / - ir daugiau, respondentas nurodo savo atsakymą tiesiog pažymėdamas savo poziciją tarp nurodytų alternatyvų.

Antrasis taškas, kuriuo gali vykti kodavimas, yra tai, kad duomenų rinkimo metu interviu ar stebėtojas kategorizuoja subjektų atsakymus. Tai daroma tada, kai interviu ar stebėtojas naudoja reitingų skalę, kad apibūdintų asmens atsaką ar elgesį.

Galutinis taškas, kuriuo gali vykti kodavimas, yra, žinoma, kai neapdoroti neklasifikuoti duomenys (surinkti ypač per nestruktūruotas duomenų rinkimo priemones) yra deponuojami projekto biure, o oficialūs koduotojai čia naudojasi savo sprendimu tam tikriems kodams priskirti konkrečius kodus. atsakymus ar duomenis.

Trumpai palyginkite ir kontrastuosime oficialių koduotojų kodavimo privalumus ir trūkumus, o interviu dalyviai arba stebėtojai, atlikę duomenų rinkimą šioje srityje, koduoja.

Interviuojantys ar stebėtojai gali pastebėti situaciją ir asmens elgesį. Taigi jie turi daugiau informacijos, kuria remiantis gali būti grindžiami sprendimai, susiję su tinkamu atsakymų skirstymu, palyginti su koduotojais, dirbančiais remiantis rašytiniais įrašais, kurie negali pateikti išsamios informacijos apie tikrą atsakymo prasmę.

Kitas duomenų rinkėjų kodavimo privalumas yra tas, kad tiek laikas, tiek darbas gali būti išsaugoti.

Priešingai, kodavimo kodavimas koduotojams turi tam tikrų pranašumų. Sudėtingų duomenų, kuriems reikia laiko apmąstymams, kodavimą rekomenduoja atlikti biuro koduotojai. Vietoje kodavimo sprendimas, kurį priėmė duomenų rinkėjai, gali būti ne toks išsamus, kaip ir sprendimai, priimti daugiau laiko svarstymui.

Duomenų rinkėjai gali būti vertinami daugeliu veiksnių, pvz., Respondentų pasirodymai, akcentai ir atsakymai į ankstesnius klausimus, manierai ir kt. Antra, kyla pavojus, kad duomenų rinkėjai nepakenks koduodami atsakymus.

Taigi trukdo daugelio respondentų gautų duomenų palyginamumas. Trečia, apklausos dalyviai ar stebėtojai gali sukurti savo asmeninę nuorodų medžiagą, susijusią su medžiaga, kurią jie koduoja. Tai paskatintų jų kategorijų patikimumą, po kurio laiko. Bendrą nuorodų sistemą lengviau gauti ir išlaikyti biuro kodavimo operacijoje nei lauke.

Aptarkime kai kurias svarbias problemas, susijusias su kodavimo patikimumu. Yra daug dalykų, kurie gali veikti, kad koduotojų sprendimas būtų nepatikimas. Kai kurie veiksniai gali atsirasti dėl duomenų, kuriuos reikia suskirstyti į kategorijas, kai kurie iš kategorijų, kurios turi būti taikomos, ir dar kiti gali atsirasti iš pačių koduotojų.

Dabar trumpai apžvelgsime kai kuriuos iš šių veiksnių ir būdų, kuriais jie gali būti apsaugoti.

Daugelis su kodavimu susijusių sunkumų kyla dėl duomenų trūkumo. Dažnai duomenys nepateikia pakankamai svarbios informacijos patikimam kodavimui. Tai gali būti dėl nepakankamų ir netinkamų duomenų rinkimo procedūrų. Tačiau šiuos sunkumus galima įveikti kruopščiai redaguojant duomenis. Procesas, kurio metu tikrinami duomenys, siekiant pagerinti jų kodavimo, vadinamo redagavimu, kokybę.

Kai duomenų rinkėjas savo medžiagą perduoda projekto biurui, vis dar egzistuoja galimybė pašalinti daug galimų kodavimo sunkumų. Kruopščiai išnagrinėjus duomenis, kai tik jie bus surinkti, ir, jei reikia, sistemingai apklausti apklausos dalyvius ar stebėtojus, galima išvengti daug kodavimo problemų.

Be to, redagavimas padeda išvengti vėlesnių kodavimo problemų, taip pat gali gerokai pagerinti duomenų rinkimo kokybę, nurodydamas, kad interviu ar stebėtojai galėjo neteisingai suprasti instrukcijas arba galbūt neturėjo pakankamai išsamių duomenų.

Tiesą sakant, redagavimas turėtų būti atliekamas atliekant išankstinį interviu ar stebėjimo tvarkaraščio, kuriame dalyvauja interviu ar stebėtojai, ir iš tikrųjų visą duomenų rinkimo laikotarpį. Projektų biure redagavimas yra labai svarbus siekiant pašalinti kodavimo problemas.

Taigi, redagavimas turi būti atliekamas, o apklausos dalyviai arba stebėtojai gali būti lengvai prieinami apklausai. Redagavimas apima kruopštų interviu ar stebėjimo tvarkaraščių patikrinimą.

Jie turėtų būti patikrinti:

(1) Išbaigtumas: redaktoriai turi įsitikinti, kad visi elementai yra tinkamai užpildyti. Pavyzdžiui, tuščias laukelis, esantis prie klausimo interviu tvarkaraštyje, gali reikšti, kad „nėra atsakymo“ arba „nežinau“ arba atsisakoma atsakymas į klausimą ar jo netaikymas, arba klausimas buvo praleistas prižiūrint ir pan.

(2) Redaktorius turėtų išnagrinėti interviu ar stebėjimo tvarkaraščius, kad sužinotų, ar koduotojas gali lengvai suprasti rankraštį arba interviu ar stebėtojo priskirtus simbolius ar kodus.

Visada patartina patikrinti, ar įskaitoma, kai medžiaga perduodama, ir, jei reikia, pakviesti interviu ar stebėtoją jį perrašyti. Jei tai nebus padaryta, kodavimas gali užstrigti etape, kai apklausos dalyviai ar stebėtojai negali būti lengvai atšaukiami apklausai.

(3) Redagavimas taip pat apima suprantamumo tvarkaraščių nagrinėjimą. Dažnai pasitaiko, kad užregistruotas atsakymas puikiai suprantamas interviu ar stebėtojui, bet koduotojui nesuprantamas, nes koderio elgesio ar atsako kontekstas nėra žinomas. Sistemingas duomenų rinkėjų apklausa pašalins painiavą ir dviprasmiškumą ir žymiai pagerins kodavimo kokybę.

(4) Duomenys taip pat turėtų būti išnagrinėti arba tikrinami, siekiant išsiaiškinti, ar yra tam tikrų neatitikimų, susijusių su tvarkaraštyje užregistruotais atsakymais.

Pavyzdžiui, atsakydamas į vieną iš ankstesnių klausimų, respondentas galėjo pasakyti, kad jis niekada nesutiko su konkrečios grupės žmonėmis, tačiau, atsakydamas į vėlesnį klausimą, jis galėjo pasakyti kažką apie tam tikrus šios grupės žmones lankydamasis raundų. Jei taip yra, akivaizdu, kad reikia išsiaiškinti šį nenuoseklumą ir išsiaiškinti, apklausiant duomenų rinkėjus.

(5) Taip pat būtina patikrinti vienodumo laipsnį, kuriuo respondentai laikėsi nurodymų, renkant ir registruojant duomenis. Kodavimas gali būti trukdomas, jei atsakymas užfiksuojamas kituose nei nurodymuose nurodyti vienetai.

(6) Reikėtų pažymėti, kad tam tikras atsakymas gali būti nesvarbus tyrimui. Tai greičiausiai atsitiks, jei klausimas nėra aiškiai dirbamas ar nežinomas. Todėl duomenys turėtų būti kruopščiai išnagrinėti, siekiant atskirti netinkamus atsakymus iš tinkamų.

Duomenų kategorizavimo vertė natūraliai priklauso nuo naudojamų kategorijų patikimumo. Būtina, kad be mokslinių tyrimų tikslams svarbios kategorijos būtų apibrėžtos ir konceptualiai.

Kodavimas bus nepatikimas, jei kategorijos nėra aiškiai apibrėžtos pagal rodiklius, taikomus duomenims, čia ir dabar. Praktikoje šios kategorijos yra apibrėžtos pateiktais duomenimis. Labai naudinga, jei iliustracijos iš duomenų rodo ne tik tai, kokie atsakymai apibūdina kategoriją, bet taip pat padeda atskirti ribą tarp tariamai panašių kategorijų.

Akivaizdu, kad kodavimo kokybę veikia koduotojų kompetencija. Taigi koduotojų mokymas yra svarbus žingsnis bet kuriame tyrime.

Koduotojų mokymas gali vykti šiais etapais:

Pirma, įvairūs kodai yra paaiškinti treniruotei (koduotojams) ir iliustruojami su kategorizuojamais duomenimis.

Antra, visi praktikantų koduotojai tada naudojasi duomenimis, problemos, su kuriomis susiduriama, koduotojai aptaria kaip grupę su vadovu, kad būtų sukurtos bendros procedūros ir apibrėžimai.

Trečia, vadovaujantis praktikos kodavimo rezultatais naudojami kategorijų pataisymai, kad jie būtų geriau pritaikyti medžiagai, ir rašyti procedūras ir apibrėžimus, kurie pasikeitė per pirminį kodavimą.

Ketvirta, tam tikru praktikos laikotarpio momentu, kai atsiranda palyginti nedaug naujų problemų, koduotojai dirba vienodomis duomenų dalimis, nekonsultuodami vieni su kitais ar vadovu. Tada apskaičiuojamas kodavimo nuoseklumas arba patikimumas, siekiant nustatyti, ar galima pradėti koduoti teisingai.

Priklausomai nuo patikimumo ar nuoseklumo patikrinimų rezultatų, gali būti nuspręsta pašalinti kategorijas, kurios atrodo pernelyg nepatikimos, arba praleisti daugiau laiko mokymo programuotojams arba panaikinti programuotojus, kurie yra labiausiai nenuoseklūs ir pan.

Galiausiai atliekami periodiniai patikrinimai, siekiant užtikrinti, kad koduotojai nepatirtų didesnės patirties arba nesukurtų asmeninių idiokratinių metodų, kaip tvarkyti naujas medžiagos problemas. Siekiant užtikrinti vienodumą ir priėmus sprendimą koduoti, nedelsiant turi būti pranešta visiems koduotojams.

Akivaizdu, kad tam tikros rūšies atsakymo nuoseklumas ir tinkamumas tam tikrai kategorijai turės didelės įtakos analizės rezultatui, todėl svarbu patikrinti kodavimo patikimumą ir padidinti koduotojų susitarimą. kaip įmanoma.

Žinoma, sunku nustatyti bet kokį patikimumo lygį, kurį reikia pasiekti. Įvairių tipų medžiagos turi skirtingus sunkumus, kad būtų užtikrintas patikimumas. Paprastai, kuo struktūrizuotesnė medžiaga turi būti koduojama ir todėl paprastesnės naudojamos kategorijos, tuo didesnis patikimumas.

Pažymėtina, kad tyrime naudojamų kodų rūšys skirsis priklausomai nuo to, ar duomenys turi būti pateikiami pagal mašiną, ar rankiniu būdu. Jei duomenys turi būti surūšiuoti rankiniu būdu, klasės žodžių aprašymas yra patenkinamas.

Taip pat gali būti naudojamos alfa raidžių santrumpos arba raidės, pvz., „Y“, „N“, „N“, „No“ ir tt. Kita vertus, mašinų lentelės reikalauja, kad klasės būtų išreikštos skaitmeniniais simboliais, nes mašinos gali būti tiekiamos tik skaitiniais duomenimis.

Mechaninei lentelei reikia naudoti perforavimo korteles. Tačiau skirtingų klasių, kurios gali būti rodomos perforavimo kortelėje, skaičius yra ribotas. Bet kokiu atveju visi kompiuterių lentelėse naudojami kodai taip pat gali būti naudojami rankų lentelėms.

Jei kodai turi būti įterpti į perforavimo korteles, kurių bendras dydis yra du, ty 80 stulpelių kortelių ir 54 stulpelių kortelės, pageidautina, kad daugumai informacijos ar atsakymų klasių būtų naudojamos dešimt mažiau klasių / kategorijų.

Įspaudos kortelėje yra 10 numeruotų tarpų, o kiekvienoje stulpelyje yra X ir Y, iš kurių gali būti naudojami 12 kodų. Tai gana sudėtinga procedūra gauti daugiau nei vienos rūšies elementą stulpelyje. Pvz., Gimstamumo ir amžiaus kodai negali būti perkeliami į vieną stulpelį, nebent kiekvienam iš jų būtų naudojamos tik šešios amžiaus grupės.

# 3 veiksmas. Lentelė:

Lentelė yra techninio proceso statistinės analizės dalis. Svarbiausias lentelių sudarymo elementas yra rezultatų apibendrinimas statistinių lentelių pavidalu.

Tik tada, kai neapdoroti duomenys yra suskirstyti į grupes ir skaičiuojami nuo šiose įvairiose grupėse esančių atvejų skaičiaus, mokslininkas gali nustatyti, ką reiškia jo rezultatai, ir perduoti savo išvadas vartotojui tokia forma, kuri gali būti suprantama.

Tabuliacija natūraliai priklauso nuo kategorijų nustatymo neapdorotiems duomenims, atsakymo redagavimo ir kodavimo (kortelių štampavimo ir veikimo mechanizmų, skirtų mechaninėms lentelių sudarymams ir rūšiavimui bei derinimui rankose).

Patyrę mokslininkai paprastai rengia planavimo planus maždaug tuo pačiu metu, kai rengia arba kuria duomenų rinkimo priemones ir sudaro atrankos planus. Nepatyrę mokslininkai retai susiduria su lentelių sudarymo planais, kol bus renkami duomenys. Žinoma, mokslo darbuotojui neįmanoma numatyti visos lentelės, kuri vėliau bus pageidaujama.

Jis turėtų būti pakankamai susipažinęs su savo mokslinių tyrimų problema ar tyrimo objektu, kad galėtų parengti lenteles, kuriose būtų pateikti atsakymai į klausimus, dėl kurių buvo atliktas tyrimas. Mokslininkas turėtų sugebėti parengti tinkamus lentelės planus, jei jis naudoja ankstesnių tyrimų rezultatus, turinčius bendrų elementų su tuo, kuriam planai rengiami.

Tiriamuosiuose tyrimuose geresnė ir saugesnė procedūra yra duomenų rinkimo priemonės išbandymas pagal tos rūšies gyventojų, kurie bus įtraukti į galutinį tyrimą, pavyzdį. Tokiu būdu paprastai galima gauti kai kurių patarimų, kokių lentelių būtų prasminga.

Lentelė gali būti atliekama tik rankiniu būdu; tai vadinama rankų lentele. Arba tai galima padaryti naudojant mechaninius metodus, kuriuose naudojami automatiniai ir greiti galios įrenginiai, skirti daugumai duomenų, o procesas yra žinomas kaip mechaninė lentelė.

Mokslininkas turi nuspręsti, kol jis parengia išsamų savo studijų planų planą, kokiu metodu jis naudos. Šis sprendimas bus grindžiamas įvairiais sumetimais, pvz., Išlaidomis, laiku, darbuotojais ir kt.

Abi rankų lentelės ir mechaninės lentelių sudarymo procedūros turi atitinkamus privalumus ir apribojimus. Mokslininko įspėjimas dėl šių nuopelnų ir trūkumų yra geresnis būdas nuspręsti, kuris metodas būtų tinkamas jo problemai.

Mes trumpai apžvelgsime šių dviejų lentelės metodų privalumus:

(1) Mechaninė lentelė apima daug darbo ir specializuotų operacijų. Žinoma, tai palengvina greitį, tačiau greitis ne visada gali būti tinkama kompensacija už papildomą darbą.

(2) Jei prieš pradedant skaičiuoti darbą nenusprendžiamas norimų lentelių skaičius ir tipai. mašinų lentelės gali būti tikslingesnės. Tačiau, jei rankų lentelių sudarymas laikomas veiksmingu, prieš pradedant skaičiavimą nustatoma tvarka, pagal kurią bus atliekami įvairūs skaičiai ir skaičiai.

(3) Pagrindinis mašinų lentelės privalumas yra tas, kad jis palengvina kryžminę klasifikaciją. Didelio masto tyrimuose, kuriuose daugelis kintamųjų turi būti koreliuojami arba kryžminiai klasifikuoti, mašinų lentelės yra pagrįstai priimtinos.

Dėl šios priežasties atliekant tyrimus, reikalaujančius daugelio kintamųjų tarpusavio sąsajų, naudojama mechaninė lentelė. Tačiau, jei bendras respondentų skaičius yra mažas, rankinis jų skaičiavimas pagal kryžminio klasifikavimo principą gali būti santykinai ekonomiškas.

(4) Kai kiekvienam atvejui reikalinga daug koduotų duomenų ir keletas perforavimo kortelių, pageidautina, kad būtų renkama rankų lentelė.

(5) Jei pageidaujama, kad duomenys būtų parengti formai, paruoštai naujai lentelės sudarymui, palyginti trumpą laiką, paprastai yra naudingos perforavimo kortelės. Mechaninė lentelė yra naudinga periodiniams tyrimams ar tyrimams, kuriuose reikalaujama surinkti tos pačios rūšies informaciją dažnai.

(6) Rūšiavimo ir skaičiavimo procesas yra mažiau tikėtinas, kad padarys klaidas, jei tai daroma naudojant mašiną, o ne rankiniu būdu. Žinoma, klaidos gali kilti ir atsirasti mašinų lentelėse, o kai jos daromos, jas dažnai sunku nustatyti ir patikrinti.

Bet kokios klaidos, aptiktos apklausos kodavimo, redagavimo ar lauko darbų etapuose, gali trukdyti mašinų lentelėms. Todėl dažnai pageidautina, kad kartu su lauko darbu būtų atliekami rankiniai lentelės.

(7) Lentelių sudarymo operacijų išlaidos yra svarbus tyrėjo rūpestis. Mašinų lentelėse dažnai yra daug didesnių sąnaudų, nes dauguma perforavimo kortelių, rinkliavų už štampavimą ir patikrinimą, mašinų mokesčiai už rūšiavimo ir lentelių sudarymo mašinas ir išlaidų, susijusių su konkrečių tipų mašinų operatorių specializuotų paslaugų samdymu, dažnai sudaro daug daugiau nei tie, kurie dalyvauja lentelės.

Kitas svarbus aspektas yra laikas. Mechaniniuose lentelėse tabuliavimo darbas atliekamas per labai trumpą laiką, tačiau parengiamieji etapai, taip pat ir tam tikrų tipų mašinų mokymas, priežiūra ir galimas nebuvimas, dėl kurių atsiranda darbų dislokacija, gali neišvengiamai prisidėti prie švaistymo. laiko.

(9) Patogumo sumetimais vargu ar galima nepaisyti. Jei mechaninės lentelės reikalauja žaliavinių duomenų siuntimo į tam tikrą biurą, kuris yra toli nuo projekto biuro, atsiranda nepatogumų, susijusių su pakavimu, transportavimu ir pan.

(10) Galiausiai, įrašomųjų ir analizuojamų komentarų medžiagos kiekis taip pat gali turėti įtakos lentelių sudarymo metodų pasirinkimui. Kai kuriose nuomonių apklausose svarbios yra stulbinantys informatorių komentarai. Vien tik rankų lentelėse naudojama rankinio kodo kortelė gali suteikti vietos tokioms pastaboms ar pastaboms.

Mašinos, kurios tvarko lenteles, yra įvairios. Pastaraisiais metais pokyčiai šioje srityje buvo labai sparti. Kai kurios mašinos paprasčiausiai rūšiuoja ir skaičiuoja korteles, kitos rūšiuoja, skaičiuoja ir spausdina rezultatus, dar kitos yra pasirengusios atlikti sudėtingiausias statistines operacijas ar skaičiavimus.

Šios paskutinės mašinos yra labai sudėtingos ir jos turi būti programuojamos tam tikroje operacijoje linijos specialistui. A table is an exhibit of the numerical data systematically arranged in labelled columns (vertical) and rows (horizontal).

A simple or elementary table indicates simple counts of the frequencies with which the various categories in each set occur in the data, for example, the number of people in the sample who have attended high school but not passed, the number of people who have attended college but not graduated and so on. The table given below simply points out the frequencies of visits of fifty respondents to the cinema.

In research, we are often interested in finding out the correlation between two or more variables, eg, education and income and fertility, simple tables (illustrated above) showing frequency distribution of the respondents in respect of a single characteristic, eg, education or income or fertility, do not help us see the relationship among two or more variables.

The way to see the relationship is by preparing cross-tables or breakdown tables. Such tables make possible the grouping of cases that occur jointly in two or more categories, for example, tabulation of the number of cases that are high in education, low in income and have between 2 and 3 children, or the number of cases that are low in education, low in income and have between 4 and 5 children and so on. The most elementary form of cross-tabulation the students are familiar with is the college time-table.

Suppose a researcher wants to see the relationship among three variables, viz., occupation, income and fertility. He must employ a scheme of tabulation that will afford all possible combinations of the different categories of these three variables.

Cross- tabulation of the data on a hypothetical sample of 100 persons may be presented as under:

In the above table, we have indicated the number of children in rows. This variable of fertility has been divided into five categories, ie, no issue, 1 to 2 issues, 3 to 4, 5 to 6, 7 and above. So in the margin on the left hand, we have these 5 categories of fertility. We have indicated the income of 100 respondents in columns.

The income variable has been sub-divided into five categories, ie, below Rs.200, Rs.201-400, 401-600, 601-800, 801-1000. Thus, we have five columns corresponding to these categories.

Again since we have one more variable, ie, occupation to accommodate, the columns for income have each been sub-divided into two parts corresponding to the two categories in which the occupations have been divided, ie, white collar occupation and blue-collar occupation.

Thus, we have ten vertical columns, corresponding to income and occupation. The number of horizontal rows we have for the categories of the fertility variable is five. Thus, we have ten columns crossed by five rows making up the body of the table.

The intersection of the columns and rows has effected 50 (fifty) cells or boxes. Each of these boxes or cells houses a particular number of cases which are different from those in other cells either in respect of income or occupation, in fertility or in any two of these or in all of these. Let us read the table to get some idea as to what it represents.

Out of the total sample of 100 cases, there are 25 who have between 3 and 4 issues. Of these 25, reading from the left-hand side, 5 persons (with between 3 and 4 children) have income below Rs.200/- and are employed in white-collar occupations.

Two persons (with between 3 and 4 children) have income below Rs.200 and are employed in blue- collar occupations. Let us now take the second row. Of the total respondents, 38 have between 1 and 2 children. 11 (in the 7th cell) who have between 1 and 2 children are from the income group Rs.601 to Rs.800 and are employed in white-collar occupation.

This exercise should make it very clear that cross-tabulation is an essential step in the discovery of or testing of relationships among the variables contained in the data.

Tabulation is a means to present data in a summarized form in a way that facilitates the required statistical calculations. Data may, however, be presented in other ways, ie, instead of presenting them in a tabular form, the researcher may present them in the form of diagrams or graphs. Such diagrammatic or graphic representations do have the merit of being intelligible to a less knowledgeable reader.

But they suffer from the limitation that they are not so useful as a basis for statistical calculations. Let us now proceed to discuss the next operation, ie, the statistical analysis of data. Tabulation is a prerequisite or a first step in this direction.

Step # 4. Statistical Analysis of Data :

In research, we are not concerned with each individual respondent. The purpose of research is broader than this. That is, we wish to know much more than simply that a given respondent, for example, has extremely favourable attitude toward disarmament and that another respondent has moderately unfavorable attitudes toward the same issue. But this information is just not enough.

Social science researches are generally directed toward providing information about a particular population of respondents mostly via a sample. The sample of the totality might be asked certain questions related to the problem of our study, or be subjected to some form of observation.

Let us suppose that we have asked a sample of a thousand college students studying in 'post-graduate' classes a series of questions with a view to securing information about their study habits. Our research would thus be directed toward providing information about the 'population' of 'post-graduate' students of which the thousand cases is a sample.

As a necessary step to characterizing this 'population', we would have to describe or summarize the information about study habits that we have obtained on the sample thereof. Tabulation is just a part of this step. In addition, we must estimate the reliability of generalizations of the 'population' from the obtained data. Statistical methods are useful in fulfilling both these ends.