Projektas. SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA. Vydas Čekanavičius

Size: px

Start display at page:

Download "Projektas. SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA. Vydas Čekanavičius"

Victor Barber
6 years ago
Views:

1-ŠMM-02-V-02-001 SEMINARO INFERENCINĖ STATISTIKA

1 Projektas Lietuvos HSM duomenų archyvo LiDA plėtra SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA Vydas Čekanavičius (Paslaugų sutartis Nr. SA /2, ) Kaunas, 2011 m. 1

2 Turinys 1. Įvadas į statistinių hipotezių tikrinimą Hipotezių apie vidurkių lygybes tikrinimas T testas 1 imčiai T testas 2 nepriklausomoms imtims T testas 2 priklausomoms imtims (porinis t testas) ANOVA Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) Neparametriniai kriterijai Mann Whitney testas Wilcoxon testas Kruskal Wallis testas Friedman testas Požymių priklausomumo (kryžminių lentelių) analizė Chi kvadrato nepriklausomumo (homogeniškumo) testas Chi kvadrato suderinamumo testas Literatūra

3 1. Įvadas į statistinių hipotezių tikrinimą Statistinės išvados (inferencinė statistika) turi vienintelį tikslą ištyrus dalį respondentų (imtį, imtis), padaryti išvadą apie visą populiaciją (populiacijas). Įsivaizduokime dvi situacijas: 1) Virėjas paragauja sriubos ir nusprendţia trūksta druskos. 2) Ekranţvaigţdė visiems TV ţiūrovams paaiškina visi jie tokie! Abi šios išvados yra akivaizdţiai statistinės. Virėjas prarijo šaukštą sriubos, o išvadą padarė apie visą puodą. Ekranţvaigţdė savo patirtį apibendrino pagal gal ir nemaţą dalį, bet vis tiek tik dalį visų jų. Matome, kad kartais apibendrinimai visiškai tikėtini (virėjas), o kartais labai abejotini (ţvaigţdė). Inferencinėjs statistikoje viskas formalizuojama ir dar įvertinama, kiek galima tikėti priimtu sprendimu. Visą statistinių hipotezių tikrinimą galima išskaidyti į tokius etapus: a) Tyrimo hipotezės iškėlimas. b) Statistinės hipotezės formulavimas. c) Duomenų analizė. d) Išvadų surašymas. Aptarsime kiekvieną etapą atskirai. Tyrimo hipotezė tai ta problema, kuri iš tikrųjų ir jaudina tyrėją. Ji glaudţiai susijusi su tyrimo srities specifika. Pavyzdţiui, hipotezė, kad latviai valgo daugiau ţuvies, nei lietuviai, yra sociologo (ar kulinaro, ar mediko) tyrimo hipotezė. Ji grindţiama istoriniu kontekstu Latvija visą laiką buvo jūrų valstybė, o Lietuva tik priešokiais, kai prasibrukdavo prie Baltijos per kryţiuočius. Statistikos čia dar nėra. Kai politikas pasamprotauja, kad parlamentarų darbo efektyvumas išaugs, jei jie kalbas sakys, stovėdami ant vienos kojos (kairieji ant kairės, dešinieji ant dešinės), tai irgi yra tyrimo, o ne statistinė hipotezė. Ji grindţiama ne faktais, o loginiu samprotavimu, kad tada šnekama bus trumpiau ir labiau iš esmės. Statistinė hipotezė tai tyrimo hipotezės formalizavimas (ir truputį matematizavimas). Visų pirma, atitrūkstama nuo specifikos ir viskas uţrašoma standartiniais terminais. Jeigu lyginamos vidutinės reikšmės, tai statistinė hipotezė formuluojama vidurkiams. Jeigu kalbama apie kintamųjų priklausomybę, tai daţniausiai statistinė hipotezė keliama apie koreliacijos tarp kintamųjų stiprumą. Standartinėse statistinėse hipotezėse naudojami tik šie terminai: vidurkiai, dispersijos,proporcijos (procentai), koreliacija. Neparametrinėje statistikoje dar lyginami skirstiniai. Tarkime, norint įvertinti parlamentarų darbo efektyvumą, galima tiesiog kalbėti apie vidutinį sprendimo priėmimo laiką. Norėdami išsiaiškinti, ar vienakojis šnekėjimo metodas iš esmės efektyvesnis, turime 3

4 ankstesnį vidutinį sprendimų priėmimo laiką (paţymėkime jį simboliu a) palyginti su vienakojiškų sprendimų vidutiniu laiku (paţymėkime jį simboliu ). Visos statistinės hipotezės formuluojamos, kaip du alternatyvūs teiginiai: H 0 (nulinė hipotezė), tai teiginys apie parametrų skirtumų nebuvimą, o H 1 (alternatyvioji hipotezė) teiginys, kad parametrai skiriasi. H 0 : parametrų skirtumas yra lygus nuliui. H 1 : parametrų skirtumas yra nelygus nuliui. Net ir neparametrinėse hipotezėse skirtumas skelbiamas tik alternatyvoje H 1. Pavyzdyje apie politikus statistinė hipotezė uţrašoma taip: H 0 : = a, H 1 : a Ţinoma, yra ir vienpusių alternatyvų, pavyzdţiui H 1 : a. Reikia tik atsiminti, kad griežtos nelygybės rašomos tik alternatyvose H 1. Jos niekada nerašomos nulinėje hipotezėje H 0. Duomenų analizė tai tinkamo statistinio kriterijaus parinkimas ir taikymas. Tiriama tik dalis populiacijos (imtis), o apibendrinama visai populiacijai. Taip ir apsirikti galima. Klaidingi sprendimai gali būti dviejų rūšių: kai be reikalo atmetame H 0 (vadinamoji pirmos rūšies klaida) ir, kai H 0 neteisinga, o mes jos neatmetame (vadinamoji antros rūšies klaida). Minimizuoti abiejų rūšių klaidas neįmanoma, todėl visuotinai sutarta daugiau dėmesio skirti pirmos rūšies klaidai. Kaip taisyklė, daţniausiai siekiama parodyti, kad galioja H 1. Pavyzdţiui, politikas norėtų įrodyti, kad jo siūlomas sprendimų pagreitinimo metodas veikia. Todėl iš anksto nusistatoma, koks maksimalus leistinas neteisingų H 0 atmetimų procentas. Tai vadinamasis reikšmingumo lygmuo. Daţniausiai naudojamas reikšmingumo lygmuo yra 0,05. Tai reiškia, kad jeigu jau H 0 atmesime, tai klaidos tikimybė neviršys 5%. Šiais laikais, kai statistinių hipotezių tikrinimui visuotinai naudojamos statsitinė programos, sprendimai priimami atsiţvelgus į vadinamąsias p reikšmes. P reikšmė tai konkretiems tiriamiems duomenims apskaičiuota tikimybė, atmetant H 0, padaryti klaidą. Šis apibrėţimas skamba labai panašiai, kaip reikšmingumo lygmens apibrėţimas. Vis dėlto yra esminis skirtumas reikšmingumo lygmuo, tai teorinis etalonas, nurodantis leistiną klaidingų sprendimų procentą, o p reikšmė yra konkreti konkretaus sprendimo klaidos tikimybė. Ji gali būti daug maţesnė uţ reikšmingumo lygmenį (tada galima atmesti H 0 ), o gali jį ir viršyti (tada H 0 neatmetame). 4

5 Reikšmingumo lygmuo iš anksto pasirinktas idealas (ne daugiau 5% klaidų), o p-reikšmė kiekvienai duomenų aibei sava tikimybė. H 0 atmetame, kai p-reikšmė < 0,05 (reikšmingumo lygmuo). Kuo imtis didesnė, tuo p reikšmė maţesnė (jau taip jos skaičiuojamos). Todėl labai didelėms imtims galime gauti maţas p reikšmes, vien dėl duomenų gausos. Nors trokštamos išvados daromos apie populiacijos parametrus, jos visada formuluojamos, imties duomenims ir visada naudojant ţodţių derinį statistiškai (ne)reikšminga. Ši frazė grynų gryniausias ţargonizmas. Ji tereiškia, kad (ne)labai tikėtina, jog H 0 neteisinga. Pavyzdţiui, sakinys imties vidurkis statistiškai reikšmingai skiriasi nuo skaičiaus a, tereiškia tokį samprotavimą: sprendţiant iš imties duomenų, tikimybė, kad tikrasis vidurkis skiriasi nuo a labai didelė (didesnė uţ 0,95, t.y. 95 %). Teiginys imties vidurkis statistiškai reikšmingai nesiskiria nuo skaičiaus a tereiškia, kad tikimybė, kad tikrasis vidurkis skiriasi nuo a maţesnė uţ 95 %. Bet tai dar nereiškia, kad galima teigti, jog vidurkis lygus a. Gal lygus, o gal nelygus. Tiesiog pritrūko įrodymų, kad nelygus. Panašiai, kaip paleidţiant įtariamąjį dėl įrodymų stokos. Frazė statistiškai reikšmingas skirtumas interpretuotina taip: imtyje uţfiksuotas toks didelis skirtumas, jog labai tikėtina, kad tai neatsitiktinumas ir toks skirtumas egzistuoja ir populiacijoje. Reikia nepamiršti, kad statistiškai reikšmingi skirtumai gali atsirasti ir dėl didelio duomenų skaičiaus. Todėl nereikia maišyti sąvokų statistiškai reikšmingas skirtumas ir prasmingas skirtumas. Statistiškai reikšmingai sprendimas priimamas greičiau. Visomis trimis sekundėmis. Pelnas išaugo statistiškai reikšmingai. Visu centu per metus. Ir ką labai daug prasmės tokiame statistiniame reikšmingume? Statistiškai reikšmingas skirtumas gali būti visai nesvarbus tyrėjo išvadoms. Įvado pabaigai priminsime keletą, ţemiau naudojamų sąvokų. Skirstinys: Kintamojo įgyjamos reikšmės ir jų įgijimo tikimybės. Maţdaug: ţinau visas galimas matuojamo kintamojo reikšmes ir kiek procentų respondentų populiacijoje jas turi. Normalus kintamasis: kintamasis, kuris turi normalųjį skirstinį. Jo reikšmės išsibarsčiusios pagal pakankamai bjauriai matematiškai aprašomą dėsnį. Praktikoje intervaliniai kintamieji, kurių 5

6 dauguma reikšmių yra netoli vidurkio ir kurie pakankamai simetriški laikomi beveik normaliais. Normalių kintamųjų histogramos: Visuose pavyzdţiuose naudojami duomenys paimti iš Tyrimuose naudosime: 1) Studijų rezultatų kokybė: universitetų absolventų integracijos darbo rinkoje tyrimas duomenis: LiDA0146_LAMS_STUDY_F1. 2) 2008 metų Europos Sąjungos socialinio klausimyno (European Social Survey) Lietuvos, Estijos ir Portugalijos duomenis ESS4LT, ESS4EE ir ESS4PT. 3) Lietuvos vartotojų 2005 m tyrimas LiDA003_ZTLT_F1. 2. Hipotezių apie vidurkių lygybes tikrinimas 2.1 T testas 1 imčiai Visų pirma susitarsime dėl terminų: Stjudento kriterijai dar vadinami t testais. Ir atvirkščiai. Duomenys: 1 normali intervalinė imtis. Statistinė hipotezė: H 0 atmetame (imties vidurkis statistiškai reikšmingai skiraisi nuo a), jei p-reikšmė < 0,05. 6

Pavyzdys: Ar 20-30 metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6? Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes.

7 Pavyzdys: Ar metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6? Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes. Tada renkamės Analyze Compare Means One sample T test. Į langelį Test Variable(s) įkeliame happy, o langelyje Test Value uţrašome 6. Paspaudţiame OK. Pirmojoje lentelėje pateikiamas imties vidurkis 6.88 (144 respondentai). One-Sample Statistics N Mean Std. Deviation Std. Error Mean happy How happy are you Antrojoje lentelėje stulpelyje Sig. (2-tailed) uţrašyta p reikšmė = 0,000. Kadangi p < 0,05, tai darome išvadą, jog tiriamos amţiaus grupės lietuvių laimingumo vidurkis (6.8) statistiškai reikšmingai didesnis uţ 6. One-Sample Test Test Value = 6 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper happy How happy are you T testas 2 nepriklausomoms imtims Duomenys: 2 normalios nepriklausomos intervalinės imtys. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. 7

Pavyzdys: Ar 20-30 metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina

Renkamės Analyze Compare Means Independent Samples T Test.

Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus: Spaudţiame Continue ir OK.

8 Pavyzdys: Ar metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina vienodai? Failai ESS4LT ir ESS4EE. Pradţioje su komanda Data Merge Files sujungiame abudu failus. Renkamės Analyze Compare Means Independent Samples T Test. Į langelį Test Variable(s) įkeliame happy, o į langelį Grouping variable kintamąjį cntry. Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus: Spaudţiame Continue ir OK. Rezultatų išklotinė prasideda nuo imčių vidurkių. Group Statistics cntry Country N Mean Std. Deviation Std. Error Mean happy How happy are you LT Lithuania EE Estonia

9 Matome, kad Lietuvos piliečių vidutinis laimingumas yra 6.68, o estai truputį laimingesni jų laimingumo vidurkis yra 7,0. Norint nustatyti, ar vidurkių skirtumas yra statistiškai reikšmingas, reikia kitoje lentelėje surasti tinkamą p reikšmę. SPSS pateikia net du t testo variantus. Vienas jų skirtas atvejui, kai dispersijos lygios, o kitas kai dispersijos nelygios. Formaliai sprendimas daromas taip: pasiţiūrima į stulpelyje Levene s Test for Equality of Variances Sig. esančią reikšmę. Jeigu ji 0,05, tai t testo p reikšme laikoma viršutinis stulpelyje t-test for Equality of Means Sig. (2-tailed) esantis skaičius. Priešingu atveju apatinis skaičius. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig. Interval of the (2- Mean Std. Error Difference F Sig. t df tailed) Difference Difference Lower Upper happy How happy are you Equal variances assumed Equal variances not assumed Matome, kad t testo p reikšmė yra lygi 0,131 > 0,05. Todėl darome išvadą, kad metų lietuvių ir estų vidutiniai laimingumo vertinimai statistiškai reikšmingai nesiskiria. 2.3 T testas 2 priklausomoms imtims (porinis t testas) Duomenys: poriniai normalieji stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar metų Lietuvos respondentai vienodai vertina švietimą ir sveikatos prieţiūros įstaigas? Failas ESS4LT. Vertinimo skalė nuo 0 (labai nepatinka) iki 10 (labai patinka). Atsirenkame norimo amţiaus respondentus. Tada renkamės Analyze Compare Means Paired Samples T Test. Į laukelį Paired-Samples T Test įkeliame kintamuosius stfedu ir stfhlth. Paspaudţiame OK. 9

Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei sveikatos prieţiūra (vid. 3,59). Paired Samples Statistics Mean N Std. Deviation Std.

10 Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei sveikatos prieţiūra (vid. 3,59). Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 stfedu stfhlth Lentelėje Paired Samples Test susiradę Sig. (2 tailed) matome, kad p reikšmė = 0,007 < 0,05. Todėl darome išvadą, kad mokslas vertinamas statistiškai reikšmingai palankiau, nei sveikatos prieţiūra. Paired Samples Test Paired Differences 95% Confidence Interval of the Std. Std. Error Difference Sig. (2- Mean Deviation Mean Lower Upper t df tailed) Pair 1 stfedu - stfhlth ANOVA ANOVA vienfaktorės dispersinės analizės trumpinys (angl. Analysis Of Variance). Pavadinimas klaidinantis. ANOVA lygina dviejų ar daugiau nepriklausomų imčių vidurkius. Tai t testo nepriklausomoms imtims apibendrinimas. Tiesiog hipotezė tikrinama, palyginant dviem būdais įvertintą kintamųjų dispersiją: laikant, kad vidurkiai lygūs ir, kad ne. Iš čia ir ţodis dispersinė pavadinime. Duomenys: 2 ar daugiau nepriklausomų normaliųjų imčių. Visų imčių dispersijos turi būti panašios. Standartinis reikalavimas visi standartiniai nuokrypiai skiriasi ne daugiau nei dvigubai. Statistinė hipotezė: 10

H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05.

Failus ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną.

Portugalija). Su Select Cases atsirenkame reikiamus respondentus.

11 H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar m lietuviai, estai ir portugalai vienodai vertina savo laimingumą? Failus ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną. Su komanda Automatic Record perkoduojame kintamąjį cntry į skaitinį kintamąjį Acountry (1 Estija, 2 Lietuva, 2 Portugalija). Su Select Cases atsirenkame reikiamus respondentus. Pasirenkame: Analyze Compare Means One- Way ANOVA. Į langelį Dependent List įkeliame happy, į langelį Factor Acountry. Pasirenkame Post Hoc ir paţymime Bonferroni. Paspaudę Continue, renkamės Options. Paţymime Descriptives ir Means plot. Tada spaudţiame Continue ir OK. 11

12 Rezultatų išklotinė prasideda nuo aprašomosios statistikos. Matome, kad vidutinis estų laimingumas yra pats maţiausias, o portugalai patys laimingiausi. Standartiniai nuokrypiai yra labai panašūs, nė vienas nėra didesnis uţ kitus daugiau nei dvigubai. happy How happy are you Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 1 Estonia Lithuania Portugal Total Pagrindinėje ANOVA lentelėje suradę p reikšmę p = 0,001, padarome išvadą, kad ne visų grupių vidurkiai vienodi (yra statistiškai reikšmingai besiskiriančių vidurkių). ANOVA happy How happy are you Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Lentelėje Multiple Comparisons matome Bonferoni testo rezultus. Statistiškai reikšmingi vidurkių skirtumai paţymėti ţvaigţdutėmis. Estai skairiasi nuo lietuvių ir nuo portugalų, o lietuviai ir portugalai savo laimingumu statistiškai reikšmingai nesiskiria. happy How happy are you Bonferroni Multiple Comparisons (I) Acountry (J) Acountry Mean 95% Confidence Interval Country Country Difference (I-J) Std. Error Sig. Lower Bound Upper Bound 1 Estonia 2 Lithuania * Portugal * Lithuania 1 Estonia.683 * Portugal Portugal 1 Estonia * Lithuania *. The mean difference is significant at the 0.05 level. Rezultatų išklotinė baigiasi vidurkių grafiku. 12

Lietuvių ir portugalų vidutiniai laimingumai statistiškai reikšmingai nesiskiria. 2.

13 Išvadas galima aprašyti taip: taikėme ANOVA. Gavome, kad gyvenamoji vieta ir laimingumas statistiškai reikšmingai susiję (p = 0,007). Pagal Bonferoni kriterijų vidutinis estų laimingumas statistiškai reikšmingai skiriasi nuo lietuvių ir portugalų laimingumo. Lietuvių ir portugalų vidutiniai laimingumai statistiškai reikšmingai nesiskiria. 2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) Porinio T testo apibendrinimas, kai imčių gali būti daugiau uţ 2. Duomenys: dviejų, ar daugiau, normaliųjų stebėjimų vektoriai (x,y,z,...). Statistinė hipotezė: H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar Lietuvos m respondentai vienodai palankiai vertina partijas, teisinę sistemą ir Europarlamentą? Failas ESS4LT. Atsirenkame reikiamo amţiaus respondentus. Pasirenkame Analyze General Linear Model Repeated Measures. Langelyje Number of Levels nurodome kelių stulpelių vidurkius lyginsime (3), paspaudţiame Add, po to Define. Atsidariusiame langelyje perkeliame kintamuosius trstprt, trstlgl, trstep į Within Subject Variables. Renkamės Options. 13

Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK.

14 Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK. Rezultatų išklotinėje pateikti vidurkiai (skalė 1 visiškai nepasitikiu,...,10 visiškai pasitikiu): Descriptive Statistics Mean Std. Deviation N trstprt trstlgl trstep Ar yra statistiškai besiskiriančių vidurkių, suţinome paţiūrėję į lentelę Tests of Within-Subjet Effects, stulpelį Sig. Šiuo atveju visos p reikšmės yra statistiškai reikšmingos (pagrindinė p reikšmė yra eilutėje Sphericity Assumed). Taigi yra statistiškai reikšmingai besiskiriančių vidurkių. Measure:MEASURE_1 Source Tests of Within-Subjects Effects Type III Sum of Squares df Mean Square F Sig. factor1 Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Bonferoni testo rezultatai yra lentelėje Pairwise Comparisons. Matome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Išvada: pritaikius blokuotų duomenų ANOVA ir Bonferoni testą, gavome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Palankiausiai vertinamas Europarlamentas (vid balo), blogiau teisinė 14

15 sistema (vid. 3,50 balo). Visų nepalankiausiai vertinamos partijos (vid. 1,88 balo). Visos institucijos vertinamos blogiau, nei vidutiniškai. Measure:MEASURE_1 Pairwise Comparisons 95% Confidence Interval for Mean Difference a (I) factor1 (J) factor1 Difference (I-J) Std. Error Sig. a Lower Bound Upper Bound * * * * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Bonferroni. 3. Neparametriniai kriterijai Tai kriterijai, kuriems uţtenka rangų ir nereikia, kad kintamieji būtų normalūs. Išvadas visada sunkiau suformuluoti ir kitiems išaiškinti. Kai visi skaičiai išrikiuojami nuo maţiausio iki didţiausio, tai iš esmės rangas nurodo, kurioje pozicijoje konkretus stebėjimas atsidūrė. Nuo pozicijos numerio rangas skiriasi tik tada, kai yra vienodo didumo stebėjimai, nes jų rangai turi būti lygūs. Stebėjimai: 1, 3, 7, 12, 23, 25, 25, 48. Pozicijos nr: 1, 2, 3, 4, 5, 6, 7, 8. Rangai: 1, 2, 3, 4, 5, 6.5, 6.5, 8. Neparametriniuose kriterijuose lyginami skirstiniai, t.y. bandoma viso labo nustatyti, kurioje imtyje daugiau didesnių skaičių. Beveik visada tai reiškia, kad išrikiuojame abiejų (visų) imčių stebėjimus į vieną eilutę, suranguojame, o tada surandame vidutinius rangus (angl. mean rank). Ta imtis, kurios vidutinis rangas didesnis ir įgyja daugiau didesnių reikšmių. Vidutinis rangas nėra stebėjimų vidurkis, nes rangas nėra tas pats, kas stebėjimas. Jeigu dešimtas stovi metro dvidešimties ūgio respondentas, tai rangas bus dšimt (jei kaimynų ūgiai skiriasi), o stebėjimas 1,20 m. 15

3.1 Mann Whitney testas T kriterijaus nepriklausomoms imtims analogas. Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imtys.

16 3.1 Mann Whitney testas T kriterijaus nepriklausomoms imtims analogas. Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imtys. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu baigusieji ekonomiką vyrai ir moterys? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame ekonomiką baigusius (K8=57). Nuomonė apie algą yra ranginė (K37_4: 1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Independent Samples. Kintamąjį K37_4 keliame į Test Variable List, kintamąjį D1 į Grouping Variable ir nurodome lyties kodus. Spaudţiame OK. Rezultatų išklotinėje matome, kad vyrai palankiau vertina savo algą (mean rank = 53,32), nei moterys (41,91). Ranks D1 Lytis N Mean Rank Sum of Ranks K37_4 1 Moteris Vyras Total 92 16

Kitoje lentelėje suradę Asymp.Sig. (2-tailed), įsitikiname, kad p reikšmė =0,035 < 0,05. Darome išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys.

17 Kitoje lentelėje suradę Asymp.Sig. (2-tailed), įsitikiname, kad p reikšmė =0,035 < 0,05. Darome išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys. Test Statistics a K37_4 K37_4 Pasitenkinimas atlyginimu uþ esamà darbà Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed).035 a. Grouping Variable: D1 D1 Lytis 3.2 Wilcoxon testas T porinio kriterijaus analogas. Duomenys: poriniai intervaliniai arba ranginiai (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: : Ar vienodai patenkinti atlyginimu ir darbo sąlygomis baigusieji psichologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame psichologiją baigusius (K8=60). Nuomonė apie algą ir darbo sąlygas yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Related Samples. Kintamuosius K37_3 ir K37_4 keliame į Test Pairs, spaudţiame OK. 17

18 Rezultatų išklotinėje matome, kad vidutinis rangas yra didesnis atveju, kai K37_4 < K37_3. Ranks N Mean Rank Sum of Ranks K37_4 - K37_3 Negative Ranks 26 a Positive Ranks 4 b Ties 9 c Total 39 a. K37_4 < K37_3 b. K37_4 > K37_3 c. K37_4 = K37_3 Suradę kitoje lentelėje Asymp.Sig.(2-tailed), įsitikiname, kad p = 0,002 < 0,05. Darome išvadą, kad statistiškai reikšmingai palankiau vertinamos darbo sąlygos, nei gaunamas atlyginimas. Test Statistics b K37_4 - K37_3 Z a Asymp. Sig. (2-tailed) Kruskal Wallis testas ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: Dvi ar daugiau nepriklausomų intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imčių. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar m lietuviai, estai ir portugalai vienodai vertina savo pasitenkinimą gyvenimu? Failai ESS4LT, ESS4EE, ESS4PT. Sujungiame failus (Merge Files) ir atsirenkame tinkamo amţiaus respondentus. Su Automatic Recode sukuriame skaitinį, šalį nurodantį, kintamąjį Acountry. Pasitenkinimas gyvenimu (kintamasis stflife) įgyja reikšmes nuo 1 labai nepatenkintas, iki 10 labai patenkintas. Pasirenkame Analyze Nonparametric Tests (Legacy Dialogs) K Independent Samples. Į langelį Test Variable List įkeliame kintamąjį stflife. Į langelį 18

19 Grouping Variable įkeliame Acountry ir nurodome jo maţiausią (1) ir didţiausią (3) kodus. Spaudţiame OK. Pagal vidutinius rangus darome išvadą, kad palankiausiai gyvenimą vertina lietuviai, o nepalankiausiai portugalai. Ranks Acountry Country N Mean Rank stflife How satisfied with life as a whole 1 Estonia Lithuania Portugal Total 474 Grafoje Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05. Todėl darome išvadą, kad yra statistiškai reikšmingų skirtumų tarp Lietuvos, Estijos ir Portugalijos jaunimo poţiūrių į gyvenimą. Test Statistics a,b stflife How satisfied with life as a whole Chi-Square df 2 Asymp. Sig..000 a. Kruskal Wallis Test Svarbu: niekur neminėjome vidurkių (geriausiu atveju vidutinius rangus) ir netaikėme Post Hoc testų (nes jų nėra). Todėl atsakymas ganėtinai dalinis, ne taip, kaip taikant ANOVA. 19

20 3.4 Friedman testas Blokuotų duomenų ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: 2 ar daugiau intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimų vektoriai. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu, darbo sąlygomis ir darbo pobūdţiu baigusieji politologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame politologiją baigusius (K8=52) respondentus. Nuomonė apie algą, darbo sąlygas ir darbo pobūdį yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) K Related Samples. Kintamuosius K37_2, K37_3 ir K37_4 keliame į Test Variables, spaudţiame OK. Lentelėje Ranks nurodyti kintamųjų vidutiniai rangai. Friedman kriterijaus atveju jie rodo, kokią vidutiniškai vietą tarp trijų kintamųjų pagal savo didumą uţima kiekvienas kintamasis. Aiškiai matyti, kad nepalankiausiai įvertinta nuomonė apie atlyginimą (jeigu visi respondentai šiam kintamajam būtų skyrę maţiausius balus, vidurkis būtų 1, o dabar jis 1,37). Ranks Mean Rank K37_ K37_ K37_

21 Test Statistics a N 30 Chi-Square df 2 Asymp. Sig..000 Nors skirtumai statistiškai reikšmingi (Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05) vis dėlto tegalima padaryti išvadą, kad yra statistiškai reikšmingų skirtumų, vertinant darbo pobūdį, sąlygas ir atlyginimą ir pasamprotauti apie tai, kuo labiausiai nepatenkinti respondentai. Taip, kaip parašėme aukščiau. Post hoc kriterijų nėra. 4. Požymių priklausomumo (kryžminių lentelių) analizė. Faktiškai kryţminių lentelių statistiniam vertinimui taikomas vienintelis chi kvadrato kriterijus. Reikia įsidėmėti, kad a) Chi kvadrato kriterijus labai jautrus duomenų skaičiui. Kai duomenų nedaug, net ir dideli procentiniai skirtumai bus pripaţinti statistiškai nereikšmingais. Kai duomenų labai daug, tai net ir menkiausi procentiniai skirtumai tampa statistiškai reikšmingais. b) Sudarinius kryţminę lentelę, joje neturi būti daug pustuščių langelių. Chi kvadrato statistika tampa nepatikima, kai tokių langelių daugiau, nei penktadalis. Tada tiesiog reikėtų sustambinti kategorijas. 4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas Duomenys: respondentai pagal du kategorinius poţymius suskirstyti į kategorijas. Statistinė hipotezė: H 0 atmetame (požymiai statistiškai reikšmingai susiję), jei p-reikšmė < 0,05. Pavyzdys: Ar, išmokant grąţą, vienodai apgaudinėjami vyrai ir moterys? Failas LiDA003_ZTLT_F1. Renkamės Analyze Descriptive Statistics Crosstabs. Į langelį Row(s) įkeliame kintamąjį s01 (lytį), į Column(s) kintamąjį a09_01. 21

Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu. Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir spaudţiame OK.

Crosstabulation a09_01 Bûti apgautam gaunant gràþà 1 Taip 2 Ne Total s01 Lytis 1 Vyras Count 184 288 472 % within s01 Lytis 39.0% 61.0% 100.0% % within a09_01 Bûti apgautam gaunant gràþà 43.4% 45.

22 Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu. Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir spaudţiame OK. Rezultatų išklotinėje randame lentelę Crosstabulation. Jooje pateikti procentai nerodo, kad kaţkurią lytį apgaudinėtų daţniau. Gaunant grąţą buvo apgauti 39% vyrų ir 40,6 % moterų. Crosstabulation a09_01 Bûti apgautam gaunant gràþà 1 Taip 2 Ne Total s01 Lytis 1 Vyras Count % within s01 Lytis 39.0% 61.0% 100.0% % within a09_01 Bûti apgautam gaunant gràþà 43.4% 45.1% 44.4% 2 Moteris Count % within s01 Lytis 40.6% 59.4% 100.0% % within a09_ Bûti apgautam gaunant gràþà 56.6% 54.9% 55.6% Total Count % within s01 Lytis 39.9% 60.1% 100.0% % within a09_ 100.0% 100.0% 100.0% Lentelėje Chi-Square Tests pateiktos net kelios p reikšmės. Kadangi šiuo atveju turime 2x2 lentelę, tai stulpelyje Exact.Sig. (2-tailed) pateikiama ir tiksli p reikšmė (0,614). Visada bus 22

23 aprašyta ir asimptotinė p reikšmė stulpelyje Asymp. Sig. (2-sided) (ji lygi 0,591). Kadangi p reikšmė didesnė uţ 0,05, tai darome išvadą, nėra statistiškai reikšmingo skirtumo tarp apgautų vyrų ir moterų procentų. Tą pačią išvadą galima formuluoti ir kitais ţodţiais: apgaudinėjimas, išmokant grąţą, nėra statistiškai reikšmingai susijęs su apgaudinėjamos personos lytimi. Chi-Square Tests Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value df sided) sided) sided) Pearson Chi-Square.289 a Continuity Correction b Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases 1063 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is b. Computed only for a 2x2 table 4.2 Chi kvadrato suderinamumo testas Duomenys: viena imtis pagal vieną poţymį suskirstytą į kategorijas. Spėjame kiek kokių respondentų bus (procentinę sudėtį, proporcijas) Statistinė hipotezė: ė ė H 0 atmetame (duomenys statistiškai reikšmingai prieštarauja spėjamoms proporcijoms skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar duomenys neprieštarauja spėjimui, kad išmokant grąţą, apgaudinėjama 40 % respondentų? Failas LiDA003_ZTLT_F1. Renkamės Analyze Nonparametric Tests Legacy Dialogs) Chi Square. Į langelį Test Variable List įkeliame a09_01. 23

Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio a09_01 kodo. Kadangi kintamajema yra 1 apgautiems ir 2 neapgautiems, tai vedame 40 ir 60 ( o ne 60 ir 40).

24 Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio a09_01 kodo. Kadangi kintamajema yra 1 apgautiems ir 2 neapgautiems, tai vedame 40 ir 60 ( o ne 60 ir 40). Spaudţiame OK. Pirmojoje lentelėje išrašyta, kiek ţmonių buvo apgauta (424) ir kiek jų turėtų būti imtyje, jeigu spėjamas santykis būtų teisingas. Matome, kad neatitikimas labai maţas tik 1,2 respondento (trupmenos neturi gasdinti taip tiksliau, nes matematinis modelis keičia sveikus skaičius realiais). a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Observed N Expected N Residual 1 Taip Ne Total 1063 Antrojoje lentelėje suradę Asymp. Sig. eilutėje esančią p reikšmę, matome, kad ji (0,940) daug didesnė uţ 0,05. Todėl darome išvadą, kad duomenys statistiškai reikšmingai neprieštarauja spėjamam santykiui (apgautųjų procentui). Norime atkreipti, kad išvada švelni neprieštarauja spėjimui, o ne įrodėme, kad tokių 40 procentų. Gali lygiai taip pat, tiems patiems duomenims neprieštarauti spėjimui, kad tokių respondentų yra 39 procentai. Arba 41 %. Taigi, visada įdomiau, kai atsiranda prieštaravimas, nes tada galima matyti daugiau, ar maţiau buvo apgautųjų. Test Statistics 24

25 a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Chi-Square.006 a df 1 Asymp. Sig..940 Literatūra 1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai I, TEV, V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai II, TEV,

SPSS Guide For MMI 409

SPSS Guide For MMI 409 by John Wong March 2012 Preface Hopefully, this document can provide some guidance to MMI 409 students on how to use SPSS to solve many of the problems covered in the D Agostino