Projektas. SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA. Vydas Čekanavičius
|
|
- Victor Barber
- 6 years ago
- Views:
Transcription
1 Projektas Lietuvos HSM duomenų archyvo LiDA plėtra SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA Vydas Čekanavičius (Paslaugų sutartis Nr. SA /2, ) Kaunas, 2011 m. 1
2 Turinys 1. Įvadas į statistinių hipotezių tikrinimą Hipotezių apie vidurkių lygybes tikrinimas T testas 1 imčiai T testas 2 nepriklausomoms imtims T testas 2 priklausomoms imtims (porinis t testas) ANOVA Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) Neparametriniai kriterijai Mann Whitney testas Wilcoxon testas Kruskal Wallis testas Friedman testas Požymių priklausomumo (kryžminių lentelių) analizė Chi kvadrato nepriklausomumo (homogeniškumo) testas Chi kvadrato suderinamumo testas Literatūra
3 1. Įvadas į statistinių hipotezių tikrinimą Statistinės išvados (inferencinė statistika) turi vienintelį tikslą ištyrus dalį respondentų (imtį, imtis), padaryti išvadą apie visą populiaciją (populiacijas). Įsivaizduokime dvi situacijas: 1) Virėjas paragauja sriubos ir nusprendţia trūksta druskos. 2) Ekranţvaigţdė visiems TV ţiūrovams paaiškina visi jie tokie! Abi šios išvados yra akivaizdţiai statistinės. Virėjas prarijo šaukštą sriubos, o išvadą padarė apie visą puodą. Ekranţvaigţdė savo patirtį apibendrino pagal gal ir nemaţą dalį, bet vis tiek tik dalį visų jų. Matome, kad kartais apibendrinimai visiškai tikėtini (virėjas), o kartais labai abejotini (ţvaigţdė). Inferencinėjs statistikoje viskas formalizuojama ir dar įvertinama, kiek galima tikėti priimtu sprendimu. Visą statistinių hipotezių tikrinimą galima išskaidyti į tokius etapus: a) Tyrimo hipotezės iškėlimas. b) Statistinės hipotezės formulavimas. c) Duomenų analizė. d) Išvadų surašymas. Aptarsime kiekvieną etapą atskirai. Tyrimo hipotezė tai ta problema, kuri iš tikrųjų ir jaudina tyrėją. Ji glaudţiai susijusi su tyrimo srities specifika. Pavyzdţiui, hipotezė, kad latviai valgo daugiau ţuvies, nei lietuviai, yra sociologo (ar kulinaro, ar mediko) tyrimo hipotezė. Ji grindţiama istoriniu kontekstu Latvija visą laiką buvo jūrų valstybė, o Lietuva tik priešokiais, kai prasibrukdavo prie Baltijos per kryţiuočius. Statistikos čia dar nėra. Kai politikas pasamprotauja, kad parlamentarų darbo efektyvumas išaugs, jei jie kalbas sakys, stovėdami ant vienos kojos (kairieji ant kairės, dešinieji ant dešinės), tai irgi yra tyrimo, o ne statistinė hipotezė. Ji grindţiama ne faktais, o loginiu samprotavimu, kad tada šnekama bus trumpiau ir labiau iš esmės. Statistinė hipotezė tai tyrimo hipotezės formalizavimas (ir truputį matematizavimas). Visų pirma, atitrūkstama nuo specifikos ir viskas uţrašoma standartiniais terminais. Jeigu lyginamos vidutinės reikšmės, tai statistinė hipotezė formuluojama vidurkiams. Jeigu kalbama apie kintamųjų priklausomybę, tai daţniausiai statistinė hipotezė keliama apie koreliacijos tarp kintamųjų stiprumą. Standartinėse statistinėse hipotezėse naudojami tik šie terminai: vidurkiai, dispersijos,proporcijos (procentai), koreliacija. Neparametrinėje statistikoje dar lyginami skirstiniai. Tarkime, norint įvertinti parlamentarų darbo efektyvumą, galima tiesiog kalbėti apie vidutinį sprendimo priėmimo laiką. Norėdami išsiaiškinti, ar vienakojis šnekėjimo metodas iš esmės efektyvesnis, turime 3
4 ankstesnį vidutinį sprendimų priėmimo laiką (paţymėkime jį simboliu a) palyginti su vienakojiškų sprendimų vidutiniu laiku (paţymėkime jį simboliu ). Visos statistinės hipotezės formuluojamos, kaip du alternatyvūs teiginiai: H 0 (nulinė hipotezė), tai teiginys apie parametrų skirtumų nebuvimą, o H 1 (alternatyvioji hipotezė) teiginys, kad parametrai skiriasi. H 0 : parametrų skirtumas yra lygus nuliui. H 1 : parametrų skirtumas yra nelygus nuliui. Net ir neparametrinėse hipotezėse skirtumas skelbiamas tik alternatyvoje H 1. Pavyzdyje apie politikus statistinė hipotezė uţrašoma taip: H 0 : = a, H 1 : a Ţinoma, yra ir vienpusių alternatyvų, pavyzdţiui H 1 : a. Reikia tik atsiminti, kad griežtos nelygybės rašomos tik alternatyvose H 1. Jos niekada nerašomos nulinėje hipotezėje H 0. Duomenų analizė tai tinkamo statistinio kriterijaus parinkimas ir taikymas. Tiriama tik dalis populiacijos (imtis), o apibendrinama visai populiacijai. Taip ir apsirikti galima. Klaidingi sprendimai gali būti dviejų rūšių: kai be reikalo atmetame H 0 (vadinamoji pirmos rūšies klaida) ir, kai H 0 neteisinga, o mes jos neatmetame (vadinamoji antros rūšies klaida). Minimizuoti abiejų rūšių klaidas neįmanoma, todėl visuotinai sutarta daugiau dėmesio skirti pirmos rūšies klaidai. Kaip taisyklė, daţniausiai siekiama parodyti, kad galioja H 1. Pavyzdţiui, politikas norėtų įrodyti, kad jo siūlomas sprendimų pagreitinimo metodas veikia. Todėl iš anksto nusistatoma, koks maksimalus leistinas neteisingų H 0 atmetimų procentas. Tai vadinamasis reikšmingumo lygmuo. Daţniausiai naudojamas reikšmingumo lygmuo yra 0,05. Tai reiškia, kad jeigu jau H 0 atmesime, tai klaidos tikimybė neviršys 5%. Šiais laikais, kai statistinių hipotezių tikrinimui visuotinai naudojamos statsitinė programos, sprendimai priimami atsiţvelgus į vadinamąsias p reikšmes. P reikšmė tai konkretiems tiriamiems duomenims apskaičiuota tikimybė, atmetant H 0, padaryti klaidą. Šis apibrėţimas skamba labai panašiai, kaip reikšmingumo lygmens apibrėţimas. Vis dėlto yra esminis skirtumas reikšmingumo lygmuo, tai teorinis etalonas, nurodantis leistiną klaidingų sprendimų procentą, o p reikšmė yra konkreti konkretaus sprendimo klaidos tikimybė. Ji gali būti daug maţesnė uţ reikšmingumo lygmenį (tada galima atmesti H 0 ), o gali jį ir viršyti (tada H 0 neatmetame). 4
5 Reikšmingumo lygmuo iš anksto pasirinktas idealas (ne daugiau 5% klaidų), o p-reikšmė kiekvienai duomenų aibei sava tikimybė. H 0 atmetame, kai p-reikšmė < 0,05 (reikšmingumo lygmuo). Kuo imtis didesnė, tuo p reikšmė maţesnė (jau taip jos skaičiuojamos). Todėl labai didelėms imtims galime gauti maţas p reikšmes, vien dėl duomenų gausos. Nors trokštamos išvados daromos apie populiacijos parametrus, jos visada formuluojamos, imties duomenims ir visada naudojant ţodţių derinį statistiškai (ne)reikšminga. Ši frazė grynų gryniausias ţargonizmas. Ji tereiškia, kad (ne)labai tikėtina, jog H 0 neteisinga. Pavyzdţiui, sakinys imties vidurkis statistiškai reikšmingai skiriasi nuo skaičiaus a, tereiškia tokį samprotavimą: sprendţiant iš imties duomenų, tikimybė, kad tikrasis vidurkis skiriasi nuo a labai didelė (didesnė uţ 0,95, t.y. 95 %). Teiginys imties vidurkis statistiškai reikšmingai nesiskiria nuo skaičiaus a tereiškia, kad tikimybė, kad tikrasis vidurkis skiriasi nuo a maţesnė uţ 95 %. Bet tai dar nereiškia, kad galima teigti, jog vidurkis lygus a. Gal lygus, o gal nelygus. Tiesiog pritrūko įrodymų, kad nelygus. Panašiai, kaip paleidţiant įtariamąjį dėl įrodymų stokos. Frazė statistiškai reikšmingas skirtumas interpretuotina taip: imtyje uţfiksuotas toks didelis skirtumas, jog labai tikėtina, kad tai neatsitiktinumas ir toks skirtumas egzistuoja ir populiacijoje. Reikia nepamiršti, kad statistiškai reikšmingi skirtumai gali atsirasti ir dėl didelio duomenų skaičiaus. Todėl nereikia maišyti sąvokų statistiškai reikšmingas skirtumas ir prasmingas skirtumas. Statistiškai reikšmingai sprendimas priimamas greičiau. Visomis trimis sekundėmis. Pelnas išaugo statistiškai reikšmingai. Visu centu per metus. Ir ką labai daug prasmės tokiame statistiniame reikšmingume? Statistiškai reikšmingas skirtumas gali būti visai nesvarbus tyrėjo išvadoms. Įvado pabaigai priminsime keletą, ţemiau naudojamų sąvokų. Skirstinys: Kintamojo įgyjamos reikšmės ir jų įgijimo tikimybės. Maţdaug: ţinau visas galimas matuojamo kintamojo reikšmes ir kiek procentų respondentų populiacijoje jas turi. Normalus kintamasis: kintamasis, kuris turi normalųjį skirstinį. Jo reikšmės išsibarsčiusios pagal pakankamai bjauriai matematiškai aprašomą dėsnį. Praktikoje intervaliniai kintamieji, kurių 5
6 dauguma reikšmių yra netoli vidurkio ir kurie pakankamai simetriški laikomi beveik normaliais. Normalių kintamųjų histogramos: Visuose pavyzdţiuose naudojami duomenys paimti iš Tyrimuose naudosime: 1) Studijų rezultatų kokybė: universitetų absolventų integracijos darbo rinkoje tyrimas duomenis: LiDA0146_LAMS_STUDY_F1. 2) 2008 metų Europos Sąjungos socialinio klausimyno (European Social Survey) Lietuvos, Estijos ir Portugalijos duomenis ESS4LT, ESS4EE ir ESS4PT. 3) Lietuvos vartotojų 2005 m tyrimas LiDA003_ZTLT_F1. 2. Hipotezių apie vidurkių lygybes tikrinimas 2.1 T testas 1 imčiai Visų pirma susitarsime dėl terminų: Stjudento kriterijai dar vadinami t testais. Ir atvirkščiai. Duomenys: 1 normali intervalinė imtis. Statistinė hipotezė: H 0 atmetame (imties vidurkis statistiškai reikšmingai skiraisi nuo a), jei p-reikšmė < 0,05. 6
7 Pavyzdys: Ar metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6? Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes. Tada renkamės Analyze Compare Means One sample T test. Į langelį Test Variable(s) įkeliame happy, o langelyje Test Value uţrašome 6. Paspaudţiame OK. Pirmojoje lentelėje pateikiamas imties vidurkis 6.88 (144 respondentai). One-Sample Statistics N Mean Std. Deviation Std. Error Mean happy How happy are you Antrojoje lentelėje stulpelyje Sig. (2-tailed) uţrašyta p reikšmė = 0,000. Kadangi p < 0,05, tai darome išvadą, jog tiriamos amţiaus grupės lietuvių laimingumo vidurkis (6.8) statistiškai reikšmingai didesnis uţ 6. One-Sample Test Test Value = 6 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper happy How happy are you T testas 2 nepriklausomoms imtims Duomenys: 2 normalios nepriklausomos intervalinės imtys. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. 7
8 Pavyzdys: Ar metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina vienodai? Failai ESS4LT ir ESS4EE. Pradţioje su komanda Data Merge Files sujungiame abudu failus. Renkamės Analyze Compare Means Independent Samples T Test. Į langelį Test Variable(s) įkeliame happy, o į langelį Grouping variable kintamąjį cntry. Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus: Spaudţiame Continue ir OK. Rezultatų išklotinė prasideda nuo imčių vidurkių. Group Statistics cntry Country N Mean Std. Deviation Std. Error Mean happy How happy are you LT Lithuania EE Estonia
9 Matome, kad Lietuvos piliečių vidutinis laimingumas yra 6.68, o estai truputį laimingesni jų laimingumo vidurkis yra 7,0. Norint nustatyti, ar vidurkių skirtumas yra statistiškai reikšmingas, reikia kitoje lentelėje surasti tinkamą p reikšmę. SPSS pateikia net du t testo variantus. Vienas jų skirtas atvejui, kai dispersijos lygios, o kitas kai dispersijos nelygios. Formaliai sprendimas daromas taip: pasiţiūrima į stulpelyje Levene s Test for Equality of Variances Sig. esančią reikšmę. Jeigu ji 0,05, tai t testo p reikšme laikoma viršutinis stulpelyje t-test for Equality of Means Sig. (2-tailed) esantis skaičius. Priešingu atveju apatinis skaičius. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig. Interval of the (2- Mean Std. Error Difference F Sig. t df tailed) Difference Difference Lower Upper happy How happy are you Equal variances assumed Equal variances not assumed Matome, kad t testo p reikšmė yra lygi 0,131 > 0,05. Todėl darome išvadą, kad metų lietuvių ir estų vidutiniai laimingumo vertinimai statistiškai reikšmingai nesiskiria. 2.3 T testas 2 priklausomoms imtims (porinis t testas) Duomenys: poriniai normalieji stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar metų Lietuvos respondentai vienodai vertina švietimą ir sveikatos prieţiūros įstaigas? Failas ESS4LT. Vertinimo skalė nuo 0 (labai nepatinka) iki 10 (labai patinka). Atsirenkame norimo amţiaus respondentus. Tada renkamės Analyze Compare Means Paired Samples T Test. Į laukelį Paired-Samples T Test įkeliame kintamuosius stfedu ir stfhlth. Paspaudţiame OK. 9
10 Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei sveikatos prieţiūra (vid. 3,59). Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 stfedu stfhlth Lentelėje Paired Samples Test susiradę Sig. (2 tailed) matome, kad p reikšmė = 0,007 < 0,05. Todėl darome išvadą, kad mokslas vertinamas statistiškai reikšmingai palankiau, nei sveikatos prieţiūra. Paired Samples Test Paired Differences 95% Confidence Interval of the Std. Std. Error Difference Sig. (2- Mean Deviation Mean Lower Upper t df tailed) Pair 1 stfedu - stfhlth ANOVA ANOVA vienfaktorės dispersinės analizės trumpinys (angl. Analysis Of Variance). Pavadinimas klaidinantis. ANOVA lygina dviejų ar daugiau nepriklausomų imčių vidurkius. Tai t testo nepriklausomoms imtims apibendrinimas. Tiesiog hipotezė tikrinama, palyginant dviem būdais įvertintą kintamųjų dispersiją: laikant, kad vidurkiai lygūs ir, kad ne. Iš čia ir ţodis dispersinė pavadinime. Duomenys: 2 ar daugiau nepriklausomų normaliųjų imčių. Visų imčių dispersijos turi būti panašios. Standartinis reikalavimas visi standartiniai nuokrypiai skiriasi ne daugiau nei dvigubai. Statistinė hipotezė: 10
11 H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar m lietuviai, estai ir portugalai vienodai vertina savo laimingumą? Failus ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną. Su komanda Automatic Record perkoduojame kintamąjį cntry į skaitinį kintamąjį Acountry (1 Estija, 2 Lietuva, 2 Portugalija). Su Select Cases atsirenkame reikiamus respondentus. Pasirenkame: Analyze Compare Means One- Way ANOVA. Į langelį Dependent List įkeliame happy, į langelį Factor Acountry. Pasirenkame Post Hoc ir paţymime Bonferroni. Paspaudę Continue, renkamės Options. Paţymime Descriptives ir Means plot. Tada spaudţiame Continue ir OK. 11
12 Rezultatų išklotinė prasideda nuo aprašomosios statistikos. Matome, kad vidutinis estų laimingumas yra pats maţiausias, o portugalai patys laimingiausi. Standartiniai nuokrypiai yra labai panašūs, nė vienas nėra didesnis uţ kitus daugiau nei dvigubai. happy How happy are you Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 1 Estonia Lithuania Portugal Total Pagrindinėje ANOVA lentelėje suradę p reikšmę p = 0,001, padarome išvadą, kad ne visų grupių vidurkiai vienodi (yra statistiškai reikšmingai besiskiriančių vidurkių). ANOVA happy How happy are you Sum of Squares df Mean Square F Sig. Between Groups Within Groups Total Lentelėje Multiple Comparisons matome Bonferoni testo rezultus. Statistiškai reikšmingi vidurkių skirtumai paţymėti ţvaigţdutėmis. Estai skairiasi nuo lietuvių ir nuo portugalų, o lietuviai ir portugalai savo laimingumu statistiškai reikšmingai nesiskiria. happy How happy are you Bonferroni Multiple Comparisons (I) Acountry (J) Acountry Mean 95% Confidence Interval Country Country Difference (I-J) Std. Error Sig. Lower Bound Upper Bound 1 Estonia 2 Lithuania * Portugal * Lithuania 1 Estonia.683 * Portugal Portugal 1 Estonia * Lithuania *. The mean difference is significant at the 0.05 level. Rezultatų išklotinė baigiasi vidurkių grafiku. 12
13 Išvadas galima aprašyti taip: taikėme ANOVA. Gavome, kad gyvenamoji vieta ir laimingumas statistiškai reikšmingai susiję (p = 0,007). Pagal Bonferoni kriterijų vidutinis estų laimingumas statistiškai reikšmingai skiriasi nuo lietuvių ir portugalų laimingumo. Lietuvių ir portugalų vidutiniai laimingumai statistiškai reikšmingai nesiskiria. 2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) Porinio T testo apibendrinimas, kai imčių gali būti daugiau uţ 2. Duomenys: dviejų, ar daugiau, normaliųjų stebėjimų vektoriai (x,y,z,...). Statistinė hipotezė: H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar Lietuvos m respondentai vienodai palankiai vertina partijas, teisinę sistemą ir Europarlamentą? Failas ESS4LT. Atsirenkame reikiamo amţiaus respondentus. Pasirenkame Analyze General Linear Model Repeated Measures. Langelyje Number of Levels nurodome kelių stulpelių vidurkius lyginsime (3), paspaudţiame Add, po to Define. Atsidariusiame langelyje perkeliame kintamuosius trstprt, trstlgl, trstep į Within Subject Variables. Renkamės Options. 13
14 Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK. Rezultatų išklotinėje pateikti vidurkiai (skalė 1 visiškai nepasitikiu,...,10 visiškai pasitikiu): Descriptive Statistics Mean Std. Deviation N trstprt trstlgl trstep Ar yra statistiškai besiskiriančių vidurkių, suţinome paţiūrėję į lentelę Tests of Within-Subjet Effects, stulpelį Sig. Šiuo atveju visos p reikšmės yra statistiškai reikšmingos (pagrindinė p reikšmė yra eilutėje Sphericity Assumed). Taigi yra statistiškai reikšmingai besiskiriančių vidurkių. Measure:MEASURE_1 Source Tests of Within-Subjects Effects Type III Sum of Squares df Mean Square F Sig. factor1 Sphericity Assumed Greenhouse-Geisser Huynh-Feldt Lower-bound Bonferoni testo rezultatai yra lentelėje Pairwise Comparisons. Matome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Išvada: pritaikius blokuotų duomenų ANOVA ir Bonferoni testą, gavome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Palankiausiai vertinamas Europarlamentas (vid balo), blogiau teisinė 14
15 sistema (vid. 3,50 balo). Visų nepalankiausiai vertinamos partijos (vid. 1,88 balo). Visos institucijos vertinamos blogiau, nei vidutiniškai. Measure:MEASURE_1 Pairwise Comparisons 95% Confidence Interval for Mean Difference a (I) factor1 (J) factor1 Difference (I-J) Std. Error Sig. a Lower Bound Upper Bound * * * * * * Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Bonferroni. 3. Neparametriniai kriterijai Tai kriterijai, kuriems uţtenka rangų ir nereikia, kad kintamieji būtų normalūs. Išvadas visada sunkiau suformuluoti ir kitiems išaiškinti. Kai visi skaičiai išrikiuojami nuo maţiausio iki didţiausio, tai iš esmės rangas nurodo, kurioje pozicijoje konkretus stebėjimas atsidūrė. Nuo pozicijos numerio rangas skiriasi tik tada, kai yra vienodo didumo stebėjimai, nes jų rangai turi būti lygūs. Stebėjimai: 1, 3, 7, 12, 23, 25, 25, 48. Pozicijos nr: 1, 2, 3, 4, 5, 6, 7, 8. Rangai: 1, 2, 3, 4, 5, 6.5, 6.5, 8. Neparametriniuose kriterijuose lyginami skirstiniai, t.y. bandoma viso labo nustatyti, kurioje imtyje daugiau didesnių skaičių. Beveik visada tai reiškia, kad išrikiuojame abiejų (visų) imčių stebėjimus į vieną eilutę, suranguojame, o tada surandame vidutinius rangus (angl. mean rank). Ta imtis, kurios vidutinis rangas didesnis ir įgyja daugiau didesnių reikšmių. Vidutinis rangas nėra stebėjimų vidurkis, nes rangas nėra tas pats, kas stebėjimas. Jeigu dešimtas stovi metro dvidešimties ūgio respondentas, tai rangas bus dšimt (jei kaimynų ūgiai skiriasi), o stebėjimas 1,20 m. 15
16 3.1 Mann Whitney testas T kriterijaus nepriklausomoms imtims analogas. Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imtys. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu baigusieji ekonomiką vyrai ir moterys? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame ekonomiką baigusius (K8=57). Nuomonė apie algą yra ranginė (K37_4: 1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Independent Samples. Kintamąjį K37_4 keliame į Test Variable List, kintamąjį D1 į Grouping Variable ir nurodome lyties kodus. Spaudţiame OK. Rezultatų išklotinėje matome, kad vyrai palankiau vertina savo algą (mean rank = 53,32), nei moterys (41,91). Ranks D1 Lytis N Mean Rank Sum of Ranks K37_4 1 Moteris Vyras Total 92 16
17 Kitoje lentelėje suradę Asymp.Sig. (2-tailed), įsitikiname, kad p reikšmė =0,035 < 0,05. Darome išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys. Test Statistics a K37_4 K37_4 Pasitenkinimas atlyginimu uþ esamà darbà Mann-Whitney U Wilcoxon W Z Asymp. Sig. (2-tailed).035 a. Grouping Variable: D1 D1 Lytis 3.2 Wilcoxon testas T porinio kriterijaus analogas. Duomenys: poriniai intervaliniai arba ranginiai (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: : Ar vienodai patenkinti atlyginimu ir darbo sąlygomis baigusieji psichologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame psichologiją baigusius (K8=60). Nuomonė apie algą ir darbo sąlygas yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Related Samples. Kintamuosius K37_3 ir K37_4 keliame į Test Pairs, spaudţiame OK. 17
18 Rezultatų išklotinėje matome, kad vidutinis rangas yra didesnis atveju, kai K37_4 < K37_3. Ranks N Mean Rank Sum of Ranks K37_4 - K37_3 Negative Ranks 26 a Positive Ranks 4 b Ties 9 c Total 39 a. K37_4 < K37_3 b. K37_4 > K37_3 c. K37_4 = K37_3 Suradę kitoje lentelėje Asymp.Sig.(2-tailed), įsitikiname, kad p = 0,002 < 0,05. Darome išvadą, kad statistiškai reikšmingai palankiau vertinamos darbo sąlygos, nei gaunamas atlyginimas. Test Statistics b K37_4 - K37_3 Z a Asymp. Sig. (2-tailed) Kruskal Wallis testas ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: Dvi ar daugiau nepriklausomų intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imčių. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar m lietuviai, estai ir portugalai vienodai vertina savo pasitenkinimą gyvenimu? Failai ESS4LT, ESS4EE, ESS4PT. Sujungiame failus (Merge Files) ir atsirenkame tinkamo amţiaus respondentus. Su Automatic Recode sukuriame skaitinį, šalį nurodantį, kintamąjį Acountry. Pasitenkinimas gyvenimu (kintamasis stflife) įgyja reikšmes nuo 1 labai nepatenkintas, iki 10 labai patenkintas. Pasirenkame Analyze Nonparametric Tests (Legacy Dialogs) K Independent Samples. Į langelį Test Variable List įkeliame kintamąjį stflife. Į langelį 18
19 Grouping Variable įkeliame Acountry ir nurodome jo maţiausią (1) ir didţiausią (3) kodus. Spaudţiame OK. Pagal vidutinius rangus darome išvadą, kad palankiausiai gyvenimą vertina lietuviai, o nepalankiausiai portugalai. Ranks Acountry Country N Mean Rank stflife How satisfied with life as a whole 1 Estonia Lithuania Portugal Total 474 Grafoje Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05. Todėl darome išvadą, kad yra statistiškai reikšmingų skirtumų tarp Lietuvos, Estijos ir Portugalijos jaunimo poţiūrių į gyvenimą. Test Statistics a,b stflife How satisfied with life as a whole Chi-Square df 2 Asymp. Sig..000 a. Kruskal Wallis Test Svarbu: niekur neminėjome vidurkių (geriausiu atveju vidutinius rangus) ir netaikėme Post Hoc testų (nes jų nėra). Todėl atsakymas ganėtinai dalinis, ne taip, kaip taikant ANOVA. 19
20 3.4 Friedman testas Blokuotų duomenų ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: 2 ar daugiau intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimų vektoriai. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu, darbo sąlygomis ir darbo pobūdţiu baigusieji politologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame politologiją baigusius (K8=52) respondentus. Nuomonė apie algą, darbo sąlygas ir darbo pobūdį yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) K Related Samples. Kintamuosius K37_2, K37_3 ir K37_4 keliame į Test Variables, spaudţiame OK. Lentelėje Ranks nurodyti kintamųjų vidutiniai rangai. Friedman kriterijaus atveju jie rodo, kokią vidutiniškai vietą tarp trijų kintamųjų pagal savo didumą uţima kiekvienas kintamasis. Aiškiai matyti, kad nepalankiausiai įvertinta nuomonė apie atlyginimą (jeigu visi respondentai šiam kintamajam būtų skyrę maţiausius balus, vidurkis būtų 1, o dabar jis 1,37). Ranks Mean Rank K37_ K37_ K37_
21 Test Statistics a N 30 Chi-Square df 2 Asymp. Sig..000 Nors skirtumai statistiškai reikšmingi (Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05) vis dėlto tegalima padaryti išvadą, kad yra statistiškai reikšmingų skirtumų, vertinant darbo pobūdį, sąlygas ir atlyginimą ir pasamprotauti apie tai, kuo labiausiai nepatenkinti respondentai. Taip, kaip parašėme aukščiau. Post hoc kriterijų nėra. 4. Požymių priklausomumo (kryžminių lentelių) analizė. Faktiškai kryţminių lentelių statistiniam vertinimui taikomas vienintelis chi kvadrato kriterijus. Reikia įsidėmėti, kad a) Chi kvadrato kriterijus labai jautrus duomenų skaičiui. Kai duomenų nedaug, net ir dideli procentiniai skirtumai bus pripaţinti statistiškai nereikšmingais. Kai duomenų labai daug, tai net ir menkiausi procentiniai skirtumai tampa statistiškai reikšmingais. b) Sudarinius kryţminę lentelę, joje neturi būti daug pustuščių langelių. Chi kvadrato statistika tampa nepatikima, kai tokių langelių daugiau, nei penktadalis. Tada tiesiog reikėtų sustambinti kategorijas. 4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas Duomenys: respondentai pagal du kategorinius poţymius suskirstyti į kategorijas. Statistinė hipotezė: H 0 atmetame (požymiai statistiškai reikšmingai susiję), jei p-reikšmė < 0,05. Pavyzdys: Ar, išmokant grąţą, vienodai apgaudinėjami vyrai ir moterys? Failas LiDA003_ZTLT_F1. Renkamės Analyze Descriptive Statistics Crosstabs. Į langelį Row(s) įkeliame kintamąjį s01 (lytį), į Column(s) kintamąjį a09_01. 21
22 Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu. Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir spaudţiame OK. Rezultatų išklotinėje randame lentelę Crosstabulation. Jooje pateikti procentai nerodo, kad kaţkurią lytį apgaudinėtų daţniau. Gaunant grąţą buvo apgauti 39% vyrų ir 40,6 % moterų. Crosstabulation a09_01 Bûti apgautam gaunant gràþà 1 Taip 2 Ne Total s01 Lytis 1 Vyras Count % within s01 Lytis 39.0% 61.0% 100.0% % within a09_01 Bûti apgautam gaunant gràþà 43.4% 45.1% 44.4% 2 Moteris Count % within s01 Lytis 40.6% 59.4% 100.0% % within a09_ Bûti apgautam gaunant gràþà 56.6% 54.9% 55.6% Total Count % within s01 Lytis 39.9% 60.1% 100.0% % within a09_ 100.0% 100.0% 100.0% Lentelėje Chi-Square Tests pateiktos net kelios p reikšmės. Kadangi šiuo atveju turime 2x2 lentelę, tai stulpelyje Exact.Sig. (2-tailed) pateikiama ir tiksli p reikšmė (0,614). Visada bus 22
23 aprašyta ir asimptotinė p reikšmė stulpelyje Asymp. Sig. (2-sided) (ji lygi 0,591). Kadangi p reikšmė didesnė uţ 0,05, tai darome išvadą, nėra statistiškai reikšmingo skirtumo tarp apgautų vyrų ir moterų procentų. Tą pačią išvadą galima formuluoti ir kitais ţodţiais: apgaudinėjimas, išmokant grąţą, nėra statistiškai reikšmingai susijęs su apgaudinėjamos personos lytimi. Chi-Square Tests Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value df sided) sided) sided) Pearson Chi-Square.289 a Continuity Correction b Likelihood Ratio Fisher's Exact Test Linear-by-Linear Association N of Valid Cases 1063 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is b. Computed only for a 2x2 table 4.2 Chi kvadrato suderinamumo testas Duomenys: viena imtis pagal vieną poţymį suskirstytą į kategorijas. Spėjame kiek kokių respondentų bus (procentinę sudėtį, proporcijas) Statistinė hipotezė: ė ė H 0 atmetame (duomenys statistiškai reikšmingai prieštarauja spėjamoms proporcijoms skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar duomenys neprieštarauja spėjimui, kad išmokant grąţą, apgaudinėjama 40 % respondentų? Failas LiDA003_ZTLT_F1. Renkamės Analyze Nonparametric Tests Legacy Dialogs) Chi Square. Į langelį Test Variable List įkeliame a09_01. 23
24 Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio a09_01 kodo. Kadangi kintamajema yra 1 apgautiems ir 2 neapgautiems, tai vedame 40 ir 60 ( o ne 60 ir 40). Spaudţiame OK. Pirmojoje lentelėje išrašyta, kiek ţmonių buvo apgauta (424) ir kiek jų turėtų būti imtyje, jeigu spėjamas santykis būtų teisingas. Matome, kad neatitikimas labai maţas tik 1,2 respondento (trupmenos neturi gasdinti taip tiksliau, nes matematinis modelis keičia sveikus skaičius realiais). a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Observed N Expected N Residual 1 Taip Ne Total 1063 Antrojoje lentelėje suradę Asymp. Sig. eilutėje esančią p reikšmę, matome, kad ji (0,940) daug didesnė uţ 0,05. Todėl darome išvadą, kad duomenys statistiškai reikšmingai neprieštarauja spėjamam santykiui (apgautųjų procentui). Norime atkreipti, kad išvada švelni neprieštarauja spėjimui, o ne įrodėme, kad tokių 40 procentų. Gali lygiai taip pat, tiems patiems duomenims neprieštarauti spėjimui, kad tokių respondentų yra 39 procentai. Arba 41 %. Taigi, visada įdomiau, kai atsiranda prieštaravimas, nes tada galima matyti daugiau, ar maţiau buvo apgautųjų. Test Statistics 24
25 a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Chi-Square.006 a df 1 Asymp. Sig..940 Literatūra 1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai I, TEV, V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai II, TEV,
SPSS Guide For MMI 409
SPSS Guide For MMI 409 by John Wong March 2012 Preface Hopefully, this document can provide some guidance to MMI 409 students on how to use SPSS to solve many of the problems covered in the D Agostino
More informationNijolė Cibulskaitė, Kristina Baranovska
MATEMATIKOS VADOVĖLIŲ V KLASEI VERTINIMAS DALYKINIU, PEDAGOGINIU IR PSICHOLOGINIU POŽIŪRIAIS Anotacija. Beveik du Nepriklausomybės dešimtmečius pertvarkant Lietuvos švietimą ypač daug dėmesio buvo skiriama
More information1. BINARY LOGISTIC REGRESSION
1. BINARY LOGISTIC REGRESSION The Model We are modelling two-valued variable Y. Model s scheme Variable Y is the dependent variable, X, Z, W are independent variables (regressors). Typically Y values are
More informationDISKREČIOJI MATEMATIKA
Vilniaus universitetas Matematikos ir informatikos fakultetas Informatikos katedra Gintaras Skersys DISKREČIOJI MATEMATIKA Mokymo priemonė Vilnius 2016 Įvadas Kas yra diskrečioji matematika? Diskrečioji
More informationStatistical analysis of design codes calculation methods for punching sheer resistance in column to slab connections
Journal of Civil Engineering and Management ISSN: 139-3730 (Print) 18-3605 (Online) Journal homepage: https://www.tandfonline.com/loi/tcem0 Statistical analysis of design codes calculation methods for
More informationM A N O V A. Multivariate ANOVA. Data
M A N O V A Multivariate ANOVA V. Čekanavičius, G. Murauskas 1 Data k groups; Each respondent has m measurements; Observations are from the multivariate normal distribution. No outliers. Covariance matrices
More informationVILNIUS UNIVERSITY LIJANA STABINGIENĖ IMAGE ANALYSIS USING BAYES DISCRIMINANT FUNCTIONS
VILNIUS UNIVERSITY LIJANA STABINGIENĖ IMAGE ANALYSIS USING BAYES DISCRIMINANT FUNCTIONS Summary of doctoral dissertation Physical sciences (P 000) Informatics (09 P) Vilnius, 2012 Doctoral dissertation
More informationLR Seimo narių elgsenos tyrimas, naudojant klasterinę analizę ir daugiamačių skalių metodą
LR Seimo narių elgsenos tyrimas, naudojant klasterinę analizę ir daugiamačių skalių metodą Vytautas Mickevičius Vytauto Didžiojo universitetas, Informatikos fakultetas Kaunas, Lietuva El. paštas: vytautas.mickevicius@fc.vdu.lt
More informationVango algoritmo analizė
VILNIAUS GEDIMINO TECHNIKOS UNIVERSITETAS 2017 m. balandžio 18 d. Problemos formulavimas Nagrinėkime lygtį u t = i 2 u, t [0, T ], x Ω x 2 u t=0 = u 0 (x). (1) Problema Realybėje Ω (, ), kas verčia įvesti
More informationGARSĄ SUGERIANČIŲ MEDŽIAGŲ IŠDĖSTYMO VIETŲ ĮTAKA SKAIČIUOJANT SALĖS AIDĖJIMO TRUKMĘ SKIRTINGOMIS FORMULĖMIS
GARSĄ SUGERIANČIŲ MEDŽIAGŲ IŠDĖSTYMO VIETŲ ĮTAKA SKAIČIUOJANT SALĖS AIDĖJIMO TRUKMĘ SKIRTINGOMIS FORMULĖMIS Vytautas J. Stauskis Vilniaus Gedimino technikos universitetas. Įvadas Projektuojant įvairaus
More informationAlgebraic and spectral analysis of local magnetic field intensity
Lietuvos matematikos rinkinys ISSN 132-2818 Proc. of the Lithuanian Mathematical Society, Ser. A Vol. 6, DOI:.388/LMR.A.. pages 4 9 Algebraic and spectral analysis of local magnetic field intensity Mantas
More informationWhy should I use a Kruskal-Wallis test? (With Minitab) Why should I use a Kruskal-Wallis test? (With SPSS)
Why should I use a Kruskal-Wallis test? (With Minitab) To perform this test, select Stat > Nonparametrics > Kruskal-Wallis. Use the Kruskal-Wallis test to determine whether the medians of two or more groups
More informationNon-parametric tests, part A:
Two types of statistical test: Non-parametric tests, part A: Parametric tests: Based on assumption that the data have certain characteristics or "parameters": Results are only valid if (a) the data are
More informationReklamos internete vartotojų segmentavimas taikant latentinį Dirichlė paskirstymo modelį
Lietuvos matematikos rinkinys ISSN 0132-2818 Lietuvos matematikų draugijos darbai, ser. B www.mii.lt/lmr/ 56 t., 2015, 1 6 Reklamos internete vartotojų segmentavimas taikant latentinį Dirichlė paskirstymo
More informationS. Tamošiūnas a,b, M. Žilinskas b,c, A. Nekrošius b, and M. Tamošiūnienė d
Lithuanian Journal of Physics, Vol. 45, No. 5, pp. 353 357 (2005) CALCULATION OF RADIO SIGNAL ATTENUATION USING LOCAL PRECIPITATION DATA S. Tamošiūnas a,b, M. Žilinskas b,c, A. Nekrošius b, and M. Tamošiūnienė
More informationNUOTOLINIŲ KURSŲ OPTIMIZAVIMAS
Vilniaus Universitetas Matematikos ir informatikos institutas L I E T U V A INFORMATIKA (09 P) NUOTOLINIŲ KURSŲ OPTIMIZAVIMAS Irina Vinogradova 2013 m. spalis Mokslinė ataskaita MII-DS-09P-13-5 Matematikos
More information10 16 metų mokinių nuostatos dėl matematikos ir metakognityvaus sąmoningumo sąsaja
ISSN 1392-5016. ACTA PAEDAGOGICA VILNENSIA 2015 35 DOI: http://dx.doi.org/10.15388/actpaed.2015.35.9188 10 16 metų mokinių nuostatos dėl matematikos ir metakognityvaus sąmoningumo sąsaja Raminta Seniūnaitė
More informationLietuvių šnekos balsių aprašymo autoregresijos modeliu adekvatumo tyrimas
Lietuvos matematikos rinkinys ISSN 0132-2818 Lietuvos matematikų draugijos darbai, ser. B www.mii.lt/lmr/ 57 t., 2016, 19 24 Lietuvių šnekos balsių aprašymo autoregresijos modeliu adekvatumo tyrimas Jonas
More informationIntroduction and Descriptive Statistics p. 1 Introduction to Statistics p. 3 Statistics, Science, and Observations p. 5 Populations and Samples p.
Preface p. xi Introduction and Descriptive Statistics p. 1 Introduction to Statistics p. 3 Statistics, Science, and Observations p. 5 Populations and Samples p. 6 The Scientific Method and the Design of
More informationSPSS LAB FILE 1
SPSS LAB FILE www.mcdtu.wordpress.com 1 www.mcdtu.wordpress.com 2 www.mcdtu.wordpress.com 3 OBJECTIVE 1: Transporation of Data Set to SPSS Editor INPUTS: Files: group1.xlsx, group1.txt PROCEDURE FOLLOWED:
More informationSEVERAL μs AND MEDIANS: MORE ISSUES. Business Statistics
SEVERAL μs AND MEDIANS: MORE ISSUES Business Statistics CONTENTS Post-hoc analysis ANOVA for 2 groups The equal variances assumption The Kruskal-Wallis test Old exam question Further study POST-HOC ANALYSIS
More informationLietuvos miškų pajaurėjusių, paprastųjų ir rudžemiškųjų smėlžemių granuliometrinės sudėties ypatumai
ŽEMĖS ŪKIO MOKSLAI. 2014. T. 21. Nr. 3. P. 181 190 Lietuvos mokslų akademija, 2014 Lietuvos miškų pajaurėjusių, paprastųjų ir rudžemiškųjų smėlžemių granuliometrinės sudėties ypatumai Valstybinė miškų
More informationCALCULATION OF ELECTROMAGNETIC WAVE ATTENUATION DUE TO RAIN USING RAINFALL DATA OF LONG AND SHORT DURATION
Lithuanian Journal of Physics, Vol. 47, No. 2, pp. 163 168 (2007) CALCULATION OF ELECTROMAGNETIC WAVE ATTENUATION DUE TO RAIN USING RAINFALL DATA OF LONG AND SHORT DURATION S. Tamošiūnas a,b, M. Tamošiūnienė
More informationDegrees of freedom df=1. Limitations OR in SPSS LIM: Knowing σ and µ is unlikely in large
Z Test Comparing a group mean to a hypothesis T test (about 1 mean) T test (about 2 means) Comparing mean to sample mean. Similar means = will have same response to treatment Two unknown means are different
More informationVIEŠŲJŲ PASLAUGŲ PERKöLIMO IŠ TRADICINöS Į ELEKTRONINĘ TERPĘ BRANDOS LYGIO VERTINIMAS
VIEŠŲJŲ PASLAUGŲ PERKöLIMO IŠ TRADICINöS Į ELEKTRONINĘ TERPĘ BRANDOS LYGIO VERTINIMAS Egidijus Ostašius Vilniaus Gedimino technikos universitetas Saul tekio al. 11, LT-10223, Vilnius EgidijusOstasius@gama.vtu.lt
More informationPrepared by: Prof. Dr Bahaman Abu Samah Department of Professional Development and Continuing Education Faculty of Educational Studies Universiti
Prepared by: Prof. Dr Bahaman Abu Samah Department of Professional Development and Continuing Education Faculty of Educational Studies Universiti Putra Malaysia Serdang Use in experiment, quasi-experiment
More informationTypes of Statistical Tests DR. MIKE MARRAPODI
Types of Statistical Tests DR. MIKE MARRAPODI Tests t tests ANOVA Correlation Regression Multivariate Techniques Non-parametric t tests One sample t test Independent t test Paired sample t test One sample
More informationCHAPTER 17 CHI-SQUARE AND OTHER NONPARAMETRIC TESTS FROM: PAGANO, R. R. (2007)
FROM: PAGANO, R. R. (007) I. INTRODUCTION: DISTINCTION BETWEEN PARAMETRIC AND NON-PARAMETRIC TESTS Statistical inference tests are often classified as to whether they are parametric or nonparametric Parameter
More informationSandra Mekšriūnaitė, Romualdas Gurevičius
ŠEIMOS MEDICINOS IR PIRMINĖS PSICHIKOS SVEIKATOS PRIEŽIŪROS PASLAUGAS TEIKIANČIŲ ASMENS SVEIKATOS PRIEŽIŪROS ĮSTAIGŲ GEOGRAFINIS PRIEINAMUMAS LIETUVOJE Sandra Mekšriūnaitė, Romualdas Gurevičius Higienos
More informationContents. Acknowledgments. xix
Table of Preface Acknowledgments page xv xix 1 Introduction 1 The Role of the Computer in Data Analysis 1 Statistics: Descriptive and Inferential 2 Variables and Constants 3 The Measurement of Variables
More informationPAGERINTAS EURISTINIS ALGORITMAS DVIEJŲ SEKŲ BENDRO ILGIAUSIO POSEKIO PAIEŠKAI
PAGERINTAS EURISTINIS ALGORITMAS DVIEJŲ SEKŲ BENDRO ILGIAUSIO POSEKIO PAIEŠKAI Lasse Bergroth Turku universitetas, Programinių įrangų technikos filialas, Salo, Suomija Anotacija Dviejų sekų bendro ilgiausio
More informationDETAILED CONTENTS PART I INTRODUCTION AND DESCRIPTIVE STATISTICS. 1. Introduction to Statistics
DETAILED CONTENTS About the Author Preface to the Instructor To the Student How to Use SPSS With This Book PART I INTRODUCTION AND DESCRIPTIVE STATISTICS 1. Introduction to Statistics 1.1 Descriptive and
More informationStructural integrity verification of polycarbonate type personal identity documents
239 ISSN 1392-1207. MECHANIKA. 2012 Volume 18(2): 239-244 Structural integrity verification of polycarbonate type personal identity documents S. Greičius*, V. Daniulaitis**, R. Vasiliauskas***, K. Pilkauskas****,
More informationDiscriminant Analysis
Discriminant Analysis V.Čekanavičius, G.Murauskas 1 Discriminant analysis one categorical variable depends on one or more normaly distributed variables. Can be used for forecasting. V.Čekanavičius, G.Murauskas
More informationAnalysis of variance
Analysis of variance Tron Anders Moger 3.0.007 Comparing more than two groups Up to now we have studied situations with One observation per subject One group Two groups Two or more observations per subject
More informationRinktiniai informacijos saugos skyriai. 3. Kriptografija ir kriptografijos protokolai: Klasikinė kriptografija
Rinktiniai informacijos saugos skyriai 3. Kriptografija ir kriptografijos protokolai: Klasikinė kriptografija Paskaitos tikslai Šioje temoje nagrinėjami klausimai: Perstatų šifrai Keitinių šifrai Vienos
More informationANALIZĖ 0: TEORINĖ ARITMETIKA
ANALIZĖ 0: TEORINĖ ARITMETIKA RIMAS NORVAIŠA 11.4 variantas, 2018 rugsėjo 20 E-paštas: rimas.norvaisa @mii.vu.lt 1 skyrius Pratarmė Analizė 0 - pirmoji matematinės analizės dalis iš trijų. Ši dalis yra
More informationMATEMATINĖ STATISTIKA IR INFORMATIKA BIOMEDICINOJE
LIETUVOS SVEIKATOS MOKSLŲ UNIVERSITETAS KAUNO MEDICINOS UNIVERSITETAS PATVIRTINTA Kauno medicinos universiteto Senato 2004 m. gruodžio 17 d. Nutarimu 3-11 ATNAUJINTA 2013 m. spalio mėn. MATEMATINĖ STATISTIKA
More informationSkirtingų vasarinių miežių veislių jautrumas ozonui
žemės ūkio mokslai. 2008. t. 15. Nr. 4. P. 35 39 lietuvos mokslų akademija, 2008 lietuvos mokslų akademijos leidykla, 2008 Skirtingų vasarinių miežių veislių jautrumas ozonui Kristina Dėdelienė, Romualdas
More informationStruktūrinė geologija
Pirmadienį pirmą pusdienį Struktūrinė geologija Audrius Čečys audrius.cecys@gf.vu.lt / audrius.cecys@gmail.com + 370 686 96 480 http://web.vu.lt/gf/a.cecys ir Dropbox Struktūrinė geologija yra mokslas
More informationOCCASIONAL PAPER SERIES. No 6 / 2015 A NOTE ON THE BOOTSTRAP METHOD FOR TESTING THE EXISTENCE OF FINITE MOMENTS
BANK OF LITHUANIA. WORKING PAPER SERIES No 1 / 2008 SHORT-TERM FORECASTING OF GDP USING LARGE MONTHLY DATASETS: A PSEUDO REAL-TIME FORECAST EVALUATION EXERCISE 1 OCCASIONAL PAPER SERIES A NOTE ON THE BOOTSTRAP
More informationMETHODS FOR GENERATION OF RANDOM NUMBERS IN PARALLEL STOCHASTIC ALGORITHMS FOR GLOBAL OPTIMIZATION
METHODS FOR GENERATION OF RANDOM NUMBERS IN PARALLEL STOCHASTIC ALGORITHMS FOR GLOBAL OPTIMIZATION Algirdas Lančinskas, Julius Žilinskas Institute of Mathematics and Informatics 1. Introduction Generation
More information1 DV is normally distributed in the population for each level of the within-subjects factor 2 The population variances of the difference scores
One-way Prepared by: Prof. Dr Bahaman Abu Samah Department of Professional Development and Continuing Education Faculty of Educational Studies Universiti Putra Malaysia Serdang The purpose is to test the
More informationKurso tikslai. 1 Įgyti galimybę skaitiškai spręsti taikomuosius uždavinius; 2 Įvertinti skirtingus skaitinius sprendimo metodus (žinant jų
Kurso tikslai Skaitiniai metodai Kompiuterių aritmetika ir algoritmai Olga Štikonienė Diferencialinių lygčių ir skaičiavimo matematikos katedra, MIF VU 01-0-05 Skaitiniai metodai (MIF VU) Komp.aritmetika
More informationVidutinės oro temperatūros dinamika Lietuvoje
GEOGRAFIJA. 2013. T. 49. Nr. 2. P. 114 122 Lietuvos mokslų akademija, 2013 Vidutinės oro temperatūros dinamika Lietuvoje Ana Mickievič, Egidijus Rimkus Vilniaus universitetas, M. K. Čiurlionio g. 21/27,
More informationStochastinės analizės egzaminas MIF magistrantūra, FDM I kursas, 2018 m. ruduo (1 semestras), X s db s, t 0.
Stochastinės analizės egzaminas MIF magistrantūra, FDM I kursas, 218 m. ruduo (1 semestras), 219 1 18 1. Prove the following: Proposition. If X t, t, is an Itô process and f C 3 (IR), then f ( ) ( ) t
More informationEkonometrinių modelių pritaikymas OMXV indekso pokyčių prognozavimui
ISSN 1822-7996 (PRINT), ISSN 2335-8742 (ONLINE) TAIKOMOJI EKONOMIKA: SISTEMINIAI TYRIMAI: 2016.10 / 1 http://dx.doi.org/10.7220/aesr.2335.8742.2016.10.1.10 Inga MAKSVYTIENĖ Giedrius SAFONOVAS Ekonometrinių
More informationESP 178 Applied Research Methods. 2/23: Quantitative Analysis
ESP 178 Applied Research Methods 2/23: Quantitative Analysis Data Preparation Data coding create codebook that defines each variable, its response scale, how it was coded Data entry for mail surveys and
More information1 Kompiuterių aritmetika ir algoritmai. 2 Tiesinių lygčių sistemų sprendimo metodai: 3 Duomenų aproksimacija: 4 Tikrinių reikšmių uždavinys.
Skaitiniai metodai Skaitiniai metodai Kompiuterių aritmetika ir algoritmai Olga Štikonienė Diferencialinių lygčių ir skaičiavimo matematikos katedra, MIF VU 24-2-4 Skaitiniai metodai randa matematinių
More informationRandom Factors in IOI 2005 Test Case Scoring
Informatics in Education, 2006, Vol. 5, No. 1, 5 14 5 2006 Institute of Mathematics and Informatics, Vilnius Random Factors in IOI 2005 Test Case Scoring Gordon CORMACK David R. Cheriton School of Computer
More informationCHI SQUARE ANALYSIS 8/18/2011 HYPOTHESIS TESTS SO FAR PARAMETRIC VS. NON-PARAMETRIC
CHI SQUARE ANALYSIS I N T R O D U C T I O N T O N O N - P A R A M E T R I C A N A L Y S E S HYPOTHESIS TESTS SO FAR We ve discussed One-sample t-test Dependent Sample t-tests Independent Samples t-tests
More informationShort Term Wind Speed Forecasting with ANN in Batman, Turkey
ELECTRONICS AND ELECTRICAL ENGINEERING ISSN 139 115 11. No. 1(7) ELEKTRONIKA IR ELEKTROTECHNIKA T 17 ELECTRONICS ELEKTRONIKA Short Term Wind Speed Forecasting with ANN in Batman, Turkey T. Ç. Akinci Department
More informationTranzistoriai. 1947: W.H.Brattain and J.Bardeen (Bell Labs, USA)
LTRONOS ĮTASA 2009 1 Tranzistoriai 1947: W.H.Brattain an J.Bareen (Bell Labs, USA) JPPi J.P.Pierce (Bell lllabs): tran(sfer)+(re)sistor ( ) t = transistor. t 1949: W.Schockley pasiūlė plokštinio vipolio
More informationData are sometimes not compatible with the assumptions of parametric statistical tests (i.e. t-test, regression, ANOVA)
BSTT523 Pagano & Gauvreau Chapter 13 1 Nonparametric Statistics Data are sometimes not compatible with the assumptions of parametric statistical tests (i.e. t-test, regression, ANOVA) In particular, data
More informationPSY 307 Statistics for the Behavioral Sciences. Chapter 20 Tests for Ranked Data, Choosing Statistical Tests
PSY 307 Statistics for the Behavioral Sciences Chapter 20 Tests for Ranked Data, Choosing Statistical Tests What To Do with Non-normal Distributions Tranformations (pg 382): The shape of the distribution
More informationResearch of the Grid-Tied Power System Consisting of Wind Turbine and Boiler GALAN
ELECTRONICS AND ELECTRICAL ENGINEERING ISSN 392 25 200. No. 0(06) ELEKTRONIKA IR ELEKTROTECHNIKA ELECTRICAL ENGINEERING T 90 ELEKTROS INŽINERIJA Research of the Grid-Tied Power System Consisting of Wind
More informationPrognosis of radionuclides dispersion and radiological measurements in Lithuania after the accident at Fukushima Daiichi nuclear
Prognosis of radionuclides dispersion and radiological measurements in Lithuania after the accident at Fukushima Daiichi nuclear power plant Rima Ladygienė, Aušra Urbonienė, Auksė Skripkienė, Laima Pilkytė,
More informationLIETUVOS ENERGETIKOS STRATEGIJA: OPTIMALIOS RENOVACIJOS MODELIS (ORM) (projektas pastaboms)
Įvadas LIETUVOS ENERGETIKOS STRATEGIJA: OPTIMALIOS RENOVACIJOS MODELIS (ORM) (projekas pasaboms) ORM yra kašų ir naudos analiz s (cos-benefi analysis) aikymas svarbiu masin s daugiabučių renovacijos aveju,
More informationWorkshop Research Methods and Statistical Analysis
Workshop Research Methods and Statistical Analysis Session 2 Data Analysis Sandra Poeschl 08.04.2013 Page 1 Research process Research Question State of Research / Theoretical Background Design Data Collection
More information8 laboratorinis darbas Klasterinė ir diskriminantinė analizė
8 laboratorinis darbas Klasterinė ir diskriminantinė analizė Teorinė dalis 1.1. Hierarchinė klasterinė analizė Objektų klasifikavimas, kai nėra mokomųjų imčių SAS sistemoje realizuotas CLUSTER procedūroje.
More informationNonparametric Statistics
Nonparametric Statistics Nonparametric or Distribution-free statistics: used when data are ordinal (i.e., rankings) used when ratio/interval data are not normally distributed (data are converted to ranks)
More informationMULTINOMIAL LOGISTIC REGRESSION
MULTINOMIAL LOGISTIC REGRESSION Model graphically: Variable Y is a dependent variable, variables X, Z, W are called regressors. Multinomial logistic regression is a generalization of the binary logistic
More informationTurinys. Geometrinės diferencialinių lygčių teorijos savokos. Diferencialinės lygties sprendiniai. Pavyzdžiai. CIt, (- 00,0) C'It, (0, (0);
Turinys In this chapter we illustrate the qualitative approach to differential equations and introduce some key ideas such as phase portraits and qualitative equivalence Geometrinės diferencialinių lygčių
More informationAlgoritmų analizės specialieji skyriai
VGTU Matematinio modeliavimo katedra VGTU SC Lygiagrečiųjų skaičiavimų laboratorija Paskaitų kursas. 2-oji dalis. Turinys 1 Algoritmų sudarymo principai ir metodai Variantų perrinkimas Tai bendras daugelio
More informationSelection should be based on the desired biological interpretation!
Statistical tools to compare levels of parasitism Jen_ Reiczigel,, Lajos Rózsa Hungary What to compare? The prevalence? The mean intensity? The median intensity? Or something else? And which statistical
More informationVILNIAUS UNIVERSITETAS PAGRINDAI. Mokymo priemonė
VILNIAUS UNIVERSITETAS Valdas Dičiūnas ALGORITMŲ ANALIZĖS PAGRINDAI Mokymo priemonė Vilnius, 2005 ĮVADAS Algoritmų analizės objektas yra algoritmai. Nors algoritmo sąvoka yra laikoma pirmine matematikos
More informationRepeated-Measures ANOVA in SPSS Correct data formatting for a repeated-measures ANOVA in SPSS involves having a single line of data for each
Repeated-Measures ANOVA in SPSS Correct data formatting for a repeated-measures ANOVA in SPSS involves having a single line of data for each participant, with the repeated measures entered as separate
More information4/6/16. Non-parametric Test. Overview. Stephen Opiyo. Distinguish Parametric and Nonparametric Test Procedures
Non-parametric Test Stephen Opiyo Overview Distinguish Parametric and Nonparametric Test Procedures Explain commonly used Nonparametric Test Procedures Perform Hypothesis Tests Using Nonparametric Procedures
More informationDISKREČIOJI MATEMATIKA
Vilniaus Gedimino technikos universitetas Aleksandras KRYLOVAS DISKREČIOJI MATEMATIKA Mokomoji knyga Vilnius Technika 2004 UDK 519.1(075.8) Kr242 A. Krylovas. Diskrečioji matematika. Mokomoji knyga. Vilnius:
More information..,, .. -, ..,.. : - ., ISBN. Excel, SPSS Statistica. Statistica 6.0,,, OpenOffice.org Calc.
This project has been funded with support from the European Commission. This publication reflects the views only of the author, and the Commission cannot be held responsible for any use which may be made
More informationElectrochemical investigations of Ni P electroless deposition in solutions containing amino acetic acid
CHEMIJA 7 Vol No P 7 Lietuvos mokslų Electrochemical akademija, investigations 7 of NiP electroless deposition in solutions containing amino acetic acid Lietuvos mokslų akademijos leidykla, 7 Electrochemical
More informationR. Plukienė a, A. Plukis a, V. Remeikis a, and D. Ridikas b a Institute of Physics, Savanorių 231, LT Vilnius, Lithuania
Lithuanian Journal of Physics, Vol. 45, No. 4, pp. 281 287 (2005) MCNP AND ORIGEN CODES VALIDATION BY CALCULATING RBMK SPENT NUCLEAR FUEL ISOTOPIC COMPOSITION R. Plukienė a, A. Plukis a, V. Remeikis a,
More informationĮvairiuose projektuose nustatytų vidutinių Lietuvos dirvožemio parametrų
Įvairiuose projektuose nustatytų vidutinių Lietuvos dirvožemio parametrų palyginimas dr. Virgilija Gregorauskienė Lietuvos geologijos tarnyba Problema dirvožemio duomenų, naudojamų formuojant ES dirvožemio
More informationIracionalieji skaičiai
Iracionalieji skaičiai Rimas Norvaiša 2018 m. balandžio mėn. 2 d. Abstract Dalomoji medžiaga paskaitoms Matematika ir filosofija". Iracionaliaisiais skaičiais vadinami tie realiųjų skaičių aibės elementai,
More informationThe Burg Algorithm with Extrapolation for Improving the Frequency Estimation
INFORMATICA, 2011, Vol. 22, No. 2, 177 188 177 2011 Vilnius University The Burg Algorithm with Extrapolation for Improving the Frequency Estimation Kazys KAZLAUSKAS Vilnius University Institute of Mathematics
More informationNon-invasive ultrasonic level measurement technology
ULTRAGARSAS Journal, Ultrasound Institute, Kaunas, Lithuania For all papers of this publication click: www.ndt.net/search/docs.php3?mainsource=27 ISSN 1392-2114 ULTRAGARSAS, Nr.4(61). 2006. Non-invasive
More informationKAUNO TECHNOLOGIJOS UNIVERSITETAS MATLAB/SIMULINK PROGRAMŲ TIPINIŲ OPTIMIZAVIMO METODŲ TYRIMUI SUKŪRIMAS
KAUNO TECHNOLOGIJOS UNIVERSITETAS ELEKTROS IR ELEKTRONIKOS FAKULTETAS Aurimas Gajauskas MATLAB/SIMULINK PROGRAMŲ TIPINIŲ OPTIMIZAVIMO METODŲ TYRIMUI SUKŪRIMAS Baigiamasis magistro projektas Vadovas Doc.
More informationTextbook Examples of. SPSS Procedure
Textbook s of IBM SPSS Procedures Each SPSS procedure listed below has its own section in the textbook. These sections include a purpose statement that describes the statistical test, identification of
More informationISSN Evaldas Nekrašas, 2010 Straipsnis įteiktas redakcijai 2009 m. lapkričio 5 d. Straipsnis pasirašytas spaudai 2010 m. vasario 2 d.
ISSN 1392 1681 POZITYVIZMO IR POSTPOZITYVIZMO GINČAS SOCIALINIUOSE MOKSLUOSE EVALDAS NEKRAŠAS Straipsnyje nagrinėjamas socialiniuose moksluose jau ilgokai vykstantis pozityvizmo ir postpozityvizmo ginčas.
More informationT. Mark Beasley One-Way Repeated Measures ANOVA handout
T. Mark Beasley One-Way Repeated Measures ANOVA handout Profile Analysis Example In the One-Way Repeated Measures ANOVA, two factors represent separate sources of variance. Their interaction presents an
More informationParametric versus Nonparametric Statistics-when to use them and which is more powerful? Dr Mahmoud Alhussami
Parametric versus Nonparametric Statistics-when to use them and which is more powerful? Dr Mahmoud Alhussami Parametric Assumptions The observations must be independent. Dependent variable should be continuous
More informationMultiple Comparisons
Multiple Comparisons Error Rates, A Priori Tests, and Post-Hoc Tests Multiple Comparisons: A Rationale Multiple comparison tests function to tease apart differences between the groups within our IV when
More informationAnalysis of repeated measurements (KLMED8008)
Analysis of repeated measurements (KLMED8008) Eirik Skogvoll, MD PhD Professor and Consultant Institute of Circulation and Medical Imaging Dept. of Anaesthesiology and Emergency Medicine 1 Day 2 Practical
More informationTHE EIGENVALUE PROBLEM FOR DIFFERENTIAL OPERATOR WITH NONLOCAL INTEGRAL CONDITIONS
VILNIUS GEDIMINAS TECHNICAL UNIVERSITY INSTITUTE OF MATHEMATICS AND INFORMATICS Živil JESEVIČIŪTö THE EIGENVALUE PROBLEM FOR DIFFERENTIAL OPERATOR WITH NONLOCAL INTEGRAL CONDITIONS SUMMARY OF DOCTORAL
More informationUsing SPSS for One Way Analysis of Variance
Using SPSS for One Way Analysis of Variance This tutorial will show you how to use SPSS version 12 to perform a one-way, between- subjects analysis of variance and related post-hoc tests. This tutorial
More informationWORKSHOP 3 Measuring Association
WORKSHOP 3 Measuring Association Concepts Analysing Categorical Data o Testing of Proportions o Contingency Tables & Tests o Odds Ratios Linear Association Measures o Correlation o Simple Linear Regression
More informationRare earth elements of Holocene sediments in the South- Eastern Baltic Region (Nida VI borehole, Lithuania)
GEOLOGIJA. 2013. Vol. 55. No. 1(81). P. 1 7 Lietuvos mokslų akademija, 2013 Rare earth elements of Holocene sediments in the South- Eastern Baltic Region (Nida VI borehole, Lithuania) Donatas Kaminskas,
More informationSignalų analizė ir apdorojimas
Signalų analizė ir apdorojimas Tadas Meškauskas Vilniaus universitetas, Matematikos ir informatikos fakultetas E-mail: tadas.meskauskas@mif.vu.lt Atnaujinta 2017 m. vasario 5 d. Turinys 1. Signalų kilmė,
More informationNonparametric Statistics. Leah Wright, Tyler Ross, Taylor Brown
Nonparametric Statistics Leah Wright, Tyler Ross, Taylor Brown Before we get to nonparametric statistics, what are parametric statistics? These statistics estimate and test population means, while holding
More informationRank-Based Methods. Lukas Meier
Rank-Based Methods Lukas Meier 20.01.2014 Introduction Up to now we basically always used a parametric family, like the normal distribution N (µ, σ 2 ) for modeling random data. Based on observed data
More informationANOVA continued. Chapter 10
ANOVA continued Chapter 10 Zettergren (003) School adjustment in adolescence for previously rejected, average, and popular children. Effect of peer reputation on academic performance and school adjustment
More informationV. Palenskis, J. Matukas, and B. Šaulys
Lithuanian Journal of Physics, Vol. 49, No. 4, pp. 453 460 (2009) doi:10.3952/lithjphys.49408 ANALYSIS OF ELECTRICAL AND OPTICAL FLUCTUATIONS OF LIGHT-EMITTING DIODES BY CORRELATION METHOD V. Palenskis,
More informationPanaudojamumo vertinimai Dr. Kristina Lapin
www.wordle.net Testavimas su naudotojais Mastymas garsiai Stebėjimai Apklausos Testavimas su naudotojais Panaudojamumo vertinimai Dr. Kristina Lapin 1 Turinys Panaudojamumo testavimai Tiesioginiai Panaudojamumo
More informationHilbert Schmidt component analysis
Lietuvos matematikos rinkinys ISSN 0132-2818 Proc. of the Lithuanian Mathematical Society, Ser. A Vol. 57, 2016 DOI: 10.15388/LMR.A.2016.02 pages 7 11 Hilbert Schmidt component analysis Povilas Daniušis,
More informationNon-parametric tests 2:
Non-parametric tests : Non-parametric tests for comparing three or more groups or conditions: (a) Kruskal-Wallis test: Similar to the Mann-Whitney test, except that it enables you to compare three or more
More informationPJŪTIES LAIKO POVEIKIS ŽIEMINIŲ KVIEČIŲ GRŪDŲ BALTYMŲ KIEKIUI IR SEDIMENTACIJOS RODIKLIUI
III skyrius. AUGALININKYSTĖ Chapter 3. CROP PRODUCTION ISSN 1392-3196 Žemdirbystė / Zemdirbyste / Agriculture, t. 95, Nr. 1 (2008), p. 58 72 UDK 633.11 324 :581.19.631.84:631.55.03 PJŪTIES LAIKO POVEIKIS
More informationPsy 420 Final Exam Fall 06 Ainsworth. Key Name
Psy 40 Final Exam Fall 06 Ainsworth Key Name Psy 40 Final A researcher is studying the effect of Yoga, Meditation, Anti-Anxiety Drugs and taking Psy 40 and the anxiety levels of the participants. Twenty
More informationSTRUCTURAL EQUATION MODEL (SEM)
STRUCTURAL EQUATION MODEL (SEM) V. Čekanavičius, G. Murauskas 1 PURPOSE OF SEM To check if the model of possible variable dependencies matches data. SEM can contain latent (directly unobservable) variables.
More informationŠIAULIŲ UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS INFORMATIKOS KATEDRA. Remigijus Valčiukas
ŠIAULIŲ UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS INFORMATIKOS KATEDRA Remigijus Valčiukas Informatikos specialybės magistrantūros II kurso dieninio skyriaus studentas Internetinė matematinio
More informationOptimizavimas ekonomikoje. Optimizavimas ekonomikoje 1 / 121
Optimizavimas ekonomikoje Optimizavimas ekonomikoje 1 / 121 Literat ura (1) K. Sydsæter, P. Hammond, A. Seierstad, A. Strøm Further Mathematics for Economic Analysis, FT Prentice Hall, 2008. M. D. Intriligator
More information