Projektas. SFMIS Nr. VP1-3.1-ŠMM-02-V SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA. Vydas Čekanavičius

Similar documents
SPSS Guide For MMI 409

Nijolė Cibulskaitė, Kristina Baranovska

1. BINARY LOGISTIC REGRESSION

DISKREČIOJI MATEMATIKA

Statistical analysis of design codes calculation methods for punching sheer resistance in column to slab connections

M A N O V A. Multivariate ANOVA. Data

VILNIUS UNIVERSITY LIJANA STABINGIENĖ IMAGE ANALYSIS USING BAYES DISCRIMINANT FUNCTIONS

LR Seimo narių elgsenos tyrimas, naudojant klasterinę analizę ir daugiamačių skalių metodą

Vango algoritmo analizė

GARSĄ SUGERIANČIŲ MEDŽIAGŲ IŠDĖSTYMO VIETŲ ĮTAKA SKAIČIUOJANT SALĖS AIDĖJIMO TRUKMĘ SKIRTINGOMIS FORMULĖMIS

Algebraic and spectral analysis of local magnetic field intensity

Why should I use a Kruskal-Wallis test? (With Minitab) Why should I use a Kruskal-Wallis test? (With SPSS)

Non-parametric tests, part A:

Reklamos internete vartotojų segmentavimas taikant latentinį Dirichlė paskirstymo modelį

S. Tamošiūnas a,b, M. Žilinskas b,c, A. Nekrošius b, and M. Tamošiūnienė d

NUOTOLINIŲ KURSŲ OPTIMIZAVIMAS

10 16 metų mokinių nuostatos dėl matematikos ir metakognityvaus sąmoningumo sąsaja

Lietuvių šnekos balsių aprašymo autoregresijos modeliu adekvatumo tyrimas

Introduction and Descriptive Statistics p. 1 Introduction to Statistics p. 3 Statistics, Science, and Observations p. 5 Populations and Samples p.

SPSS LAB FILE 1

SEVERAL μs AND MEDIANS: MORE ISSUES. Business Statistics

Lietuvos miškų pajaurėjusių, paprastųjų ir rudžemiškųjų smėlžemių granuliometrinės sudėties ypatumai

CALCULATION OF ELECTROMAGNETIC WAVE ATTENUATION DUE TO RAIN USING RAINFALL DATA OF LONG AND SHORT DURATION

Degrees of freedom df=1. Limitations OR in SPSS LIM: Knowing σ and µ is unlikely in large

VIEŠŲJŲ PASLAUGŲ PERKöLIMO IŠ TRADICINöS Į ELEKTRONINĘ TERPĘ BRANDOS LYGIO VERTINIMAS

Prepared by: Prof. Dr Bahaman Abu Samah Department of Professional Development and Continuing Education Faculty of Educational Studies Universiti

Types of Statistical Tests DR. MIKE MARRAPODI

CHAPTER 17 CHI-SQUARE AND OTHER NONPARAMETRIC TESTS FROM: PAGANO, R. R. (2007)

Sandra Mekšriūnaitė, Romualdas Gurevičius

Contents. Acknowledgments. xix

PAGERINTAS EURISTINIS ALGORITMAS DVIEJŲ SEKŲ BENDRO ILGIAUSIO POSEKIO PAIEŠKAI

DETAILED CONTENTS PART I INTRODUCTION AND DESCRIPTIVE STATISTICS. 1. Introduction to Statistics

Structural integrity verification of polycarbonate type personal identity documents

Discriminant Analysis

Analysis of variance

Rinktiniai informacijos saugos skyriai. 3. Kriptografija ir kriptografijos protokolai: Klasikinė kriptografija

ANALIZĖ 0: TEORINĖ ARITMETIKA

MATEMATINĖ STATISTIKA IR INFORMATIKA BIOMEDICINOJE

Skirtingų vasarinių miežių veislių jautrumas ozonui

Struktūrinė geologija

OCCASIONAL PAPER SERIES. No 6 / 2015 A NOTE ON THE BOOTSTRAP METHOD FOR TESTING THE EXISTENCE OF FINITE MOMENTS

METHODS FOR GENERATION OF RANDOM NUMBERS IN PARALLEL STOCHASTIC ALGORITHMS FOR GLOBAL OPTIMIZATION

1 DV is normally distributed in the population for each level of the within-subjects factor 2 The population variances of the difference scores

Kurso tikslai. 1 Įgyti galimybę skaitiškai spręsti taikomuosius uždavinius; 2 Įvertinti skirtingus skaitinius sprendimo metodus (žinant jų

Vidutinės oro temperatūros dinamika Lietuvoje

Stochastinės analizės egzaminas MIF magistrantūra, FDM I kursas, 2018 m. ruduo (1 semestras), X s db s, t 0.

Ekonometrinių modelių pritaikymas OMXV indekso pokyčių prognozavimui

ESP 178 Applied Research Methods. 2/23: Quantitative Analysis

1 Kompiuterių aritmetika ir algoritmai. 2 Tiesinių lygčių sistemų sprendimo metodai: 3 Duomenų aproksimacija: 4 Tikrinių reikšmių uždavinys.

Random Factors in IOI 2005 Test Case Scoring

CHI SQUARE ANALYSIS 8/18/2011 HYPOTHESIS TESTS SO FAR PARAMETRIC VS. NON-PARAMETRIC

Short Term Wind Speed Forecasting with ANN in Batman, Turkey

Tranzistoriai. 1947: W.H.Brattain and J.Bardeen (Bell Labs, USA)

Data are sometimes not compatible with the assumptions of parametric statistical tests (i.e. t-test, regression, ANOVA)

PSY 307 Statistics for the Behavioral Sciences. Chapter 20 Tests for Ranked Data, Choosing Statistical Tests

Research of the Grid-Tied Power System Consisting of Wind Turbine and Boiler GALAN

Prognosis of radionuclides dispersion and radiological measurements in Lithuania after the accident at Fukushima Daiichi nuclear

LIETUVOS ENERGETIKOS STRATEGIJA: OPTIMALIOS RENOVACIJOS MODELIS (ORM) (projektas pastaboms)

Workshop Research Methods and Statistical Analysis

8 laboratorinis darbas Klasterinė ir diskriminantinė analizė

Nonparametric Statistics

MULTINOMIAL LOGISTIC REGRESSION

Turinys. Geometrinės diferencialinių lygčių teorijos savokos. Diferencialinės lygties sprendiniai. Pavyzdžiai. CIt, (- 00,0) C'It, (0, (0);

Algoritmų analizės specialieji skyriai

Selection should be based on the desired biological interpretation!

VILNIAUS UNIVERSITETAS PAGRINDAI. Mokymo priemonė

Repeated-Measures ANOVA in SPSS Correct data formatting for a repeated-measures ANOVA in SPSS involves having a single line of data for each

4/6/16. Non-parametric Test. Overview. Stephen Opiyo. Distinguish Parametric and Nonparametric Test Procedures

DISKREČIOJI MATEMATIKA

..,, .. -, ..,.. : - ., ISBN. Excel, SPSS Statistica. Statistica 6.0,,, OpenOffice.org Calc.

Electrochemical investigations of Ni P electroless deposition in solutions containing amino acetic acid

R. Plukienė a, A. Plukis a, V. Remeikis a, and D. Ridikas b a Institute of Physics, Savanorių 231, LT Vilnius, Lithuania

Įvairiuose projektuose nustatytų vidutinių Lietuvos dirvožemio parametrų

Iracionalieji skaičiai

The Burg Algorithm with Extrapolation for Improving the Frequency Estimation

Non-invasive ultrasonic level measurement technology

KAUNO TECHNOLOGIJOS UNIVERSITETAS MATLAB/SIMULINK PROGRAMŲ TIPINIŲ OPTIMIZAVIMO METODŲ TYRIMUI SUKŪRIMAS

Textbook Examples of. SPSS Procedure

ISSN Evaldas Nekrašas, 2010 Straipsnis įteiktas redakcijai 2009 m. lapkričio 5 d. Straipsnis pasirašytas spaudai 2010 m. vasario 2 d.

T. Mark Beasley One-Way Repeated Measures ANOVA handout

Parametric versus Nonparametric Statistics-when to use them and which is more powerful? Dr Mahmoud Alhussami

Multiple Comparisons

Analysis of repeated measurements (KLMED8008)

THE EIGENVALUE PROBLEM FOR DIFFERENTIAL OPERATOR WITH NONLOCAL INTEGRAL CONDITIONS

Using SPSS for One Way Analysis of Variance

WORKSHOP 3 Measuring Association

Rare earth elements of Holocene sediments in the South- Eastern Baltic Region (Nida VI borehole, Lithuania)

Signalų analizė ir apdorojimas

Nonparametric Statistics. Leah Wright, Tyler Ross, Taylor Brown

Rank-Based Methods. Lukas Meier

ANOVA continued. Chapter 10

V. Palenskis, J. Matukas, and B. Šaulys

Panaudojamumo vertinimai Dr. Kristina Lapin

Hilbert Schmidt component analysis

Non-parametric tests 2:

PJŪTIES LAIKO POVEIKIS ŽIEMINIŲ KVIEČIŲ GRŪDŲ BALTYMŲ KIEKIUI IR SEDIMENTACIJOS RODIKLIUI

Psy 420 Final Exam Fall 06 Ainsworth. Key Name

STRUCTURAL EQUATION MODEL (SEM)

ŠIAULIŲ UNIVERSITETAS MATEMATIKOS IR INFORMATIKOS FAKULTETAS INFORMATIKOS KATEDRA. Remigijus Valčiukas

Optimizavimas ekonomikoje. Optimizavimas ekonomikoje 1 / 121

Transcription:

Projektas Lietuvos HSM duomenų archyvo LiDA plėtra SFMIS Nr. VP1-3.1-ŠMM-02-V-02-001 SEMINARO INFERENCINĖ STATISTIKA SOCIALINIUOSE MOKSLUOSE MEDŽIAGA Vydas Čekanavičius (Paslaugų sutartis Nr. SA-2010-771/2, 2010-12-22) Kaunas, 2011 m. 1

Turinys 1. Įvadas į statistinių hipotezių tikrinimą... 3 2. Hipotezių apie vidurkių lygybes tikrinimas... 6 2.1 T testas 1 imčiai... 6 2.2. T testas 2 nepriklausomoms imtims... 7 2.3 T testas 2 priklausomoms imtims (porinis t testas)... 9 2.4 ANOVA... 10 2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA)... 13 3. Neparametriniai kriterijai... 15 3.1 Mann Whitney testas... 16 3.2 Wilcoxon testas... 17 3.3 Kruskal Wallis testas... 18 3.4 Friedman testas... 20 4. Požymių priklausomumo (kryžminių lentelių) analizė.... 21 4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas... 21 4.2 Chi kvadrato suderinamumo testas... 23 Literatūra... 25 2

1. Įvadas į statistinių hipotezių tikrinimą Statistinės išvados (inferencinė statistika) turi vienintelį tikslą ištyrus dalį respondentų (imtį, imtis), padaryti išvadą apie visą populiaciją (populiacijas). Įsivaizduokime dvi situacijas: 1) Virėjas paragauja sriubos ir nusprendţia trūksta druskos. 2) Ekranţvaigţdė visiems TV ţiūrovams paaiškina visi jie tokie! Abi šios išvados yra akivaizdţiai statistinės. Virėjas prarijo šaukštą sriubos, o išvadą padarė apie visą puodą. Ekranţvaigţdė savo patirtį apibendrino pagal gal ir nemaţą dalį, bet vis tiek tik dalį visų jų. Matome, kad kartais apibendrinimai visiškai tikėtini (virėjas), o kartais labai abejotini (ţvaigţdė). Inferencinėjs statistikoje viskas formalizuojama ir dar įvertinama, kiek galima tikėti priimtu sprendimu. Visą statistinių hipotezių tikrinimą galima išskaidyti į tokius etapus: a) Tyrimo hipotezės iškėlimas. b) Statistinės hipotezės formulavimas. c) Duomenų analizė. d) Išvadų surašymas. Aptarsime kiekvieną etapą atskirai. Tyrimo hipotezė tai ta problema, kuri iš tikrųjų ir jaudina tyrėją. Ji glaudţiai susijusi su tyrimo srities specifika. Pavyzdţiui, hipotezė, kad latviai valgo daugiau ţuvies, nei lietuviai, yra sociologo (ar kulinaro, ar mediko) tyrimo hipotezė. Ji grindţiama istoriniu kontekstu Latvija visą laiką buvo jūrų valstybė, o Lietuva tik priešokiais, kai prasibrukdavo prie Baltijos per kryţiuočius. Statistikos čia dar nėra. Kai politikas pasamprotauja, kad parlamentarų darbo efektyvumas išaugs, jei jie kalbas sakys, stovėdami ant vienos kojos (kairieji ant kairės, dešinieji ant dešinės), tai irgi yra tyrimo, o ne statistinė hipotezė. Ji grindţiama ne faktais, o loginiu samprotavimu, kad tada šnekama bus trumpiau ir labiau iš esmės. Statistinė hipotezė tai tyrimo hipotezės formalizavimas (ir truputį matematizavimas). Visų pirma, atitrūkstama nuo specifikos ir viskas uţrašoma standartiniais terminais. Jeigu lyginamos vidutinės reikšmės, tai statistinė hipotezė formuluojama vidurkiams. Jeigu kalbama apie kintamųjų priklausomybę, tai daţniausiai statistinė hipotezė keliama apie koreliacijos tarp kintamųjų stiprumą. Standartinėse statistinėse hipotezėse naudojami tik šie terminai: vidurkiai, dispersijos,proporcijos (procentai), koreliacija. Neparametrinėje statistikoje dar lyginami skirstiniai. Tarkime, norint įvertinti parlamentarų darbo efektyvumą, galima tiesiog kalbėti apie vidutinį sprendimo priėmimo laiką. Norėdami išsiaiškinti, ar vienakojis šnekėjimo metodas iš esmės efektyvesnis, turime 3

ankstesnį vidutinį sprendimų priėmimo laiką (paţymėkime jį simboliu a) palyginti su vienakojiškų sprendimų vidutiniu laiku (paţymėkime jį simboliu ). Visos statistinės hipotezės formuluojamos, kaip du alternatyvūs teiginiai: H 0 (nulinė hipotezė), tai teiginys apie parametrų skirtumų nebuvimą, o H 1 (alternatyvioji hipotezė) teiginys, kad parametrai skiriasi. H 0 : parametrų skirtumas yra lygus nuliui. H 1 : parametrų skirtumas yra nelygus nuliui. Net ir neparametrinėse hipotezėse skirtumas skelbiamas tik alternatyvoje H 1. Pavyzdyje apie politikus statistinė hipotezė uţrašoma taip: H 0 : = a, H 1 : a Ţinoma, yra ir vienpusių alternatyvų, pavyzdţiui H 1 : a. Reikia tik atsiminti, kad griežtos nelygybės rašomos tik alternatyvose H 1. Jos niekada nerašomos nulinėje hipotezėje H 0. Duomenų analizė tai tinkamo statistinio kriterijaus parinkimas ir taikymas. Tiriama tik dalis populiacijos (imtis), o apibendrinama visai populiacijai. Taip ir apsirikti galima. Klaidingi sprendimai gali būti dviejų rūšių: kai be reikalo atmetame H 0 (vadinamoji pirmos rūšies klaida) ir, kai H 0 neteisinga, o mes jos neatmetame (vadinamoji antros rūšies klaida). Minimizuoti abiejų rūšių klaidas neįmanoma, todėl visuotinai sutarta daugiau dėmesio skirti pirmos rūšies klaidai. Kaip taisyklė, daţniausiai siekiama parodyti, kad galioja H 1. Pavyzdţiui, politikas norėtų įrodyti, kad jo siūlomas sprendimų pagreitinimo metodas veikia. Todėl iš anksto nusistatoma, koks maksimalus leistinas neteisingų H 0 atmetimų procentas. Tai vadinamasis reikšmingumo lygmuo. Daţniausiai naudojamas reikšmingumo lygmuo yra 0,05. Tai reiškia, kad jeigu jau H 0 atmesime, tai klaidos tikimybė neviršys 5%. Šiais laikais, kai statistinių hipotezių tikrinimui visuotinai naudojamos statsitinė programos, sprendimai priimami atsiţvelgus į vadinamąsias p reikšmes. P reikšmė tai konkretiems tiriamiems duomenims apskaičiuota tikimybė, atmetant H 0, padaryti klaidą. Šis apibrėţimas skamba labai panašiai, kaip reikšmingumo lygmens apibrėţimas. Vis dėlto yra esminis skirtumas reikšmingumo lygmuo, tai teorinis etalonas, nurodantis leistiną klaidingų sprendimų procentą, o p reikšmė yra konkreti konkretaus sprendimo klaidos tikimybė. Ji gali būti daug maţesnė uţ reikšmingumo lygmenį (tada galima atmesti H 0 ), o gali jį ir viršyti (tada H 0 neatmetame). 4

Reikšmingumo lygmuo iš anksto pasirinktas idealas (ne daugiau 5% klaidų), o p-reikšmė kiekvienai duomenų aibei sava tikimybė. H 0 atmetame, kai p-reikšmė < 0,05 (reikšmingumo lygmuo). Kuo imtis didesnė, tuo p reikšmė maţesnė (jau taip jos skaičiuojamos). Todėl labai didelėms imtims galime gauti maţas p reikšmes, vien dėl duomenų gausos. Nors trokštamos išvados daromos apie populiacijos parametrus, jos visada formuluojamos, imties duomenims ir visada naudojant ţodţių derinį statistiškai (ne)reikšminga. Ši frazė grynų gryniausias ţargonizmas. Ji tereiškia, kad (ne)labai tikėtina, jog H 0 neteisinga. Pavyzdţiui, sakinys imties vidurkis statistiškai reikšmingai skiriasi nuo skaičiaus a, tereiškia tokį samprotavimą: sprendţiant iš imties duomenų, tikimybė, kad tikrasis vidurkis skiriasi nuo a labai didelė (didesnė uţ 0,95, t.y. 95 %). Teiginys imties vidurkis statistiškai reikšmingai nesiskiria nuo skaičiaus a tereiškia, kad tikimybė, kad tikrasis vidurkis skiriasi nuo a maţesnė uţ 95 %. Bet tai dar nereiškia, kad galima teigti, jog vidurkis lygus a. Gal lygus, o gal nelygus. Tiesiog pritrūko įrodymų, kad nelygus. Panašiai, kaip paleidţiant įtariamąjį dėl įrodymų stokos. Frazė statistiškai reikšmingas skirtumas interpretuotina taip: imtyje uţfiksuotas toks didelis skirtumas, jog labai tikėtina, kad tai neatsitiktinumas ir toks skirtumas egzistuoja ir populiacijoje. Reikia nepamiršti, kad statistiškai reikšmingi skirtumai gali atsirasti ir dėl didelio duomenų skaičiaus. Todėl nereikia maišyti sąvokų statistiškai reikšmingas skirtumas ir prasmingas skirtumas. Statistiškai reikšmingai sprendimas priimamas greičiau. Visomis trimis sekundėmis. Pelnas išaugo statistiškai reikšmingai. Visu centu per metus. Ir ką labai daug prasmės tokiame statistiniame reikšmingume? Statistiškai reikšmingas skirtumas gali būti visai nesvarbus tyrėjo išvadoms. Įvado pabaigai priminsime keletą, ţemiau naudojamų sąvokų. Skirstinys: Kintamojo įgyjamos reikšmės ir jų įgijimo tikimybės. Maţdaug: ţinau visas galimas matuojamo kintamojo reikšmes ir kiek procentų respondentų populiacijoje jas turi. Normalus kintamasis: kintamasis, kuris turi normalųjį skirstinį. Jo reikšmės išsibarsčiusios pagal pakankamai bjauriai matematiškai aprašomą dėsnį. Praktikoje intervaliniai kintamieji, kurių 5

dauguma reikšmių yra netoli vidurkio ir kurie pakankamai simetriški laikomi beveik normaliais. Normalių kintamųjų histogramos: Visuose pavyzdţiuose naudojami duomenys paimti iš http://www.lidata.eu/. Tyrimuose naudosime: 1) Studijų rezultatų kokybė: universitetų absolventų integracijos darbo rinkoje tyrimas duomenis: LiDA0146_LAMS_STUDY_F1. 2) 2008 metų Europos Sąjungos socialinio klausimyno (European Social Survey) Lietuvos, Estijos ir Portugalijos duomenis ESS4LT, ESS4EE ir ESS4PT. 3) Lietuvos vartotojų 2005 m tyrimas LiDA003_ZTLT_F1. 2. Hipotezių apie vidurkių lygybes tikrinimas 2.1 T testas 1 imčiai Visų pirma susitarsime dėl terminų: Stjudento kriterijai dar vadinami t testais. Ir atvirkščiai. Duomenys: 1 normali intervalinė imtis. Statistinė hipotezė: H 0 atmetame (imties vidurkis statistiškai reikšmingai skiraisi nuo a), jei p-reikšmė < 0,05. 6

Pavyzdys: Ar 20-30 metų lietuvės savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina 6? Failas ESS4LT: Su Select Cases atsirenkame reikiamas respondentes. Tada renkamės Analyze Compare Means One sample T test. Į langelį Test Variable(s) įkeliame happy, o langelyje Test Value uţrašome 6. Paspaudţiame OK. Pirmojoje lentelėje pateikiamas imties vidurkis 6.88 (144 respondentai). One-Sample Statistics N Mean Std. Deviation Std. Error Mean happy How happy are you 144 6.88 1.857.155 Antrojoje lentelėje stulpelyje Sig. (2-tailed) uţrašyta p reikšmė = 0,000. Kadangi p < 0,05, tai darome išvadą, jog tiriamos amţiaus grupės lietuvių laimingumo vidurkis (6.8) statistiškai reikšmingai didesnis uţ 6. One-Sample Test Test Value = 6 t df Sig. (2-tailed) Mean Difference 95% Confidence Interval of the Difference Lower Upper happy How happy are you 5.700 143.000.882.58 1.19 2.2. T testas 2 nepriklausomoms imtims Duomenys: 2 normalios nepriklausomos intervalinės imtys. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. 7

Pavyzdys: Ar 20-30 metų lietuviai ir estai vyrai savo laimę skalėje nuo 1 iki 10 vidutiniškai vertina vienodai? Failai ESS4LT ir ESS4EE. Pradţioje su komanda Data Merge Files sujungiame abudu failus. Renkamės Analyze Compare Means Independent Samples T Test. Į langelį Test Variable(s) įkeliame happy, o į langelį Grouping variable kintamąjį cntry. Paspaudţiame Define Groups ir įrašome Lietuvos ir Estijos kodus: Spaudţiame Continue ir OK. Rezultatų išklotinė prasideda nuo imčių vidurkių. Group Statistics cntry Country N Mean Std. Deviation Std. Error Mean happy How happy are you LT Lithuania 179 7.00 1.735.130 EE Estonia 136 6.68 1.965.169 8

Matome, kad Lietuvos piliečių vidutinis laimingumas yra 6.68, o estai truputį laimingesni jų laimingumo vidurkis yra 7,0. Norint nustatyti, ar vidurkių skirtumas yra statistiškai reikšmingas, reikia kitoje lentelėje surasti tinkamą p reikšmę. SPSS pateikia net du t testo variantus. Vienas jų skirtas atvejui, kai dispersijos lygios, o kitas kai dispersijos nelygios. Formaliai sprendimas daromas taip: pasiţiūrima į stulpelyje Levene s Test for Equality of Variances Sig. esančią reikšmę. Jeigu ji 0,05, tai t testo p reikšme laikoma viršutinis stulpelyje t-test for Equality of Means Sig. (2-tailed) esantis skaičius. Priešingu atveju apatinis skaičius. Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Sig. Interval of the (2- Mean Std. Error Difference F Sig. t df tailed) Difference Difference Lower Upper happy How happy are you Equal variances assumed Equal variances not assumed 3.467.064 1.512 313.131.316.209 -.095.728 1.487 270.359.138.316.213 -.102.735 Matome, kad t testo p reikšmė yra lygi 0,131 > 0,05. Todėl darome išvadą, kad 20-30 metų lietuvių ir estų vidutiniai laimingumo vertinimai statistiškai reikšmingai nesiskiria. 2.3 T testas 2 priklausomoms imtims (porinis t testas) Duomenys: poriniai normalieji stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar 20-25 metų Lietuvos respondentai vienodai vertina švietimą ir sveikatos prieţiūros įstaigas? Failas ESS4LT. Vertinimo skalė nuo 0 (labai nepatinka) iki 10 (labai patinka). Atsirenkame norimo amţiaus respondentus. Tada renkamės Analyze Compare Means Paired Samples T Test. Į laukelį Paired-Samples T Test įkeliame kintamuosius stfedu ir stfhlth. Paspaudţiame OK. 9

Rezultatų išklotinėje matome, kad mokslo lygiu lietuviai pasitiki šiek tiek labiau (vid. 4,09), nei sveikatos prieţiūra (vid. 3,59). Paired Samples Statistics Mean N Std. Deviation Std. Error Mean Pair 1 stfedu 4.09 139 2.519.214 stfhlth 3.59 139 2.398.203 Lentelėje Paired Samples Test susiradę Sig. (2 tailed) matome, kad p reikšmė = 0,007 < 0,05. Todėl darome išvadą, kad mokslas vertinamas statistiškai reikšmingai palankiau, nei sveikatos prieţiūra. Paired Samples Test Paired Differences 95% Confidence Interval of the Std. Std. Error Difference Sig. (2- Mean Deviation Mean Lower Upper t df tailed) Pair 1 stfedu - stfhlth.504 2.158.183.142.866 2.751 138.007 2.4 ANOVA ANOVA vienfaktorės dispersinės analizės trumpinys (angl. Analysis Of Variance). Pavadinimas klaidinantis. ANOVA lygina dviejų ar daugiau nepriklausomų imčių vidurkius. Tai t testo nepriklausomoms imtims apibendrinimas. Tiesiog hipotezė tikrinama, palyginant dviem būdais įvertintą kintamųjų dispersiją: laikant, kad vidurkiai lygūs ir, kad ne. Iš čia ir ţodis dispersinė pavadinime. Duomenys: 2 ar daugiau nepriklausomų normaliųjų imčių. Visų imčių dispersijos turi būti panašios. Standartinis reikalavimas visi standartiniai nuokrypiai skiriasi ne daugiau nei dvigubai. Statistinė hipotezė: 10

H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar 20-25 m lietuviai, estai ir portugalai vienodai vertina savo laimingumą? Failus ESS4LT, ESS4EE ir ESS4PT sujungiame į vieną. Su komanda Automatic Record perkoduojame kintamąjį cntry į skaitinį kintamąjį Acountry (1 Estija, 2 Lietuva, 2 Portugalija). Su Select Cases atsirenkame reikiamus respondentus. Pasirenkame: Analyze Compare Means One- Way ANOVA. Į langelį Dependent List įkeliame happy, į langelį Factor Acountry. Pasirenkame Post Hoc ir paţymime Bonferroni. Paspaudę Continue, renkamės Options. Paţymime Descriptives ir Means plot. Tada spaudţiame Continue ir OK. 11

Rezultatų išklotinė prasideda nuo aprašomosios statistikos. Matome, kad vidutinis estų laimingumas yra pats maţiausias, o portugalai patys laimingiausi. Standartiniai nuokrypiai yra labai panašūs, nė vienas nėra didesnis uţ kitus daugiau nei dvigubai. happy How happy are you Descriptives 95% Confidence Interval for Mean N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum 1 Estonia 80 6.29 2.039.228 5.83 6.74 2 10 2 Lithuania 103 6.97 1.729.170 6.63 7.31 3 10 3 Portugal 78 7.41 1.670.189 7.03 7.79 2 10 Total 261 6.89 1.859.115 6.67 7.12 2 10 Pagrindinėje ANOVA lentelėje suradę p reikšmę p = 0,001, padarome išvadą, kad ne visų grupių vidurkiai vienodi (yra statistiškai reikšmingai besiskiriančių vidurkių). ANOVA happy How happy are you Sum of Squares df Mean Square F Sig. Between Groups 50.824 2 25.412 7.730.001 Within Groups 848.172 258 3.287 Total 898.996 260 Lentelėje Multiple Comparisons matome Bonferoni testo rezultus. Statistiškai reikšmingi vidurkių skirtumai paţymėti ţvaigţdutėmis. Estai skairiasi nuo lietuvių ir nuo portugalų, o lietuviai ir portugalai savo laimingumu statistiškai reikšmingai nesiskiria. happy How happy are you Bonferroni Multiple Comparisons (I) Acountry (J) Acountry Mean 95% Confidence Interval Country Country Difference (I-J) Std. Error Sig. Lower Bound Upper Bound 1 Estonia 2 Lithuania -.683 *.270.036-1.33 -.03 3 Portugal -1.123 *.289.000-1.82 -.43 2 Lithuania 1 Estonia.683 *.270.036.03 1.33 3 Portugal -.439.272.323-1.10.22 3 Portugal 1 Estonia 1.123 *.289.000.43 1.82 2 Lithuania.439.272.323 -.22 1.10 *. The mean difference is significant at the 0.05 level. Rezultatų išklotinė baigiasi vidurkių grafiku. 12

Išvadas galima aprašyti taip: taikėme ANOVA. Gavome, kad gyvenamoji vieta ir laimingumas statistiškai reikšmingai susiję (p = 0,007). Pagal Bonferoni kriterijų vidutinis estų laimingumas statistiškai reikšmingai skiriasi nuo lietuvių ir portugalų laimingumo. Lietuvių ir portugalų vidutiniai laimingumai statistiškai reikšmingai nesiskiria. 2.5 Blokuotų duomenų ANOVA (pakartotinų matavimų ANOVA) Porinio T testo apibendrinimas, kai imčių gali būti daugiau uţ 2. Duomenys: dviejų, ar daugiau, normaliųjų stebėjimų vektoriai (x,y,z,...). Statistinė hipotezė: H 0 atmetame (kažkurie imčių vidurkiai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar Lietuvos 20-25 m respondentai vienodai palankiai vertina partijas, teisinę sistemą ir Europarlamentą? Failas ESS4LT. Atsirenkame reikiamo amţiaus respondentus. Pasirenkame Analyze General Linear Model Repeated Measures. Langelyje Number of Levels nurodome kelių stulpelių vidurkius lyginsime (3), paspaudţiame Add, po to Define. Atsidariusiame langelyje perkeliame kintamuosius trstprt, trstlgl, trstep į Within Subject Variables. Renkamės Options. 13

Perkeliame factor1 į Display Means for, paţymime laukelį Compare main effects, ir pasirenkame Bonferroni. Paţymime Descriptive statistics. Tada Continue ir OK. Rezultatų išklotinėje pateikti vidurkiai (skalė 1 visiškai nepasitikiu,...,10 visiškai pasitikiu): Descriptive Statistics Mean Std. Deviation N trstprt 1.88 2.016 151 trstlgl 3.50 2.503 151 trstep 4.87 2.751 151 Ar yra statistiškai besiskiriančių vidurkių, suţinome paţiūrėję į lentelę Tests of Within-Subjet Effects, stulpelį Sig. Šiuo atveju visos p reikšmės yra statistiškai reikšmingos (pagrindinė p reikšmė yra eilutėje Sphericity Assumed). Taigi yra statistiškai reikšmingai besiskiriančių vidurkių. Measure:MEASURE_1 Source Tests of Within-Subjects Effects Type III Sum of Squares df Mean Square F Sig. factor1 Sphericity Assumed 675.024 2 337.512 116.164.000 Greenhouse-Geisser 675.024 1.876 359.828 116.164.000 Huynh-Feldt 675.024 1.899 355.484 116.164.000 Lower-bound 675.024 1.000 675.024 116.164.000 Bonferoni testo rezultatai yra lentelėje Pairwise Comparisons. Matome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Išvada: pritaikius blokuotų duomenų ANOVA ir Bonferoni testą, gavome, kad statistiškai reikšmingai skiriasi visų trijų institucijų vertinimų vidurkiai. Palankiausiai vertinamas Europarlamentas (vid. 4.87 balo), blogiau teisinė 14

sistema (vid. 3,50 balo). Visų nepalankiausiai vertinamos partijos (vid. 1,88 balo). Visos institucijos vertinamos blogiau, nei vidutiniškai. Measure:MEASURE_1 Pairwise Comparisons 95% Confidence Interval for Mean Difference a (I) factor1 (J) factor1 Difference (I-J) Std. Error Sig. a Lower Bound Upper Bound 1 2-1.616 *.169.000-2.025-1.206 3-2.987 *.209.000-3.493-2.480 2 1 1.616 *.169.000 1.206 2.025 3-1.371 *.208.000-1.873 -.868 3 1 2.987 *.209.000 2.480 3.493 2 1.371 *.208.000.868 1.873 Based on estimated marginal means *. The mean difference is significant at the.05 level. a. Adjustment for multiple comparisons: Bonferroni. 3. Neparametriniai kriterijai Tai kriterijai, kuriems uţtenka rangų ir nereikia, kad kintamieji būtų normalūs. Išvadas visada sunkiau suformuluoti ir kitiems išaiškinti. Kai visi skaičiai išrikiuojami nuo maţiausio iki didţiausio, tai iš esmės rangas nurodo, kurioje pozicijoje konkretus stebėjimas atsidūrė. Nuo pozicijos numerio rangas skiriasi tik tada, kai yra vienodo didumo stebėjimai, nes jų rangai turi būti lygūs. Stebėjimai: 1, 3, 7, 12, 23, 25, 25, 48. Pozicijos nr: 1, 2, 3, 4, 5, 6, 7, 8. Rangai: 1, 2, 3, 4, 5, 6.5, 6.5, 8. Neparametriniuose kriterijuose lyginami skirstiniai, t.y. bandoma viso labo nustatyti, kurioje imtyje daugiau didesnių skaičių. Beveik visada tai reiškia, kad išrikiuojame abiejų (visų) imčių stebėjimus į vieną eilutę, suranguojame, o tada surandame vidutinius rangus (angl. mean rank). Ta imtis, kurios vidutinis rangas didesnis ir įgyja daugiau didesnių reikšmių. Vidutinis rangas nėra stebėjimų vidurkis, nes rangas nėra tas pats, kas stebėjimas. Jeigu dešimtas stovi metro dvidešimties ūgio respondentas, tai rangas bus dšimt (jei kaimynų ūgiai skiriasi), o stebėjimas 1,20 m. 15

3.1 Mann Whitney testas T kriterijaus nepriklausomoms imtims analogas. Duomenys: Dvi nepriklausomos intervalinės arba ranginės (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imtys. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu baigusieji ekonomiką vyrai ir moterys? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame ekonomiką baigusius (K8=57). Nuomonė apie algą yra ranginė (K37_4: 1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Independent Samples. Kintamąjį K37_4 keliame į Test Variable List, kintamąjį D1 į Grouping Variable ir nurodome lyties kodus. Spaudţiame OK. Rezultatų išklotinėje matome, kad vyrai palankiau vertina savo algą (mean rank = 53,32), nei moterys (41,91). Ranks D1 Lytis N Mean Rank Sum of Ranks K37_4 1 Moteris 55 41.91 2305.00 2 Vyras 37 53.32 1973.00 Total 92 16

Kitoje lentelėje suradę Asymp.Sig. (2-tailed), įsitikiname, kad p reikšmė =0,035 < 0,05. Darome išvadą, kad vyrai statistiškai reikšmingai palankiau vertina savo atlyginimą, nei moterys. Test Statistics a K37_4 K37_4 Pasitenkinimas atlyginimu uþ esamà darbà Mann-Whitney U 765.000 Wilcoxon W 2305.000 Z -2.105 Asymp. Sig. (2-tailed).035 a. Grouping Variable: D1 D1 Lytis 3.2 Wilcoxon testas T porinio kriterijaus analogas. Duomenys: poriniai intervaliniai arba ranginiai (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimai. Statistinė hipotezė: H 0 atmetame (imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: : Ar vienodai patenkinti atlyginimu ir darbo sąlygomis baigusieji psichologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame psichologiją baigusius (K8=60). Nuomonė apie algą ir darbo sąlygas yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) 2 Related Samples. Kintamuosius K37_3 ir K37_4 keliame į Test Pairs, spaudţiame OK. 17

Rezultatų išklotinėje matome, kad vidutinis rangas yra didesnis atveju, kai K37_4 < K37_3. Ranks N Mean Rank Sum of Ranks K37_4 - K37_3 Negative Ranks 26 a 14.63 380.50 Positive Ranks 4 b 21.13 84.50 Ties 9 c Total 39 a. K37_4 < K37_3 b. K37_4 > K37_3 c. K37_4 = K37_3 Suradę kitoje lentelėje Asymp.Sig.(2-tailed), įsitikiname, kad p = 0,002 < 0,05. Darome išvadą, kad statistiškai reikšmingai palankiau vertinamos darbo sąlygos, nei gaunamas atlyginimas. Test Statistics b K37_4 - K37_3 Z -3.133 a Asymp. Sig. (2-tailed).002 3.3 Kruskal Wallis testas ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: Dvi ar daugiau nepriklausomų intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) imčių. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar 20-25 m lietuviai, estai ir portugalai vienodai vertina savo pasitenkinimą gyvenimu? Failai ESS4LT, ESS4EE, ESS4PT. Sujungiame failus (Merge Files) ir atsirenkame tinkamo amţiaus respondentus. Su Automatic Recode sukuriame skaitinį, šalį nurodantį, kintamąjį Acountry. Pasitenkinimas gyvenimu (kintamasis stflife) įgyja reikšmes nuo 1 labai nepatenkintas, iki 10 labai patenkintas. Pasirenkame Analyze Nonparametric Tests (Legacy Dialogs) K Independent Samples. Į langelį Test Variable List įkeliame kintamąjį stflife. Į langelį 18

Grouping Variable įkeliame Acountry ir nurodome jo maţiausią (1) ir didţiausią (3) kodus. Spaudţiame OK. Pagal vidutinius rangus darome išvadą, kad palankiausiai gyvenimą vertina lietuviai, o nepalankiausiai portugalai. Ranks Acountry Country N Mean Rank stflife How satisfied with life as a whole 1 Estonia 159 249.21 2 Lithuania 162 197.95 3 Portugal 153 267.21 Total 474 Grafoje Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05. Todėl darome išvadą, kad yra statistiškai reikšmingų skirtumų tarp Lietuvos, Estijos ir Portugalijos jaunimo poţiūrių į gyvenimą. Test Statistics a,b stflife How satisfied with life as a whole Chi-Square 22.387 df 2 Asymp. Sig..000 a. Kruskal Wallis Test Svarbu: niekur neminėjome vidurkių (geriausiu atveju vidutinius rangus) ir netaikėme Post Hoc testų (nes jų nėra). Todėl atsakymas ganėtinai dalinis, ne taip, kaip taikant ANOVA. 19

3.4 Friedman testas Blokuotų duomenų ANOVA neparametrinis analogas (bet be post hoc testų). Duomenys: 2 ar daugiau intervalinių arba ranginių (kintamasis įgyja bent 5 skirtingas rangines reikšmes) stebėjimų vektoriai. Statistinė hipotezė: H 0 atmetame (kažkurie imčių skirstiniai statistiškai reikšmingai skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar vienodai patenkinti atlyginimu, darbo sąlygomis ir darbo pobūdţiu baigusieji politologiją? Failas LiDA0146_LAMS_STUDY_F1. Atsirenkame politologiją baigusius (K8=52) respondentus. Nuomonė apie algą, darbo sąlygas ir darbo pobūdį yra ranginė (1- labai ne, 5 labai taip). Renkamės Analyze Nonparametric Tests (Legacy Dialogs) K Related Samples. Kintamuosius K37_2, K37_3 ir K37_4 keliame į Test Variables, spaudţiame OK. Lentelėje Ranks nurodyti kintamųjų vidutiniai rangai. Friedman kriterijaus atveju jie rodo, kokią vidutiniškai vietą tarp trijų kintamųjų pagal savo didumą uţima kiekvienas kintamasis. Aiškiai matyti, kad nepalankiausiai įvertinta nuomonė apie atlyginimą (jeigu visi respondentai šiam kintamajam būtų skyrę maţiausius balus, vidurkis būtų 1, o dabar jis 1,37). Ranks Mean Rank K37_2 2.28 K37_3 2.35 K37_4 1.37 20

Test Statistics a N 30 Chi-Square 27.519 df 2 Asymp. Sig..000 Nors skirtumai statistiškai reikšmingi (Asymp.Sig. pateikta p reikšmė = 0,000 < 0,05) vis dėlto tegalima padaryti išvadą, kad yra statistiškai reikšmingų skirtumų, vertinant darbo pobūdį, sąlygas ir atlyginimą ir pasamprotauti apie tai, kuo labiausiai nepatenkinti respondentai. Taip, kaip parašėme aukščiau. Post hoc kriterijų nėra. 4. Požymių priklausomumo (kryžminių lentelių) analizė. Faktiškai kryţminių lentelių statistiniam vertinimui taikomas vienintelis chi kvadrato kriterijus. Reikia įsidėmėti, kad a) Chi kvadrato kriterijus labai jautrus duomenų skaičiui. Kai duomenų nedaug, net ir dideli procentiniai skirtumai bus pripaţinti statistiškai nereikšmingais. Kai duomenų labai daug, tai net ir menkiausi procentiniai skirtumai tampa statistiškai reikšmingais. b) Sudarinius kryţminę lentelę, joje neturi būti daug pustuščių langelių. Chi kvadrato statistika tampa nepatikima, kai tokių langelių daugiau, nei penktadalis. Tada tiesiog reikėtų sustambinti kategorijas. 4.1 Chi kvadrato nepriklausomumo (homogeniškumo) testas Duomenys: respondentai pagal du kategorinius poţymius suskirstyti į kategorijas. Statistinė hipotezė: H 0 atmetame (požymiai statistiškai reikšmingai susiję), jei p-reikšmė < 0,05. Pavyzdys: Ar, išmokant grąţą, vienodai apgaudinėjami vyrai ir moterys? Failas LiDA003_ZTLT_F1. Renkamės Analyze Descriptive Statistics Crosstabs. Į langelį Row(s) įkeliame kintamąjį s01 (lytį), į Column(s) kintamąjį a09_01. 21

Paspaudţiame Statistics ir paţymime Chi-square. Grįţtame į ankstesnį meniu. Paspaudţiame Cells, atsidariusiame lange paţymime Row ir Column. Grįţtame į ankstenį meniu ir spaudţiame OK. Rezultatų išklotinėje randame lentelę Crosstabulation. Jooje pateikti procentai nerodo, kad kaţkurią lytį apgaudinėtų daţniau. Gaunant grąţą buvo apgauti 39% vyrų ir 40,6 % moterų. Crosstabulation a09_01 Bûti apgautam gaunant gràþà 1 Taip 2 Ne Total s01 Lytis 1 Vyras Count 184 288 472 % within s01 Lytis 39.0% 61.0% 100.0% % within a09_01 Bûti apgautam gaunant gràþà 43.4% 45.1% 44.4% 2 Moteris Count 240 351 591 % within s01 Lytis 40.6% 59.4% 100.0% % within a09_ Bûti apgautam gaunant gràþà 56.6% 54.9% 55.6% Total Count 424 639 1063 % within s01 Lytis 39.9% 60.1% 100.0% % within a09_ 100.0% 100.0% 100.0% Lentelėje Chi-Square Tests pateiktos net kelios p reikšmės. Kadangi šiuo atveju turime 2x2 lentelę, tai stulpelyje Exact.Sig. (2-tailed) pateikiama ir tiksli p reikšmė (0,614). Visada bus 22

aprašyta ir asimptotinė p reikšmė stulpelyje Asymp. Sig. (2-sided) (ji lygi 0,591). Kadangi p reikšmė didesnė uţ 0,05, tai darome išvadą, nėra statistiškai reikšmingo skirtumo tarp apgautų vyrų ir moterų procentų. Tą pačią išvadą galima formuluoti ir kitais ţodţiais: apgaudinėjimas, išmokant grąţą, nėra statistiškai reikšmingai susijęs su apgaudinėjamos personos lytimi. Chi-Square Tests Asymp. Sig. (2- Exact Sig. (2- Exact Sig. (1- Value df sided) sided) sided) Pearson Chi-Square.289 a 1.591 Continuity Correction b.226 1.635 Likelihood Ratio.290 1.591 Fisher's Exact Test.614.318 Linear-by-Linear.289 1.591 Association N of Valid Cases 1063 a. 0 cells (.0%) have expected count less than 5. The minimum expected count is 188.27. b. Computed only for a 2x2 table 4.2 Chi kvadrato suderinamumo testas Duomenys: viena imtis pagal vieną poţymį suskirstytą į kategorijas. Spėjame kiek kokių respondentų bus (procentinę sudėtį, proporcijas) Statistinė hipotezė: ė ė H 0 atmetame (duomenys statistiškai reikšmingai prieštarauja spėjamoms proporcijoms skiraisi), jei p-reikšmė < 0,05. Pavyzdys: Ar duomenys neprieštarauja spėjimui, kad išmokant grąţą, apgaudinėjama 40 % respondentų? Failas LiDA003_ZTLT_F1. Renkamės Analyze Nonparametric Tests Legacy Dialogs) Chi Square. Į langelį Test Variable List įkeliame a09_01. 23

Pasirenkame Values ir paeiliui suvedame procentus, kurių tikimės, pradėdami nuo maţesnio a09_01 kodo. Kadangi kintamajema yra 1 apgautiems ir 2 neapgautiems, tai vedame 40 ir 60 ( o ne 60 ir 40). Spaudţiame OK. Pirmojoje lentelėje išrašyta, kiek ţmonių buvo apgauta (424) ir kiek jų turėtų būti imtyje, jeigu spėjamas santykis būtų teisingas. Matome, kad neatitikimas labai maţas tik 1,2 respondento (trupmenos neturi gasdinti taip tiksliau, nes matematinis modelis keičia sveikus skaičius realiais). a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Observed N Expected N Residual 1 Taip 424 425.2-1.2 2 Ne 639 637.8 1.2 Total 1063 Antrojoje lentelėje suradę Asymp. Sig. eilutėje esančią p reikšmę, matome, kad ji (0,940) daug didesnė uţ 0,05. Todėl darome išvadą, kad duomenys statistiškai reikšmingai neprieštarauja spėjamam santykiui (apgautųjų procentui). Norime atkreipti, kad išvada švelni neprieštarauja spėjimui, o ne įrodėme, kad tokių 40 procentų. Gali lygiai taip pat, tiems patiems duomenims neprieštarauti spėjimui, kad tokių respondentų yra 39 procentai. Arba 41 %. Taigi, visada įdomiau, kai atsiranda prieštaravimas, nes tada galima matyti daugiau, ar maţiau buvo apgautųjų. Test Statistics 24

a09_01 Ar per pastaruosius 12 mënesiø Jums yra tekæ: Bûti apgautam gaunant gràþà Chi-Square.006 a df 1 Asymp. Sig..940 Literatūra 1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai I, TEV, 2000. 1. V, Čekanavičius, G. Murauskas, Statistika ir jos taikymai II, TEV, 2002. 25