STATISTIČNE METODE V PEDAGOŠKEM RAZISKOVANJU

Similar documents
VAJE 2: Opisna statistika

Multipla korelacija in regresija. Multipla regresija, multipla korelacija, statistično zaključevanje o multiplem R

Statistika 2 z računalniško analizo podatkov

Reševanje problemov in algoritmi

ENAČBA STANJA VODE IN VODNE PARE

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

Cveto Trampuž PRIMERJAVA ANALIZE VEČRAZSEŽNIH TABEL Z RAZLIČNIMI MODELI REGRESIJSKE ANALIZE DIHOTOMNIH SPREMENLJIVK

modeli regresijske analize nominalnih spremenljivk

TOPLJENEC ASOCIIRA LE V VODNI FAZI

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

Statistika 2 z računalniško analizo podatkov. Neizpolnjevanje predpostavk regresijskega modela

ZNANJE MATEMATIKE V TIMSS ADVANCED 2015 IN NA MATURI:

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA POLONA ŠENKINC REŠEVANJE LINEARNIH DIFERENCIALNIH ENAČB DRUGEGA REDA S POMOČJO POTENČNIH VRST DIPLOMSKO DELO

Analiza variance in linearna regresija

OPTIMIRANJE IZDELOVALNIH PROCESOV

Multipla regresija. Iztok Grabnar. Univerza v Ljubljani, Fakulteta za farmacijo

ENERGY AND MASS SPECTROSCOPY OF IONS AND NEUTRALS IN COLD PLASMA

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. O neeksaknotsti eksaktnega binomskega intervala zaupanja

Attempt to prepare seasonal weather outlook for Slovenia

Metode raziskovanja. Vzorčenje. Vzorčenje. Raziskovalni proces

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Ekstremne porazdelitve za odvisne spremenljivke

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Optimizacija 1 Course title: Optimization 1. Študijska smer Study field

Linearna regresija. Poglavje 4

Ravni merjenja: številne posledice preproste ideje

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

Excel. Matjaž Željko

Linearne enačbe. Matrična algebra. Linearne enačbe. Linearne enačbe. Linearne enačbe. Linearne enačbe

Parametrični in neparametrični pristopi za odkrivanje trenda v časovnih vrstah

UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Analiza 1 Course title: Analysis 1. Študijska smer Study field. Samost. delo Individ.

AKSIOMATSKA KONSTRUKCIJA NARAVNIH

UČNI NAČRT PREDMETA / COURSE SYLLABUS Numerical linear algebra. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Parcialne diferencialne enačbe Partial differential equations. Študijska smer Study field

OA07 ANNEX 4: SCOPE OF ACCREDITATION IN CALIBRATION

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Študijska smer Study field ECTS

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Statistika 2 Course title: Statistics 2. Študijska smer Study field

Problem umetnostne galerije

UMESTITEV EKOLOŠKIH RAZISKAV MED OSTALE VRSTE RAZISKAV

Spletni sistem za vaje iz jezika SQL

Uvod v odkrivanje znanj iz podatkov (zapiski predavatelja, samo za interno uporabo)

Domen Perc. Implementacija in eksperimentalna analiza tehnike razvrščanja podatkov s konsenzom

ACTA BIOLOGICA SLOVENICA LJUBLJANA 2012 Vol. 55, [t. 1: 29 34

Verifikacija napovedi padavin

NIKJER-NIČELNI PRETOKI

Hipohamiltonovi grafi

Makroekonomija 1: 4. vaje. Igor Feketija

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

THE TOWNS AND THE TRAFFIC OF THEIR OUTSKIRTS IN SLOVENIA

LISREL. Mels, G. (2006). LISREL for Windows: Getting Started Guide. Lincolnwood, IL: Scientific Software International, Inc.

KONFLIKTI MED ZAPOSLENIMI

USING THE DIRECTION OF THE SHOULDER S ROTATION ANGLE AS AN ABSCISSA AXIS IN COMPARATIVE SHOT PUT ANALYSIS. Matej Supej* Milan Čoh

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

1) V diagramu sta prikazana plazemska koncentracijska profila po večkratnem intravenskem odmerjanju učinkovine v dveh različnih primerih (1 in 2).

Biološka ekvivalenca Statistične metode. Iztok Grabnar

Uporaba preglednic za obdelavo podatkov

Izvedbe hitrega urejanja za CPE in GPE

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Analiza 3 Course title: Analysis 3. Študijska smer Study field ECTS

OFF-LINE NALOGA NAJKRAJŠI SKUPNI NADNIZ

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Verjetnostni algoritmi za testiranje praštevilskosti

SVM = Support Vector Machine = Metoda podpornih vektorjev

PRIPRAVA PODATKOV V PROCESU PODATKOVNEGA RUDARJENJA

Katastrofalno zaporedje okvar v medsebojno odvisnih omrežjih

Osnove numerične matematike

Matematika 1. Gabrijel Tomšič Bojan Orel Neža Mramor Kosta

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

13. poglavje. Značilnosti šolske klime

Univerza v Ljubljani Fakulteta za matematiko in fiziko. Oddelek za fiziko. Seminar - 3. letnik, I. stopnja. Kvantni računalniki. Avtor: Tomaž Čegovnik

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Kromatično število in kromatični indeks grafa

MECHANICAL EFFICIENCY, WORK AND HEAT OUTPUT IN RUNNING UPHILL OR DOWNHILL

Vpliv zadovoljstva zaposlenih na produktivnost v Tiskarni Novo mesto, d.d.

Simulation of multilayer coating growth in an industrial magnetron sputtering system

56 1 Upogib z osno silo

Minimizacija učne množice pri učenju odločitvenih dreves

Verodostojnost in kvaliteta spletno dostopnih informacij

matematika + biologija = sistemska biologija? Prof. Dr. Kristina Gruden Prof. Dr. Aleš Belič Doc. DDr. Jure Ačimovič

MICROWAVE PLASMAS AT ATMOSPHERIC PRESSURE: NEW THEORETICAL DEVELOPMENTS AND APPLICATIONS IN SURFACE SCIENCE

Osnovna statistična analiza v R-ju

Miha Troha. Robotsko učenje in planiranje potiskanja predmetov

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

Calculation of stress-strain dependence from tensile tests at high temperatures using final shapes of specimen s contours

UNIVERZA V MARIBORU FAKULTETA ZA NARAVOSLOVJE IN MATEMATIKO. Oddelek za matematiko in računalništvo MAGISTRSKA NALOGA. Tina Lešnik

Usmerjenost v samopreseganje in dosežke vodenje samega sebe

Linearna algebra. Bojan Orel. Univerza v Ljubljani

Solutions. Name and surname: Instructions

Univerza na Primorskem FAMNIT, MFI STATISTIKA 2 Seminarska naloga

POLDIREKTNI PRODUKT GRUP

D I P L O M S K A N A L O G A

ANALIZA PREIZKUSA INSTRUMENTARIJA GNSS-RTK PO NAVODILIH STANDARDA ISO ANALYSIS OF GNSS-RTK INSTRUMENTS TESTING ON THE ISO INSTRUCTIONS

Dejan Petelin. Sprotno učenje modelov na podlagi Gaussovih procesov

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA ODDELEK ZA RAZREDNI POUK

JEDRSKA URA JAN JURKOVIČ. Fakulteta za matematiko in fiziko Univerza v Ljubljani

Eulerjevi in Hamiltonovi grafi

USING SIMULATED SPECTRA TO TEST THE EFFICIENCY OF SPECTRAL PROCESSING SOFTWARE IN REDUCING THE NOISE IN AUGER ELECTRON SPECTRA

Hadamardove matrike in misija Mariner 9

Izračun osnovne gravimetrične mreže Slovenije

UČNI NAČRT PREDMETA / COURSE SYLLABUS

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field

Vsebina Od problema do načrta programa 1. del

Državni izpitni center MATEMATIKA PREIZKUS ZNANJA. Sreda, 4. maj 2011 / 60 minut. NACIONALNO PREVERJANJE ZNANJA ob koncu 2. obdobja NAVODILA UČENCU

2A skupina zemeljskoalkalijske kovine

Grafični gradnik za merjenje kvalitete klasifikatorja s pomočjo krivulj

Transcription:

UNIVERZA NA PRIMORSKEM PEDAGOŠKA FAKULTETA BORIS KOŽUH STATISTIČNE METODE V PEDAGOŠKEM RAZISKOVANJU KOPER 2010

OSNOVNI POJMI... 6 I. MNOŢIČNI POJAVI... 6 II. STATISTIČNE MNOŢICE IN ENOTE... 6 III. SPREMENLJIVKE... 8 1. Opisne in številske spremenljivke... 8 2. Merske lestvice... 9 3. Uporaba statističnih metod... 12 4. Zvezne in nezvezne spremenljivke... 13 5. Odvisne in neodvisne spremenljivke... 14 IV. PARAMETRI... 15 DRUGO POGLAVJE... 16 UREJEVANJE PODATKOV... 16 I. UREJEVANJE PODATKOV ZA OPISNE SPREMENLJIVKE... 16 II. UREJEVANJE PODATKOV ZA ŠTEVILSKE SPREMENLJIVKE... 22 1. Ranžirna vrsta... 23 2. Frekvenčna porazdelitev... 24 III. PRIPRAVA PODATKOV ZA RAČUNALNIŠKO OBDELAVO... NAPAKA! ZAZNAMEK NI DEFINIRAN. 1. Zbiranje podatkov... Napaka! Zaznamek ni definiran. 2. Seznam spremenljivk... Napaka! Zaznamek ni definiran. 3. Zapisovanje vrednosti... Napaka! Zaznamek ni definiran. 4. Neposredno in posredno vnašanje... Napaka! Zaznamek ni definiran. TRETJE POGLAVJE... 27 RANGI... 27 I. ABSOLUTNI RANGI... 27 II. RELATIVNI RANGI... 28 III. ZNAČILNI KVANTILNI RANGI IN KVANTILI... NAPAKA! ZAZNAMEK NI DEFINIRAN. 1. Delitev na polovici... Napaka! Zaznamek ni definiran. 2. Delitev na četrtine... Napaka! Zaznamek ni definiran. 3. Delitev na desetine... Napaka! Zaznamek ni definiran. 4. Delitev na stotine... Napaka! Zaznamek ni definiran. ČETRTO POGLAVJE... 29 SREDNJE VREDNOSTI... 29 I. PRIMERJANJE MNOŢIC... 29 II. SREDNJE VREDNOSTI... 30

III. IZRAČUNAVANJE ARITMETIČNE SREDINE... 33 1. Računanje iz individualnih podatkov... 33 2. Računanje iz frekvenčne porazdelitve... Napaka! Zaznamek ni definiran. IV. TEHTANA ARITMETIČNA SREDINA... NAPAKA! ZAZNAMEK NI DEFINIRAN. Tehtan strukturni odstotek... Napaka! Zaznamek ni definiran. PETO POGLAVJE... 34 RAZPRŠENOST... 34 I. POJEM RAZPRŠENOSTI... 34 II. VIRI RAZPRŠENOSTI... 35 III. MERJENJE RAZPRŠENOSTI... 36 1. Razpršenost podatkov za nominalne spremenljivke... 37 2. Razpršenost podatkov za ordinalne spremenljivke... 38 3. Razpršenost podatkov za intervalne spremenljivke... 39 IV. MERE RAZPRŠENOSTI... 40 1.Variacijski razmik... 40 2. Decilni razmik... 41 3. Kvartilni razmik... 42 4. Kvartilni odklon... 42 5. Povprečni absolutni odklon... 43 6. Varianca in standardni odklon... 44 V. IZRAČUNAVANJE VARIANCE... 45 1. Računanje iz individualnih podatkov... 45 2. Računanje iz frekvenčne porazdelitve... Napaka! Zaznamek ni definiran. VI. RELATIVNA MERA RAZPRŠENOSTI... NAPAKA! ZAZNAMEK NI DEFINIRAN. VII. RELATIVNI ODKLON... NAPAKA! ZAZNAMEK NI DEFINIRAN. VIII. ANALIZA RAZPRŠENOSTI... 46 Računanje pojasnjene in nepojasnjene variance... Napaka! Zaznamek ni definiran. ŠESTO POGLAVJE... 49 NORMALNA PORAZDELITEV... 49 I. POJEM IN ZNAČILNOSTI... 49 II. UPORABA TABELE IN ZAKONITOSTI... NAPAKA! ZAZNAMEK NI DEFINIRAN. 1. Določanje odstotka vrednosti, ki so pod neko vrednostjo spremenljivke... Napaka! Zaznamek ni definiran. 2. Določanje odstotka vrednosti, ki so nad neko vrednostjo spremenljivke... Napaka! Zaznamek ni definiran. 3.Določanje odstotka vrednosti, ki so v nekem razmiku... Napaka! Zaznamek ni definiran. 4.Določanje rezultata, pod katerim je dani odstotek enot... Napaka! Zaznamek ni definiran. 5.Določanje meja, med katerima je dani odstotek enot... Napaka! Zaznamek ni definiran.

6. Upoštevanje narave zveznih spremenljivk... Napaka! Zaznamek ni definiran. SEDMO POGLAVJE... 51 KORELACIJE... 51 I. POJEM IN VRSTE KORELACIJE... 51 1. Razmerje med korelacijo in vzročno-posledičnimi zvezami... 54 2. Korelacijski grafikon... 55 3. Pozitivna in negativna korelacija... 56 4. Linearna in nelinearna korelacija... 56 II. INDEKS KORELACIJE... 57 III. KORELACIJSKI KOEFICIENTI... 58 1. Pearsonov korelacijski koeficient... 58 Interpretacija Pearsonovega korelacijskega koeficienta... 60 2. Korelacija ranga... 61 3. Biserialni korelacijski koeficient... Napaka! Zaznamek ni definiran. 4. Točkovni biserialni korelacijski koeficient... Napaka! Zaznamek ni definiran. 5. Tetrakorični korelacijski koeficient... Napaka! Zaznamek ni definiran. 6. Korelacijsko razmerje... Napaka! Zaznamek ni definiran. IV. REGRESIJA... 63 V. PARCIALNA KORELACIJA... 65 1. Parcialni korelacijski koeficent prvega reda... Napaka! Zaznamek ni definiran. 2. Parcialni korelacijski koeficent drugega reda... Napaka! Zaznamek ni definiran. OSMO POGLAVJE... 66 VZORČENJE... 66 I. OSNOVNE MNOŢICE IN VZORCI... 66 1. Zakaj sploh vzorčimo... 67 2. Posploševanje z vzorca na osnovno množico... 68 3. Reprezentativnost vzorca... 69 O razpršenosti spremenljivke v osnovni mnoţici... 69 O velikosti vzorca... 69 O načinu izbora enot v vzorec... 70 4. Izbiranje vzorcev... 70 Slučajnostni izbor... 70 Sistematični izbor... 72 Namenski izbor... 75 Priloţnostni izbor... 75 Enostopenjsko in večstopenjsko vzorčenje... 76 Izbiranje s ponavljanjem... 78 Stratificirano vzorčenje... Napaka! Zaznamek ni definiran. Veliki in mali vzorci... 78

Odvisni in neodvisni vzorci... 79 5. Enostavni slučajnostni vzorec... 80 6. Posploševanje na hipotetično osnovno množico... 80 7. Oznake za parametre... 81 II. OCENJEVANJE PARAMETROV... 82 1. Množica vzorcev in množica vseh vzorcev... Napaka! Zaznamek ni definiran. 2. Porazdelitev vzorčnih parametrov... Napaka! Zaznamek ni definiran. 3. Ocenjevanje aritmetične sredine z velikimi enostavnimi slučajnostnimi vzorci... Napaka! Zaznamek ni definiran. Standardna napaka ocene aritmetične sredine... Napaka! Zaznamek ni definiran. 4. Ocenjevanje strukturnega odstotka z velikimi enostavnimi slučajnostnimi vzorci. Napaka! Zaznamek ni definiran. Standardna napaka ocene strukturnega odstotka... Napaka! Zaznamek ni definiran. 5. Ocenjevanje standardnega odklona z velikimi enostavnimi slučajnostnimi vzorci Napaka! Zaznamek ni definiran. 6. Ocenjevanje Pearsonovega korelacijskega koeficienta z velikimi enostavnimi slučajnostnimi vzorci... Napaka! Zaznamek ni definiran. Standardna napaka ocene korelacijskega koeficienta... Napaka! Zaznamek ni definiran. III. PREIZKUŠANJE HIPOTEZ... 84 1. Preizkušanje hipotez o razliki med aritmetičnimi sredinami z velikimi enostavnimi slučajnostnimi vzorci... 85 Standardna napaka... Napaka! Zaznamek ni definiran. 2. Preizkušanje hipotez o razliki med strukturnimi odstotki z velikimi enostavnimi slučajnostnimi vzorci... Napaka! Zaznamek ni definiran. Standardna napaka... Napaka! Zaznamek ni definiran. 3. Preizkušanje hipotez o razliki med standardnimi odkloni z velikimi enostavnimi slučajnostnimi vzorci... Napaka! Zaznamek ni definiran. Standardna napaka razlike... Napaka! Zaznamek ni definiran. 4. Preizkušanje hipotez o razliki med Pearsonovimi korelacijskimi koeficienti z velikimi enostavnimi slučajnostnimi vzorci... Napaka! Zaznamek ni definiran. Standardna napaka razlike... Napaka! Zaznamek ni definiran. IV. Χ 2 -PREIZKUS... 87 1. Preizkušanje hipoteze neodvisnosti... 87 Prostostne stopinje... Napaka! Zaznamek ni definiran. Pričakovane frekvence... Napaka! Zaznamek ni definiran. Hitrejši način računanja vrednosti χ 2... Napaka! Zaznamek ni definiran. Poročanje o preizkusu pri računalniški obdelavi... Napaka! Zaznamek ni definiran. Pogoj za uporabo χ 2 -preizkusa... Napaka! Zaznamek ni definiran. Ukrepi pri neizpolnjenih pogojih... Napaka! Zaznamek ni definiran. 2. Preizkušanje hipoteze enake verjetnosti... 89 V. KOEFICIENTI KONTINGENCE... 90 1. Pearsonov kontingenčni koeficient... 91

2. Cramérjev koeficient... 92 3.Koeficient... Napaka! Zaznamek ni definiran. VI. NAPAKE PRI OCENJEVANJU PARAMETROV IN PREIZKUŠANJU HIPOTEZ... 93 LITERATURA... 94

PRVO POGLAVJE OSNOVNI POJMI I. Mnoţični pojavi V empiričnih pedagoških raziskavah proučujemo enkratne pojave in mnoţične pojave. Enkratni pojavi so tisti, ki nastopajo samo enkrat, mnoţični pa se pojavljajo večkrat (več kot le enkrat). Osnovna šola Ledina je enkraten pojav, osnovna šola nasploh pa mnoţični pojav (saj jih je v Sloveniji več kot petsto). Učenec J. M. iz kraja C. je enkratni pojav, učenec osnovne šole pa je mnoţični pojav. Pri proučevanju mnoţičnih pojavov pogosto uporabljamo statistične metode, pri preučevanju enkratnih pa ne. S temi, sicer bolj kvantitativnimi metodami, proučujemo hkrati kvantitativne in kvalitativne značilnosti in zakonitosti vzgojnih (pedagoških) pojavov. Čeprav je definicija mnoţičnih pojavov preprosta, je slabo uporabna za presojo, kdaj uporabiti statistične metode, kdaj pa ne. Če bomo, na primer imeli "mnoţico" dveh ali treh učiteljev, ne bomo za njeno preučevanje uporabili statističnih metod (pa čeprav po definiciji gre za mnoţični pojav). Naj velja, da bomo statistične metode uporabili takrat, ko bomo preučevali vendarle "malo bolj mnoţične" pojave - mnoţice velikosti od ene vzgojne skupine navzgor (šolskega oddelka, učne skupine, kroţka in podobno). Šele pri takšni velikosti bodo statistične metode zares uporabne. Seveda ni nobene ostre meje, kar se zlasti lepo vidi, če si zastavimo napačno vprašanje: "Pri kateri velikosti skupine ţe smemo uporabiti statistične metode?" Odgovor na takšno vprašanje bi seveda bil: "Ţe pri dveh enotah!" Vendar pa raba statističnih metod na tako majhnih skupinah ni smiselna in smotrna. II. Statistične mnoţice in enote Enote, ki sestavljajo mnoţice v pedagoških raziskavah, so lahko učenci, gojenci, učitelji, dijaki, ravnatelji, a tudi šole, vrtci, dijaški domovi, učbeniki, delovni zvezki, učni načrti, računalniki, šolsko pohištvo, šolske stavbe, učne ure, ekskurzije, šolske ocene, izdelki učencev, vprašanja, računalniki itd. V empiričnih raziskavah nas vedno zanima neka konkretna skupina. Da bi jo lahko preučili, jo moramo natančno opredeliti. Tako dobimo statistično mnoţico; zanjo potem lahko uporabimo statistične metode. Opredeliti jo, pomeni določiti pogoje, ki opredeljujejo, kdo vanjo sodi in kdo ne. To so opredeljujoči pogoji: - s stvarnim opredeljujočim pogojem določimo, kaj (ali kdo) so enote te mnoţice,

- s krajevnim opredeljujočim pogojem določimo geografske razseţnosti mnoţice, - s časovnim opredeljujočim pogojem določimo čas, v katerem bomo zajeli mnoţico. Vse enote, ki ustrezajo opredeljujočim pogojem, sodijo v tako opredeljeno statistično mnoţico. S temi pogoji so natančno določene enote statistične mnoţice in s tem tudi celotna statistična mnoţica. Če katerikoli od teh pogojev manjka, statistična mnoţica ni zadosti natančno določena in se ne ve, kdo (ali kaj) jo sestavlja. Ilustrirajmo to z nekaj primeri ustrezno opredeljenih statističnih mnoţic: Ravnatelji osnovnih šol v Sloveniji v šolskem letu 1998/99. Dijaki gimnazij v Ljubljani na dan 20. februarja 2001. Osnovne šole v dolenjski regiji v šolskem letu 1999/2000. Preprosteje je, če časovni opredeljujoči pogoj ni določen v predolgem intervalu (celo šolsko leto, semester, polletje ali kaj podobnega). Če se nanaša na celo šolsko leto, moramo zajeti (v nekem smislu čakati) vse enote, ki se pojavijo v tistem šolskem letu. V prvem primeru bi bili to vsi ravnatelji, tudi tisti, ki so med šolskim letom postali ravnatelji. Za praktično izvedbo raziskave je to pogosto precejšnja ovira (še zlasti za zbiranje podatkov). Običajno opredeljujemo mnoţice v celih šolskih letih le kadar jemljemo podatke iz ţe obstoječe dokumentacije: npr. iz dokumentacije zavoda za statistiko, zavoda za šolstvo, ministrstev in podobno. Kadar pa sami zbiramo podatke, si mnoţice pogosteje opredeljujemo trenutno - z nekim datumom. Res je, da tudi dan (datum) ni povsem dosledno trenutna opredelitev; tudi dan je interval štiriindvajsetih ur. Ne bomo širili razprave o časovnem pogoju na filozofska vprašanja trenutnega opredeljevanja statističnih mnoţic. Zato le povejmo, da nekatere pojave moramo opredeliti intervalno: število opravljenih učnih ur (npr. v enem tednu, mesecu ali šolskem letu), število pobegov iz dijaškega doma (npr. v mesecu ali letu), število seminarjev, ki so se jih učitelji udeleţili (npr. v zadnjih treh letih) itd. Takšnih mnoţic nikakor ne moremo opredeliti trenutno; mnoge pa lahko opredelimo trenutno ali intervalno. Bistveno je, da je časovni opredeljujoči pogoj jasno in nedvoumno določen. Statistično mnoţico v raziskovalnem poročilu običajno imenujemo raziskovalna mnoţica ali tudi kar kratko - mnoţica. Bistveno drugače pa statistične mnoţice imenujemo v vzorčnih raziskavah, kjer iz mnoţice izberemo le manjši del. Takrat celotno statistično mnoţico imenujemo osnovna mnoţica, manjši izbrani del pa vzorec (ali redkeje: vzorčna mnoţica).

III. Spremenljivke Enote statistične mnoţice imajo nešteto lastnosti. Vsaka takšna lastnost je spremenljivka. Naštejmo nekaj najpogostejših enot in njihovih lastnosti. Seveda lahko naštejemo le nekaj najpomembnejših lastnosti, saj jih je v resnici nešteto. Tabela 1. Statistične enote in spremenljivke enota lastnosti ali spremenljivke učenec starost, ocene, prizadevnost, spol, narodnost, interesi, telesna višina, telesna teţa itd. učitelj leta prakse, stopnja izobrazbe, kateri predmet uči, kraj, kjer je zaposlen itd. šola število učencev na šoli, stopnja šole (osnovna, srednja itd.), kako dolgo ţe deluje, koliko oddelkov ima, koliko je zaposlenih itd. učbenik število strani, avtor, cena, format, število ilustracij, leto izdaje itd. delavska univerza katere programe izvaja, število zaposlenih, kraj, v katerem ima sedeţ itd. Proučevati enote (in s tem mnoţice) pomeni proučevati njihove lastnosti spremenljivke. Zato je spremenljivka osrednji pojem statistike. Vsebina praktično vseh statističnih metod je obdelava podatkov za spremenljivke. Ker vsakokrat raziskujemo pedagoške pojave z drugačnim namenom, bomo vsakokrat proučevali neke druge spremenljivke (tudi takrat, ko bo šlo za podobne ali celo iste mnoţice!). 1. OPISNE IN ŠTEVILSKE SPREMENLJIVKE Spremenljivke lahko delimo po različnih kriterijih. Začeli bomo z eno preprostejših delitev: po tem, kako spremenljivkam izraţamo vrednosti. Spremenljivke, ki jim vrednosti izraţamo z besedami, imenujemo opisne ali atributivne. Takšne spremenljivke so spol, narodnost, stopnja izobrazbe itd. Tabela 2. Opisne spremenljivke spremenljivka vrednosti spol ţenski, moški stopnja šole osnovna, srednja, višja, visoka itd. znanje tujega jezika pasivno, aktivno ali tudi: dobro, srednje, slabo prisotnost vedno, pogosto, včasih, nikoli šolski uspeh odličen, prav dober, dober, zadosten, nezadosten

Spremenljivke, ki jim vrednosti izraţamo s številkami, imenujemo številske ali numerične. Tabela 3. Številske spremenljivke spremenljivka vrednosti telesna višina v cm 154, 155, 156 itd starost v letih 9, 10, 11, 12 itd. leta prakse 2, 15, 24, 33 itd število učencev v oddelku 19, 20, 21, 22, 23 itd. Majhno nejasnost v tej delitvi povzroča dejstvo, da vrednosti nekaterih spremenljivk izraţamo hkrati besedno in številčno. Najbolj značilen primer so šolske ocene. Ali je šolska ocena opisna ali številska spremenljivka? V takšnih primerih moramo razmisliti, kakšna je narava spremenljivke. Bistvena je namreč narava spremenljivke in ne zgolj oblika, kako so zapisane vrednosti. Razmislek bi nam hitro pokazal, da je pri šolski oceni bistvena beseda in ne številka. Odlična ocena je povsod najboljša, vedno je med ocenami najvišja, izraţena pa je lahko z različnimi številkami (pri nas s številko 5, na Poljskem s številko 6, v Italiji s številko 1, na naših univerzah s številko 10, na italijanskih s 30 itd.). Po svojem bistvu je opisna in ne številska spremenljivka. 2. MERSKE LESTVICE Veliko večji pomen v statistiki ima delitev glede na vrsto informacije, ki jo vsebujejo rezultati merjenja (podatki, vrednosti spremenljivke). Glede na ta kriterij razlikujemo štiri vrste spremenljivk (štiri merske lestvice): 1. nominalne, 2. ordinalne, 3. intervalne, 4. razmernostne. Nominalne spremenljivke vsebujejo informacijo, po kateri lahko ugotovimo le ali se enote razlikujejo ali se ne razlikujejo. Takšna spremenljivka je spol. Po spolu lahko ugotovimo ali sta dva učenca enakega ali različnega spola. Za vrednosti nominalnih spremenljivk uporabljamo raje izraz kategorije. Nekatere nominalne spremenljivke imajo le dve kategoriji, nekatere pa več kategorij: Tabela 4. Nominalne spremenljivke z dvema kategorijama spremenljivka kategorije spol moški, ţenski ali je dijak član neke organizacije je član, ni član ali se pri pisnem izpitu lahko uporablja da, ne literatura ali ima učenka svojo pisalno mizo ima, nima

Tabela 5. Nominalne spremenljivke z več kategorijami spremenljivka kategorije narodnost Kitajec, Francoz, Slovenec itd. smer študija na univerzi pedagogika, pravo, kemija, strojništvo itd. kakšne oddaje učenci najraje športne, informativne, dokumentarne, gledajo na TV izobraţevalne itd. kakšno strokovno literaturo revije, knjige, časopise, priročnike itd. učiteljice uporabljajo Nikakor ni mogoče kategorij nominalne spremenljivke razvrstiti po velikosti od manjših do večjih, ker te lastnosti nominalne spremenljivke nimajo. Poenostavljeno bi lahko rekli, da so vse kategorije na isti ravni. Nominalne spremenljivke so čiste atributivne spremenljivke in nimajo kvantitativne osnove. Pri presojanju, ali je neka spremenljivka nominalna ali "pa kaj več", moramo biti pazljivi in presoditi na podlagi bistva spremenljivke in ne na podlagi poimenovanja njenih kategorij. Pokaţimo to s primerom: V neki anketi smo učence vprašali, ali jim je bila všeč gledališka predstava. Kot moţne odgovore smo postavili le kategoriji DA in NE. Toda ta spremenljivka ni nominalna. Zadovoljnost se stopnjuje; ne gre za to, da eni sploh niso zadovoljni, drugi so pa popolnoma zadovoljni. Gre v bistvu za niţjo in višjo stopnjo zadovoljnosti. Podobno je z mnogimi takšnimi pojavi (zainteresiranost, motiviranost itd.). Nominalno spremenljivko bi dobili, če bi učence, npr. vprašali, ali so bili na gledališki predstavi. Tukaj bi odgovori DA in NE bili bistveno drugačni kot v prejšnjem vprašanju. Zunanji videz imena spremenljivke ali njenih kategorij nas lahko pogosto zavede. Ordinalne spremenljivke vsebujejo takšno informacijo, po kateri lahko ugotovimo ali so enote enake ali različne in nekaj več: vrednosti se stopnjujejo in so lahko večje ali manjše. Vrednosti takšne spremenljivke lahko razvrstimo od najmanjše do največje (in s tem tudi enote). Za dve enoti lahko torej ugotovimo, katera je na lestvici višje in katera niţje. Vrednostim ordinalne spremenljivke običajno rečemo stopnje (redkeje pa kategorije). Stopnje na tej lestvici niso vse na isti ravni kot pri nominalnih spremenljivkah, temveč se stopnjujejo - izraţajo neko količino (kvantitativno osnovo). Značilna ordinalna spremenljivka je stopnja izobrazbe. Ordinalne spremenljivke najpogosteje dobimo pri anketiranju, opazovanju ter uporabi ocenjevalnih lestvic in lestvic stališč. Pogosto se ţe iz oblike anketnega vprašanja vidi, da gre za ordinalno spremenljivko: npr. "koliko ste zadovoljni..." ali "koliko berete..." itd. Tudi kategorije ordinalne spremenljivke nakazujejo kvantitativno osnovo: zelo,

srednje, malo; pogosto, včasih, redko itd. Zato kategorijam ordinalne spremenljivke pogosteje rečemo stopnje kot kategorije. Pri ordinalni spremenljivki sicer vemo, katere stopnje so višje in katere so niţje, ne vemo pa, kakšne so razlike med posameznimi stopnjami. Zato tudi ne moremo reči, da so intervali med posameznimi stopnjami povsod enaki. Največkrat vemo iz izkušenj, da ti intervali še zdaleč niso enaki. Ordinalno lestvico si lahko zamislimo kot stopnišče z neenakimi stopnicami. Tudi, če bi pri kakšni ordinalni spremenljivki intervali bili enaki (kar je teoretično moţno), bi nam to dejstvo ostalo skrito. Za stopnje ordinalnih spremenljivk poleg besed pogosto uporabljamo tudi številke (za šolske ocene in šolski uspeh, za range v ranţirni vrsti itd.). Te številke ustvarjajo videz, da gre za enake intervale. Zdi se, da je razlika med zadostno in dobro oceno enaka razliki med dobro in prav dobro oceno. Pa seveda ni. Tudi rangi, npr. kot vrstni red prihoda v cilj pri krosu, zakrivajo dejanske razlike v doseţkih med učenci. Zdi se, kakor da so doseţki učencev enakomerno nanizani od prvega do zadnjega; kakor da so razlike med njimi enake (saj so med vsemi rangi enake razlike: med 4. do 5. je enaka razlika kot med 16. in 17.). V bistvu so med posameznimi ocenami in tudi med posameznimi rangi razlike neenake (seveda v tisti lastnosti, ki jo s temi ocenami ali rangi izraţamo). Podobno je s spremenljivko doseţek na testu znanja, le da je tu neenakost intervalov bolj zakrita. Zdi se, da je zares interval med, npr. 20 in 21 točk enak intervalu med 12 in 13 točk (vsakokrat gre le za eno točko in na videz je "točka tu enaka točki tam"). Pa ni, saj je naraščanje teţavnosti od naloge do naloge v testu neenakomerno. Vendarle pa je izenačenost intervalov pri doseţkih na testu znanja v splošnem večja kot pri mnogih drugih ordinalnih spremenljivkah. Seveda bi bila izenačenost (enakost!) intervalov med posameznimi stopnjami neke merske lestvice zelo dobrodošla lastnost. Nekatere spremenljivke, ki so vmes med ordinalnimi in intervalnimi, pogosto obravnavamo kot intervalne (npr. doseţke na testih znanja v točkah, rezultate na nekaterih ocenjevalnih lestvicah in lestvicah stališč itd.). Pri tem pa vendarle ne smemo pozabiti, kakšno je njihovo bistvo, zato moramo biti previdni v interpretaciji takšnih rezultatov. Intervalne spremenljivke so številske in imajo vse lastnosti ordinalnih spremenljivk, le intervali med stopnjami so povsod enaki. Katere spremenljivke so torej intervalne? To so tiste, ki imajo natančno določeno mersko enoto (temperaturna lestvica v Celzijusovih stopinjah in podobno). Intervalno lestvico si lahko zamislimo kot stopnišče z enako visokimi stopnicami. Zaradi enakih intervalov lahko določimo, kakšna je razlika med katerimikoli vrednostmi. Nimajo pa intervalne spremenljivke absolutne ničle. To ni vselej vidno ţe na pogled. Zamislimo si test znanja, katerega vrednosti bi tvorile intervalno lestvico. Ali ima takšna spremenljivka absolutno ničlo? Ker s testom merimo znanje, lahko to vprašanje konkretiziramo: ali nič točk na testu

pomeni ničelno znanje? Seveda ne pomeni (pa čeprav se zdi, da je tako - v vsakdanjem ţivljenju bi takšen rezultat vsi komentirali:»ah, saj nič ne zna!«). Doseţek nič točk pomeni, da je imel učenec premalo znanja, da bi pravilno rešil vsaj eno nalogo. Da ničla res ni absolutna, se lahko prepričamo tudi s preprostim poskusom. V test dodamo še eno izredno lahko nalogo sedaj bo isti učenec dosegel točko. Pa je vendar to isti učenec; gre za isto znanje. Prvič bi površno presodili, da ta učenec nič ne zna; drugič bi rekli, da nekaj malega le zna. Ničelna točka je torej odvisna od teţavnosti nalog. Če so vse naloge v testu zelo teţke, bo ničelna točka visoko in jo bodo le redki presegli. Če so naloge v testu zelo lahke, bo ničelna točka nizko in jo bodo mnogi presegli. Vidimo, da ničelna točka ni absolutna, ampak se lahko premika. Razmernostne spremenljivke so tiste intervalne spremenljivke, ki imajo absolutno ničlo. Ta lastnost razmernostnih spremenljivk omogoča presojo, kolikokrat je neka vrednost večja od neke druge vrednosti. Takšnih primerjav nam zgolj intervalne lestvice ne omogočajo (ker nimajo absolutne ničle). Razmernostne spremenljivke so starost, telesna višina in teţa, število otrok v razredu ali vzgojni skupini, število ur pouka, čas učenja, število prebranih knjig, skok v višino itd. Temperaturna lestvica Celzijusa nima absolutne ničle in je intervalna spremenljivka. Zato ne moremo reči, da je temperatura 80 C štirikrat večja od temperature 20 C. Temperaturna lestvica Calvina ima absolutno ničlo in temperatura 80 K zares je štirikrat večja od temperature 20 K. Vendar je ta prednost razmernostnih spremenljivk (v primerjavi z intervalnimi) tako majhna, da nam omogoča le majhen korak naprej v statistični obdelavi. Zato pogosto razmernostne in intervalne spremenljivke obravnavamo enako. 3. UPORABA STATISTIČNIH METOD Zakaj je sploh pomembno vedeti, kakšne so spremenljivke? Od narave spremenljivke je namreč odvisno, katere statistične metode zanjo lahko uporabimo. Veljata dve pomembni splošni pravili: 1. Čim višje je spremenljivka v tej delitvi, tem več statističnih metod lahko uporabimo pri obdelavi podatkov zanjo. Najmanj statističnih metod lahko uporabimo za nominalne, nekaj več za ordinalne, še več za intervalne in največ (vse!) za razmernostne. 2. Vse statistične metode, ki veljajo za neko vrsto spremenljivk, lahko uporabimo za vse vrste, ki so višje v tej delitvi. Če neko metodo lahko uporabimo, na primer za ordinalne spremenljivke, jo lahko tudi za intervalne in razmernostne.

Pri vseh statističnih metodah bomo še sproti navajali, za katere spremenljivke jih lahko uporabimo in za katere ne. 4. ZVEZNE IN NEZVEZNE SPREMENLJIVKE Numerične spremenljivke lahko imajo vse vrednosti v nekem intervalu ali pa le nekatere. Prve so zvezne in druge nezvezne. Za prispodobo bomo vzeli jato ptičev. Predstavimo si telefonske ţice med dvema drogovoma ob cesti in ptiče na njih. Nekateri ptiči se nagnetejo in sedijo na ţicah tesno drug ob drugem. Druge vrste ptičev ne prenašajo telesnega dotika in sedijo na ţicah drug od drugega oddaljeni decimeter ali dva. Stisnjeni drug ob drugega nam ponazarjajo zvezne spremenljivke, ptiči na razmakih pa nezvezne. Telesna višina je tipična zvezna spremenljivka. Če je učenec imel na začetku šolskega leta 156 cm in na koncu 159 je v tem intervalu moral preiti čez vse višine: npr. ni mogel preskočiti višine 158,65 cm. Podobno je tudi z vrednostmi telesnih višin za skupino učencev: med najmanjšim in največjim učencem v razredu lahko imajo ostali učenci kakršnokoli višino. Pri tem moramo opozoriti, da v praksi običajno meritve telesne višine izraţamo v celih centimetrih. Če bi omenjenega učenca vsakih nekaj mesecev merili pri šolskem zdravniku, bi v kartoteki imel zabeleţene višine: 156, 157, 158 in na koncu 159 cm. Toda to ne spremeni bistva spremenljivke: učenec je postopno rasel od 156 cm do 157 cm itd. Zvezne spremenljivke lahko imajo vse vrednosti v nekem intervalu. Ime zvezne izhaja iz tega, da se vrednosti nizajo neprekinjeno (zvezno, brez praznih mest, med vrednostmi ni preskokov ). Število učencev v razredu je tipična nezvezna spremenljivka. Če je najmanjše moţno število, npr. šestnajst in največje petindvajset, ima lahko ta spremenljivka vrednosti le 16, 17, 18, 19, 20, 21 22, 23, 24 in 25. Med sosednjima vrednostma ni nobene vrednosti (npr. med 16 in 17). Naredimo še kratko miselno vajo. Imamo spremenljivko doseţek na testu znanja. Vrednosti so izraţene v celih točkah. Za pravilno rešitev učenec dobi točko, za nepravilno pa nič točk. To je nezvezna spremenljivka. Kaj pa, če učitelj daje za delne rešitve po pol točke? Ali je sedaj, ko se pojavijo vmesne vrednosti (npr. 11,5), ta spremenljivka zvezna? Odgovor je ne! Res je, da so

moţne vmesne vrednosti, toda med 11,5 in 12 spet ni nobenih vrednosti. Spremenljivka lahko ima samo vrednosti enajst, enajst in pol, dvanajst, dvanajst in pol itd. Torej je nezvezna. Moramo povedati še to, da zvezne spremenljivke v praksi izraţamo z nezveznimi vrednostmi. To smo videli ţe pri telesni višini; podobno je s starostjo, telesno teţo, temperaturo itd. Navsezadnje je tudi znanje zvezna spremenljivka, vedno pa jo izraţamo s točkami ali ocenami, ki so nezvezne. Obratno pa je pri obdelavi podatkov. Mnoge nezvezne spremenljivke brez večje škode obdelujemo kot da so zvezne, saj je to bolj preprosto. 5. ODVISNE IN NEODVISNE SPREMENLJIVKE Spremenljivke po vlogi, ki jo imajo v medsebojnih povezavah, delimo na neodvisne in odvisne. V najpreprostejših primerih proučujemo povezanost dveh spremenljivk. V vsakem paru dveh povezanih spremenljivk ima ena vlogo neodvisne (to je tista, ki deluje) in druga vlogo odvisne (tista na katero deluje). Takšne vloge jim dajemo glede na naravo povezanosti med njima in glede na namen raziskave. Ista spremenljivka je lahko v enem paru odvisna, v nekem drugem paru pa neodvisna. Celo v istem paru lahko spremenljivki zamenjata vlogi. Mnoge povezave vzgojnih pojavov niso enoznačne in enostranske. V paru čas domačega učenja in šolska ocena štejemo, da je čas domačega učenja neodvisna spremenljivka in šolska ocena odvisna. Vemo, da več učenja v splošnem pomeni boljše ocene. Vendar je zveza tudi obratna: ocena, ki jo učenec dobi v šoli, vpliva na to, koliko se bo učil. Torej je lahko tudi ocena neodvisna in čas domačega učenja odvisna. Takšni primeri so na pedagoškem področju pogosti. Zato so te delitve večinoma začasne. Hkrati pa poznamo vrsto spremenljivk, ki so v pedagoških raziskavah trajno neodvisne. Spol je spremenljivka, ki v pedagoških raziskavah nastopa vedno kot neodvisna (seveda, kadar sploh nastopa), podobno je z narodnostjo, starostjo itd. Večina

pravih vzgojnih pojavov pa stalno menja vloge neodvisnih in odvisnih spremenljivk. Omenimo še, da izraz neodvisna spremenljivka, seveda ne pomeni, da je ta spremenljivka neodvisna v kakšnem absolutnem smislu: da ni od ničesar odvisna. Ni takšnih pojavov, ki bi bili absolutno neodvisni. Izraz pomeni le, da je imenovana spremenljivka tista, ki vpliva (pa še pri tem smo videli, da je vpliv pogosto obojestranski). IV. Parametri Vrednosti spremenljivke so značilne za vsako posamezno enoto mnoţice. Po teh vrednostih enote lahko primerjamo, razvrščamo, grupiramo itd. Podobno vlogo, kot jo ima vrednost spremenljivke za enoto, ima parameter za neko mnoţico. Parametri so številske značilnosti mnoţice. V splošnem parameter določamo iz vrednosti spremenljivke za posamezne enote. Najpogostejši parametri v pedagoških raziskavah so: strukturni odstotki, srednje vrednosti, mere razpršenosti, kazalci korelacije itd.

DRUGO POGLAVJE UREJEVANJE PODATKOV Podatke za proučevane spremenljivke moramo pred statistično obdelavo primerno urediti. S tem si olajšamo njihovo obdelavo in jo naredimo pregledno. S pojavom in vse bolj mnoţično uporabo računalnikov se je urejanje podatkov bistveno spremenilo. Za ročno obdelavo podatkov podatke zares uredimo, za računalniško jih pa le pripravimo. Ker je za dobro razumevanje (in uporabo!) statističnih postopkov obdelave podatkov, potrebno poznati tudi postopke računanja (bolj literarno povedano: poleg rezultatov moramo poznati tudi pot do teh ), bomo na kratko prikazali postopke za urejanje podatkov in pripravo za računalniško obdelavo. I. Urejevanje podatkov za opisne spremenljivke Podatke za opisno spremenljivko uredimo tako, da sestavimo frekvenčno tabelo. Za vsako kategorijo spremenljivke določimo frekvenco, tako pripravljene podatke pa vnesemo v frekvenčne tabele. Frekvence so lahko absolutne ali relativne. Absolutna frekvenca pove, koliko je enot v določeni kategoriji neke spremenljivke, relativna pa, kolikšen del celotne mnoţice je v tej kategoriji. Relativne frekvence praviloma vedno izraţamo v odstotkih. S tem smo uredili podatke in prikazali njihovo strukturo, kar je ţe prvi korak v statistično obdelavo. Takšne odstotke, ki kaţejo notranjo delitev neke mnoţice, imenujemo strukturni odstotki, tabele pa pogosto tudi strukturne tabele ali kratko strukture (nič hudega ne bo, če ji rečemo frekvenčna tabela). Spodaj imamo primer tabele po spremenljivki spol za neko mnoţico.

Tabela 6. Strukturna tabela učencev po spolu kategorije f f % ţenski 25 43,1 moški 33 56,9 skupaj 58 100,0 Vidimo, da je ţensk v tej mnoţici nekaj manj kot polovica in moških več kot polovica vseh. Število vseh enot v mnoţici je 58; to število imenujemo numerus in označujemo z oznako N. To lahko zapišemo: N = 58. Če je spremenljivka ordinalna in ima več kot dve stopnji, včasih dodamo še stolpec z kumulativnimi odstotnimi frekvencami. To so zbirne frekvence, ki povedo, koliko odstotkov enot je skupaj do te stopnje (rečemo tudi: koliko jih je pod to kategorijo ). Vendar kumulativne frekvence delamo le takrat, ko jih zares potrebujemo. Kumulativne frekvence dobimo tako, da seštejemo vse frekvence za niţje kategorije. Spodaj imamo tabelo za spremenljivko šolski uspeh. Tabela 7. Strukturna tabela učencev po šolskem uspehu šolski uspeh f f % F % nezadosten 3 3,9 0 zadosten 11 14,5 3,9 dober 38 50,0 18,4 prav dober 17 22,4 68,4 odličen 7 9,2 90,8 skupaj 76 100,0 100,0 Kumulativna frekvenca 68,4% nam pove, da je toliko učencev z uspehom niţjim od prav dobrega.

Rezultate v statistiki praviloma zaokroţamo na dve decimalki; vendar z nekaterimi izjemami. Izjemo vidimo v obeh prejšnjih tabelah. Uveljavilo se je namreč pravilo, da se odstotne frekvence v tabelah zaokroţajo na eno decimalno mesto. To pa ne velja za tiste odstotke, ki jih nameravamo uporabiti za nadaljnje obdelave. Tam velja splošno pravilo o zaokroţanju vrednosti na dve decimalni mesti. Seveda ne bo nič narobe, če odstotke v tabeli zaokroţimo na dve decimalni mesti, vendar ni potrebno. Po eni strani je škoda dela, po drugi strani pa je takšna tabela manj pregledna. Toda pozor: na manj kot eno decimalko pa ne! Na takšen način uredimo in prikaţemo podatke za vse spremenljivke v raziskavi. Pogosto pa poleg stanja po posameznih spremenljivkah proučujemo tudi povezanost med spremenljivkama. Za takšne namene moramo narediti drugačne tabele. Tabela lahko prikazuje strukturo posamezne spremenljivke ali pa strukturo več spremenljivk hkrati. Prve imenujemo enostavne ali enkratne strukture, druge pa večkratne ali sestavljene strukture. Največkrat prikazujemo v večkratni strukturi dve spremenljivki; večkratna struktura za več spremenljivk je namreč izredno nepregledna. Kadar proučujemo povezanost več spremenljivk hkrati, podatkov ne urejamo v obliki strukturnih tabel. Spodaj imamo primer večkratne strukture za spremenljivki stopnja izobrazbe in stališče (o nekem pojavu). Tabela 8. Frekvenčna tabela zaposlenih po izobrazbi in stališču sem za ne morem sem proti skupaj se odločiti srednja izobrazba 12 6 28 46 višja izobrazba 5 3 7 15 visoka izobrazba 11 2 4 17 skupaj 28 11 39 78

Podatki so sicer urejeni, vendar tabela slabo kaţe povezanost med spremenljivkama. Zato je treba izračunati še odstotne frekvence. Odstotne frekvence lahko izračunamo na tri načine in tako lahko nastanejo tri različne tabele. Spodaj so prikazane vse tri. V prvi so odstotki računani po kategorijah izobrazbe, v drugi po kategorijah stališča, v tretji pa iz celotnega numerusa (N=78). Tabela 9. Strukturna tabela zaposlenih po stališču, posebej za vsako izobrazbo sem za ne morem se sem proti skupaj odločiti srednja izobrazba 12 26,1 6 13,0 28 60,9 46 100,0 višja izobrazba 5 33,3 3 20,0 7 46,7 15 100,0 visoka izobrazba 11 64,7 2 11,8 4 23,5 17 100,0 skupaj 28 35,9 11 14,1 39 50,0 78 100,0 V tej tabeli smo v vodoravnih vrsticah računali odstotke iz vsote na koncu vrtice (desno). Tako v prvi vrstici frekvenca 12 predstavlja 26,1% od vsote 46 (na desnem koncu vrstice). Zato vsi odstotki v vrstici tvorijo skupaj 100,0% (26,1% + 13,0% + 60,9% = 100,0%). Enako je v ostalih vrsticah.

Tabela 10. Strukturna tabela zaposlenih po izobrazbi, posebej za vsako stališče sem za ne morem se sem proti skupaj odločiti srednja izobrazba 12 42,9 6 54,5 28 71,8 46 59,0 višja izobrazba 5 17,9 3 27,3 7 17,9 15 19,2 visoka izobrazba 11 39,3 2 18,2 4 10,3 17 21,8 skupaj 28 100,0* 11 100,0 39 100,0 78 100,0 V tej tabeli smo v navpičnih stolpcih računali odstotke iz vsote na dnu stolpca (spodaj). Tako v drugem stolpcu frekvenca 6 predstavlja 54,5% od vsote 11 (na dnu stolpca). Zato vsi odstotki v stolpcu tvorijo skupaj 100,0% (54,5% + 27,3% + 18,2% = 100,0%). Enako je v ostalih stolpcih.

Tabela 11. Strukturna tabela zaposlenih po izobrazbi in stališču sem za ne morem se sem proti skupaj odločiti srednja izobrazba 12 15,4 6 7,7 28 35,9 46 59,0 višja izobrazba 5 6,4 3 3,8 7 9,0 15 19,2 visoka izobrazba 11 14,1 2 2,6 4 5,1 17 21,8 skupaj 28 35,9 11 14,1 39 50,0 78 100,0 V tej tabeli smo v okencih računali odstotke iz celotnega numerusa (N = 78). Tako v prvem okencu (levo zgoraj) frekvenca 12 predstavlja 15,4% od numerusa 78. Odstotki iz vseh okenc tvorijo skupaj 100,0% (15,4% + 7,7% + 35,9% + 6,4% + 3,8% + 9,0% + 14,1% + 2,6% + 5,1% = 100,0%). Tudi v okencih»skupaj«so vsi odstotki izračunani iz celotnega numerusa. Prva tabela je primerna za odgovarjanje na vprašanje, kako izobrazba vpliva na stališče. Iz izkušenj vemo, da imajo ljudje z različno izobrazbo različna stališča, po katerih jih sprašujemo v raziskavi. Torej sta ti dve spremenljivki povezani. Če sta povezani, moramo presoditi, katera je neodvisna in katera odvisna. Sodimo, da je v tem paru izobrazba neodvisna spremenljivka in stališče odvisna. Ker je to smiselna smer povezave, je prav ta tabela tisto, kar najbolj potrebujemo. Zato praktično vedno pri proučevanju povezanosti med dvema spremenljivkama izračunavamo odstotke na takšen način kot v prvi tabeli (torej po kategorijah neodvisne spremenljivke). Druga tabela je primerna za interpretacijo vpliva stališča na izobrazbo, kar je seveda nesmiselno. Zato v praksi takšnih tabel ne uporabljamo.

Tretja tabela ni primerna za interpretacijo povezanosti med spremenljivkama; iz nje izvemo le to, koliko je enot v vsakem okencu (in koliko je to odstotkov). Ker ni primerna za interpretacijo povezanosti, je pravzaprav nepotrebno omenjeni dve spremenljivki sploh prikazovati v takšni tabeli. Če sta spremenljivki, ki ju proučujemo, povezani, je smiselna prva tabela, če pa nista povezani, pa je edina smiselna tabela pravzaprav nepotrebna (to je tretja tabela). In še drobna tehnična zadeva: ponekod v tabeli vsota odstotkov iz okenc v vrstici ali stolpcu ni enaka napisani vsoti na koncu vrstice ali stolpca (npr. 100,0). To se zgodi zaradi vmesnih zaokroţanj. Tudi v naših tabelah se je to na enem mestu zgodilo (vsota označena z zvezdico). Ne gre za vsebinski problem, to je le tehnični problem. V takšnih primerih imamo na voljo več moţnosti: V okencu "skupaj" zapišemo vsoto 100,0 in jo označimo z zvezdico, v opombi pa napišemo, da zaradi zaokroţanja vsota vmesnih odstotkov ni 100,0. Enega izmed odstotkov v vrstici ali stolpcu zaokroţimo (proti pravilom) tako, da dobimo vsoto 100,0 in tako zaokroţeni odstotek označimo z zvezdico; znova v opombi bralcem pojasnimo zadevo. Zapišemo vsoto tako kot znese (npr. 100,1), jo označimo z zvezdico in v opombi to pojasnimo itd. Moţnosti je še več. Zagotovo je najslabša, da nič ne ukrenemo in bralcem sploh ničesar ne pojasnimo. II. Urejevanje podatkov za številske spremenljivke Urejeni opisni podatki so ţe primerni za interpretacijo, pri številskih podatkih pa je drugače. Številski podatki nam le malo pokaţejo samo s tem, da so urejeni. Urejevanje je potrebno predvsem zaradi laţje nadaljnje obdelave. Odkar se za obdelavo podatkov uporabljajo računalniški programi, je urejevanje številskih podatkov postalo skoraj nepotrebno. Številske podatke uredimo na dva načina.

1. RANŢIRNA VRSTA Kadar je število enot majhno, zadostuje, da podatke razvrstimo po velikosti. Tako urejen niz podatkov je ranţirna vrsta. Običajno začnemo z najmanjšo vrednostjo in končamo z največjo. Med tema so razvrščene vse ostale vrednosti. Tiste, ki se pojavljajo večkrat, tolikokrat tudi napišemo. V ranţirni vrsti morajo biti vsi podatki (vse vrednosti, ki se pojavljajo). Iz ranţirne vrste se vidi vsak podatek, število vseh podatkov in poloţaj vsakega podatka med ostalimi. Poglejmo primer neurejene vrste podatkov in ranţirne vrste. Podatki o letih prakse za skupino učiteljev: 22, 16, 7, 3, 29, 27, 11, 9, 14, 5, 10, 5, 8, 17, 26, 13. Ranţirna vrsta za iste podatke: 3 5 5 7 8 9 10 11 13 14 16 17 22 26 27 29 Pogosto v ranţirni vrsti k vrednostim spremenljivke pripišemo še absolutne range. Absolutni rangi kaţejo vrstni red enot v ranţirni vrsti. Najniţji vrednosti damo rang 1 (ena), naslednji 2 (dva) in tako do konca ranţirne vrste. Tabela 12. Ranţirna vrsta z vrednostmi spremenljivke in absolutnimi rangi x 3 5 5 7 8 9 10 11 13 14 16 17 22 26 27 29 R 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 Pri določanju rangov lahko trčimo ob vprašanje, kaj narediti v primeru dveh (ali več) enakih vrednosti. V našem primeru imamo dve enoti z vrednostjo 5 let prakse. Na voljo imamo vsaj dve moţnosti. Prva je ta, ki smo jo uporabili v zgornjem primeru: čeprav sta vrednosti enaki, smo jima dali različna zaporedna ranga (dva in tri). To je preprostejša rešitev, čeprav manj natančna. Namreč, ni najbolje, da imajo enaki rezultati različne range. Druga moţnost je dati enakim vrednostim enake range. Takšnim rangom rečemo vezani rangi, prejšnjim pa nevezani. Za isti primer bomo naredili ranţirno vrsto z vezanimi rangi.

Tabela 13. Ranţirna vrsta z vezanimi rangi x 3 5 5 7 8 9 10 11 13 14 16 17 22 26 27 29 R 1 2,5 2,5 4 5 6 7 8 9 10 11 12 13 14 15 16 Vezani rang smo v tem primeru določili kot povprečni rang: sešteli smo ranga dva in tri ter delili z dva. Takšen način je nekoliko manj pregleden, potrebna je večja pazljivost in tudi interpretacija ni več tako preprosta; je pa vsekakor bolj natančen. Če ranţirno vrsto sestavljamo za posamično spremenljivko in podatke naprej obdelujemo brez povezav z drugimi spremenljivkami, običajno izberemo prvi, preprostejši način. Kadar pa je z rangi povezano še kaj drugega, izberemo raje vezane range. Še zlasti v vzgojni praksi: če bi bilo od rangov odvisno karkoli pomembnega za posameznike, ki jih razvrščamo, izberemo vezane range. Na primer - pri sestavljanju ranţirne vrste za sprejem na neko srednjo šolo (kjer je več kandidatov za vpis kot prostih mest) nikakor ne moremo uporabiti neenakih rangov za enake vrednosti. Lahko bi se namreč zgodilo, da bi izmed učencev z enakim doseţkom nekateri bili sprejeti in nekateri ne. Kaj narediti v takem primeru s kandidati za vpis, presega namen te knjige (mimogrede: to sploh ni lahek problem v praksi). Če je število enot večje od običajnega šolskega razreda, postane ranţirna vrsta zaradi dolţine slabo pregledna. Zato pri večjih numerusih uporabljamo bolj ekonomičen način urejevanja numeričnih podatkov - frekvenčno porazdelitev. 2. FREKVENČNA PORAZDELITEV Ta način urejevanja podatkov smo v nekoliko drugačni podobi videli ţe pri opisnih podatkih. Vsaki vrednosti spremenljivke določimo frekvenco (število enot, ki imajo takšno vrednost). Za primer bomo vzeli telesne višine učencev in prikazali preprosto frekvenčno porazdelitev: Tabela 14. Frekvenčna porazdelitev telesna višina f 142 3 146 6 147 7 149 9 152 8 155 5 157 2 159 1

V tej frekvenčni porazdelitvi je najmanjša frekvenca ena in največja devet. Vrednosti so porazdeljene v razponu med 142 in 159. Takšno preprosto frekvenčno porazdelitev v praksi redko uporabljamo. Običajno je razpon numeričnih vrednosti velik in je potrebno frekvenčno porazdelitev strniti. To storimo tako, da zdruţimo več vrednosti in seštejemo njihove frekvence. Zdruţenim vrednostim rečemo razredi. Zaradi praktičnih razlogov zdruţujemo tako, da dobimo deset do dvajset razredov (raje bliţe k deset) in da so vsi enako široki (zajemajo enako širok razpon vrednosti). Poglejmo primer frekvenčne porazdelitve za rezultate na testu znanja: Tabela 15. Frekvenčna tabela razredi f f% F F% 8-12 2 1,7 0 0 13-17 5 4,2 2 1,7 18-22 8 6,7 7 5,8 23-27 11 9,2 15 12,5 28-32 17 14,2 26 21,7 33-37 21 17,5 43 35,8 38-42 15 12,5 64 53,3 43-47 15 12,5 79 65,8 48-52 12 10,0 94 78,3 53-57 10 8,3 106 88,3 58-62 4 3,3 116 96,7 N=120 Opišimo podrobno to frekvenčno porazdelitev. Vrednosti spremenljivke so porazdeljene na enajst razredov. Vsi razredi imajo enako širino. Širino razreda izberemo tako, da celoten razpon vrednosti delimo z ţeljenim številom razredov in zaokroţimo na najbliţje celo število. V našem primeru je bil največji rezultat x max =61, najniţji rezultat x min =8 in razpon 61-8+1=54 (dodajanje enke bomo pojasnili pozneje). Ta razpon smo delili z deset in rezultat 5,4 zaokroţili na 5. Širina razreda je i=5 (čeprav se na prvi pogled zdi, da je med 8 in 12 točk razpon le štiri). Običajne frekvence (f) ţe poznamo. Tako nam frekvenca 2 pove, da sta dva učenca dosegla rezultat med osem in dvanajst točk. V drugem stolpcu so te frekvence izraţene v odstotkih (relativne frekvence). Če sluţijo le interpretaciji, je zadosti, da so zaokroţene na eno decimalko, če pa sluţijo nadaljnjim preračunavanjem, pa morajo biti zaokroţene na dve decimalki. Tretji stolpec so kumulativne frekvence F. Te nadomeščajo absolutne range. Kumulativna frekvenca pove, koliko enot ima niţje vrednosti od danega razreda (koliko jih je pod tem razredom). V četrtem stolpcu so te frekvence preračunane v odstotke (relativne kumulativne frekvence). Kakšne lastnosti ima frekvenčna porazdelitev in kaj nam omogoča? Podatki so prikazani strnjeno, kar je ekonomično za nadaljnjo obdelavo. Čim manj je

razredov, tem večji je prihranek časa pri obdelavi. Vendar pa se z zdruţevanjem podatkov in tvorjenjem razredov del informacije o podatkih izgubi. Iz frekvenčne porazdelitve se vidi, npr. da je pet učencev doseglo rezultate med 13 in 17 točk, ne vidi se pa natančno za vsakega učenca, koliko točk je dosegel. Treba je še omeniti, zakaj smo pri računanju razpona prišteli ena. Število točk na testu znanja je nezvezna spremenljivka. Vrednosti, ki se pojavljajo, so osem, devet, deset itd. Zaradi laţje obdelave si zamislimo, da je spremenljivka zvezna. Tedaj se najniţji rezultat začne pri 7,5 in najvišji konča pri 61,5. Razpon bi torej morali računati tako: 61,5-7,5 = 54. Ker takšne vrednosti zapisujemo kot 61 in 7, moramo na koncu dodati tisti dve polovički - od tod torej +1. Preprosto povedano: vse numerične spremenljivke obdelujemo kot da so zvezne. S tem je obdelava preprostejša in enotna. Takšen način se sicer rahlo upira našemu (običajnemu) razumevanju pojavov; bistveno pa je, da ne naredi nobene stvarne škode podatkom. Nekoč se je frekvenčna porazdelitev uporabljala predvsem zaradi nadaljnje obdelave podatkov, odkar se uporabljajo računalniki, pa predvsem le za njihov prikaz.

TRETJE POGLAVJE RANGI S pomočjo rangov določamo poloţaj posameznega rezultata med ostalimi. Range v vsakdanjem ţivljenju zelo pogosto srečujemo in uporabljamo. Opis turističnega potovanja se začne navadno: Prvi dan se preko Ljubelja odpeljemo... Podobno je v športu: Rajmond Debevec je osvojil šesto mesto... Ali tudi v ljudskih rekih: V tretje gre rado! Pravzaprav gre tudi pri empiričnem proučevanju vzgojnih pojavov za podobno uporabo rangov. Da bi bolje razumeli in pojasnili pojave, jih med seboj primerjamo in razvrščamo. Temu sluţi metoda rangov. Poznamo dve temeljni vrsti rangov absolutne range in relativne range. I. Absolutni rangi Ta rang smo spoznali ţe pri ranţirni vrsti. Ranţirno vrsto sestavimo tako, da rezultate (vrednosti spremenljivke) razvrstimo po velikosti. Običajno začnemo z najmanjšo vrednostjo in končamo z največjo. Najmanjša vrednost dobi absolutni rang ena (R=1), naslednja večja dva (R=2) in tako do največje vrednosti. Vendar takšne range le redko uporabljamo. Ranţirna vrsta nam je bolj potrebna kot način urejanja podatkov. Pogosteje absolutni rangi nastanejo v praksi, ko proučujemo spremenljivko, ki se ne da numerično meriti. Kako izmeriti prizadevnost učencev? Instrumenta za merjenje prizadevnosti nimamo. Sploh pa ne gre na numeričen način - prizadevnost ni intervalna spremenljivka. Če bi učence vprašali, kakšna je njihova prizadevnost, bi dobili preveč subjektivne in povrhu zelo nezanesljive samoocene. V takem primeru lahko učitelj razvrsti učence po prizadevnosti od najmanj prizadevnega do najbolj prizadevnega. Dobljeni rangi so ocena prizadevnosti. To je bolje, kot če bi imeli za učence nenatančne opise, npr.: "Marko je precej prizadeven, Andreja je med najbolj prizadevnimi..." itd. Seveda je uporabnost dobljenih rangov predvsem odvisna od učitelja (od njegove strokovnosti, objektivnosti itd.). Vendar poglabljanje v to, ţe presega namen te knjige. Dodajmo le: če bi v kakšnem primeru dvomili, ali lahko dobimo dovolj dobre range, jih pač ne bi uporabili.

II. Relativni rangi Absolutni rangi so uporabni le znotraj neke skupine; primerjave med skupinami so moţne le za enako velike skupine. Da bi primerjali poloţaje v različno velikih skupinah, potrebujemo relativne range. Relativni rang izračunamo tako: formula: P= R/N Relativni rang pove, kolikšen del skupine je pod določeno vrednostjo (pod določenim rezultatom). Torej bi rang 0,20 pomenil, da je ena petina skupine (ali 20%) pod tem rezultatom. Učenec, ki bi pri neki uspešnosti imel rang 0,60, bi rekel: "Šestdeset odstotkov skupine je slabših od mene, štirideset odstotkov pa je boljših". Vrednosti relativnih rangov se gibljejo med nič in ena. Vrednosti malo nad nič pomenijo zelo nizek poloţaj (na začetku ranţirne vrste), vrednosti okoli 0,50 pomenijo srednji poloţaj (na sredini ranţirne vrste), vrednosti blizu ena pa pomenijo zelo visok poloţaj.

ČETRTO POGLAVJE SREDNJE VREDNOSTI I. Primerjanje mnoţic Posameznike (posamezne enote statistične mnoţice) po neki spremenljivki primerjamo tako, da primerjamo njihove vrednosti, doseţene v tej spremenljivki. Tako, npr. če sta na testu znanja iz kemije učenca Marko in Aleš dosegla 26 oziroma 14 točk, bomo iz teh dveh doseţkov takoj videli, da je Marko dosegel več točk (da ima višji rezultat; da je njegov doseţek boljši). Včasih višja vrednost spremenljivke sicer pomeni slabši doseţek (npr. večje število napak pri nareku pomeni slabši doseţek), vendar to ne spremeni bistva pri primerjanju doseţkov posameznikov. Kaj izbrati, kadar ţelimo primerjati statistične mnoţice? Kaj sploh pomeni primerjava mnoţic in za kaj to potrebujemo? Npr. ţelimo vedeti: Ali so bolje pisali test učenci v 8.a razredu ali v 8.b? Ali se plače učiteljev v srednjem šolstvu razlikujejo od plač učiteljev v osnovnem šolstvu? Ali študenti ob delu študirajo dlje od rednih študentov? itd. Pri primerjavi dveh mnoţic bi sicer lahko primerjali vse rezultate iz ene mnoţice z vsemi iz druge, vendar bi hitro ugotovili, da je to uspešno le, kadar imajo mnoţice komaj nekaj enot. Pri količkaj večjih mnoţicah je to praktično nemogoče. Lahko bi izbrali iz vsake mnoţice le po eno enoto za primerjavo, vendar se takoj postavi vprašanje, katere enote izbrati? Če je najboljši posameznik v eni mnoţici dosegel višji rezultat od najboljšega v drugi mnoţici, to še ne pomeni, da je hkrati ta mnoţica boljša. Podobno velja tudi za najniţje doseţke. Hitro bi spoznali, da takšni postopki ne omogočajo dobre in zanesljive primerjave. Najbolj zanesljivo primerjavo nam omogočajo tiste vrednosti, ki so

na sredini porazdelitve. Te vrednosti so najbolj tipične, največ jih je, okoli sredine so najbolj nakopičene itd. Zato bomo rešitev iskali v tej smeri. Takšne vrednosti imenujemo srednje vrednosti. II. Srednje vrednosti Naravi pojavov in spremenljivk na pedagoškem področju najbolj ustrezajo naslednje tri srednje vrednosti: modus (M o ), mediana (M e )in aritmetična sredina (M). Modus je točka (vrednost), kjer so vrednosti spremenljivke najbolj zgoščene (nakopičene). V najpreprostejšem primeru je to vrednost, ki se najpogosteje pojavlja. Npr. če ima v nekem razredu največ učencev oceno prav dobro (4) pri nekem predmetu, je ta ocena hkrati modus (modus je torej 4). Modus lahko določimo celo za nominalne spremenljivke (čeprav je res, da to nima skoraj nobenega praktičnega pomena). Je zelo preprosta srednja vrednost: hitro in preprosto se ga da daločiti, je lahko razumljiv in preprost za interpretacijo. Ker pa za določanje modusa niso potrebne vse vrednosti v mnoţici, pogosto ne omogoča zanesljivih primerjav med mnoţicami. Povrhu tega se lahko zgodi, da je točk z največjo gostoto vrednosti hkrati več; takrat je tudi več modusov. V takšnih primerih običajno primerjava mnoţic ni mogoča. Moduse sicer lahko določimo, vendar praktično ne sluţijo ničemur. Mediana je vrednost, od katere ima polovica mnoţice višje vrednosti, polovica pa niţje. Npr. razvrstimo učence v razredu po velikosti od najmanjšega do največjega. Poiščemo učenca, ki je na sredini (polovica učencev v razredu je večjih od njega, polovica pa manjših). Telesna višina tega učenca je mediana (npr.153 cm).