LINEARNI MODELI 3 STATISTIČKI PRAKTIKUM 2 4. VJEŽBE

Similar documents
TEORIJA SKUPOVA Zadaci

LINEARNI MODELI STATISTIČKI PRAKTIKUM 2 2. VJEŽBE

Red veze za benzen. Slika 1.

PRIPADNOST RJEŠENJA KVADRATNE JEDNAČINE DANOM INTERVALU

Uvod u relacione baze podataka

Mathcad sa algoritmima

Projektovanje paralelnih algoritama II

Multipla korelacija in regresija. Multipla regresija, multipla korelacija, statistično zaključevanje o multiplem R

Rešenja zadataka za vežbu na relacionoj algebri i relacionom računu

NAPREDNI FIZIČKI PRAKTIKUM II studij Geofizika POLARIZACIJA SVJETLOSTI

GENERALIZIRANI LINEARNI MODELI. PROPENSITY SCORE MATCHING.

Fajl koji je korišćen može se naći na

MODELS WITHOUT AN INTERCEPT

Metode praćenja planova

Slika 1. Slika 2. Da ne bismo stalno izbacivali elemente iz skupa, mi ćemo napraviti još jedan niz markirano, gde će

ZANIMLJIV NAČIN IZRAČUNAVANJA NEKIH GRANIČNIH VRIJEDNOSTI FUNKCIJA. Šefket Arslanagić, Sarajevo, BiH

NAPREDNI FIZIČKI PRAKTIKUM 1 studij Matematika i fizika; smjer nastavnički MJERENJE MALIH OTPORA

Konstrukcija i analiza algoritama

APPROPRIATENESS OF GENETIC ALGORITHM USE FOR DISASSEMBLY SEQUENCE OPTIMIZATION

NAPREDNI FIZIČKI PRAKTIKUM II studij Geofizika MODUL ELASTIČNOSTI

Formule za udaljenost točke do pravca u ravnini, u smislu lp - udaljenosti math.e Vol 28.

Neke klase maksimalnih hiperklonova

Oracle Spatial Koordinatni sustavi, projekcije i transformacije. Dalibor Kušić, mag. ing. listopad 2010.

Tests of Linear Restrictions

DETERMINATION OF THE EFFECTIVE STRAIN FLOW IN COLD FORMED MATERIAL

KLASIFIKACIJA NAIVNI BAJES. NIKOLA MILIKIĆ URL:

KVADRATNE INTERPOLACIJSKE METODE ZA JEDNODIMENZIONALNU BEZUVJETNU LOKALNU OPTIMIZACIJU 1

24. Balkanska matematiqka olimpijada

INTRODUCTION TO LOW FREQUENCY LOCAL PLASMONS IN BULK EXTRINSIC SEMICONDUCTORS UDC 538.9; Yuri Kornyushin

PRECIPITATION FORECAST USING STATISTICAL APPROACHES UDC 55:311.3

DEVELOPMENT OF MATHEMATICAL MODELS TO PREDICT THE EFFECT OF INPUT PARAMETERS ON FEED RATE OF A RECIPROCATORY TUBE FUNNEL FEEDER

STATISTICAL ANALYSIS OF WET AND DRY SPELLS IN CROATIA BY THE BINARY DARMA (1,1) MODEL

FIZIKALNA KOZMOLOGIJA VII. VRLO RANI SVEMIR & INFLACIJA

Fibonaccijev brojevni sustav

A NEW THREE-DIMENSIONAL CHAOTIC SYSTEM WITHOUT EQUILIBRIUM POINTS, ITS DYNAMICAL ANALYSES AND ELECTRONIC CIRCUIT APPLICATION

Chapter 8 Conclusion

HENDERSON'S APPROACH TO VARIANCE COMPONENTS ESTIMATION FOR UNBALANCED DATA UDC Vera Djordjević, Vinko Lepojević

Funkcijske jednadºbe

Konstekstno slobodne gramatike

Iskazna logika 1. Matematička logika u računarstvu. oktobar 2012

1 Multiple Regression

RELIABILITY OF GLULAM BEAMS SUBJECTED TO BENDING POUZDANOST LIJEPLJENIH LAMELIRANIH NOSAČA NA SAVIJANJE

Modified Zagreb M 2 Index Comparison with the Randi} Connectivity Index for Benzenoid Systems

Booklet of Code and Output for STAC32 Final Exam

Algoritam za množenje ulančanih matrica. Alen Kosanović Prirodoslovno-matematički fakultet Matematički odsjek

Krivulja središta i krivulja fokusa u pramenu konika. konika zadanom pomoću dviju dvostrukih točaka u izotropnoj ravnini

Metode izračunavanja determinanti matrica n-tog reda

NC Births, ANOVA & F-tests

Osobine metode rezolucije: zaustavlja se, pouzdanost i kompletnost. Iskazna logika 4

Sveučilište J.J.Strossmayera u Osijeku Odjel za matematiku. Sveučilišni preddiplomski studij matematike

Karakteri konačnih Abelovih grupa

A L A BA M A L A W R E V IE W

Stat 5102 Final Exam May 14, 2015

Mjerenje snage. Na kraju sata student treba biti u stanju: Spojevi za jednofazno izmjenično mjerenje snage. Ak. god. 2008/2009

Umjetna inteligencija - Neizrazita (fuzzy) logika

MS&E 226: Small Data

Teorem o reziduumima i primjene. Završni rad

Metrički prostori i Riman-Stiltjesov integral

Zlatko Mihalić MOLEKULARNO MODELIRANJE (2+1, 0+0)

Nested 2-Way ANOVA as Linear Models - Unbalanced Example

The Prediction of. Key words: LD converter, slopping, acoustic pressure, Fourier transformation, prediction, evaluation

Zanimljive rekurzije

REVIEW OF GAMMA FUNCTIONS IN ACCUMULATED FATIGUE DAMAGE ASSESSMENT OF SHIP STRUCTURES

Nekoliko kombinatornih dokaza

DEVELOPMENT OF A MATHEMATICAL MODEL TO PREDICT THE PERFORMANCE OF A VIBRATORY BOWL FEEDER FOR HEADED COMPONENTS

Karakterizacija problema zadovoljenja uslova širine 1

APPLICATION OF THOMAS-FERMI MODEL TO FULLERENE MOLECULE AND NANOTUBE UDC 547. Yuri Kornyushin

Basic Business Statistics, 10/e

Sveučilište J.J. Strossmayera u Osijeku Odjel za matematiku Sveučilišni preddiplomski studij matematike. Ivana Oreški REKURZIJE.

Utjecaj trajanja i temperature skladištenja na udio ialctoze u jogurtu - falctorslci plan 3^

Sveučilište Josipa Jurja Strossmayera u Osijeku Odjel za matematiku

Ariana Trstenjak Kvadratne forme

MATH 556 Homework 13 Due: Nov 21, Wednesday

Ksenija Doroslovački KOMBINATORIKA INTERPRETIRANA FUNKCIJAMA I NJIHOVIM OSOBINAMA MASTER RAD. NOVI SAD jun 2008

Jasna Kellner. snowman. twigs 5 snowflakes. snow. carrot. nose. hands school. hat. ice. head. mountain. window

PARALELNI ALGORITMI ZA PROBLEM GRUPIRANJA PODATAKA

General Linear Model (Chapter 4)

Sveučilište J.J. Strossmayera u Osijeku. Odjel za matematiku. David Komesarović. Mooreovi grafovi. Diplomski rad. Osijek, 2017.

UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU I INFORMATIKU

KRITERIJI KOMPLEKSNOSTI ZA K-MEANS ALGORITAM

Fraktali - konačno u beskonačnom

Regression and the 2-Sample t

Stat 5303 (Oehlert): Models for Interaction 1

Matematika (PITUP) Prof.dr.sc. Blaženka Divjak. Matematika (PITUP) FOI, Varaždin

Multiple Regression: Example

Chapter 7 Student Lecture Notes 7-1

Statistics - Lecture Three. Linear Models. Charlotte Wickham 1.

GPA Chris Parrish January 18, 2016

Strojno učenje. Metoda potpornih vektora (SVM Support Vector Machines) Tomislav Šmuc

36-707: Regression Analysis Homework Solutions. Homework 3

ECON 497 Final Exam Page 1 of 12

SCHOOL OF MATHEMATICS AND STATISTICS

ALGORITAM FAKTORIZACIJE GNFS

MATH 423/533 - ASSIGNMENT 4 SOLUTIONS

Ivan Soldo. Sažetak. U članku se analiziraju različiti načini množenja matrica. Svaki od njih ilustriran je primjerom.

Mirela Nogolica Norme Završni rad

(a) The percentage of variation in the response is given by the Multiple R-squared, which is 52.67%.

Recall that a measure of fit is the sum of squared residuals: where. The F-test statistic may be written as:

Factorial Analysis of Variance with R

Transcription:

LINEARNI MODELI 3 STATISTIČKI PRAKTIKUM 2 4. VJEŽBE

Neke vaijable poticaja mou biti kvalitativne po piodi, pimjeice boja očiju i sl. Takve vaijable poticaja nekad zovemo kateoijske vaijable ili faktoi. Kako se ovakve vaijable poticaja mou uaditi u naše modele? Analiza kovaijance se bavi upavo takvim poblemima dje se pojavljuju kombinacije kvantitativnih i kvalitativnih vaijabli poticaja.

Naša stateija je uaditi kvalitativne vaijable poticaja u model pi čemu ih moamo kodiati. Pimje Y = Xb + ε, Y = pomjena u azini kolesteola x = boj odina kvalitativna vaijabla d = { 0, ne uzima lijek 1, uzima lijek

Ovisno o odnosu vaijable poticaja x i kvalitativne vaijable d biamo jedan od sljedećih lineanih modela: 1. Isti model za obje upe > model1=lm(y~x) Y = β 0 + β 1 x + ε 2. Dva eesijska pavca s istim koeficijentom smjea Y = β 0 + β 1 x + β 2 d + ε > model2=lm(y~x+d) U modelu se javlja fiksan utjecaj lijeka. 3. Različiti pavci za svaku upu Y = β 0 + β 1 x + β 2 d + β 3 x d > model3=lm(y~x*d) ili > model3=lm(y~x+d+x:d) Utjecaj lijeka nije fiksan, već ovisi i o odinama.

U pvom slučaju je teško testiati utjecaj lijeka (imamo dva azličita skupa podataka, svaki odeduje svoj eesijski pavac). Dui model efikasnije iskoištava sve podatke za pocjenu zajedničko koeficijenta smjea (uz pp. fiksno utjecaja lijeka). Teći model uključuje inteakciju izmedu pediktoa.

Inteakcija vs. koelacija - Koelacija - statistička ovisnost jedne vaijable o duoj - Inteakcija - utjecaj jedne vaijable poticaja na zavisnu vaijablu ovisi o duoj vaijabli poticaja Izmedu dvije vaijable poticaja može postojati inteakcija bez obzia na to postoji li izmedu njih koelacija ili ne.

Kolineanost Koelianost izmedu pediktoa - jedna vaijabla može biti lineano pedvidena pomoću ostalih (s odedenom točnošću ). Kolineanost ne utječe na pouzdanost modela u cjelini (baem ne za dani skup podataka), neo na pojedine pediktoe o kojima je iječ (pocijenjeni paameti i p-vijednosti mou se značajno pomijeniti ako napavimo male pomjene u modelu ili podacima). Posljedica je da ne možemo pocijeniti utjecaj pediktoa na zavisnu vaijablu. Maticu koelacija dobivamo na sljedeći način: >summay(model, co=t)

Pimje: Dummy vaijabla s dva stupnja Podaci za ovaj pimje se sastoje od visina x, dužina y i stila adnje style sednjevjekovnih katedala. Neke su omaničko (), a due su otičko () stila. Podaci su upisani u cathedal.txt. Učitajmo podatke: > k=ead.table("cathedal.txt") > k style x y Duham 75 502 Glouceste 68 425 --- WinchesteG 103 530 Salisbuy 84 473

Gafička analiza: > plot(k$x,k$y,type="n",xlab="visina",ylab="duzina") > text(k$x,k$y,as.chaacte(k$s)) Duzina 200 300 400 500 600 50 60 70 80 90 100 Visina

Deskiptivna analiza: > lapply(split(k,k$style),summay) $ style x y :16 Min. : 45.00 Min. :182.0 : 0 1st Qu.: 60.75 1st Qu.:298.8 Median : 73.50 Median :412.0 Mean : 74.94 Mean :397.4 3d Qu.: 86.50 3d Qu.:481.2 Max. :103.00 Max. :611.0 $ style x y :0 Min. :64.00 Min. :344.0 :9 1st Qu.:70.00 1st Qu.:425.0 Median :75.00 Median :502.0 Mean :74.44 Mean :475.4 3d Qu.:80.00 3d Qu.:530.0 Max. :83.00 Max. :551.0

Model: > model = lm(y ~ x * style,k) > summay(model) Call: lm(fomula = y ~ x * style, data = k) Residuals: Min 1Q Median 3Q Max -172.68-30.22 23.75 55.78 89.50 Coefficients: Estimate Std. Eo t value P(> t ) (Intecept) 37.111 85.675 0.433 0.669317 x 4.808 1.112 4.322 0.000301 *** style 204.722 347.207 0.590 0.561733 x:style -1.669 4.641-0.360 0.722657 --- Sinif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standad eo: 79.11 on 21 deees of feedom Multiple R-squaed: 0.5412,Adjusted R-squaed: 0.4757 F-statistic: 8.257 on 3 and 21 DF, p-value: 0.0008072

Kako je kodiana vaijabla style možemo vidjeti iz matice modela X: > model.matix(model) (Intecept) x style x:style Duham 1 75 1 75 Cantebuy 1 80 1 80 --- Old.St.Paul 1 103 0 0 Salisbuy 1 84 0 0

Nactajmo pavce koji pipadaju modelu: > abline(model$coef[-3],col="ed") > abline(model$coef[1]+model$coef[3],model$coef[2]+model$coef[4],col="blue") Duzina 200 300 400 500 600 50 60 70 80 90 100 Visina

Kako je koeficijent uz x:style malen i nije značajan, model se može pojednostavniti. > model1=lm(y~x+style,k) > summay(model1) Call: lm(fomula = y ~ x + style, data = k) Residuals: Min 1Q Median 3Q Max -172.67-30.44 20.38 55.02 96.50 Coefficients: Estimate Std. Eo t value P(> t ) (Intecept) 44.298 81.648 0.543 0.5929 x 4.712 1.058 4.452 0.0002 *** style 80.393 32.306 2.488 0.0209 * --- Sinif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standad eo: 77.53 on 22 deees of feedom Multiple R-squaed: 0.5384,Adjusted R-squaed: 0.4964 F-statistic: 12.83 on 2 and 22 DF, p-value: 0.0002028

Uspoedba dvaju modela pokazuje opavdanost naše petpostavke. > anova(model1,model) Analysis of Vaiance Table Model 1: y ~ x + style Model 2: y ~ x + style + x:style Res.Df RSS Df Sum of Sq F P(>F) 1 22 132223 2 21 131413 1 810 0.1294 0.7227

Nactajmo sada dva pavca koji pipadaju ovim podacima. > abline(1$coef[-3]) > abline(1$coef[1]+1$coef[3],1$coef[2],lty=2) Duzina 200 300 400 500 600 50 60 70 80 90 100 Visina Zaključak: za istu visinu Romaničke su katedale duže 80.39 feet-a i za svako povećanje za 1 foot, oba tipa katedale će biti oko 4.7 feet-a duže.

Gotičke katedale su uzete za efeentne je slovo se nalazi isped u abecedi. Slovo možemo napaviti efeentnim. > k$style = elevel(k$sty,ef="") > model1=lm(y~x+style,k) > summay(model1) Call: lm(fomula = y ~ x + style, data = k) Residuals: Min 1Q Median 3Q Max -172.67-30.44 20.38 55.02 96.50 Coefficients: Estimate Std. Eo t value P(> t ) (Intecept) 124.690 82.922 1.504 0.1469 x 4.712 1.058 4.452 0.0002 *** style -80.393 32.306-2.488 0.0209 * --- Sinif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standad eo: 77.53 on 22 deees of feedom Multiple R-squaed: 0.5384,Adjusted R-squaed: 0.4964 F-statistic: 12.83 on 2 and 22 DF, p-value: 0.0002028

Kodianje kvalitativnih vaijabli Kodianje dvostupanjskih faktoa nije jedinstveno, a još više je načina za kodianje višestupanjskih faktoa. Za fakto koji ima k azina, potebna nam je k 1 umjetna vaijabla za epezentaciju. Jedan paameta se koisti da bi se ocjenio sednji efekt ili možda efekt neko efeentno nivoa i k 1 vaijabla nam je potebna kako bi pokili peostale slučajeve. Postoje azne metode kodianja, a mi ćemo se pozabaviti tetiajućim kodianjem.

Tetiajuće kodianje Fakto koji ima 4 azine bit će kodian sa 3 umjetne vaijable nivoi Umjetne vaijable 1 2 3 1 0 0 0 2 1 0 0 3 0 1 0 4 0 0 1 Ovakav način pvi nivo tetia kao standadni/efeentni, a ostale uspoeduje u odnosu na njea. Ovo je standadni način kodianja umjetnih vaijabli u R-u.

Zadatak U datoteci twins.txt nalaze se podaci o ezultatima IQ testianja za jednojajčane blizance. Jedno blizanca su odajali stvani oditelji, a duo usvojitelji. Dostupni su i podaci o socijalnoj skupini kojoj pipadaju stvani oditelji. (i) Gafički uspoedite IQ posvojeno i IQ blizanca koji odastao s biološkim oditeljima, pi tome naznačite socijalnu skupinu oditelja. (ii) Analiziajte ovisnost IQ posvojeno blizanca o IQ-u blizanca koji odastao s biološkim oditeljima i socijalnom statusu oditelja. Izabeite najbolji model. (iii) Testiajte azlikuje li se IQ blizanaca?