Inferenčna statistika

Similar documents
Solutions. Name and surname: Instructions

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

Rule of probability. Let A and B be two events (sets of elementary events). 11. If P (AB) = P (A)P (B), then A and B are independent.

Important Formulas. Expectation: E (X) = Σ [X P(X)] = n p q σ = n p q. P(X) = n! X1! X 2! X 3! X k! p X. Chapter 6 The Normal Distribution.

VAJE 2: Opisna statistika

Agenda: Recap. Lecture. Chapter 12. Homework. Chapt 12 #1, 2, 3 SAS Problems 3 & 4 by hand. Marquette University MATH 4740/MSCS 5740

Grant MacEwan University STAT 252 Dr. Karen Buro Formula Sheet

Below are the following formulas for the z-scores section.

independence of the random sample measurements, we have U = Z i ~ χ 2 (n) with σ / n 1. Now let W = σ 2. We then have σ 2 (x i µ + µ x ) 2 i =1 ( )

Lecture 8: Non-parametric Comparison of Location. GENOME 560, Spring 2016 Doug Fowler, GS

Common Large/Small Sample Tests 1/55

UNIT 8: INTRODUCTION TO INTERVAL ESTIMATION

Stat 200 -Testing Summary Page 1

Attempt to prepare seasonal weather outlook for Slovenia

Describing the Relation between Two Variables

Reševanje problemov in algoritmi

CE3502 Environmental Monitoring, Measurements, and Data Analysis (EMMA) Spring 2008 Final Review

STAT431 Review. X = n. n )

ENERGY AND MASS SPECTROSCOPY OF IONS AND NEUTRALS IN COLD PLASMA

Interval Estimation (Confidence Interval = C.I.): An interval estimate of some population parameter is an interval of the form (, ),

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

Multipla korelacija in regresija. Multipla regresija, multipla korelacija, statistično zaključevanje o multiplem R

Exam II Review. CEE 3710 November 15, /16/2017. EXAM II Friday, November 17, in class. Open book and open notes.

Distributions of Functions of. Normal Random Variables Version 27 Jan 2004

Pearson Edexcel Level 3 Advanced Subsidiary and Advanced GCE in Statistics

Statistics 20: Final Exam Solutions Summer Session 2007

Statistika 2 z računalniško analizo podatkov

Comparing Two Populations. Topic 15 - Two Sample Inference I. Comparing Two Means. Comparing Two Pop Means. Background Reading

Statistics. Chapter 10 Two-Sample Tests. Copyright 2013 Pearson Education, Inc. publishing as Prentice Hall. Chap 10-1

ST 305: Exam 3 ( ) = P(A)P(B A) ( ) = P(A) + P(B) ( ) = 1 P( A) ( ) = P(A) P(B) σ X 2 = σ a+bx. σ ˆp. σ X +Y. σ X Y. σ X. σ Y. σ n.

Inštitut za matematiko, fiziko in mehaniko. Seminar DMFA Slovenije. Zgledi uporabe statistike na različnih strokovnih področjih

Two sample test (def 8.1) vs one sample test : Hypotesis testing: Two samples (Chapter 8) Example 8.2. Matched pairs (Example 8.6)

Overview. p 2. Chapter 9. Pooled Estimate of. q = 1 p. Notation for Two Proportions. Inferences about Two Proportions. Assumptions

Lesson 2. Projects and Hand-ins. Hypothesis testing Chaptre 3. { } x=172.0 = 3.67

Sinteza homologov paracetamola

Will Landau. Feb 28, 2013

Chapter 20. Comparing Two Proportions. BPS - 5th Ed. Chapter 20 1

z is the upper tail critical value from the normal distribution

BIOS 4110: Introduction to Biostatistics. Breheny. Lab #9

Formulas and Tables for Gerstman

Analiza variance in linearna regresija

Biostatistics for Med Students. Lecture 2

Department of Civil Engineering-I.I.T. Delhi CEL 899: Environmental Risk Assessment HW5 Solution

Simple Regression. Acknowledgement. These slides are based on presentations created and copyrighted by Prof. Daniel Menasce (GMU) CS 700

October 25, 2018 BIM 105 Probability and Statistics for Biomedical Engineers 1

AMS 216 Stochastic Differential Equations Lecture 02 Copyright by Hongyun Wang, UCSC ( ( )) 2 = E X 2 ( ( )) 2

This chapter focuses on two experimental designs that are crucial to comparative studies: (1) independent samples and (2) matched pair samples.

A L A BA M A L A W R E V IE W

Mathacle. PSet Stats, Concepts In Statistics Level Number Name: Date:

CHAPTER 2. Mean This is the usual arithmetic mean or average and is equal to the sum of the measurements divided by number of measurements.

Grant MacEwan University STAT 151 Formula Sheet Final Exam Dr. Karen Buro

M $ 4 65\ K;$ 5, 65\ M $ C! 4 /2 K;$ M $ /+5\ 8$ A5 =+0,7 ;* C! 4.4/ =! K;$,7 $,+7; ;J zy U;K z< mj ]!.,,+7;

Calculation of stress-strain dependence from tensile tests at high temperatures using final shapes of specimen s contours

Tables and Formulas for Sullivan, Fundamentals of Statistics, 2e Pearson Education, Inc.

TABLES AND FORMULAS FOR MOORE Basic Practice of Statistics

MidtermII Review. Sta Fall Office Hours Wednesday 12:30-2:30pm Watch linear regression videos before lab on Thursday

TOPLJENEC ASOCIIRA LE V VODNI FAZI

DIOFANTSKE ČETVERICE

TAMS24: Notations and Formulas

Topic 9: Sampling Distributions of Estimators

Samples from Normal Populations with Known Variances

OPTIMIRANJE IZDELOVALNIH PROCESOV

2 1. The r.s., of size n2, from population 2 will be. 2 and 2. 2) The two populations are independent. This implies that all of the n1 n2

Notation List. For Cambridge International Mathematics Qualifications. For use from 2020

Stat 427/527: Advanced Data Analysis I

Comparing Two Variances. CI For Variance Ratio

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. O neeksaknotsti eksaktnega binomskega intervala zaupanja

Regression, Inference, and Model Building

Midterm 1 and 2 results

Topic 9: Sampling Distributions of Estimators

Assessment and Modeling of Forests. FR 4218 Spring Assignment 1 Solutions

Statistics Parameters

Homework for 2/3. 1. Determine the values of the following quantities: a. t 0.1,15 b. t 0.05,15 c. t 0.1,25 d. t 0.05,40 e. t 0.

Confidence Interval for Standard Deviation of Normal Distribution with Known Coefficients of Variation

STA Learning Objectives. Population Proportions. Module 10 Comparing Two Proportions. Upon completing this module, you should be able to:

Chapter 22. Comparing Two Proportions. Copyright 2010, 2007, 2004 Pearson Education, Inc.

Introduction to Econometrics (3 rd Updated Edition) Solutions to Odd- Numbered End- of- Chapter Exercises: Chapter 3

SOLUTIONS y n. n 1 = 605, y 1 = 351. y1. p y n. n 2 = 195, y 2 = 41. y p H 0 : p 1 = p 2 vs. H 1 : p 1 p 2.

Paired comparisons. We assume that

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

The variance of a sum of independent variables is the sum of their variances, since covariances are zero. Therefore. V (xi )= n n 2 σ2 = σ2.

Summarizing Data. Major Properties of Numerical Data

Recall the study where we estimated the difference between mean systolic blood pressure levels of users of oral contraceptives and non-users, x - y.

IIT JAM Mathematical Statistics (MS) 2006 SECTION A

Več nivojski model kratkoročnega napovedovanja cene električne energije

Topic 9: Sampling Distributions of Estimators

S T A T R a c h e l L. W e b b, P o r t l a n d S t a t e U n i v e r s i t y P a g e 1. = Population Variance

Epidemiology Principles of Biostatistics Chapter 10 - Inferences about two populations. John Koval

APPLIED MULTIVARIATE ANALYSIS

32 estimating the cumulative distribution function

VERJETNOSTNI RAČUN IN STATISTIKA. Aleksandar Jurišić, FRI

Math 152. Rumbos Fall Solutions to Review Problems for Exam #2. Number of Heads Frequency

(7 One- and Two-Sample Estimation Problem )

April 18, 2017 CONFIDENCE INTERVALS AND HYPOTHESIS TESTING, UNDERGRADUATE MATH 526 STYLE

GRADE 12 JUNE 2017 MATHEMATICS P2

MOST PEOPLE WOULD RATHER LIVE WITH A PROBLEM THEY CAN'T SOLVE, THAN ACCEPT A SOLUTION THEY CAN'T UNDERSTAND.

Ch. 7. One sample hypothesis tests for µ and σ

P a g e 5 1 of R e p o r t P B 4 / 0 9

The Hong Kong University of Science & Technology ISOM551 Introductory Statistics for Business Assignment 3 Suggested Solution

Sampling Distributions, Z-Tests, Power

Transcription:

Raziskovala metodologija v fizioterapiji Predavaje 3 Ifereča statistika Ištitut za biostatistiko i medicisko iformatiko Mediciska fakulteta, Uiverza v Ljubljai

Biomska porazdelitev! P(K = k, p) = # " k $ & p k (' p) 'k % parametra Bi(,p) število eot (eodvise) k slučaja spremeljivka (število uspeših dogodkov pri eotah) p verjetost uspeha Povpreča vredost (pričakovaa vredost, expected value) E(K)=ΣP(K=k)*k=*p Variaca Var(K)=*p*(-p)

Normala porazdelitev f (x µ,! ) = 2"! 2 e! (x!µ ) 2 2! 2 parametra N(µ, σ) 95% 2.5% 2.5% STANDARDIZACIJA X~N(µ, σ), Z=(X- µ)/σ Z~N(0, ) z 0,025 : P(Z<= z 0,025 ) =0,025 -.96 2,5 percetil z 0,025 =-z 0,975.96 97,5 percetil z 0.975 =z -0.05/2 Tabele za N(0,) pr. glej Distributios.xls

Pomembost N(µ, σ) - CLI spremeljivka X merjea a eodvisih eotah Poavljaj velikokrat: izberemo vzorec velikosti, izraču Dobimo veliko povprečij Ta povprečja so porazdeljea po porazdelitvi ~ N(µ, σ/ ) Povprečje spremeljivke X je torej v populaciji eako µ. SE je odvisa od velikosti vzorca! X i X Stadarda apaka (stadard error of the mea, SE) PRIMER itervali zaupaja za pulz

Raziskovalo vprašaje??? µ s = 60??? Verjetost Ifereča statistika športiki x _ = i= x i Vzorčo povprečje: X s Name: Določiti, ali je povpreči pulz športikov eak 60 udarcev a miuto.

Statističo sklepaje _ X s ~ N(µ s, σ s / s ) SE Ničela hipoteza/domeva (H0): µ s = 60 Alterativa hipoteza/domeva (Ha): µ s 60 Če H0 drži _ (i je populacijska variaca zaa) X s ~ N(60, σ s / s ) Z = X! 60! ~ N(0,) Kolikša je verjetost, da bi lahko ta stadardizirai odmik od 0 (ali pa še večji odmik) astal po aključju (če velja ičela domeva)? p

Statističo sklepaje - primer Primer: 67, 42, 53, 40, 55, σ=5 _ X s ~ N(60, σ s / s ) Z = X! 60! p = P(X! "x! X # x H 0 ) = P(Z! "z! Z # z) ~ N(0,) Vzorčo povprečje=5,4, =5; SE= σ/ =5/ 5=2,24 z=(5,4-60)/2,24=-3,85: testa statistika Kakše je p (verjetost) pri tej testi statistiki?

Primer - adaljevaje p= P(X! "x X # x! H 0 ) = P(Z! "z Z # z! ) P(Z! "z! Z # z) = p = 2P(Z! "z) P(Z! "3,85) = 0,000059 p = 2*0,000059 = 0,0002 p=0,0002 Sklep: zavremo H0: µ s = 60 µ s povpreči pulz športikov v populaciji

Iterpretacija rezultatov Kaj pomei P=0,0002? če bi bil povpreče pulz v populaciji športikov eak 60 (i.e. ičela hipoteza drži) bi bilo zelo malo verjeto, da bi opazili a vzorcu tak ali večji odmik od 60, kot smo ga opazili. Kaj aredimo? Zavremo ičelo domevo i rečemo, da imajo športiki povpreče pulz, ki je različe od 60. Poavadi pravimo, da če je p<0,05 ali p<0,0, potem je rezultat statističo začile

Iterpretacija rezultatov Kaj pomei P=0,25? absece of evidece is ot evidece of absece Kaj bi aredili? Ne bi zavrili ičele domeve ( sprejeli!!!). Rekli bi, da a podlagi aših podatkov, e moremo trditi, da je povpreče pulz različe od 60. Rezultat i statističo začile.

Kaj lahko aredimo, če e pozamo populacijske variace? _ E vzorec: X ~ N(µ, σ/ ) Prej: Z = X µ ~ N(0,) σ Potem: X µ s ~ t t-porazdelitev z - stopijami prostosti Stopije prostosti (degrees of freedom, df) s = ( x i x) i= Variaco oceimo a podlagi vzorca N(0,) df=5 df=2 df=20 2

Z i t... Ali sta si podobi? 5 9 N(0,) t 4 N(0,) t 8.96 2.78 2.3 9 99 N(0,) N(0,) t t 8 98.98 2.0 Tudi za t-porazdelitev si bomo pomagali s tabelami za izraču verjetosti

Raziskovalo vprašaje??? µ s = µ s??? Verjetost Ifereča statistika športiki _ Vzorčo povprečje: X s x = i= x i ostali _ Vzorčo povprečje: X s Name: Primerjati povpreči pulz športikov i ostalih ljudi v populaciji

Statističo sklepaje?? µ v populaciji a vzorcu s -µ =0 s x s - X =0 s Ničela domeva: Kolikša je verjetost, da bi lahko ta odmik* (ali pa še večji odmik) astal po aključju? P-vredost (p) (stopja tvegaja) Če je verjetost majha, bomo zavrili (ičelo) domevo, da v populaciji i razlike Tipiča odločitev: p< 0,05 ---> µ s -µ s (zavremo domevo, da µ s -µ s odmik a vzorcu 0 ( statističo začila razlika ) = 0 i s 95 % gotovostjo trdimo, da gre za dejasko razliko v povprečem pulzu; razlika med pulzoma i 0) α=0,05 je stopja začilosti * Odmik bomo stadardizirali, glede a velikosti vzorca i a razpršeosti spremeljivke v populaciji

Ali imajo v povprečju dekleta i fatje v mirovaju isti pulz? Povprečje: 74, (m) 77,5 (f) Stadardi odklo: 3,8 (m) 2,6 (f) Populacija: študetje UQ µ f -µ m =0 Ničela domeva Vzorec: študetje Osov stat. x f - X m =3,4

Kako bomo primerjali vzorča _ povprečja dveh vzorcev? _ Testa statistika t _ E vzorec: X s ~ N(µ s, σ s / s ) Dva vzorca, če sta populacijski variaci zai X s X s ~ N(µ s µ s, (σ 2 s / s + σ2 s / s ) ) Dva vzorca, če populacijski variaci ista zai i sta eaki bolj realističa situacija Porazdelitev ~t +2-2 df SE Stadarda apaka (SE: stadard error) Skupa variaca (pooled variace)

Kako se porazdeli t, če µ = µ 2 i = 2 =50? X~N(µ, σ) -> Z=(X- µ)/ σ ~ N(0, ) stadarda ormala porazdelitev

Kako se porazdeli t, če µ = µ 2 i = 2 =0?

Kako se porazdeli t, če µ = µ 2 i = 2 =5? 2 2 2 2 ~ ) ( + + = p t s x x t Če velja ičela domeva (µ = µ 2 ) zdaj vemo, da 2 2 2 ) ( ) ( s x x t p + = µ µ

Skupa variaca () s p = (!)s 2 + ( 2!)s 2 2 (!)+ ( 2!) = povpr. SD (število študetov) študetke 77,5 2,6 50 = (50!)"2, 62 + (59!)"3,8 2 (50!)+ (59!) =3,3 študeti 74, 3,8 59 Stadarda apaka (2) SE = s p + 2 =3,3 50 + 59 Razlika povprečij (3) x! x2 = 77, 5! 74,= 3, 4 Stopije prostosti (4) df = + 2! 2 = 50 + 59! 2 =07 = 2, 56 Testa statistika (5) ( x x2) ( µ µ 2) t ~ SE H 0 : µ = µ 2 ičela domeva = t + H a : µ µ 2 alterativa domeva t = 3, 4! 0 2, 56 =,32 ~H0 t 07 2 2

Kako pridemo iz teste statistike do p-vredosti? t 07 T=,32, P=0,92 x = x2 Pričakujemo 95% sredjih vredosti med -.99 i.99

Predpostavke za t-test za eodvisa vzorca. Porazdelitev spremeljivke v populaciji Majhe vzorec: spremeljivke so ormalo porazdeljee če iso obstajajo eparametriči testi (Ma-Whitey U / Wilcoxo rak-sum test) Velik vzorec: lahko uporabljamo test e glede a porazdelitev 2. Statističe eote so eodvise 3. Populacijski variaci sta eaki σ =σ 2 Lahko testiramo H0: σ =σ 2 (Leveov test) Če ista lahko uporabljamo Welchev t-test ~ t ν d.f. H0: σ f 2 / σ m 2 = Naš primer: s f 2 / s m 2 =,09, P=0,798 (Leveov test)

Postopek statističega sklepaja Izberite zastveo vprašaje Populacija Vzorec Spremeljivka/e Kaj primerjati Postavite ičelo domevo i alterativo domevo Izberite testo statistiko, (statističi test, ki ga boste boste uporabili) Določite porazdelitev teste statistike, če velja ičela domeva Izberite stopjo tvegaja (α) Izračuajte vredost teste statistike iz vašega vzorca Izračuajte P-vredost i odgovorite a zastveo vprašaje Ali imajo študetke višji pulz v mirovaju kot študeti? Populacija : študetje UQ Vzorec : študeti pri Osovah stat. Spremeljvke spol pulz v mirovaju Primerjava: povpreče pulz H 0 : µ f = µ m ičela domeva H a : µ f µ m alterativa domeva t = (x f! xm)! (µ f! µ m ) SE t = 3, 4! 0 =,32 ~H0 2, 56 t 07 ~t f + m!2 P=0,92, e zavremo ičele domeve

Primer 2: t-test za dva eodvisa vzorca

Test 2 Mea Stadard deviatio Group 32 5 30 Group 2 23 6 27

Test 2 Mea Stadard deviatio H 0 :µ G = µ G2 Ha : µ G! µ G2 Group 32 5 30 Group 2 23 6 27 s p = 52 (30!)+6 2 (27!) 30 + 27! 2 SE =5, 52 30 + 27 = 4,9 pri " H 0 " velja t = 32! 23 4,9 =5, 52 = 9 4,9 = 2,5 ~ t 30+27!2 p = P(t 55 <! t! t 55 > t ) = 2P(t 55 > t ) = 2(t 55 > 2,5) = 0, 036 s p = s2 G( G ")+ s 2 G2( G2 ") G + G2 " 2 SE = s p G + G2 (X G " X G2)" (µ G " µ G2 ) ~ t G + SE G 2 "2 pri # H 0 # velja X G " X G2 SE ~ t G + G 2 "2 Kaj lahko sklepamo?

Ali bi lahko izračuali tudi 95% iterval zaupaja za razliko povprečij? 95% iterval zaupaja za µ µ 2 Iterval za katerega imamo 95% zaupaje, da vsebuje ezao populacijsko razliko povprečij 95% IZ za µ G! µ G2 : (xg! xg2)! t 55;!0,05/2 " SE,(xG! xg2)+ t 55;!0,05/2 " SE xg! xg2 = 9 SE = 4,9 9! 2 " 4,9 do 9 + 2 " 4,9 0, 62 do 7,38 t 55 0,025 T 55;0,975 =2 0,025 S 95% zaupajem lahko trdimo, da je razlika populacijskih povprečij (µ G µ G2 ) med 0,62 i 7,38 t α ) 2 df, α / 2 : P( tdf = α

Predpostavka 2. Statističe eote so (e)odvise? Za isto skupio (iste eote) primerjamo 2 izhoda testa (takoj po kapi i 2 teda po jej. Uporabimo t-test za odvisa vzorca (pari t-test).

Pari t-test (t-test za dva odvisa vzorca) Ali se pulza pred i po obremeitvi statističo začilo razlikujeta. Razlika D (po pred) H0: µ po - µ pred = δ=0 s 68 s2 80 s3 63 s4 2...... s46 26 Povprečje 5,4 SD 2, SE=SD/ 3, X µ s ~ t Testa statistika T=5,4/3,=6,52, df=45 p= 9,8*0-2 t 45; -0,05/2 =2,0 D δ s d ~ t 95% IZ za δ: 5,4-2,0*3, do 5,4+2,0*3, =45, do 57,7 udarcev a miuto

Predpostavke za t-test za odvisa vzorca. Porazdelitev spremeljivke v populaciji Majhe vzorec: spremeljivke so ormalo porazdeljee če iso obstajajo eparametriči testi (Wilcoxo siged-rak test) Velik vzorec: lahko uporabljamo test e glede a porazdelitev Statističe eote so odvise

Postopek statističega sklepaja Izberite zastveo vprašaje Populacija Vzorec Spremeljivka/e Kaj primerjati Postavite ičelo domevo i alterativo domevo Izberite testo statistiko, (statističi test, ki ga boste boste uporabili) Določite porazdelitev teste statistike, če velja ičela domeva Izberite stopjo tvegaja (α) Izračuajte vredost teste statistike iz vašega vzorca Izračuajte P-vredost i odgovorite a zastveo vprašaje Ali imajo študeti višji pulz po obremeitvi? Populacija : študetje UQ Vzorec : študeti pri Osovah stat. Spremeljvke pulz v mirovaju pulz po obremeitvi Primerjava: povpreča pulza istih študetov H 0 : µ pred = µ po ičela domeva H a : µ pred µ po alterativa domeva D δ s d ~ t t = 5, 4! 0 =6, 52 H 0 ~ 3, t 45 P<0,00, zavremo ičelo domevo