Definiţie. Pr(X a) - probabilitatea ca X să ia valoarea a ; Pr(a X b) - probabilitatea ca X să ia o valoare în intervalul a,b.

Variabile aleatoare

Definiţie Se numeşte variabilă aleatoare pe un spaţiu fundamental E şi se notează prin X, o funcţie definită pe E cu valori în mulţimea numerelor reale. Unei variabile aleatoare X i se pot asocia diferite probabilităţi cu care această variabilă aleatoare poate lua anumite valori, ca de exemplu: Pr(Xa) - probabilitatea ca X să ia valoarea a ; Pr(aXb) - probabilitatea ca X să ia o valoare în intervalul a,b.

Definiţie O variabilă aleatoare se numeşte discretă dacă ea poate lua un număr finit sau cel mult numărabil de valori

Exemple Numărul de internări într-un spital într-un interval de timp dat X0,1,2,...,n,... variabilă aleatoare discretă infinită. Numărul de bacterii într-un mililitru de apă X0,1,2,...,n,... variabilă aleatoare discretă infinită. Numărul de indivizi cu RH-negativ dintr-un grup de n persoane luate la întâmplare X0,1,2,...,n. variabilă aleatoare discretă finită Numărul de prezentari la medic pentru otita in primii doi ani de viata. variabilă aleatoare discretă infinită care poate avea valorile 0,1,2,...

Definiţie O variabilă aleatoare este continuă atunci când variază în mod continuu într-un interval şi poate lua o mulţime nenumărabilă de valori.

Exemple

LEGEA DE PROBABILITATE A UNEI VARIABILE ALEATOARE FINITE Fie X o variabilă aleatoare pe un spaţiu fundamental E finit, adică X x 1, x 2,..., x i,..., x n. Mulţimea de probabilităţi asociate valorilor: p(x 1 ), p(x 2 ),..., p(x i ),..., p(x n ) x 1, x 2,..., x i,..., x n se numeşte distribuţia sau legea de probabilitate a variabilei aleatoare X.

LEGEA DE PROBABILITATE A UNEI VARIABILE ALEATOARE FINITE Distribuţia unei variabile aleatoare finite X se mai notează prin următorul tabel: X : x1 p(x ) 1 x2 p(x 2 )...... xn p(xn ) Probabilităţile care apar în distribuţia unei variabile aleatoare finite X verifică următoarea condiţie: n i1 p( x i ) 1.

Exemple Probabilitatea de apariţie a uneia dintre feţele {1,2,3,4,5,6} ale unui zar este 1/6. In acest caz avem variabila aleatoare: Pentru că probabilitatea p(x) este constantă oricare ar fi x se spune că distribuţia lui X1 este uniformă.. 6 1 6 1 6 1 6 1 6 1 6 1 6 5 4 3 2 1 X 1 :

Exemplu Într-un studiu realizat pentru 100 de medici s-a urmărit frecvența cu care un tratament antihipertensiv poate controla hipertensiunea pentru un numar de pacienti din 4.

Exemplu Probabilitatea ca tratamentul antihipertensiv sa poată controla hipertensiunea pentru 4 pacienti are distributia din tabelul de mai jos:

Media sau speranţa matematică Valoarea M(X) se mai numeşte şi valoarea aşteptată a variabilei aleatoare X. Observaţii: n M(X) x i1 p(x ) Dacă legea de probabilitate a lui X este uniformă, adică p(xi) 1/n, pentru orice i 1,2,...,n, atunci M(X) este media aritmetică a numerelor x1, x2,..., xi,..., xn. i i

Exemplu Care este media estimata a valorilor obtinute prin 1 2 3 4 5 aruncarea unui zar? n M(X) x i1 i p(x ) i X 1 : 1 6 1 6 1 6 1 6 1 6 6. 1 6 M(X)= 1*1/6+2*1/6+3*1/6+4*1/6+5*1/6+6*1/6 M(X)=(1+2+3+4+5+6)/6 M(X)=21/6 M(X)=3,5

Exemplu M(X)=0x0,008+1x0,076+2x0,265+3x0,411+4x0,240 M(X)=2,8 Ne vom astepta la o medie de 2,8 din cei 4 hipertensivi a caror afectiune sa poata fi controlata

Exemplu Numărul de episoade de otită în primii doi ani de viață: M(X)=0x0,129+1x0,264+2x0,271+3x0,185+4x0, 095+5x0,039+6x0,017 M(X)=2,038 Ne vom astepta la o medie de 2,038 episoade de otita la un copil in primii doi ani de viata

Variaţia şi abaterea standard Variaţia variabilei aleatoare X se defineşte prin V(X) M( X- M(X) 2 ) Sau n 2 V(X) [x i M(X)] p(x i ) i 1 Prin definiţie abaterea standard este: (X) V(X)

Exemplu Numarul de episoade de otita in primii doi ani de viata: V(X)=1,96 σ =1,402 Aproximativ 95% din distributia de probabilitate este cuprinsa in medie +/- 2 σ (1,96 σ) Numarul de episoade de otita in primii doi ani de viata: 2,038 ± 2,8 (corectat 0-4)

Variabile aleatoare centrate reduse Unei variabile aleatoare X cu media M(X) şi abaterea standard (X) i se poate asocia o variabilă aleatoare Y numită variabilă aleatoare centrată redusă definită prin: X M(X) Y (X) In baza proprietăţilor mediei şi abaterii standard, se poate arăta uşor că variabila aleatoare centrată redusă are media M(Y)0 şi abaterea standard (Y)1.

VARIABILE ALEATOARE DEFINITE PE UN SPAŢIU FUNDAMENTAL INFINIT

Cazul discret Cazul continuu Noţiunile şi proprietăţile prezentate anterior pentru variabilele aleatoare finite se pot introduce în mod analog pentru cazul variabilelor aleatoare discrete având o mulţime infinită de valori, prin înlocuirea sumei finite cu una infinită n i1 i1

Cazul discret Cazul continuu n i1 i1

ATENTIE! Următoarele slide-uri conţin formule daunătoare sănătăţii!

Cazul continuu In cazul unei variabile aleatoare continue X, se consideră o funcţie f:rr numită densitate de probabilitate, care are proprietăţile: Pr(a X b) b f(x)dx a f(x) 0, xr f(x)dx 1

Cazul continuu In acest caz funcţia de repartiţie F asociată variabilei aleatoare X este definită prin: F(x) De asemenea, media lui X este definită prin : iar variaţia lui X = Pr(X x) x - f(t)dt M( X) xf(x)dx 2 ( ) [x-m(x)] f(x)dx V X

Clasificarea variabilelor

Legi de distribuţie (principalele distribuţii de probabilitate)

Introducere In general, distribuţiile variabilelor aleatoare definite pe o populaţie nu se cunosc. Din punct de vedere practic se încearcă încadrarea acestor distribuţii în unele legi teoretice care constituie modele pentru aceste variabile statistice

Principalele legi de distribuţie legea BINOMIALĂ (BERNOULLI) variabile aleatoare discrete finite legea POISSON variabile aleatoare discrete infinite legea normală sau legea LAPLACE-GAUSS variabile aleatoare continue legea STUDENT (t) variabilă aleatoare continuă legea 2 a lui PEARSON legea F a lui FISHER. sume de pătrate a unor variabile independente normal distribuite comportarea câtului a două variabile cu distribuţie 2

LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI Variabile aleatoare finite Modelul legii binomiale este următorul: Un experiment este alcătuit din repetarea unei încercări elementare de n ori, n fiind un număr natural dat. Rezultatele posibile ale fiecărei încercări elementare sunt doar două evenimente numite de obicei: succes (S) şi eşec (E). Probabilităţile p de succes şi q = 1 - p de eşec sunt constante de la o încercare la alta. Cele n încercări repetate sunt independente una de cealaltă

LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI Numărul de reuşite obţinute din cele n încercări repetate este o variabilă aleatoare de tip binomial care depinde de parametrii n şi p: Bi(n,p). Probabilitatea pentru X=K este: Pr( X = k ) = C k p k q n k n Această variabilă aleatoare X poate să ia valorile 0, 1, 2,..., n şi are următorul tabel de distribuţie: X k : C k k n k n p q C k n n! k!( n k)!

LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI speranţa matematică a legii binomiale: M(X) = n p, variaţia: Var(X) =n p q, abaterea standard: (X) = npq

Comportarea la limită a legii binomiale când n este mare Se poate arăta că atunci când np 10 şi nq 10, distribuţia variabilei binomiale X (frecvenţa absolută a succeselor) tinde să se apropie de o lege normală N np, npq

Exemple Presupunem că de regulă un vaccin contra pojarului produce febră la15% din copii. Care este probabilitatea ca din 6 copii vaccinaţi 4 să aibă o reacţie în urma vaccinării? Faptul că am întalnit aceasta situaţie este o întamplare sau un posibil început de epidemie? Răspuns: In acest caz avem n = 6, k = 4, p =0.15, q = 1-p = 0.85. Atunci 4 4 2 Pr( X = 4) = C (0.15) (0.85) 0.00549. 6 Această probabilitate fiind mai mică de 1% se poate considera că această situaţie apare cu o şansă foarte mică.

Exemple Presupunem că de regulă un anumit vaccin contra pojarului produce o reacţie (febră) cu o probabilitate p=0.5. Care este probabilitatea ca din 600 copii vaccinaţi cel putin 4 să aibă o reacţie în urma vaccinării? 4 4 596 Pr( X = 4) = C (0.5) (0.5) 600

LEGEA LUI POISSON Variabila aleatoare POISSON este o variabilă discretă care ia o infinitate numărabilă de valori: 0,1,2,...,k,..., care reprezintă numărul de realizări într-un interval dat de timp sau spaţiu ale unui eveniment. Exemple: numărul de internări pe an într-un spital, numărul de bacterii într-un mililitru de apă, numărul de dezintegrări ale unei substanţe radioactive într-un interval de timp T dat

LEGEA LUI POISSON Variabila aleatoare X este caracterizată de un parametru care reprezintă numărul mediu teoretic (aşteptat) de realizări ale evenimentului în intervalul considerat şi are următoarea lege de distribuţie: X k : k e k! Pr( X = k ) = e k k!

LEGEA LUI POISSON Despre variabila aleatoare de tip Poisson X se mai spune că este de tipul Po(). Speranţa matematică şi variaţia în cazul legii lui Poisson sunt egale ambele cu, adică : M(X) = Var(X) =.

Exemple Rata de mortalitate pentru o anumită boală este de 7 la 1000 de cazuri. Care este probabilitatea ca într-un grup de 400 de persoane această boală să cauzeze 5 decese? Răspuns: Avem p =7/1000=0.007 M = np = 400 x 0.007= 2.8 2.8 5 2.8 5 e (2.8) (2.7183) (2.8) Pr(X=5) = 0.0872 5! 5!

Exemple Rata de mortalitate pentru o vaccinul pentru cancerul de col uterin este de 10 la 20000000 de cazuri. Care este probabilitatea ca într-un grup de 200000 de persoane această boală să cauzeze 1 deces? Răspuns: Avem p =10/ 20000000 M = np = 200000 x 10/ 20000000 = 0,1 P(X)=0,104

Exemple Rata de mortalitate pentru o anumită boală este de 10 la 1000 de cazuri. Care este probabilitatea de a avea mai puţin de 7 decese într-un grup de 500 persoane? Care este probabilitatea de a avea 7 sau mai multe decese într-un grup de 500 persoane? Răspuns: Avem p =10/1000=0.01, M = np = 500 x 0.01= 5 Probabilitatea de a avea mai puţin de 7 decese este: 6 5 k 2 3 4 5 6 e 5 5 5 5 5 5 5 Pr(X<7) = Pr(X 6) = e (1 5 ) 0,7622 k! 2 6 24 120 720 k 0 Probabilitatea de a avea 7 sau mai multe decese este: Pr(X7) = 1- Pr(X<7) = 0.2378

Karl Friedrich Gauss Scrierile lui Gauss (404 la număr, doar 178 publicate) sunt destinate mai multor domenii, de la discipline ale matematicii, fizicii şi până la geodezie, sau astronomie. Bestimmung der Genauigkeit der Beobachtungen (1816) este o analiză asupra eficienţei estimatorilor statistici

LEGEA NORMALĂ Această lege de probabilitate a cărei funcţie de probabilitate are o alură tipică de clopot numită curba normală sau curba lui Gauss este un model pentru multe variabile aleatoare continue Această distribuţie depinde de doi parametri: media m abaterea standard şi are densitatea de probabilitate următoare: f(x) 1 2 e 1 xm ( 2 2 )

Exemple Distributia greutatii corporale sau a TAS in grupuri de pacientii cu varste cuprinse intre 35 si 44 de ani

LEGEA NORMALĂ Dacă X satisface o lege normală de medie m şi abatere standard atunci se spune că X este de tipul N(m, ). Pentru variabila normală X au loc: M(X) = m Ab S(X) =.

LEGEA NORMALĂ

LEGEA NORMALĂ REDUSĂ Există o gamă infinită de legi normale, care corespund câte unei perechi de parametri (m, ). Toate aceste distribuţii normale se pot reduce la una singură, având media 0 şi abaterea standard 1, cu ajutorul unei schimbări de variabilă: Z X m

LEGEA NORMALĂ REDUSĂ f(x) 1 2 e 1 xm ( 2 2 ) Aceasta este legea normală redusă cu densitatea de probabilitate: f(x) 1 2 1 e 2 x2

LEGEA NORMALĂ REDUSĂ

LEGEA STUDENT (T) Variabila aleatoare Student t este o variabilă aleatoare continuă care ia valori în intervalul (-, + ), a cărei funcţie densitate de probabilitate depinde de un singur parametru, numărul de grade de libertate. Fie X0, X1,, Xn variabile aleatoare independente care toate urmează legea normală centrată redusă. Atunci variabila aleatoare T n X 0 n i1 n X 2 i urmează o lege de probabilitate Student cu n grade de libertate.

LEGEA STUDENT (T) Densitatea de probabilitate a variabilei aleatoare Student Tn este: unde este funcţia Gamma definită astfel: 2 1 2 ) (1 1 ) ( ) ( 2 1 ) ( 2 2 1 n n n x n n f T x 0 1 ) 2 1 ( dt t e n n t

LEGEA STUDENT (T) Distribuţia acestei variabile aleatoare este simetrică în raport cu originea şi are o formă de clopot: Pr[ Tk < -x ] = Pr[ Tk > x]. Atunci când k tinde la, distribuţia Student tinde către o distribuţie normală redusă. Dacă n>30 legea lui Student şi legea normală sunt foarte apropiate. Această variabilă aleatoare este utilizată, în anumite condiţii de normalitate, în testul de comparaţie a mediilor numit şi testul Student sau testul t.

LEGEA HI-PĂTRAT (PEARSON) Distribuţia 2 descrie comportarea unei sume de pătrate a unor variabile independente normal distribuite, fiecare având o medie egală cu zero şi abatere standard egală cu 1. Astfel variabila X, definită prin egalitatea X 2 2 X1 X 2... X n 2 Unde X i 2 reprezintă pătratul unei observaţii selectate aleator dintr-o populaţie normal distribuită având media zero şi deviaţia standard 1, este 2 distribuită cu n grade de libertate. Densitatea de probabilitate a legii 2 este f X ( x) x 1 2 2 e x n n 1 2 2 ( ) 2 n

LEGEA HI-PĂTRAT (PEARSON) Forma acestei distribuţii depinde de numărul de termeni X i 2 independenţi din sumă. Numărul de termeni X i 2 independenţi se numeşte numărul de grade de libertate. Fiecărui nivel d al gradelor de libertate i se asociază o distribuţie 2 distinctă. Media şi variaţia unei distribuţii 2 sunt : M(2) = d, Var(2 ) = 2 d, unde d este numărul de grade de libertate.

LEGEA F (FISHER) Distribuţia F introdusă de R. A. Fisher, este definită pe intervalul [0,+) şi descrie comportarea câtului a două variabile cu distribuţie Hi-pătrat, fiecare fiind împărţită prin numărul gradelor sale de libertate. Un membru al acestei clase de distribuţii este determinat prin numărul de grade de libertate ale numărătorului dn şi respectiv numărul de grade de libertate ale numitorului dm, distribuţiile F distincte fiind determinate de perechi (dn, dm) distincte.

LEGEA F (FISHER) In general, pentru dn şi dm > 2 distribuţia F este unimodală şi pozitiv asimetrică. Atunci când numărul gradelor de libertate creşte distribuţia F se apropie pe domeniul său de definiţie de o distribuţie normală. Această distribuţie este utilizată în testele de comparaţie a variaţiilor şi ca aplicaţie a acestora în testele ANOVA.

Distributie Test statistic