Legi de distribuţie (principalele distribuţii de probabilitate) Tudor Drugan
Introducere In general distribuţiile variabilelor aleatoare definite pe o populaţie, care face obiectul unui studiu, nu se cunosc. Din punct de vedere practic se încearcă încadrarea acestor distribuţii în unele legi teoretice care constituie modele pentru aceste variabile statistice
Principalele legi de distribuţie legea BINOMIALĂ (BERNOULLI) variabile aleatoare discrete finite legea POISSON variabile aleatoare discrete infinite legea normală sau legea LAPLACE-GAUSS variabile aleatoare continue legea STUDENT (t) variabilă aleatoare continuă legea a lui PEARSON legea F a lui FISHER. sume de pătrate a unor variabile independente normal distribuite comportarea câtului a două variabile cu distribuţie Hi-pătrat
LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI Variabile aleatoare finite Modelul legii binomiale este următorul: Un experiment este alcătuit din repetarea unei încercări elementare de n ori, n fiind un număr natural dat. Rezultatele posibile ale fiecărei încercări elementare sunt doar două evenimente numite de obicei: succes (S) şi eşec (E). Probabilităţile p de succes şi q = 1 - p de eşec sunt constante de la o încercare la alta. Cele n încercări repetate sunt independente una de cealaltă
LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI Numărul de reuşite obţinute din cele n încercări repetate este o variabilă aleatoare de tip binomial care depinde de parametrii n şi p şi este de obicei notată prin Bi(n,p). Probabilitatea pentru X=K este: Pr( X = k ) = C k p k q n k n Această variabilă aleatoare X poate să ia valorile 0, 1,,..., n şi are următorul tabel de distribuţie: X k : C k k n k n p q C k n n! k!*( n k)!
LEGEA BINOMIALĂ SAU DISTRIBUŢIA LUI BERNOULLI speranţa matematică a legii binomiale este: M(X) = n p, iar variaţia: Var(X) =n p q, şi deci abaterea standard: (X) = npq
Comportarea la limită a legii binomiale când n este mare Se poate arăta că atunci când np 10 şi nq 10, distribuţia variabilei binomiale X (frecvenţa absolută a succeselor) tinde să se apropie de o lege normală N np, npq
Exemple Presupunem că de regulă un vaccin contra pojarului produce febră la15% din copii. Care este probabilitatea ca din 6 copii vaccinaţi 4 să aibă o reacţie în urma vaccinării? Faptul că am întalnit aceasta situaţie este o întamplare sau un posibil început de epidemie? Răspuns: In acest caz avem n = 6, k = 4, p =0.15, q = 1-p = 0.85. Atunci 4 4 Pr( X = 4) = C (0.15) (0.85) 0.00549. 6 Această probabilitate fiind mai mică de 1% se poate considera că această situaţie apare cu o şansă foarte mică.
Exemple Presupunem că de regulă un anumit vaccin contra pojarului produce o reacţie (febră) cu o probabilitate p=0.5. Care este probabilitatea ca din 600 copii vaccinaţi cel putin 4 să aibă o reacţie în urma vaccinării? 4 4 596 Pr( X = 4) = C (0.5) (0.5) 600
LEGEA LUI POISSON Variabila aleatoare POISSON este o variabilă discretă care ia o infinitate numărabilă de valori: 0,1,,...,k,..., care reprezintă numărul de realizări într-un interval dat de timp sau spaţiu ale unui eveniment de exemplu numărul de internări pe an într-un spital, numărul de bacterii într-un mililitru de apă, numărul de dezintegrări ale unei substanţe radioactive într-un interval de timp T dat
LEGEA LUI POISSON Această variabilă aleatoare X este caracterizată de un parametru care reprezintă numărul mediu teoretic (aşteptat) de realizări ale evenimentului în intervalul considerat şi are următoarea lege de distribuţie: k X : k e k! Pr( X = k ) = e k k!
LEGEA LUI POISSON Despre variabila aleatoare de tip Poisson X se mai spune că este de tipul Po(). Speranţa matematică şi variaţia în cazul legii lui Poisson sunt egale ambele cu, adică : M(X) = Var(X) =.
Exemple Rata de mortalitate pentru o anumită boală este de 7 la 1000 de cazuri. Care este probabilitatea ca într-un grup de 400 de persoane această boală să cauzeze 5 decese? Răspuns: Avem p =7/1000=0.007, m = np = 400 x 0.007=.8.8 5.8 5 e (.8) (.7183) (.8) Pr(X=5) = 0.087 5! 5!
Exemple Rata de mortalitate pentru o vaccinul pentru cancerul de col uterin este de 10 la 0000000 de cazuri. Care este probabilitatea ca într-un grup de 00000 de persoane această boală să cauzeze 1 deces? Răspuns: Avem p =10/ 0000000, m = np = 00000 x 10/ 0000000 = 0,1 P(X)=0,104
Exemple Rata de mortalitate pentru o anumită boală este de 10 la 1000 de cazuri. Care este probabilitatea de a avea mai puţin de 7 decese într-un grup de 500 persoane? Care este probabilitatea de a avea 7 sau mai multe decese într-un grup de 500 persoane? Răspuns: Avem p =10/1000=0.01, m = np = 500 x 0.01= 5 Probabilitatea de a avea mai puţin de 7 decese este: 6 5 k 3 4 5 6 e 5 5 5 5 5 5 5 Pr(X<7) = Pr(X 6) = e (1 5 ) 0,76 k! 6 4 10 70 k 0 Probabilitatea de a avea 7 sau mai multe decese este: Pr(X7) = 1- Pr(X<7) = 0.378
Karl Friedrich Gauss Scrierile lui Gauss (404 la număr, doar 178 publicate) sunt destinate mai multor domenii, de la discipline ale matematicii, fizicii şi până la geodezie, sau astronomie. Bestimmung der Genauigkeit der Beobachtungen (1816) este o analiză asupra eficienţei estimatorilor statistici
LEGEA NORMALĂ Această lege de probabilitate a cărei funcţie de probabilitate are o alură tipică de clopot numită curba normală sau curba lui Gauss este un model pentru multe variabile aleatoare continue Această distribuţie depinde de doi parametri: media m abaterea standard şi are densitatea de probabilitate următoare: f(x) 1 e 1 xm ( )
LEGEA NORMALĂ
Exemple Distributia greutatii corporale sau a TAS in grupuri de pacientii cu varste cuprinse intre 35 si 44 de ani
LEGEA NORMALĂ Dacă X satisface o lege normală de medie m şi abatere standard atunci se spune că X este de tipul N(m, ). Pentru variabila normală X au loc: M(X) = m Var(X) =.
LEGEA NORMALĂ
LEGEA NORMALĂ REDUSĂ Este evident că există o gamă infinită de legi normale, care corespund câte unei perechi de parametri (m, ). Toate aceste distribuţii normale se pot reduce la una singură, având media 0 şi abaterea standard 1, cu ajutorul unei schimbări de variabilă: Z X m
LEGEA NORMALĂ REDUSĂ f(x) 1 e 1 xm ( ) Aceasta este legea normală redusă cu densitatea de probabilitate: f(x) 1 1 e x
LEGEA NORMALĂ REDUSĂ
LEGEA STUDENT (T) Variabila aleatoare Student t este o variabilă aleatoare continuă care ia valori în intervalul (-, + ), a cărei funcţie densitate de probabilitate depinde de un singur parametru, numărul de grade de libertate. Fie X0, X1,, Xn variabile aleatoare independente care toate urmează legea normală centrată redusă. Atunci variabila aleatoare T n X 0 n i1 n X i urmează o lege de probabilitate Student cu n grade de libertate.
LEGEA STUDENT (T) Densitatea de probabilitate a variabilei aleatoare Student Tn este: unde este funcţia Gamma definită astfel: 1 ) (1 1 ) ( ) ( 1 ) ( 1 n n n x n n f T x 0 1 ) 1 ( dt t e n n t
LEGEA STUDENT (T) Distribuţia acestei variabile aleatoare este simetrică în raport cu originea şi are o formă de clopot: Pr[ Tk < -x ] = Pr[ Tk > x]. Atunci când k tinde la, distribuţia Student tinde către o distribuţie normală redusă. Dacă n>30 legea lui Student şi legea normală sunt foarte apropiate. Această variabilă aleatoare este utilizată, în anumite condiţii de normalitate, în testul de comparaţie a mediilor numit şi testul Student sau testul t.
LEGEA HI-PĂTRAT (PEARSON) Distribuţia descrie comportarea unei sume de pătrate a unor variabile independente normal distribuite, fiecare având o medie egală cu zero şi abatere standard egală cu 1. Astfel variabila X, definită prin egalitatea X X1 X... X n Unde X i reprezintă pătratul unei observaţii selectate aleator dintr-o populaţie normal distribuită având media zero şi deviaţia standard 1, este distribuită cu n grade de libertate. Densitatea de probabilitate a legii este f X ( x) x 1 e x n n 1 ( ) n
LEGEA HI-PĂTRAT (PEARSON) Forma acestei distribuţii depinde de numărul de termeni X i independenţi din sumă. Numărul de termeni X i independenţi se numeşte numărul de grade de libertate. Fiecărui nivel d al gradelor de libertate i se asociază o distribuţie distinctă. Media şi variaţia unei distribuţii sunt : M() = d, Var( ) = d, unde d este numărul de grade de libertate.
LEGEA F (FISHER) Distribuţia F introdusă de R. A. Fisher, este definită pe intervalul [0,+) şi descrie comportarea câtului a două variabile cu distribuţie Hi-pătrat, fiecare fiind împărţită prin numărul gradelor sale de libertate. Un membru al acestei clase de distribuţii este determinat prin numărul de grade de libertate ale numărătorului dn şi respectiv numărul de grade de libertate ale numitorului dm, distribuţiile F distincte fiind determinate de perechi (dn, dm) distincte.
LEGEA F (FISHER) In general, pentru dn şi dm > distribuţia F este unimodală şi pozitiv asimetrică. Atunci când numărul gradelor de libertate creşte distribuţia F se apropie pe domeniul său de definiţie de o distribuţie normală. Această distribuţie este utilizată în testele de comparaţie a variaţiilor şi ca aplicaţie a acestora în testele ANOVA.
Distributie Test statistic