METODAT BOOTSTRAP DHE APLIKIMI I TYRE

Size: px
Start display at page:

Download "METODAT BOOTSTRAP DHE APLIKIMI I TYRE"

Transcription

1 UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS DEPARTAMENTI I MATEMATIKËS SË APLIKUAR PROGRAMI I STUDIMIT Metodat Probabltare, Statstke dhe Metodat e Aalzës umerke TEZË DOKTORATURE METODAT BOOTSTRAP DHE APLIKIMI I TYRE Doktorat Msc. Ilr Palla Udhëheqës shkecor Prof. Dr. Lorec Ekoom Traë, 018

2 REPUBLIKA E SHQIPËRISË UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE TË NATYRËS DEPARTAMENTI I MATEMATIKËS SË APLIKUAR DISERTACION paraqtur ga Msc. Ilr PALLA Udhëhequr ga Prof.Dr. Lorec EKONOMI Për marrje e gradës shkecore DOKTOR Me temë: METODAT BOOTSTRAP DHE APLIKIMI I TYRE Mbrohet ë date / /018 para jursë 1. Prof Kryetar. Prof Aëtar(Opoet) 3. Prof Aëtar(Opoet) 4. Prof Aëtar 5. Prof Aëtar

3 LISTA E FIGURAVE LISTA E TABELAVE SIMBOLET E PËRDORURA FALENDERIME PËRMBLEDHJE ABSTRACT HYRJE QËLLIMI I STUDIMIT STRUKTURA E PUNIMIT PËRMBAJTJA KAPITULLI I: PËRDORIMI I METODËS BOOTSTRAP Prcpet e shpërdarjes bootstrap 1 1. Zgjedhjet e rastt Vlerësm parametrk dhe jo parametrk fuksot të shpërdarjes Vlerësm parametrk fuksot të shpërdarjes Vlerësm joparametrk fuksot të shpërdarjes Vlerësm bootstrap gabmt stadard Algortm për vlerësm bootstrap joparametrk të gabmt stadard Vlerësm bootstrap parametrk gabmt stadard Vlerësm bootstrap gabmt stadard për mesatare Vlerësm bootstrap gabmt stadard për mesore Vlerësmet bootstrap të gabmt stadard ë jë aplkm umerk Vlerësm bootstrap gabmt stadard për koefcet e korrelacot Numr përsërtjeve bootstrap R për vlerësm bootstrap të gabmt stadard Vlerësm bootstrap zhvedosjes Rast kur metoda bootstrap dështo 1.7 Metodat Delta për përafrm joparametrk të dspersot 3 KAPITULLI II: VLERËSIMET INTERVALORE BOOTSTRAP 5.1 Itervalet e besmt 5. Përafrm jë shpërdarjeje të pajohur të jë statstke ga shpërdarja ormale 7.3 Iterval besmt stadard ormal bootstrap 9.4 Iterval t-bootstrap 31.5 Iterval përqdësh bootstrap Gjetja e tervalt të besmt bootstrap për prtje matematke kur shpërdaja është ekspoecale 33.6 Metoda BCa Aplkm metodës bootstrap BCa ë vlerësm tervalor të koefcett të përcaktueshmërsë 35 v v v x x x x x x

4 KAPITULLI III: REGRESI LINEAR Mbledhja dhe orgazm të dhëave Formulm problemt Mbledhja e të dhëave Aalza fllestare e të dhëave Regreso lear katrorëve më të vegjël Modfkm mbetjeve Dy metoda bootstrap për regres lear Metoda bootstrap që bazohet ë rzgjedhje e gabmeve Metoda bootstrap që bazohet ë rzgjedhje e rasteve Dagostkm mbetjeve. Kotroll për ormaltet e gabmeve Kotroll për dsperso e gabmeve. Heteroskedastctet Paraqtja grafke e dsa rasteve kur kem heteroskedastctet dhe komada ë R Regres peshuar Metoda e katrorëve më të vegjël të peshuar WLS Regres peshuar ë të dhëa të smuluara Aplkm tre metodave ë jë regres lear kokret Regres katrorëve më të vegjël ë të dhëat për peshku Aplkm metodës bootstrap bazuar ë rzgjedhje e mbetjeve Aplkm metodës bootstrap bazuar ë rzgjedhje e rasteve Aplkm bootstrapt për të dhëat ë rezervat e peshkut Aplkme të tjera të metodës bootstrap Regreso lear shumëfshtë Shtrm problemt Vlerësuest e katrorëve më të vegjël Kotroll hpotezës për krahasm e modeleve 69 KAPITULLI IV: KONTROLLI I HIPOTEZAVE 4.1 Llojet e hpotezave 4. Kotroll hpotezës mb barazmt e prtjeve matematke 4.3 Nvel arrtur domethëes, p-vlera 4.4 Test përkëmbmt 4.5 Dy metoda bootstrap për krahasm e dy qedrave 4.6 Zbatm metodave bootstrap ë kotroll e hpotezave 4.7 Vlerësm gabmt të llojt të parë kur përdorm metodat bootstrap PËRFUNDIME 85 REFERENCAT 86 SHTOJCA 1 88 SHTOJCA 10 v

5 LISTA E FIGURAVE Fgura 1.1 Fukso shpërdarjes emprke vja e shkallëzuar dhe grafku fuksot të shpërdarjes kumulatve ekspoecale vlerësuar 4 Fgura 1. Hstogram vlerave të mesatareve bootstap të rzgjedhjeve të marra ga jë zgjedhje ga shpërdarja ormale me prtje matematke 5 dhe dsperso 3 11 Fgura 1.3 Hstogram vlerave bootstrap për mesore. Vja blu trego mesore e vërtetë, vja lejla mesore e zgjedhjes, vaja e kuqe vlerësm bootstrap 1 Fgura 1.4 Hstogram koefceteve korrelatv bootstrap. Vja e padërprerë trego përafrm ormal dhe vja me dërprerje shpërdarje e vëzhgmeve 16 Fgura 1.5 Kovergjeca e vlerësmeve bootstrap për gabm stadard 19 Fgura.1 Hstogram vlerësueseve për prtje matematke të shpërdarjes ekspoecale 8 Fgura. Hstogram 9999 vlerësmeve bootstrap për prtje matematke të jë dryshoreje rast ekspoecale 9 Fgura.3 Hstogram për gjatëstë e studetëve 30 Fgura.4 Hstogram 1000 mesatareve bootstrap ga të dhëat e gjatësve të studetëve. Hstogram është jë mëyrë vzuale për të parë lloj e shpërdarjes së kësaj statstke, e cla ë këtë rast duket qartë përafrm ormal 31 Fgura.5 Kufjtë e tervalt të besmt. Vjat e dërprera tregojë kufjtë e tervalt 34 Fgura.6 Ldhja mds vëllmt të pemës me lartësë e saj 36 Fgura.7 Ldhja mds vëllmt të pemës me dametr e saj 36 Fgura.8 Hstogram dhe Q-Q plot për koefcet e përcaktueshmërsë ë regreso lear të thjeshtë, ldhja mds Vëllmt dhe Lartëssë 38 Fgura.9 Hstogram për koefcet e përcaktueshmërsë, rast regresot dërtuar mds Vëllmt dhe Lartëssë, Dametrt, raportt Dametër/lartës 39 Fgura 3.1 Grafku ë të majtë trego rast kur kem gabme me dsperso kostat, kurse grafku ë të djathtë trego kur gabmet dryshojë me dryshm e vlerave të x-t 5 Fgura 3. Grafku mbetjeve ë të majtë trego homoskedastctet, kurse grafku ë të djathtë trego heteroskedastctet 5 Fgura 3.3 Grafku regrest të vërtetë, grafku regrest gjetur me metodë OLS dhe grafku regrest të gjetur me metodë WLS 55 Fgura 3.4 Në të majtë skaterplot për ldhje mds gjatëssë dhe peshës së peshqve. Në të djathtë ldhja mds vlerave të logartmuar të gjatësve dhe vlerave të logartmuar të peshave 57 v

6 Fgura 3.5 Grafku dagostkues për mbetjet e regrest për të dhëat peshqt. Rast Zagorçat 59 Fgura 3.6 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të mbetjeve. Vja e kuqe trego përafrm e shpërdarjes ormale 60 Fgura 3.7 Shpërdarja bootstrap koefcett të pjerrëssë ë metodë e përsërtjeve të rasteve 61 Fgura 3.8 Hstogram për mbetjet dhe krahasm me shpërdarje ormale 63 Fgura 3.9 Grafku dagostkues për mbetjet e regrest për te dhëat e peshqve ë rezervat 64 Fgura 3.10 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të lrë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të mbetjeve. Vja e kuqe trego përafrm e shpërdarjes ormale 65 Fgura 3.11 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të mbetjeve. Vja e kuqe jep përafrm me shpërdarje ormale 65 Fgura 3.1 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të lrë ë regres lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të çfteve (rasteve). Vja e kuqe me pka të dërprera jep përafrm me shpërdarje ormale 66 Fgura 3.13 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të çfteve. Vja e kuqe jep përafrm me shpërdarje ormale 66 Fgura 4.1 Nvel kolesterolt para dhe pas trajtmt me medkamete 77 Fgura 4. Hstogram 9999 dferecave bootstrap. Vja e kuqe trego dferecë e vëzhguar 78 Fgura 4.3 Hstogram shpërdarjes bootstrap për dferecat e mesatareve të dy dryshore rast të marra ga shpërdarje ormale me prtje matematke të jëjtë por me dspersoe të dryshme. Vja vertkale trego vlerë e vëzhguar të dferecës së mesatareve 79 v

7 LISTA E TABELAVE Tabela 1.1 Rezultatet për koefcet e korrelacot kur marrm zgjedhje ga popullm 14 Tabela 1. Zgjedhje e rastt me masë 15 ga të gjthë studetët 14 Tabela 1.3 Kuatlet e vlerave bootstrap për koefcet e korrelacot 15 Tabela 1.4 Krahasm vlerave të smuluara ga popullm me vlerat e Zgjedhjeve bootstrap 16 Tabela 1.5 Koefcet krmaltett për 100 mjë baorë vt ë Shqpër 18 Tabela.1 Gjashtë vlerat e para për Dametr Lartësë dhe Vëllm ga të dhëat trees 35 Tabela. Statstkat bootsrap për koefcet e përcaktueshmërsë 37 Tabela.3 Itervalet e besmt BCa për koefcet e përcaktueshmërsë spas llojt të regresot 39 Tabela 3.1 Redtja e gjatësve të studetëve spas madhëssë 4 Tabela 3. Të dhëat për peshku ë rezervat e Zagorçat dhe lqet të Ohrt 56 Tabela 3.3 Rezultatet përmbledhëse të regrest lear për të dhëat log të peshqve 57 Tabela 3.4 Tabela e aalzës së dspersoeve për të dhëat e peshkut 58 Tabela 3.5 Të dhëat përmbledhëse për tre metodat e përdorura për gjetje e regrest ë të dhëat e peshkut ë lqe e Ohrt 6 Tabela4.1 Vlerësm gabmt të llojt të parë. X ~ N( X, X), Y ~ N( Y, Y). Dspersoet jaë të pajohura por të barabarta. MC Tabela 4. Vlerësm gabmt të llojt të parë. X ~ N( X, X), Y ~ N( Y, Y). Dspersoet jaë të pajohur por jo të barabartë. MC Tabela 4. 3 Vlerësm gabmt të llojt të parë. X ~ N( X, X), Y ~ N( Y, Y) Dspersoet jaë të pajohur por jo të barabartë. MC Tabela 4.4 Vlerësm gabmt të llojt të parë. X ~ E( ), Y ~ E( ), MC 1000, 0.05, 10, m Table 4.5 Vlerësm gabmt të llojt të parë. X ~ Gamma ( shape 3, scale ) Y ~ Gamma ( shape 3, scale ), MC 1000, 0.05, 10, m v

8 SIMBOLET E PËRDORURA X, Y, Z, jaë shëuar dryshoret e rastt x, y, z vlerat që marr dryshoret e rastt Fx ( ) fukso e shpërdarjes të dryshores së rastt X f( x ) destet e dryshores së rastt X (.) fukso Laplast prtja matematke dsperso X mesatarja artmetke e zgjedhjes së rastt X s dsperso emprk se (.) shmaga mesatare katrore, devjm stadard EX ( ) prtja matematke e dryshores së rastt X var( X ) dsperso dryshores së rastt X cov( XY, ) kovaraca mds dryshoreve të rastt XY, corr( X, Y ) koefcet korrelacot mds dryshoreve të rastt XY, parametr që do vlerësohet ˆ jë vlerësm parametrt b( ˆ, F) zhvedosja e vlerësuest L x1 x ( ;,..., ) fukso përgjassë maksmale e, r H H 0 a m,, cv koefcetet e regrest gabmet e regrest lear mbetjet ë regres lear hpoteza zero hpoteza alteratve vel domethëes, masë e krtert vëllmet e zgjedhjeve koefcet varacot v

9 FALENDERIME Faledermet kryesore shkojë për Fakultet e Shkecave të Natyrës dhe Departamet e Matematkes së aplkuar, për mbështetje dhe dhmë e vazhdueshme ë realzm e studmt të doktoratës. Dua të falederoj udhëheqës tm shkecor, Prof. Dr. Lorec Ekoom për mbështetje e tj të pakursyer për realzm e këtj pum. Dëshroj të falederoj edhe kolegët e departamett të Matematkës, Iformatkës dhe Fzkës për mbështetje dhe udhëzmet që më kaë dhëë gjatë përgattjes së tezës. Falederm të veçatë për Prof. Lluka Puka, që me xtje, dhmë, sugjermet e pakursyera të tj kaë qëë jë mbështetje e çmueshme për mua. Së fudm, falederoj famlje tme për mbështetje dhe përkrahje e vazhdueshme që më kaë dhëë gjatë gjthë kësaj kohe. x

10 PËRMBLEDHJE Në shumë studme statstkore, jë çështje e rëdësshme ka të bëjë me vlerësmet e gabmt stadard të jë statstke që vlerëso shpërhapje e jë parametr. Për vlerësm e prtjes matematke e kem formula të gatshme për vlerësm e gabmt stadard, por për vlerësm e gabmt stadard të madhësve të tjera s koefcet korrelacot uk ekzsto formulë e gatshme matematke. Një alteratvë për vlerësm e gabmt stadard të jë statstke është metoda bootstrap, e cla është jë ga metodat e reja të rzgjedhjes. Numr përshtatshëm përsërtjeve bootstrap R për vlerësm e gabmt stadard bootstrap zë jë ved ë këtë studm. Metodat bootstrap mud të përdore s ë rast parametrk kur dmë shpërdarje e zgjedhjes, me qëllm përmrësm e saktëssë, ashtu dhe ë rastet joparametrke kur uk dmë rreth shpërdarjes së zgjedhjes. Duke u bazuar ë llojet e tervaleve të besmt bootstrap të përcaktuar ga Efro jaë gjetur tervalet e besmt të prtjes matematke të jë dryshore rast ekspoecale. Kem aplkuar metodë bootstrap Bca për gjetje e tervalt të besmt për koefcet e përcaktueshmërsë ë jë regres lear me të dhëa kokrete. Një arrtje e metodave bootstrap është aplkm tyre ë regres lear për të vlerësuar koefcetet e regrest kur supozmet mb gabmet ë regres uk qëdrojë ose jaë të dyshmta. Ky studm përmba metodat bootstrap për të testuar barazë e prtjeve matematke të dy dryshoreve të rastt. Një problem tllë quhet problem me dy zgjedhje. Duke marrë parasysh jë test të hpotezës bootstrap për krahasm e dy prtjeve matematke, uk ka asjë arsye bdëse për të marrë dspersoe të barabarta dhe për këtë arsye e uk e bëjmë atë supozm. Metodat bootstrap mud të përdore edhe kur të dy zgjedhjet e rastt uk kaë shpërdarje ormale. Kem kotrolluar performacë e metodave bootstrap ë gabm e llojt të parë duke e krahasuar me metodë Dy zgjedhje t-test dhe metodë Welch t- test. Për rezultatet e xjerra është përdorur program R, duke përdorur komada të gatshme që dodhe breda tj ose duke dërtuar skrpte të reja që jaë ë fukso të gjetjes së rezultateve. ABSTRACT I may statstcal studes, a mportat ssue relates to stadard error estmates of a statstc that estmates the dspersal of a parameter. For estmato of the mea we have readly avalable formula for stadard error estmato, but for stadard error estmato of other quatty such as correlato coeffcet there s o mathematcal formula. A alteratve for stadard error estmato of a statstc s the bootstrap method, whch s oe of the ew methods of resample. The approprate bootstrap R repetto umber for estmato bootstrap of the stadard error occupes a place ths study. Bootstrap methods ca be used ether the parametrc case whe we kow the dstrbuto of samples order to mprove accuracy, or oparametrc cases whe we do ot kow about the dstrbuto of samples. Based o the types of cofdece tervals determed by Efro, the cofdece tervals of the mea of a expoetal case varable were foud. We appled the Bca bootstrap method to fd the cofdece terval for the determato coeffcet a lear regresso wth cocrete data. A accomplshmet of bootstrap methods s ther applcato the lear regresso to estmate the regresso coeffcets, whe assumptos about regresso errors do ot stad or are doubtful. Ths study cotas the bootstrap methods to test the equalty of meas of two radom samples. Such a problem s called a two-sample problem. I cosderg a bootstrap hypothess test for comparg the two meas, there s o compellg reaso to assume equal varaces ad hece we do t make that assumpto. These methods ca be used eve whe both radom samples have ot a ormal dstrbuto. We checked the performace of bootstrap methods the frst type error by comparg the "Two t-test samples" method ad the "Welch t-test" method. For the outputs, the program R s used, usg ready-made commads sde t, or by buldg ew scrpts that are fucto of fdg results. x

11 HYRJE Metodat dhe tekkat statstkore kaë zbatm ë shumë shkeca: ë shkecat bomjekësore, ë pskologj, edukm, ekoom, teor komukm, socologj, studme gjeetke, epdemologj s dhe ë fusha të tjera. Statstka a jep metoda optmale për gjetje e shejave reale ë jë mjeds të rrëmujshëm dhe gjthashtu a jep kotrolle strkte kudër terpretmeve të modeleve të rastësshme. Statstka është jë degë e matematkës që merret me mbledhje, aalzë, terpretm, paraqtje dhe orgazm e të dhëave duke përdorur metoda dhe tekka të dryshme statstkore. Teora statstkore përpqet tu përgjgjet tre pyetjeve bazke: 1. S mud të mbldhe të dhëat?. S do t aalzojmë dhe përmbledhm të dhëat? 3. Sa saktës kaë këto përmbledhje të dhëash? Pyetja e tretë kossto ë atë që quhet kokluzoe statstkore. Metodat bootstrap jaë tekka të zhvlluara kohët e fudt për të xjerrë dsa ga kokluzoet statstkore kur metodat klaske dështojë ose jaë të dyshmta. Do të shpjegojmë kur metoda bootstrap vle dhe kur ajo mud të aplkohet për jë shumëllojshmër të gjerë të stuatave të të dhëave. Dy ga problemet më të rëdësshme ë statstkë e aplkuara jaë përcaktm jë vlerësues për jë parametër të caktuar që a tereso dhe vlerësm saktëssë e atj vlerësues ëpërmjet vlerësmeve të gabmt stadard të vlerësuest dhe përcaktm e tervaleve të besmt për parametr. Metodat bootstrap jaë tekka rzgjedhje të propozuara ga Efro (1979). Efro ë fllm e përdor metodë bootstrap me qëllm për të karakterzuar vlerësmet jackkfe. Më e rëdësshmja shte vlerësm gabmt stadard të vlerësuest të parametrt, veçaërsht kur vlerësues shte kompleks dhe përafrmet stadarde të tlla s metodat Delta uk sh të përshtatshme ose shumë të pasakta. Më voë, me zhvllm e shpejtë te tekkave llogartëse, s dhe të aplkmt të tyre mjaft të gjerë, ato u vuë ë pararojë të metodave të rzgjedhjes. Aplkm bootstrap-t bazohet tek prcp plug-, që përdoret tek shpërdarja e zgjedhjeve: vlerësohet prtja matematke e popullmt, ga mesatarja x e zgjedhjes, devjm stadard popullmt ga devjm stadard zgjedhjes, vlerësohet mesorja e popullmt ga mesorja e zgjedhjes. Ideja bootstrap është jë formë e prcpt plug- : kosderohet zgjedhja s gjthë popullm, pastaj dërtohe zgjedhje (rzgjedhje) ga zgjedhja fllestare, që mtojë proces duke dërtuar shpërdarje e zgjedhjes. QËLLIMI I STUDIMIT Studm ka s qëllm që të jhe metodat bootstrap dhe aplkm tyre, s metoda që përmrësojë dhe saktësojë xjerrje e kokluzoeve statstkore. Metodat bootstrap jaë metoda të bazuar ë llogartje kompjuterke për vlerësm e masave të saktëssë ë vlerësmet statstkore. Do paraqtm deë bootstrap dhe x

12 mplemetm e saj ë kompjuter dhe aplkm dsa problemeve me të dhëa reale. Bootstrap aplkohet ë jë klasë shumë më të gjerë të problemeve sesa vetëm për vlerësm e gabmt stadard dhe tervaleve të besmt. Aplkmet përfshjë vlerësm e shkallës së gabmt ë aalzë dskrmuese, regreso lear dhe jolear, aalzë e serve kohore, ë probleme të shumta testm dhe aalza e mbjetesës dhe besueshmërsë, regreso logjstk, aalzë e kllastert (cluster aalyss). Metodat bootstrap ofrojë jë umër avatazhesh: Për shkak se uk kërkojë supozme të shpërdarjes, metodat bootstrap mud të sgurojë kokluzoe më të sakta kur të dhëat uk jaë të qarta ose kur masa e zgjedhjes është e vogël. Metodat bootstrap mud të përdoret ë përgjthës edhe kur e mud të përdorm metodat tradcoale. A është relatvsht thjeshtë për tu aplkuar ë të dhëat komplekse, sç jaë rastet e zgjedhjeve të shtresëzuara. Metodat bootstrap mud të aplkohet ë rastet e vështra ose të pasgurta për të shprehur çdo kokluzo rreth gabmeve stadard, testmt të hpotezave ose tervaleve të besmt. Një avatazh kësaj teore është se shpërdarja bootstrap e krjuar ga rzgjedhjet përshtatet me karakterstkat e shpërdarjes së zgjedhjes. Për të aplkuar shpërdarje e zgjedhjeve kërkohe shumë zgjedhje ga popullm, të clat marrja e të dhëave për to kërko shpezme të shumta. Bootstrap- lejo të llogarsm gabmet stadarde për statstkat për të clat uk kem formula dhe kotrollo ormaltet për statstkat që teora klaske uk zotëro dot me lehtës. STRUKTURA E PUNIMIT Në Kaptull 1 do të pasqyrojmë s llogartet vlerësm bootstrap gabmt stadard dhe algortm për vlerësm e gabmt stadard të jë statstke. Përveç trajtmt formal të kocepteve statstkore do jepe dhe aplkme të dryshme të metodës bootstrap për të vlerësuar gabm stadard të mesatares, mesores, koefcett të korrelacot dhe zhvedosjes së jë vlerësues të jë parametr. Trajtohet umr mjaftueshëm rpërsërtjeve bootstrap që të kem jë vlerësm të mrë për gabm stadard. Në këtë kaptull paraqtet dhe metoda Delta për vlerësm e gabmt stadard. Aplkmet umerke për këto metoda do jeë s mb zgjedhje të smuluara mb të dhëat e jë akete të bërë me studetët dhe të dhëa të sguruara ga mudësa që a jep teret dhe programet kompjuterke. Në Kaptull do të paraqesm metodat bootstrap për të dërtuar tervalet e besmt për jë parametër ë rastet parametrke dhe joparametrke. Do të pasqyrojmë procedurat dhe dërtm e tervalt të besmt t-bootstrap, terval përqdësh bootstrap, dhe terval e besmt BCa. Qëllm është që të përmrësojmë me jë red magtude saktësë e tervaleve stadarde, ë jë mëyrë të tllë që lejo aplkm edhe për probleme më të komplkuara. Metoda x

13 BCa është jë metodë e jë saktëse e redt të dytë dhe përdoret ë trasformme respektve. Për këtë arsye tervalet BCa rekomadohe sdomos për problemet joparametrke. Rezultatet e metodave bootstrap do të krahasohe me terval ekzakt, ë rast parametrk dhe joparametrk. Kem aplkuar metodë bootstrap Bca për gjetje e tervalt të besmt për koefcet e përcaktueshmërsë ë jë regres lear me të dhëa kokrete. Përpum të dhëave do të bëhet ë program R, duke përdorur fukso boot.c cl gjeero pesë lloje tervalesh joparametrke. Në Kaptull 3, aalza e regrest lear ka dsa objektva të mudshme: duke përfshrë ldhje mds dryshoreve shpjeguese me dryshore e shpjeguar, vlerësm e efektt të jë dryshoreje shpjeguese tek dryshorja e shpjeguar. Shumë metoda përdore për aalzë e regrest lear: s metoda e katrorëve më të vegjël, metoda e përgjassë maksmale, metoda e katrorëve të peshuar dhe metoda të tjera. Për përdorm e metodës së katrorëve më të vegjël ose metodës e përgjassë maksmale duhet që gabmet ë regres duhet të plotësojë dsa kushte që do theksohe ë pjesë e regrest lear. Dy metoda bootstrap, metoda e rzgjedhjes së mbetjeve dhe metoda e rzgjedhjes së rasteve jaë aplkuar ë rastet kur uk dhet shpërdarja e gabmeve dhe ë rast kur gabmet uk kaë dsperso kostat. Për kotroll e ormaltett të gabmeve përdorm test Shapro ose Kllomgorov- Smorov test. Në studm do të pasqyrojmë vlerësm e koefceteve të regresot lear dhe kotroll e hpotezave ë ldhje me koefcetet, duke përdorur metodë bootstrap. Në Kaptull 4 Kotroll hpotezave statstkore zë jë ved ë këtë studm. Metoda të dryshme testm hpotezash statstkore do të përdorm. Përdorm e metodës bootstrap për kotroll e hpotezës së barazmt të dy qedrave kur metodat e zakoshme uk jaë të sgurta, për shkak të supozmeve fllestare uk plotësohe. Me aë smulmeve do të kotrollojmë performacë e metodës bootstrap duke vlerësuar gabm e llojt të parë duke e krahasuar me metodat klaske s test dy zgjedhjeve ose test Welch (Welch's t-test). Në pjesë e fudt dodhe shtojcat e materalt ku jaë pasqyruar skrptet e përdorura ë program R për xjerrje e grafkëve dhe rezultateve që përmba materal dhe dsa tabela të dhëash. x

14 KAPITULLI I PËRDORIMI I METODËS BOOTSTRAP 1.1 Prcpet e shpërdarjes bootstrap Shpërdarja bootstrap pajtohet me shpërdarje e zgjedhjes ë formë dhe ë shpërhapje. Qedra e shpërdarjes bootstrap uk është e jëjtë me qedrë e shpërdarjes së zgjedhjes. Shpërdarja e zgjedhjes së jë statstke përdoret për të vlerësuar jë parametër të përqedruar ë vlerë aktuale të parametrt ë popullm, plus zhvedosje. Shpërdarja bootstrap është përqedruar ë vlerë e statstkës të zgjedhjes orgjale, plus zhvedosje. Fakt kyç është që dy zhvedosjet jaë të gjashme megjthëse të dy qedrat mud të mos jeë të tlla. Metoda bootstrap është shumë e përdorshme ë rastet ku e uk e dmë shpërdarje e zgjedhjes të jë statstke. Prcpet jaë: Forma: Meqeëse forma e shpërdarjes bootsrap afrohet formës së shpërdarjes së zgjedhjes, e mud të përdorm shpërdarje bootstrap për të kotrolluar shpërdarje e zgjedhjes. Qedra: Një statstkë është e zhvedosur s jë vlerësues jë parametr ëse shpërdarja e zgjedhjes së saj uk është e qedërzuar ë vlerë e vërtetë të parametrt. Ne mud të kotrollojmë zhvedosje, ëse shpërdarja bootstrap e jë statstke është qedërzuar tek vlera e statstkës të zgjedhjes orgjale. Më saktë, zhvedosja e jë statstke është dfereca mds mesatares së shpërdarjes së zgjedhjeve të saj dhe vlerës së vërtetë të parametrt. Vlerësues bootstrap zhvedosjes është dfereca mds mesatares së shpërdarjes bootstrap dhe vlerës së statstkës së zgjedhjes orgjale. Shpërhapja: Gabm stadard bootstrap jë statstke është devjm stadard shpërdarjes bootstrap të saj. Gabm stadard bootstrap vlerëso devjm stadard të shpërdarjes së zgjedhjeve të statstkës. 1. Zgjedhjet e rastt Zgjedhja e rastt përbë jë ga koceptet themelore të statstkës, tek e cla mbështete metodat statstkore për të xjerrë vedme ë ldhje me parametrat që karakterzojë popullm ë studm. Një dvd popullmt ka të gjtha karakterstkat që e duam të dmë, s opo poltk, kohë e shërbmt 1

15 mjekësor, shkalla e gradmt etj, por është shumë e vështrë dhe e shtrejtë që të ekzamohe çdo dvd, kështu që e marrm jë zgjedhje të rastt me masë të përshtatshme. Supozojmë se është dhëë dryshorja e rastt X, e cla ka fukso shpërdarje Fx. ( ) Duam të xjerrm kokluzoe dhe vedme për këtë dryshore rast X. Për këtë a duhe të gjtha vlerat e mudshme të dryshores së rastt së bashku me probabltetet përkatëse të këtyre vlerave. Kur umr vlerave të marra ë studm është madh, ose kur mudësa për të matur çdo dvd është pamudur ose me kosto facare të madhe, atëherë ld domosdoshmëra për të marrë jë zgjedhje. Zgjedhja do të jetë jë bashkës e fudme e bashkëssë së vlerave të mudshme të dryshores së rastt. Zgjedhja e marrë duhet të jetë sa më përfaqësuese e dryshores së rastt, që kokluzoet e marra të jeë më të sakta. Për të dërtuar zgjedhje të rastt përdorm umrat e rastt, aq umra rast sa është umr vëllmt të zgjedhjes. Për marrje e umrave të rastt mud të përdorm tabelë e umrave të rastt ose programet kompjuterke statstkore. Quajmë që kem përftuar ga jë zgjedhje e rastt të dhëat x1, x,..., x. Vlera e parë x 1, është vlera e tpart ë jësë studmore që është zgjedhur e para, por s jës të parë mud të kshm zgjedhur jë jës tjetër, që do ta shëom me x 1. Vlera x 1 uk do të terpretohet s vlera e parë kokrete e të dhëave të vrojtuara, por s jë vlerë e mudshme ga të gjtha vlerat që mud të marrë jësa e parë e zgjedhur, pra do të shte vlerë e jë dryshore rast që shëohet X 1. Të jëjt arsyetm mud të bëjmë për vlerë e marre x, s vlerë e dryshores së rastt X. Ky arsyetm vazhdo kështu me radhë. Në rast se kem të dhëat e të gjthë popullmt atëherë e mud të xjerrm përfudme ë ldhje me parametrat e këtj popullm. Në rast kur kem zgjedhje të rastt uk bëhet fjalë për të xjerrë përfudme por thjesht për të marrë vedme ë ldhje me parametrat e popullmt ga është marrë kjo zgjedhje. Për të marrë zgjedhje të rastt (smulme) ga shpërdarje të johura mud të përdorm program R ëpërmjet komadave: rorm për të smuluar ga shpërdarja ormale, rexp ga shpërdarja ekspoecale, rgamma ga shpërdarja beta, rbeta ga shpërdarja beta etj. Për më shumë ë përdorm e programt R ë statstkë do të trajtohet më poshtë. 1.3 Vlerësm parametrk dhe jo parametrk fuksot të shpërdarjes Në teorë e probabltett dhe të statstkës jë kocept rëdësshëm është kocept fuksot të shpërdarjes. Në qoftë se johm shpërdarje e jë dryshore rast atëherë e mud të gjejmë fukso e shpërdarjes së saj. Aasjellas, ë qoftë se e johm fukso e shpërdarjes mud të përcaktojmë shpërdarje e saj. Në shumë teorema puohet me fukso e shpërdarjes dhe jo drejtpërdrejt me fukso probabltar të dryshores së rastt.

16 1.3.1 Vlerësm parametrk fuksot të shpërdarjes Fukso e shpërdarjes e shëojmë me F (CDF, cumulatve dstrbuto fucto) dhe me f destet e shpërdarjes (PDF, probablty desty fucto). Ne jem të teresuar për dojë parametër të kësaj shpërdarje, të clë e shëojmë me. Për shembull mud të jetë: prtja matematke dsperso devjm stadard koefcet varacot (raport shmages mesatare katrore daj vlerës absolute të mesatares së të dhëave) mesorja ose kuattet koefcet korrelacot mds kompoetëve të jë shpërdarje me dy dryshore, etj. Ekzstojë dy stuate të dalluara, rast parametrk dhe jo parametrk. Kur ekzsto jë model matematkor posaçëm, me parametra që përcaktojë plotëssht destet f, jë model tllë quhet metoda parametrke dhe metodat statstkore bazuar ë këtë model jaë metoda parametrke. Kur uk përdoret jë model tllë matematkor, aalza statstkore është joparametrke dhe përdor vetëm fakt se dryshoret e rastt X jaë të pavarura dhe me shpërdarje të jëjtë. Edhe ëse ekzsto jë model parametrk besueshëm, jë aalzë joparametrke mud të jetë ede e dobshme për të vlerësuar qëdrueshmërë e kokluzoeve të xjerra ga jë aalzë parametrke. Shëojmë fukso e shpërdarjes dhe destet e shpërdarjes së dryshores së rastt përkatëssht me: F ( x) dhe f ( x). Kur vlerësohet ga ˆ shpesh por jo gjthmoë ëpërmjet vlerësuest të përgjassë maksmale, duke zëvedësuar me ˆ ë këtë model marrm model e vlerësuar me fukso shpërdarje F ˆ( x ) F ( x ). Duam që të vlerësojmë jë parametër që a tereso. Në ˆ përgjthës statstka që a tereso është jë fukso smetrk zgjedhjes që ëkupto se vlera t uk varet ga rredtja e të dhëave. Shembull 1.1. Kem jë zgjedhje ë të clat kaë rezultuar vlerat: (0.010, , 0.008, , 0.355, , , 0.763, , ,.546,.5994,.643,.8360) Të dhëat e shembullt 1.1 më spër, e mud t medojmë s të dhëa që jaë marrë ga jë shpërdarje ekspoecale. Shëojmë se fukso shpërdarjes ekspoecale dhe destet shpërdarjes ekspoecale jepe me formulat: F exp 0 për x 0 ( x) dhe (1.1) 1 exp( x / ) për x 0 0 për x 0 f( x) exp( x) për x 0 (1.) 3

17 prtja matematke EX ( ) 1/ dhe Var( X ) 1/ Vlerësm parametrk për fukso e shpërdarjes bëhet duke supozuar që kjo zgjedhje është marrë ga jë shpërdarje ekspoecale. Vlerësojmë prtje matematke të shpërdarjes ekspoecale me aë të mesatares artmetke. Përdorm softuer R dhe komadat ë shtojcë A1: Fgura 1.1 Fukso shpërdarjes emprke vja e shkallëzuar dhe grafku fuksot të shpërdarjes kumulatve ekspoecale vlerësuar. Duke përdorur model ekspoecal, atëherë e mud të marrm vettë bazke për vlerësues T X për prtje matematke. Prtja matematke e këtj vlerësues x është x kurse dsperso, të clat mud t përdorm për gjetje e tervaleve të besmt për prtje matematke të bazuar ë përafrm ormal. Dmë gjthashtu që ky vlerësues për prtje matematke është pazhvedosur. Megjthëse grafku a sugjero se model ekspoecal është arsyeshëm, e uk mud të kem shumë besm ë këtë supozm sepse vëllm e zgjedhjes që kem marrë ë studm është 15, jë vëllm që mud të kosderohet e vogël. Një sugjerm tjetër për shpërdarje e të dhëave mud të shte që ato kaë shpërdarje gamma. 4

18 1.3. Vlerësm joparametrk fuksot të shpërdarjes Supozojmë se jem ë stuatë e zakoshme rast jë zgjedhje. Zgjedhje e vëzhguar e shëojmë x x1, x,..., x. Vlerat e vëzhguara redtm spas redt rrtës x1 x... x. Vlerat e zgjedhjes jaë meduar s rezultate të dryshoreve të rastt X1, X,..., X të pavarura me shpërdarje probabltare të jëjtë, të clë e shëojmë me f dhe fukso e shpërdarjes F.Gjthashtu supozojmë se destet dhe fukso shpërdarjes ë këtë rast uk jhet. Duam të vlerësojmë jë parametër që a tereso të kësaj shpërdarje. Në aalzë joparametrke ë statstkë rol të rëdësshëm lua fukso shpërdarjes emprke. Vlerësues për fuksot e shpërdarjes F marrm fukso e shpërdarjes emprke ˆF (EDF, emprcal dstrbuto fucto). Fukso shpërdarjes emprke ˆF përcaktohet: ˆ umr { x x} 1 F x I (1.3) x x 1 ku I fukso dkator. Një mëyrë tjetër e paraqtjes së fuksot të shpërdarjes emprke jepet ë formë: ˆ 1 F ( x ) H ( x x ) (1.4) ku 1 0 kur u 0 Hu ( ) 1 kur u 0 (1.5) Vlerat e mudshme të fuksot të shpërdarjes emprke jaë 0, 1/, /,, /. Në Fgurë 1.1, vja e shkallëzuar trego grafksht fukso e shpërdarjes emprke. Fukso shpërdarjes emprke lua rol e modelt të vlerësuar kur uk është supozuar forma matematke për F. Prtja matematke e jë popullm është: xdf( x) dhe vlerësues saj është mesatarja e zgjedhjes x. Të tregojmë që ˆ x. ˆ ˆ xd( F) xd( H( x x ) xdh ( x x ) x x (1.6) sepse dmë që për çdo fukso të vazhdueshëm ax, ( ) a( z) dh( z x) a( x). Llogarsm dsperso e X. tegral 5

19 var( X ) s var X E X E X x x, (1.7) ku ( ) [ ( )] ( ) ( ) 1 1 s x x. ( ) 1 1 Në qoftë se parametr që a tereso është raport prtjeve matematke EX ( ), atëherë F do të shte fukso shpërdarjes kumulatve bvarate e EY ( ) dryshores Z ( X, Y) dhe Një vlerësm korespodues : ˆ xdfˆ ( x, y ) ydfˆ ( x, y ) x y, ku x 1 x 1 xdf( x, y). ydf( x, y) dhe 1 y 1 y. Formula (1.4) trego kovergjecë e ˆF tek F kur. Përcaktm ˆ ëkupto që ˆ kur. Jo të gjtha vlerësmet ˆ për jë parametër jaë të pazhvedosura. Të gjtha këto rezultate kem vëë ë dukje për të patur jë krahasm me rezultatet që do të xjerrm me metodë bootstrap. Do të marrm zgjedhje ga shpërdarje të johura, për shembull ga shpërdarja ekspoecale ose shpërdarja gama, për të clat e kem mudës për të xjerrë kokluzoe rreth vetve të tyre dhe do t krahasojmë me rezultatet që mudësojë metodat bootstrap. 1.4 Vlerësm bootstrap gabmt stadard Shumë vlerësme për parametrat bazohe ë prcp: plug- jë metodë që vlerëso parametrat ga zgjedhja. Vlerësues e jë parametr të jë shpërdarje e shëojmë me ˆ. Për këtë qëllm llogarsm ˆ s x ga vlerat e zgjedhjes x, ku sx ( ) është jë statstkë që vlerëso parametr. Metoda bootstrap a sguro vlerësme të saktëssë duke përdorur prcp plug- për të vlerësuar gabm stadard të jë statstke. Gabm stadard është devjm stadard (shmaga mesatare katrore) e shpërdarjes së statstkës s fukso zgjedhjeve. Gabm stadard mesatares përshkrua se sa e saktë është mesatarja përkudrejt prtjes matematke të popullmt. Vlerësm bootstrap gabmt stadard uk kërko llogartje teorke dhe është përdorshëm pavarëssht sa e komplkuar mud të jetë vlerësues ˆ sx ( ). 6

20 1.4.1 Algortm për vlerësm bootstrap joparametrk të gabmt stadard Metodat bootstrap vare ga oco zgjedhjes bootstrap. Një zgjedhje bootstrap është jë zgjedhje e rastësshme me vëllm e marrë ga ˆF, e cla shëohet: X * X * * * 1, X,..., X (1.8) F ˆ X, X,..., X * * * 1 * * Zgjedhjet bootstrap ( x1,, x ) jaë zgjedhje të rastësshme me vëllm të marra me rvedosje (me kthm) ga zgjedhja fllestare e elemetëve x x,.., Për çdo zgjedhje bootstrap ˆ * * sx ( ) 1, x. * X, vlera bootstrap llogartet me formulë: (1.9) Vlera e statstkës * sx ( ) është rezultat aplkmt të të jëjtt fukso s () tek * X, ë të jëjtë mëyrë që është llogartur tek zgjedhja orgjale X. Për * sx ( ) është shembull, ë qoftë se sx ( ) është mesatarja e zgjedhjes X, atëherë mesatarja e elemetëve të zgjedhjes Vlerësm bootstrap gabmt stadard * * 1 X X /. se ( ˆ ) F, jë statstke ˆ, është jë vlerësm vëe ë przë që përdor fukso e shpërdarjes emprke ˆF ë ved të shpërdarjes së pajohur F. Në mëyrë specfke, vlerësm bootstrap përcaktohet ga ( * ) F ˆ se ( ˆ ) F se ˆ. Me fjalë të tjera vlerësm bootstrap se ( ˆ ) F është gabm stadard ˆ për elemetet e të dhëave me masë të zgjedhur rastëssht prej ˆF. Formula * se ( ˆ ) F ˆ quhet vlerësm deal bootstrap për gabm stadard të ˆ. Një komadë umrash rast zgjedh umrat e plotë 1,,..., çdo jëra prej seclës merr vlerat ga 1 der ë me probabltet 1 /. Algortm bootstrap puo mb jë umër zgjedhjesh bootstrap të pavarura dhe me shpërdarje të jëjtë duke llogartur vlerat bootstrap përkatëse dhe vlerëso gabm stadard të ˆ ga devjm stadard emprk këtyre vlerave. Rezultat quhet vlerësm bootstrap gabmt stadard, shëohet me se ˆR, ku R është umr zgjedhjeve bootstrap të përdorura. Algortm bootstrap është jë mëyrë llogartëse për të * marrë jë përafrm të mrë të vlerave umerke të se ( ˆ ) F ˆ, shko B. Efro dhe R. J. Tbshra, 1993), faqe 47 [1]. 7

21 Algortm për vlerësm bootstrap të gabmt stadard. *1 * * R 1. Marrm R zgjedhje bootstrap të pavarura X, X,..., X. Secla prej tyre përbëhet ga vlera të dhëash të zgjedhura me rkthm prej zgjedhjes X. *r. Llogarsm vlerë bootstrap që përket çdo zgjedhje bootstrap X, ˆ * ( ) ( * r r s X ), r 1,,..., R, ku ˆ () r llogartet me të jëjt fukso që llogartet vlera e saj ga zgjedhja që kem ë fllm dhe korrespodo rzgjedhjes së r-të. 3. Vlerësojmë gabm stadard se ( ˆ ) F ëpërmjet devjmt stadard emprk (shmaga stadarde) të R vlerave bootstrap ku R ˆ* * ˆ R [ ( ) ] / ( 1) r1 se r R (1.10) R * * ˆ ( r ) / R mesatarja artmetke e R vlerave përkatëse bootstrap. r1 Meqeëse forma e statstkës ˆ s x mud të jetë shumë e komplkuar, formula ekzakte për vlerësmet bootstrap për gabm stadard (BESE, bootstrap estmate of stadard error) përafrohet ga devjm stadard emprk (1.10). Lmt kur R shko ë ft se ˆR është vlerësm deal bootstrap se ( ˆ ) F. Fakt që se ˆR qaset se kur R shko ë ft do të thotë që devjm stadard emprk ˆF përqaset devjmt stadard të popullmt kur umr vlerave bootstrap rrtet * shumë. Vlerësm deal bootstrap se ( ˆ ) F ˆ dhe përafrm tj se ˆR quhe vlerësme bootstrap joparametrke sepse jaë bazuar ë ˆF, vlerësm joparametrk popullmt F Vlerësm bootstrap parametrk gabmt stadard Vlerësm bootstrap parametrk e shëojmë me se ˆ, ku F ˆ par është jë * ˆ ( ) Fpar vlerësm F xjerrë prej modelt parametrk për të dhëat. Në ved të zgjedhm me rvedosje ga të dhëat e dërtojmë R zgjedhje me masë ga vlerësm parametrk popullmt F ˆpar. Pas gjeermt të zgjedhjeve bootstrap, e procedojmë ekzakt s ë hapat dhe 3 të algortmt bootstrap të dhëë më spër. Llogarsm statstkë toë për çdo zgjedhje bootstrap dhe pastaj llogarsm devjm stadard për R vlerat përkatëse bootstap. Pra kjo procedurë mud të pasqyrohet ë këtë formë: * r * r * r * r Smulojmë zgjedhje e rastt X ( X1, X,..., X ) ku r 1,..., R, me vëllm ga shpërdarja F. ˆpar 8

22 * * r Llogarsm statstkë ( r) s( x ) Përdorm formulë (1.10), e cla llogart vlerësm bootstrap të gabmt stadard Vlerësm bootstrap gabmt stadard për mesatare Supozojmë së X është jë dryshore rast reale me fukso shpërdarje F. Shëojmë prtje matematke dhe dsperso të kësaj dryshore rast me smbolet dhe përkatëssht. F F ( ) F EF X, var ( X ) E [( X ) (1.11) F F F F Le të jetë dhëë ( X1,..., X ), jë zgjedhje e rastt me masë ga shpërdarja F. Statstka 1 F X X ( F, ) (1.1) 1 Prtja matematke e mesatares X është e jëjtë me prtje matematke të dryshores së rastt X, kurse dsperso X është 1/ herë dspersot të dryshores së rastt X. Kjo është jë arsye që them se për të mëdha do kem dsperso të vogël për X. Mesatarja do të jetë jë vlerësues mrë për. Gabm stadard për X do jetë: F sef( X ) var F( X ) (1.13) Gabm stadard është term përgjthshëm për devjm stadard të statstkës përshkruese. Në përgjthës presm që x të jetë më vogël se jë gabm stadard ga F rreth 68% të herëve dhe më pak se dy gabme stadarde prej F rreth 95% të herëve. Nga lgj umrave të mëdhej LNM dhe ga teorema qedrore lmte shpërdarja e X bëhet përafërssht ormale për të mëdha, mud të F shkruajmë: X N( F, ). Vlerësm bootstrap gabmt stadard për prtje matematke duke u bazuar ë algortm për vlerësm e gabmt stadard të jë statstke do llogartet me formulë: ku R * r * boot 1/ (1.14) r1 seˆ { [ X X ] / ( R 1)} R R * * r boot r1 X X / R. Vlerësm bootstrap gabmt stadard të mesatares së zgjedhjeve uk është e evojshme sepse formula (1.13) është e vlefshme për çdo shpërdarje. Arsyeja që e e dhamë është për të krahasuar metodë tradcoale me metodë bootstrap, e cla do të dskutohet ë pkë ku kem bërë aplkme umerke. F 9

23 1.4.4 Vlerësm bootstrap gabmt stadard për mesore Japm ë fllm dsa johur teorke paraprake për mesore. Mesorja e jë shpërdarjeje smetrke e cla ka prtje matematke gjthashtu merr vlerë. Mesorja e shpërdarjes ormale me prtje matematke dhe dsperso ka vlerë, gjthashtu shpërdarja uforme ë terval ab, ka vlerë ( a b) / aq sa prtja matematke. Mesorja e shpërdarjes ekspoecale me parametër është: l. Mesorja e shpërdarjes Webull me parametër të formës 1/ k dhe parametër të shkallës është: (l ) k. Në qoftë se U është me shpërdarje uforme ë (0,1), atëherë dryshorja e rastt W me shpërdarje Webull me parametra dhe k. 10 1/ ( l( U)) k është Shpërdarja e mesores së zgjedhjes ga jë popullm me destet f( x ) është 1 afërssht ormale me prtje matematke m dhe dsperso:, ku m është 4 [ f ( m )] mesorja e shpërdarjes dhe është vëllm zgjedhjes. Ky rezultat është xjerrë ga Rder, Paul R. (1960) []. Kosderojmë rast e jë popullm që ka shpërdarje ormale me destet f( x ). Destet ormal është smetrk ë ldhje me prtje matematke, kështu gjejmë: 1 ( ) 1 f ( m) f ( ) exp( ) dhe var( m) (1.15) Kur vëllm zgjedhjes së marrë ga jë shpërdarje ormale rrtet pafudëssht, atëherë e mud të gjejmë jë ldhje mds gabmt stadard të mesatares së zgjedhjes dhe gabmt stadard të mesores së zgjedhjes, pra: var( m) var( x). Ky rezultat trego se ë rast asmptotk kur umr vëzhgmeve është madh, mesorja është jë vlerësues pazhvedosur parametrt dhe kur shpërdarja e zgjedhjes është ormale, atëherë devjm stadard mesores është 1.5 herë më madh se gabm stadard mesatares së zgjedhjes, që do të thotë se vlerësues mesatares së zgjedhjes është më efkas sesa mesorja. Një vlerësues do të kosderohet më efkas ë aspekt e tedecës së tj për të pasur jë gabm stadard më të vogël për të jëjtë madhës të zgjedhjes kur krahasohet me jëra tjetrë. Kur masa e zgjedhjes është e madhe, shpërdarja e kuatlt të p-të të zgjedhjes është afërssht ormale rreth kuatlt të p-të dhe me dsperso të barabartë me: p(1 p), ku f( x p) vlera e shpërdarjes e destett të shpërdarjes për [ f ( x )] p kuatl e p-të, e xjerrë ga Stuart, Ala; Ord, Keth (1994) [3]. Për vlerësm e

24 gabmt bootstrap për mesore do të përdorm të jëjt algortëm dhe formulë (1.10). Një aplkm umerk për vlerësuest e gabmeve stadard bootstrap për mesatare dhe mesore do e japm ë vazhdm të studmt Vlerësmet bootstrap të gabmt stadard ë jë aplkm umerk Në qoftë se do marrm zgjedhje me vëllm 100 ga jë shpërdarje ormale me prtje matematke 5 dhe devjm stadard 3, atëherë me aë të programt R dhe komadave të pasqyruara ë shtojcë 1 pka A., gjejmë vlerësmet bootstrap për mesatare, mesore dhe devjm stadard. Normalsht, vlerësmet uk përputhe me vlerë e vërtetë të parametrt kaë jë zhvedosje të vogël, të clë do ta trajtojmë ë pkë tjetër të pumt. Nga * përpum të dhëave kem xjerrë këto rezultate X dhe vlerësm * bootstrap gabmt stadard sd( X ) , jaë shumë afër vlerave që jep 3 metoda tradcoale e përafrmt X dhe sd( X ) Nëse e kem të dhëë jë zgjedhje x, atëherë për të bërë bootstrap ë R vetëm për jë ga vlerësuest e cla jep të pasqyruara vlerë e statstkës të vëzhguar, zhvedosje dhe gabm stadard mud të realzohet me aë të komadave: samplemea <- fucto(x, d) { retur(mea(x[d])) } b.mesat = boot(x, samplemea, R=1000) ku samplemea është fukso, x zgjedhja fllestare, b.mesat vlerat bootstrap për statstkë x dhe boot është komada e bootstrapmt. Në të jëjtë mëyrë mud të veprojmë për statstkat e tjera, komadat që kem përdorur paraqte ë Shtojcë 1pka A, dërsa rezultatet përkatëse do t vedosm ë jë tabelë përmbledhëse. Vlerat Vlerësm Vlerësm Vlerësm e vërteta pkësor gabmt stadard klask bootstrap gabmt stadard Mesatarja Mesorja

25 Fgura1. Hstogram vlerave të mesatareve bootstap të rzgjedhjeve të marra ga jë zgjedhje ga shpërdarja ormale me prtje matematke 5 dhe dsperso 3. Për mesatare do kem hstogram ë fgurë 1., ë të clë vja e kuqe trego mesatare e zgjedhjeve kurse vja blu prtje matematke të shpërdarjes ormale të vërtetë. Hstogram për mesore: Fgura 1.3 Hstogram vlerave bootstrap për mesore. Vja blu trego mesore e vërtetë, vja lejla mesore e zgjedhjes, vaja e kuqe vlerësm bootstrap. Vlera reale e mesores është 5 sa vlera e prtjes matematke sepse zgjedhje e e kem marrë ga shpërdarja reale me prtje matematke 5. Vlera e vlerësuar e mesores del Shohm ta vlerësm bootstrap të gabm stadard të mesores duke përdorur formulë (1.15) dhe komadë ë R, e cla jep vlerë

26 1.4.6 Vlerësm bootstrap gabmt stadard për koefcet e korrelacot Supozojmë se popullm joë që teresohem është vektor rast me dy përmasa ( XY, ). Duam të vlerësojmë koefcet e korrelacot mds këtyre dy dryshoreve të rastt X dhe Y kur kem jë zgjedhje dypërmasore ga popullm. Do marrm jë shembull që kem të gjtha të dhëat, rast të dhëave të çftuara. Shëojmë koefcet e korrelacot mds X dhe Y. Ne mud të gjejmë koefcet e korrelacot për këto të dhëa me aë të formulës: corr( X, Y ) 1 X Y X Y X j X Y Y 1 1 (1.16) ku ( X, Y ) çft -të ë të dhëat, X X dhe Y Y. Nëse e 1 1 supozojmë se shpërdarja probabltare F është shpërdarje bvarate ormale dhe jep çfte pkash ( x, y ), atëherë jë vlerësm arsyeshëm për gabm stadard për koefcet e korrelacot është: seˆ orm 1 corrˆ (1.17) Për të lustruar kokretsht do të përdorm të dhëat e Tabela 1 ë Shtojca që gjedet ë shtojcë e materalt. Të dhëat jaë marrë ga jë studm kryer me studetët e Uverstett të Korçës dhe qëllm është vetëm për të shpjeguar vlefshmërë e metodës bootstrap ë rast e koefcett të korrelacot. Numr studetëve të aketuar është 75. Për të puuar ë program R kem hedhur ë fllm të dhëat ë jë faqe eksel (excel) dhe më pas ruajmë ë jë dokumet tjetër me lloj e ruajtjes CSV(MS-DOS). Gjejmë koefcet e korrelacot mds dryshoreve të rastt Gjatësa dhe Gj.krahët. Të gjthë studetët të marrë ë vëzhgm, do të kosderohe s gjthë popullm. Në dryshore Gjatësa jaë vlerat e gjatësve të studetëve dhe ë dryshore e rastt Gj.krahët vlerat e gjatësve të krahëve të hapura. Përdorm program R dhe të gjtha komadat e përpumt të të dhëave gjede ë Shtojcë 1 pka A.3. Kaë rezultuar këto vlera: corr( X, Y) , X = cm, Y = cm. Këto të dhëa do t kosderojmë të plota, të meduara s gjthë 0 0 popullm. Marrm jë zgjedhje të rastësshme ( X, Y ) me masë 15 ga këto të dhëa dhe llogarsm corr ˆ ( X, Y ) X 0Y 0 X Y 0 0 X 0 Y 0 X Y (1.18) 13

27 Në qoftë se e marrm zgjedhje të tjera ga popullm e mud të gjejmë jë përafrm të shpërdarjes për ˆ. Ky përafrm do jepte rezultate të mra për shkak se rzgjedhja do të bëhet ga popullm. Korrelaco vlerësuar ëpërmjet metodës së zgjedhjeve ga gjthë popullm do ta llogartm me aë të komadave të treguara ë apedks ku R kem shëuar umr e zgjedhjeve me masë 15 të marrë ga popullm. Duke përdorur program R, kem xjerre këto rezultate. Tabela 1.1. Rezultatet për koefcet e korrelacot kur marrm zgjedhje ga popullm M. st Qu. Mesorja Mesatarja 3rd Qu. Max quatle(kzgj$t,c(.05,.5,.5,.75,.95)) 5% 5% 50% 75% 95% sd(kzgj) Krahasojmë vlerë e vërtetë të korrelacot mds Gjatëssë dhe Gj.krahët që ka rezultuar , kurse me metodë e zgjedhjeve rezulto e barabartë me , pra jaë afërssht të barabarta, me jë zhvedosje të vogël. Në shumë probleme reale, e kem vetëm jë zgjedhje të marrë ga popullm. Për shkak të pamudëssë për të marrë rzgjedhje të tjera, për arsye ga me të dryshme, s për shembull: për arsye të kostos, për arsye të kohës, etj. Pra, shtrohet problem s mud të xjerrm formacoe rreth shpërdarjes të vlerësuest toë ˆ, vetëm ga jë zgjedhje? Në rast toë formaco për koefcet e korrelacot. Le të jeë dhëë dryshoret e rastt Z1, Z,..., Z F të clat kaë shpërdarje detke dhe të pavarur ga F, ku Z ( X, Y ), 1,...,, të clat do t përdorm për të vlerësuar ga ˆ s( Z1,..., Z ) dhe F ga ˆF. Tabela 1.: Zgjedhje e rastt me masë 15 ga të gjthë studetët. Nr. Gjatësa Gj.krahët Nr. Gjatësa Gj.krahët d 14

28 Kryejmë R zgjedhje bootstrap. Algortm që kryhet është detk me algortm (1.10). Çdo zgjedhje bootstrap është jë zgjedhje detke e pavarur me masë, e jëjtë me masë e zgjedhjes orgjale ga ˆF (vlerësues F ). Në qoftë se supozojmë se popullm joë ka jë shpërdarje të johur (për shembull, shpërdarje bvarate ormale), e mud të vlerësojmë parametrat për këtë shpërdarje duke përdorur metodat stadarde. Për shembull ë qoftë se F Fˆ N(, ) N(, ), përdorm ˆ ˆ 1 1 ku ˆ Z Z, ˆ ( Z Z) Në qoftë se uk dmë shpërdarje e F përdorm vlerësm joparametrk të fuksot të shpërdarjes të dskutuar më përpara, pra fukso e shpërdarjes kumulatve emprke. Rzgjedhja ga kjo shpërdarje është ekuvalete me marrje me rvedosje të zgjedhjeve të rastësshme ga zgjedhja e vëzhguar Z,..., 1 Z. Shkruajmë fukso që do të llogart statstkë për çdo zgjedhje bootstrap të deksuar me të vëzhgmeve të rzgjedhura. Kryejmë bootstrap për koefcet e korrelacot. Ekzamojmë karakterstkat e shpërdarjes së vlerave bootstrap për koefcet e korrelacot ë tabelë e mëposhtme. Tabela 1.3. Kuatlet e vlerave bootstrap për koefcet e korrelacot. kuatlet(k$t,c(.05,.5,.5,.75,.95)) 5% 5% 50% 75% 95% m(k$t) maks(k$t) mesat(k$t) sd(k$t) Një vlerësm pkësor për koefcet e korrelacot për këto të dhëa do të jetë Mud të gjejmë vlerësm tervalor për koefcet e korrelacot të clë do ta trajtojmë ë kaptull për tervalet e besmt bootstrap. Krahasojmë vlerat e vlerësmeve të xjerra ga rzgjedhjet e marra prej popullmt të supozuar të johur me vlerat e xjerra ga metoda bootstrap. Duke krahasuar vlerat e dallojmë se rezultatet e metodës bootstrap jaë afër rezultateve reale, pra jaë rezultate të mra. Në rast e parë e supozuam që mud të dërtom zgjedhje ga popullm që kjo do të shte e pamudur ë praktkë, kurse ë rast e dytë me aë të metodës bootstrap e u sëm vetëm ga jë zgjedhje e vetme vetëm me masë 15 dhe arrtëm të xjerrm kokluzoe për koefcet e korrelacot. 15

29 Fgura 1.4 Hstogram koefceteve korrelatv bootstrap. Vja e padërprerë trego përafrm ormal dhe vja me dërprerje shpërdarje e vëzhgmeve. Tabela 1.4 Krahasm vlerave të smuluara ga popullm me vlerat e zgjedhjeve bootstrap. Vlerësmet bazuar ë 3000 Vlerësmet ga zgjedhjeve Kuatlet zgjedhje me bootstrap ga jë masë 15 ga zgjedhje e vetme popullm M Max Mesatarja e kof të korrelacot Gabm stadard

30 Numr përsërtjeve bootstrap R për vlerësm bootstrap të gabmt stadard Për të patur jë vlerësm të mrë për devjm stadard të shpërdarjes së statstkës të marrë ë shqyrtm umr R përsërtjeve bootstrap duhet të jetë sa më madh. Për arsye të kostos për kohë që merr llogartja e statstkës për çdo zgjedhje bootstrap, umr R mud ta zgjedhm ë jë umër relatvsht të vogël të tllë që vlerësm bootstrap për devjm stadard të shpërdarjes së statstkës të jetë mrë. Supozojmë se është dhëë zgjedhja x ( x1,..., x ) ga jë dryshore e rastt X. Madhësa se ˆR vlerësm bootstrap gabmt stadard (BESE, bootstrap estmate of stadard error) do ketë prtje matematke dhe dsperso të fudmë. Dsperso përgjthshëm se ˆR, B. Efro ad R. J Tbshra, faqe 80 [1], jepet ga formula: var( seˆ ) var[ E( seˆ )] E[var( seˆ )] (1.19) R R R Shëojmë me m ˆ momet e -të të shpërdarjes bootstrap të statstkës ë 4 shqyrtm dhe ˆ mˆ 3 koefcet e sheshtëssë (kurtoss) të shpërdarjes mˆ bootstrap, të dyja jaë ë fukso të zgjedhjes x. Duke përdorur formulat për prtje matematke dhe dsperso do marrm: mˆ seˆ mˆ E ˆ (1.0) 4 R var( R) var( ) [ ( ) Le të shëojmë dsperso e shpërdarjes F, 4 momet e katërt dhe ˆ ˆ koefcet e sheshtëssë të stadardzuar, kështu që ˆm, ˆ ˆ, duke zëvedësuar ë (1.0) kem: ˆ ˆ ˆ 4 / var( se ˆ ) var( ) E R [ ( )] (1,1) 4 R 4 R 4 R Në qoftë se zgjedhja është ga jë shpërdarje ormale: 1 1 var( seˆ R ) ( ) (1.) R Pjesëtojmë me ˆm të dyja aët e barazmt (1.0) dhe e vedosm ë rrëjë katrore do gjejmë koefcet e varacot për se ˆR, cl është raport shmages mesatare katrore daj mesatares së të dhëave, e cla përdoret për të dhëa poztve. Përdoret për të treguar sa e madhe është shpërhapja ë krahasm me vlerë mesatare. 17

31 mˆ ˆ [var( seˆ R)] ( ) cv( seˆr ) [ ( ) ] E( seˆr ) se 4R (1.3) 1 1 [var( mˆ ) E[ ( )] 1 4R E ˆ cv se ˆ Në qoftë se zgjedhja është ga jë shpërdarje ormale dhe s statstkë kem 1 mesatare e zgjedhjes atëherë cv( seˆ ), koefcet sheshtëssë =0. Për të parë kovergjecë e vlerësmt bootstrap për gabm stadard ë varës të umrt R aplkojmë metodë bootstrap tek të dhëat të paraqtura ë Tabelë 1.6, e cla përmba të dhëat e koefceteve të krmaltett për baorë spas rretheve ë vt 008 dhe 009 ë Shqpër. Burm të dhëave ga: RAPORT I PROKURORIT TË PËRGJITHSHËM MBI GJËNDJEN E KRIMINALITETIT PËR VITIN 009. Komadat ë program R tregohe ë shtojcë e pumt për të gjetur mesatare dhe mesore e koefcett të krmaltett ë Shqpër vetëm për vt 009, të clat jaë, mesatarja 490 dhe mesorja 459. Gabm stadard bootstrap për R=1000 ka rezultuar për statstkë që vlerëso mesatare me zhvedosje , kurse për mesore kaë rezultuar gabm stadard bootstrap 43. dhe zhvedosja Vërejmë se, vlerësm bootstrap gabm stadard për mesore është më madh se vlerësm bootstrap gabm stadard për mesatare, pra mesatarja është jë vlerësues më efkas por dmë që është më e paqëdrueshme daj vlerave ekstreme, kurse mesorja është e qëdrueshme ga vlerat ekstreme. Tabela 1.5 Koefcet krmaltett për 100 mjë baorë vt ë Shqpër. Nr. Rreth Nr. Rreth Berat Krujë Mat Tropojë Lushjë Korçë Dbër Kukës Fer Kurb Kavajë Gjrokastër Elbasa Traë Pogradec Durrës Pukë Saradë Shkodër Vlorë Lezhë

32 Paraqesm grafksht vlerësmet bootstrap për gabm stadard për mesatare dhe mesore ë fukso të umrt të rzgjedhjeve bootstrap R. Fgura 1.5. Kovergjeca e vlerësmeve bootstrap për gabm stadard. Me umër rzgjedhje më të vogël se rreth 500 vlerësmet bootstrap uk do të jeë të sakta për të dyja statstkat, për statstkë e mesatares dhe për statstkë e mesores. Me umër rzgjedhje më të mëdha se 500, ato bëhe më të qëdrueshme dhe kovergjojë rreth vlerës së vërtetë të devjmt stadard të shpërdarjes së statstkave përkatëse. Ky umër varet edhe ga masa e zgjedhjes fllestare Vlerësm bootstrap zhvedosjes Supozojmë se jem ë stuatë joparametrke dhe me jë zgjedhje të vetme, pra uk johm shpërdarje. Le të jetë dhëë X ( X1, X,..., X ), jë dryshore rast me jë shpërdarje probabltare e pajohur F. Duam të vlerësojmë jë parametër të kësaj shpërdarje. Vlerësues për parametr marrm statstkë ˆ sx ( ). Zhvedosja e ˆ sx ( ) s jë vlerësues është përcaktuar të jetë dfereca mds prtjes matematke të ˆ dhe vlerës së parametrt : b( ˆ, F) E[ s( X ) F] (1.4) 19

33 Në qofte se kem jë vlerë të madhe të zhvedosjes kjo do të tregote se vlerësues uk është mrë. Vlerësues është pa zhvedosur kur E( ˆ F). Vlerësmet ˆ për parametr uk duhe të jeë domosdoshmërsh të pazhvedosur, por duhet të keë zhvedosje të vogla të krahasuar me madhësë e gabmeve stadarde të tyre. Ne mud të përdorm metodë bootstrap për të vlerësuar zhvedosje e çdo vlerësues ˆ sx ( ). Vlerësues zhvedosjes është vlerësues b( ˆ, Fˆ ) ë të cl e e marrm duke zëvedësuar F me ˆF ë (1.4), b( ˆ, Fˆ) E[ s( X ) Fˆ] ˆ (1.5) b( ˆ, Fˆ ) quhet vlerësues deal bootstrap zhvedosjes b( ˆ, F). Këtu ˆ, vlerësues vëe ë przë (plug-), mud të jetë dryshëm ga ˆ sx ( ), me fjalë të tjera, b është vlerësues plug- ˆF vlerësues plug-. b F, pavarëssht ëse ˆ është Algortm bootstrap për të marrë jë përafrm të vlerave umerke të zhvedosjes: 1. Smulmet. Jepet zgjedhja X me masë të zgjedhjes. Gjeerojmë R * r * r * r * r zgjedhje X ( X1, X,..., X ) me vëllm r 1,,..., R, ku secl kompoet është shpërdarë ë përputhje me shpërdarje ˆF. Më kokretsht do të kshm: *1 *1 *1 *1 Gjeerojmë X ( X1, X,..., X ) ga ˆF * *1, llogarsm ˆ (1) sx ( ) * * * * Gjeerojmë X ( X1, X,..., X ) ga ˆF * *, llogarsm ˆ () sx ( ) * R * R * R * R Gjeerojmë X ( X1, X,..., X ) ga ˆF * *, llogarsm ˆ ( ) ( R R s X ) * * *. Kem gjetur vlerat ˆ (1), ˆ (),..., ˆ ( R) Vlerësm deal bootstrap për zhvedosje përafrohet ga formula (1.6) e dhëa ga A.C.Davso dhe D. Kuoe [4]: 1 (1.6) R ˆ ˆ* ˆ ˆ * () ˆ R r R r1 b R 1 * * Vlerësues korrgjuar parametrt do të jetë ˆ ( ˆ ˆ ) ˆ ˆ, ku R me ˆ * kem shëuar mesatare artmetke të vlerësuesve bootstrap të parametrt ˆ* për të gjtha përsërtjet bootstrap. Vlerësm deal për dsperso V Var( F) R 1 përafrohet ga: Vˆ ( ˆ ( ) ˆ R r ) R 1 r1 * * * 1 *, ku ˆ R ˆ () r. R r1 0

34 Shohm rast e zhvedosjes së mesatares së zgjedhjes ë rast joparametrk. Supozojmë se kem jë realzm kokret të dhëash x 1, x,..., x, e marrë ga dryshorja e rastt X me shpërdarje të pajohur F. Shëojmë s zakosht me ˆF fukso e shpërdarjes emprke të zgjedhjes. Vlerësm bootstrap për zhvedosje e mesatares së zgjedhjes është statstka: 1 b X r x (1.7) R ˆ * R () R r 1 Për të krahasuar rezultatet e vlerësuar me aë të metodës bootstrap, marrm zgjedhje ga shpërdarje të johur. Për këtë qellm kam marrë zgjedhje ga shpërdarja ormale. Dmë ga teora e statstkës që EX ( ) dhe var( X ), kur dmë mometet e dryshores së rastt X. Në rast parametrk s Eb ( R) 0 dhe var( br ). Në rast joparametrk: R R R 1 * r 1 * r 1 * r E( br ) E( X X ) E( X ) x RE( X ) x 0 sepse R R R E X * r ( ) r1 r1 x. Për dsperso: s s var( br ) var( X x) var( X ) R R R R R R R * r * r r1 r1, sepse dryshoret e *r rastt X jaë të pavarura dhe jëlloj të shpërdara. Një studm për të parë umr e përsërtjeve bootstrap për të vlerësuar zhvedosje është bërë ga J. Kubaova [5]. Numr përsërtjeve bootstrap për të marrë vlerësues të mrë për zhvedosje është 400. Gabm mesatar katror jë vlerësues ˆ për jë parametër ë jë shpërdarje F do shte: E( ˆ ) E( ˆ ) [ E( ˆ )] [ E( ˆ )] E( ˆ ) [ se( ˆ )] [ E( ˆ ) ] ˆ ˆ ˆ ˆ ˆ b(, ) ˆ 1 b(, [ se( )] [ b(, )] se( ) 1 se( ) 1 se( ˆ ) se( ˆ ) (1.8) Me aë e kësaj ldhje e mud të medojmë dkm e zhvedosjes ë gabm mesatar katror. Mud të theksojmë se ëse vlera absolute e raportt mds zhvedosjes dhe gabmt mesatar katror është më e vogël se 0., atëherë duke kryer veprmet ë (1.3), rrëja katrore e gabmt mesatar katror vlerësuest do jetë jo më madh se % gabmt stadard. Për të kryer jë aplkm umerk kthehem tek Tabela 1.5 ë të clë pasqyrohet koefcet krmaltett për 100 mjë baorë ë Shqpër. Ne mud të llogarsm ë të jëjtë kohë s gabm bootstrap s dhe zhvedosje ga e jëjta bashkës me 1000 vlera bootstrap që krjojmë. Vlerësm gabmt bootstrap për mesatare 1

35 ka rezultuar dhe zhvedosja Raport vlerësuest të zhvedosjes me gabm stadard bootstrap, është shumë vogël sugjero që zhvedosja ë këtë rast uk është e rëdësshme. 1.6 Rast kur metoda bootstrap dështo Supozojmë se X ( X1,..., X ) është jë zgjedhje e marrë ga jë shpërdarje me fukso shpërdarje F. Fukso emprk të shpërdarjes e shëojmë me ˆF. Duam të vlerësojmë vettë e madhëssë së stadardzuar Q q( X,, X ; F) { X E( X )} ( X ) 1 Vlerësm bootstrap për fukso e shpërdarjes do jetë G ( q) Pr( Q( X,, X ; F) q F) F, 1 G ( q) Pr( Q( X,, X ; Fˆ) q Fˆ) ku ë këtë rast * * F ˆ, 1 Q( X,, X ; Fˆ ) ( X X ). Një ga kushtet që metoda * * * 1 bootstrap të jetë e vlefshëm është që Gˆ G F, F, kur të jetë kovergjecë spas shpërdarjes ose e them dryshe kovergjecë e dobët. Një kusht tjetër që metoda bootstrap të fuksoojë është që kjo kovergjecë të jetë uforme. Supozojmë se X ( X1,..., X ) është jë zgjedhje e rastt ga shpërdarja uforme, pra X ~ U(0, ). Redtm vlerat ga më e vogla tek më e madhja supozojmë se X1 X. Vlerësues përgjassë maksmale për parametr është vlera më e madhe e zgjedhjes T X. Marrm ë kosderatë jë rzgjedhje ( T) joparametrke. Shpërdarja lmte e Q është ekspoecale stadarde, * * ( t T ) e cla a sugjero që të marrm madhësë e stadardzuar Q, ku t t * * * është vlera e vëzhguar e T dhe T max( X1,, X ), vlera më e madhe ë zgjedhje bootstrap. * ˆ * ˆ 1 1 Pr( Q 0 F) Pr( T t F) 1 (1 ) 1 e kur * rrjedhmsht shpërdarja e lmte e Q uk mud të jetë ekspoecale stadarde. Kovergjeca e shpërdarjes ë këtë rast uk është uforme ë fqjësë e shpërdarjes F.

36 1.7 Metodat Delta për përafrm joparametrk të dspersot Marrm ë kosderatë jë vlerësues skalar T cl është jë fukso lëmuar statstkës skalare M e bazuar ë jë zgjedhje me vëllm, pra T g( M ) Supozojmë që: ( ) M N(, ), g( ) dhe 3, dg( ) g ( ) 0. d Duke u mbështetur tek zbërthm formulës së Tejlort, meqë T është jë fukso lëmuar e mud të shkruajmë:,,, ( M ) g ( ) 1 T g( M ) g( ) ( M ) g ( ) o( ) (1.9)! Një verso shkurtuar zbërthmt të formulës së Tejlort do shte: T g( M ) g( ) ( M ) g ( ) o( ) (1.30), 1 Duke e sjellë ë jë formë tjetër (1.30) do marrm g, ( ) ( ) ( M ) 1 T g( ) o( ) ose ( ) g, ( ) ( ) 1 T g( ) Z o( ) (1.31) ku ( M ) Z ~ N(0,1) dryshore rast me shpërdarje ormale të ormuar. ( ) Formula (1.31) është jë zbërthm formal dryshores T e cla ëkupto që ku g( )., [ g ( )] ( ) T ~ N(, ) (1.3) Përafrm dspersot me metodë Delta do jetë:, var[ g( M)] [ g ( )] var( M) (1.33) Gjejmë prtje matematke të vlerësuest T ë barazm (1.9) E( T) E[ g( M )] g( ) g ( ) E( M ),,, g ( ) E{( M ) },,, g ( ) ( ) E( T) g( ) g ( ) E( M ) Në qoftë se dryshorja e rastt M është e pazhvedosur ë ldhje me, atëherë!

37 ,, g ( ) ( ) ET ( ) (1.34) Supozojmë se X është jë dryshore rast me parametra p dhe, ku p (0,1]. X Spas përcaktmeve më lart shëojmë M, p. Duam të gjejmë me metodë Delta dsperso e dryshores T log( ). Kem tjetër që log( p). Në bazë të metodës Delta do gjejmë që dsperso T do jetë p(1 p) d log p 1 p dp p Pra ë bazë të metodës Delta ( ). 1 p T ~ N(log p, ). p X Në qoftë se ˆp dh ˆq jaë vlerësuest e proporcoeve të dy grupeve të dryshme të marra ga zgjedhje të pavarura me masë m dhe përkatëssht, atëherë logartm p rskut relatv vlerësuar ˆ ka dsperso afërssht: qˆ 1 p 1q. p qm Rezultatet mud t përdorm për kotroll hpotezash ose për dërtm e tervaleve të besmt. 4

38 KAPITULLI II VLERËSIMET INTERVALORE BOOTSTRAP Kjo pjesë përmba metodat bootstrap për të dërtuar tervalet e besmt për jë parametër ë rastet parametrke dhe jo parametrke. Do të pasqyrojmë procedurat dhe dërtm e tervalt të besmt bootstrap t, terval e përqdësh bootstrap dhe terval e besmt BCa. Qëllm është të përmrësojmë me jë red madhëse mb saktësë e tervaleve stadarde, ë jë mëyrë të tllë që lejo aplkm edhe për probleme më të komplkuara. Metoda bootsrap-t është e jë saktëse e redt të dytë, por jo e jë trasferm respektv. Metoda përqdësh është trasformm respektv por jo e jë saktëse të redt të dytë. Metoda stadarde uk është e saktëssë se redt te dytë dhe jë trasformm respektv, dërsa metoda BCa është e të dyjave. Për këtë arsye tervalet BCa rekomadohe sdomos për problemet joparametrke. Rezultatet e metodave bootstrap do të krahasohe me terval ekzakt, ë rast parametrk dhe joparametrk. Përpum të dhëave do të bëhet ë program R, duke përdorur fukso boot.c cl gjeero pesë lloje tervalesh joparametrke..1 Itervalet e besmt Nga teora statstkore dmë që për të gjetur vlerësme tervalore për parametr duhet të gjejmë jë fukso mbështetës, cl është jë fukso zgjedhjes dhe parametrt, shpërdarja e të clës uk varet ga parametr. Le të jetë dhëë zgjedhja e rastt ( X1,..., X ). Kur zgjedhja ka fukso shpërdarje të vazhdueshëm, gjthmoë mud të gjejmë jë fukso mbështetës. Kur dryshorja e rastt është dskrete atëherë jë mëyrë është përafrm me jë shpërdarje të vazhdueshme. Një fukso asmptotksht mbështetës mud të gjedet duke përdorur fukso e përgjassë: L: R L( ; x,..., x ) p( x,..., x ; ), (.1) 1 1 ku p( x1,..., x, ) është destet zgjedhjes. M. Naqo [6] ë lbr Statstka matematke ka treguar se kur plotësohe dsa kushte të caktuara së ekzstecës së vlerësuest të përgjassë maksmale, atëherë l L (l px ( ; l L l L ; E( ) 0, E(( ) ) 0 dhe dryshoret 1 (l px ( ; )) jaë të pavarura dhe jëlloj të shpërdara, atëherë e mud të 5

39 l L dërtojmë jë fukso mbështetës Z l L E shpërdarje asmptotke ormale të ormuar. (( ) ) N(0,1), pra ka jë Në supozm që dryshorja e rastt X ka shpërdarje ormale e mud të dërtojmë terval e besmt për parametr ë rastet kur dsperso jhet ose jo. Në rast e parë, kur dsperso jhet, fukso mbështetës ( X ) është Z, cl ka shpërdarje afërssht ormale të ormuar. Iterval besmt me vel1 : ] X z /, X z / [ (.) / / ku vlera z / gjedet ga ldhja ( z /) (1 ) /, është fukso Laplast, vlerat e të clt jaë të tabeluara ose mud t gjejmë ë programet që përpuojë probleme statstkore. Në rast kur dsperso uk jhet, atëherë s fukso mbështetës marrm X T, e cla shpërdarje afërssht Studet me 1 shkallë lre. seˆ Iterval besmt me vel 1 : ] X t seˆ; X t seˆ[ (.3) / / ku t /gjedet ga tabela e shpërdarjes së studett me dhe me 1shkallë lre 1 1 se X X (.4) ˆ [ ( ) ] 1 1 Për terval e besmt për dsperso, kur prtja matematke jhet, fukso X mbështetës përdorm: V ( ). Me vel besm 1 gjejmë kufjtë e 1 poshtëm dhe të spër që probabltet rëes se vlerës së V poshtë kufrt të poshtëm të jetë barabartë me probabltet që vlera e saj të bjerë spër kufrt të spërm, pra p( V V1) p( V V), ku V 1 kufr poshtëm dhe V kufr spërm. Iterval besmt: 1 1 ] ( X ), ( X ) [ V 1 V1 1, ku V ( ), V ( ) (.5) 1 / 1 / 6

40 Kuatlet e shpërdarjes h-katror jaë të tabeluara ose mud të gjede ë programet statstkore. Në rast kur prja matematke uk jhet s fukso mbështetës marrm: V X X ( 1) s ( ), e cla ka shpërdarje h-katror me 1 1 Iterval besmt për dsperso kur prtja matematke uk jhet: ( 1) s ( 1) s ], [, V V 1 ku V ( 1), V ( 1) dhe 1 / 1 / s X X 1 1 shkallë lre. 1 ( ) (.6). Përafrm jë shpërdarjeje të pajohur të jë statstke ga shpërdarja ormale. Shpesh jë shpërdarje e pajohur e jë statstke përafrohet ga shpërdarja ormale. Le të jeë dhëë X,..., 1 X jë varg dryshoresh rast të pavarura dhe jëlloj të shpërdara me prtje matematke dhe dsperso. Shëojmë me S X1 X, atëherë ga teorema qedrore lmte (TQL), shh Ll.Puka [7] shpërdarja: Z S E( S) N(0,1) (.7) var( S ) Ky përafrm është vërtetë kur umr rrtet shumë ose do të kovergjojë kur shko ë ft. Shohm rast kur umr zgjedhjes është vogël dhe kur kjo zgjedhje është marrë ga jë shpërdarje ekspoecale, për shembull =10 dhe prtja matematke 4. Paraqesm e dy grafkë, ë të par shpërdarje e mesatareve të zgjedhjeve të marrë ga kjo shpërdarje dhe ë tjetr shpërdarje bootstrap të mesatareve të marra ga jë zgjedhje e vetme me rkthm (replacemet). Nga teorema qedrore lmte për këtë rast do të kshm: x N(0,1) ose x x x N(, ) (.8) Ndërtojmë hstogram e shpërdarjes së 9999 vlerësmeve për prtje matematke, këto vlerësme jaë llogartur prej 9999 zgjedhjeve me vëllm 10 ga popullm shpërdarjes ekspoecale me parametër të barabartë me 4. 7

41 Fgura.1. Hstogram vlerësueseve për prtje matematke të shpërdarjes ekspoecale. Në qoftë se X ~ Exp, atëherë shuma ( X X ) ~ Erlag k, është pkërsht shpërdarja Gamma k, 1 λ -1 1 e cla k, ku k parametr formës (shape) dhe shkalla (scale). Forma e fuksot të destett probabltar (pdf) për shpërdarje Gamma jepet me formulë: 1 (.9) ( k) x k1 f ( x; k, ) x e k Meqeëse e e dmë me saktës këtë shpërdarje, mud ta përdorm për të krahasuar tervalet e besmt të gjetura me metoda të dryshme, dhe për të parë vlefshmërë e tyre. Në grafku e mëposhtëm jepet hstogram vlerësueseve bootstrap për prtje matematke të dryshores së rastt të marrë ga shpërdarja ekspoecale. Vhet re gjashmëra e shpërdarjeve ë fgura.1 dhe fg... 8

42 Fgura.. Hstogram 9999 vlerësmeve bootstrap për prtje matematke të jë dryshoreje rast ekspoecale. Vja me dërprerje trego vlerësm e destett të mesatareve bootstrap, kurse vja e vazhduar trego destet e dryshores së rastt ormale që duhet t korrespodote spas teoremës qedrore lmte. Për të gjetur tervalet e besmt e a duhet të johm shpërdarje e statstkës mbështetëse. Nëpërmjet statstkës mbështetëse dhe ëpërmjet barazmt: P( m f ( X1,..., X ; ) d), ku është jë umër afër umrt 1, e gjejmë jë terval besm për parametr duke e zgjdhur mosbarazm breda kllapave ë ldhje me. Në shumë raste ë praktkë kjo sjell shumë vështrës, për këtë arsye a vë ë dhmë metodat bootstrap për të gjetur tervalet e besmt..3 Iterval besmt stadard ormal bootstrap Supozojmë se ˆ është jë vlerësues jë parametr dhe se ˆboot gabm stadard * bootstrap vlerësuar. Në qoftë se ˆ N( ˆ, seˆ ) atëherë terval besmt ormal bootstrap për parametr: ] ˆ, ˆ [ ] ˆ ˆ, ˆ ˆ[ (.10) posht lart z(1 ) se zse ku ˆposht është kufr poshtëm, kurse ˆlart është kufr spërm tervalt me probabltet mbulm 1. 9

43 Vlerësm stadard ormal bootstrap gjatësve të studetëve Tabela 1. Do gjejmë me dy metoda terval e besmt për prtje matematke, jëra metoda stadard dhe tjetra metoda stadard bootstrap. Në këtë rast uk është e evojshme metoda bootstrap, sepse e dmë që shpërdarja e gjatësve të studetëve është ormale dhe masa e zgjedhjes është e madhe. Qëllm është për të krahasuar dy metodat. Komadat ë R gjede ë shtojcë 1 pka A.6. Mesatarja artmetke e zgjedhjes ka rezultuar 169,7067. Iterval besmt 95% me metodë stadarde ka rezultuar: ] ; ]. Fgura.3 Hstogram për gjatëstë e studetëve Vja e dërpre trego destet e zgjedhjes, kurse vja e padërprerë destet stadard ormal. Iterval besmt ormal bootstrap me vel besm 0.95, pra terval 95% del: ]167.5;17.03[. Ndryshm mds dy tervaleve ë këtë rast është shumë vogël, ashtu s e e prsm të dodhte. Kjo afërs vje për arsye se kjo dryshore rast ka shpërdarje ormale dhe masa e zgjedhjes është e madhe. Të dyja metodat ë këtë rast jaë të vlefshme. 30

44 Fgura.4 Hstogram 1000 mesatareve bootstrap ga të dhëat e gjatësve të studetëve. Hstogram është jë mëyrë vzuale për të parë lloj e shpërdarjes së kësaj statstke, e cla ë këtë rast duket qartë përafrm ormal..4 Iterval t-bootstrap Ne kem gjetur der ta terval e besmt me supozm që dryshorja e rastt është me shpërdarje ormale. Supozojmë ta se jem ë stuatë jë zgjedhje dhe të dhëat jaë marrë ga zgjedhje të rastt ga jë shpërdarje e pajohur F. Shëojmë me ˆ tf ( ˆ) jë vlerësm plug- jë parametr që a tereso tf ( ) dhe me se ˆ jë vlerësm për gabm stadard për ˆ, cl mud të llogartet me aë të metodës bootstrap. Shëojmë me ˆ Z (.11) seˆ Gjeerojmë R zgjedhjet bootstrap x *1 * * R, x,..., x dhe për secl llogarsm ˆ* * () r ˆ Z () r, r 1,..., R (.1) * seˆ () r 31

45 ku ˆ * () r është vlera e ˆ për zgjedhje bootstrap stadard vlerësuar ˆ* për zgjedhje bootstrap vlerësohet me aë të tˆ( ) ë mëyrë të tllë që * ˆ 3 r x * dhe * seˆ () r është gabm r x *. Përqdësh Z * ( r ) umr Z ( r) t ( ) / R. (.13) Në qoftë se R 1000, vlerësues pkës 5% është vlera më e madhe e 50-të e vlerave të Z * ( r ) dhe vlerësues pkës 95% është vlera më e madhe e 950-të e vlerave të Z * ( r ). Iterval besmt t-bootstrap do jepet me shprehje: ( ˆ tˆ seˆ, ˆ tˆ seˆ) (.14) (1 ) ( ) Procedura t-bootstrap është jë përgjthësm dobshëm dhe teresat metodave t-studet. Kjo është veçaërsht e zbatueshme për statstkat s mesatarja e zgjedhjes, mesorja, mesatarja trmmed ose percetlet e zgjedhjes. Për llogartje e statstkës Z * () r kërkohet të llogartet * seˆ () r, devjm stadard ˆ* *r për çdo zgjedhjeje bootstrap x. Për të vlerësuar gabm stadard mud të marrm R=5 der R=00 spas që të jetë praueshëm, kurse për llogartje e percetleve bootstrap duhe rreth Vështrësa për dërtm e tervalt t-bootstrap qëdro se ekzstojë formula të thjeshta për llogartje e gabmeve stadarde vetëm për dsa statstka dhe kërko llogartje e gabmeve stadarde për çdo zgjedhje bootstrap. Në qoftë se duam të dërtojmë terval e besmt për prtje matematke, atëherë vlerësm gabmt bootstrap stadard përafrohet ga: * * r * r 1 seˆ ( r) ( x x ) / (.15) Nuk është e përshtatshme të dërtojmë terval e besmt t-bootstrap për koefcet e korrelcot. Gjejmë terval t-bootstrap për gjatëstë e studetëve: ]167.5, 17.[..5 Iterval përqdësh bootstrap Shëojmë me x * të dhëat bootstrap dhe ˆ* tx ( ) vlerat bootstrap të llogartur për çdo zgjedhje bootstrap. Shëojmë me Ĝ fukso e shpërdarjes kumulatve për parametr e vlerësuar bootstrap ˆ*. Iterval përqdësh me vel 1 përcaktohet ga percetl /dhe 1 / Ĝ. ˆ ˆ 1 1 ] %, posht, %, lart[ ] G ( / ), G (1 / )[ (.16) Ldhja mds fuksot të shpërdarjes kumulatve dhe shpërdarjes bootstrap të 1 * parametrt është G ( / ) ˆ /, për këtë arsye e terval e besmt përqdësh bootsrap mud ta paraqtm ë jë formë tjetër:

46 * * ] ˆ ˆ ˆ ˆ %, posht, %, lart[ ] /, 1 /[ (.17) ˆ * * Këtu kem shëuar me ˆ / dhe 1 /, përkatëssht percetl e 100 / dhe 100 (1 / ) të shpërdarjes bootstrap. Meqeëse e do kryejmë jë umër të fudmë replkme bootstrap, terval besmt përqdësh bootstrap e dhëë ga (.14) do të përafrohet me terval: * * ] ˆ ˆ ˆ ˆ %, posht, %, lart[ ] R, /, R,1 /[ (.18) ku R umr bootstrapmeve që do të dërtohe. Për ta bërë më të qartë terval e besmt përqdësh bootstrap për jë parametër marrm jë shembull. Supozojmë se R=1000, probabltet mbulmt 0.95, pra vel rëdëssë Vlerat skajore të tervalt të besmt përqdësh do jeë vlera e 5-të e vlerave bootstrap, për kufr e poshtëm dhe vlera e 975-të e vlerave bootstrap, për kufr e spërm. Iterval besmt përqdësh bootstrap me vel 95% është ]167.3, 171.9[..5.1 Gjetja e tervalt të besmt bootstrap për prtje matematke kur shpërdaja është ekspoecale. Iterval e besmt për parametr e shpërdarjes ekspoecale jepet me formulë dhëë ga Ross, Sheldo M. [8]: ku x 1 x (.19), 1 /, 1 /, /, /, jaë kuatlet e shpërdarjes h-katror me shkallë lre. Një përafrm tervalt të besmt 95% mud të xrret duke përdorur përafrm ormal të shpërdarjes h-katror: ˆ z/ ˆ ˆ z/ (, ) (, ˆ posht lart ) (.0) Përafrm ormal për jë zgjedhje me masë 100 dhe me parametër =3, jep jë terval besm për parametr me probabltet mbulm 0.95 të barabartë me: ].5008;3.701[. Komadat gjede ë shtojcë e pumt Shtojca 1 pka A.7. Gjejmë terval e besmt përqdësh bootstrap parametrk për prtje matematke: ].40557; [ (rzgjedhjet jaë marrë ga shpërdarja ekspoecale me prtje matematke të vlerësuar). Ky terval drysho ga terval përafruar më lart. Në fgurë.4 tregohe kufjtë e tervalt të besmt ë rast kur probabltet mbulmt është Në këtë rast tervalet e besmt stadard dhe përqdësh bootstrap uk dryshojë shumë, sepse masa e zgjedhjes që kem marrë ga ekspoecalja është relatvsht e madhe. 33

47 Fgura.5 Kufjtë e tervalt të besmt. Vjat e dërprera tregojë kufjtë e tervalt. Në qoftë se shpërdarja bootstrap e ˆ* është përafërssht ormale, atëherë terval stadard ormal dhe terval përqdësh do të jeë përafërssht të jëjtë. Në qoftë se masa e zgjedhjes është e vogël dhe shpërdarja e ˆ* të mos jetë shpërdarje ormale, atëherë këto dy tervale uk do të jeë të jëjtë, pra do të jeë të dryshëm. Shtrohet problem se kë terval duhet të përdorm. Për këtë qëllm smulojmë raste kur dhet terval vërtetë dhe krahasojmë dy tervalet me këtë terval. Përdorm program R për të bërë smulm e vlerave..6 Metoda BCa Metoda BCa është dhëë ga Bradly Efro, s jë terval që merr ë kosderatë zhvedosje. Emr BCa (accelerato ad bas-correcto) korespodo kuptm ë shqp përshpejtm dhe korgjm zhvedosjes. Kufjtë e terval BCa jepe ëpërmjet percetleve të shpërdarjes bootstrap. Percetlet vare ga dy umra ˆ dhe ẑ 0 të clat quhe përkatëssht përshpejtues dhe korgjm-zhvedosje. Iterval besmt BCa me probabltet mbulm 1 dhëë ga B. Efro ad R. J Tbshra [1] është: ( ˆ, ˆ ) ( ˆ, ˆ ) (.1) ˆ * * posht lart ( ) ( ) zˆ z 1 0 ( /) 1 ( z0 ) dhe 1 aˆ ( zˆ 0 z( /)) ˆ zˆ z 0 (1 /) ( z0 ) (.) 1 aˆ ( zˆ 0 z(1 /)) 34

48 kem shëuar me () fukso e shpërdarjes kumulatv stadard ormal, kurse z( /) është percetl 100 / ë shpërdarje ormale stadarde. Në qoftë se 0.1, atëherë z( /) z(0.05) dhe (1.645) Vlera e korrgjm-zhvedosje ẑ0 gjedet drekt ga proporcoet e replkacoeve bootstrap ë këtë mëyrë: ku ˆ ˆ (.3) R * 1 umr{ ( r) } zˆ 0 ( ) 1 () është fukso aasjellë fuksot të shpërdarjes kumulatv stadard ormal. Për shembull 1 (0.95) Për të llogartur përshpejtues â përdorm shprehje: [ ˆ( ) ˆ ] 3 1 () aˆ (.4) 6{ [ ˆ( ) ˆ ] } 3 / 1 () 1, ˆ (,...,,,..., ) ( ) s x1 x 1 x 1 x, pra është hequr vlera e -të ga ku ˆ () ˆ () 1 zgjedhja orgjale, ˆ sx ( ) statstkë që vlerëso parametr. Në qoftë se â dhe z0 jaë të barabartë me zero, atëherë terval besmt BCa dhe terval përqdësh përputhe me jër tjetr..6.1 Aplkm metodës bootstrap BCa ë vlerësm tervalor të koefcett të përcaktueshmërsë Gjetja e tervalt të besmt me metodë BCa për koefcet e përcaktueshmërsë ë jë regreso lear ku kërkojmë ldhje më të mrë mds volumt, permetrt dhe lartëssë. Të dhëat gjede breda datasett R-Studo me burm: Rya, T. A. Joer, ad Rya, B. F. [10]. Të dhëat jaë pasqyruar ë Tabelë të shtojcës të pumt dhe komadat për dërtm grafkëve dhe tervaleve të besmt ë shtojcë 1 pka A.8. Tabela.1 Gjashtë vlerat e para për Dametr Lartësë dhe Vëllm ga të dhëat trees. Dametr Lartësa Vëllm

49 Eksplorojmë ldhje mds vëllmt, Dametrt dhe lartëssë ëpërmjet grafkut Fgura.6 Ldhja mds vëllmt të pemës me lartësë e saj. Eksplorojmë ldhje mds Vëllmt dhe Dametrt të pemës ëpërmjet grafkut. Fgura.7 Ldhja mds vëllmt të pemës me dametr e saj. Vhet re se kjo ldhje është më e fortë sesa me lartësë. 36

50 Krjojmë jë fukso cl do të llogarsë çdo zgjedhje bootstrap. Fukso statstkë llogartës për paketë boot merr dy parametra të veçata ë këtë rast dhe do të aplkohet për çdo zgjedhje bootstrap, llogart mesatare e zgjedhjes bootstrap, krjo zgjedhje bootstrap do me thëë ëbashkës të dhëash e sguruara ga parametr "dekseve. Idekset jepe automatksht ga fukso "boot" e cla krye rzgjedhje me kthm. Një formë ë R e shkurtuar e kësaj komade do shte: sample_mea = fucto(data, dces){ retur(mea(data[dces])) } Krjojmë jë fukso për të llogartur regreset leare për dsa dryshore të kombuara. 1) Vetëm me Lartësë. ) Vetëm me Dametr. 3) Me Dametr dhe Lartësë. 4) Me Dametër, Lartës dhe raport Dametër/Lartës. Llogarsm jëkohëssht statstkat për ldhjet e përmedura më lart. Këto statstka do të llogartet për seclë zgjedhje bootstrap. Në fukso e dërtuar të pasqyruar ë shtojcë 1 pka A.8 me d kem shëuar të dhëat spas dekst, H_relatoshp regreso lear të thjeshtë mds Vëllmt dhe Lartëssë, H_r_sq vlerë e koefcett përcaktueshmërsë për këtë ldhje, G_relatoshp regreso lear të thjeshtë mds Vëllmt dhe Dametrt, G_r_sq koefcet përcaktueshmërsë për këtë ldhje, G_H relatoshp regreso lear të thjeshtë mds Vëllmt dhe raportt Dametër/Lartës. Në rast e regresot të përgjthshëm kem shëuar me combed_relatoshp regreso mds Vëllmt dhe dy dryshoreve, Lartës, Dametër, me combed_r_sq vlerë e koefcett të përcaktueshmërsë, me combed relatoshp regreso mds Vëllmt dhe tre varablave Lartës, Dametër, Raport. Koefcet e përcaktueshmërsë për ldhje e fudt e kem shëuar me combed r_sq. Përdorm fukso "boot" për të zbatuar këtë metodë. Numr e rzgjedhjeve bootstrap e marrm R=000, jë umër relatvsht të madh sepse vlerësmet tervalore bootstrap kërkojë jë umër të paktë Shohm dsa statstka të llogartura, statstc = volume_estmate është fukso krjuar për të llogartur statstka mb seclë zgjedhje bootstrap. Tabela. Statstkat bootsrap për koefcet e përcaktueshmërsë. Koef.perc Orgjalja Zhvedosja Gabm stadard t1* t* t3* t4* t5*

51 t* =1,,3,4,5 korrespodo vlera për koefcet e përcaktueshmërsë të rastt të -të të kombmeve që shpjeguam më lart. Ndërtojmë grafkët e objekteve boot. Më poshtë jep hstogram dhe Q-Q plot për rast e parë. Fgura.8 Hstogram dhe Q-Q plot për koefcet e përcaktueshmërsë ë regreso lear të thjeshtë, ldhja mds Vëllmt dhe Lartëssë. Në të jëjtë mëyrë mud të dërtojmë edhe hstogramet dhe Q-Q plotet e tjera. Llogartja e tervaleve të besmt 95% për çdo vlerë të R me metodë bootstrap. Përdorm metodë BCa. Këtu po tregojmë vetëm jë rast, kurse të tjerat llogarte ë të jëjtë mëyrë duke dërruar vlerë e dekst ga 1 ë vlerat e tjera, 3, 4 dhe 5. cofdece_terval_h = boot.c(results, dex = 1, cof = 0.95, type = 'bca') prt(cofdece_terval_h) Iterval besmt BCa me vel besueshmëre 95% për koefcet e përcaktueshmërsë ë regres e parë del (0.115, 0.606). Të gjtha rezultatet e xjerra paraqesm ë jë tabelë të përbashkët. 38

52 Tabela.3 Itervalet e besmt BCa për koefcet e përcaktueshmërsë spas llojt të regresot. Lloj regrest Mds Vëllmt dhe Lartëssë Mds Vëllmt dhe Dametrt Mds Vëllmt dhe raportt D/L Mds vëllmt dhe Lartës plus Dametër Mds vëllmt dhe tre dryshoreve Nvel Kufr Kufr besueshmërsë poshtëm spërm 95% % % % % Ndërtojmë hstogramet duke shtuar ë të edhe destet kërel së bashku me kufjtë e tervaleve të besmt të gjetur. Ndërtojmë vetëm hstogram e rastt të fudt, jësoj rastet e tjera. Fgura.9 Hstogram për koefcet e përcaktueshmërsë, rast regresot dërtuar mds Vëllmt dhe Lartëssë, Dametrt, raportt Dametër/lartës. Djathtas grafku Q-Q plot. 39

53 Duket qartë që shpërdarja e vlerave bootstrap të koefcett të përcaktueshmërsë ë regres që ldh Vëllm me Lartësë, Dametr dhe raport Dametër/Lartës uk është me shpërdarje ormale, kështu që tervalet e besmt ormal stadard uk do të jeë të saktë. Në këtë rast e mud të përdorm terval e gjetur me metodë botstrap Bca të paraqtur ë tabelë e mëspërme. Itervalet e besmt bootstrap kem aplkuar për gjetje e vlerësmeve tervalore të raportt kosto-efektvtet ë provat klke L. Ekoom, I. Palla, Gj. Capollar, E. Doefsk []. Meqeëse shpërdarja e raportt kosto efektvtet ka pjerrës djathtas, atëherë metodat klaske me supozme të ormaltett uk jap rezultate të sakta. Metoda bootstrap-t dhe metoda Bca (korrgjm të përshpejtuar të zhvedosjes) jap rezultate më të sakta. Për performacë e vlerësmeve tervalore bootstrap dhe krahasm e tyre me metoda të johura e kem bërë duke smuluar dryshore të rastt ga shpërdarja ormale Palla I.,(014) [9]. KAPITULLI III REGRESI LINEAR 3.1 Mbledhja dhe orgazm të dhëave Përpara se të përdorm metoda të dryshme statstkore për të aalzuar të dhëat dhe për të marrë vedme, duhet që të kuptojmë se çfarë të dhëash kem ë dspozco. Një çështje e rëdësshme është të dmë se s jaë mbledhur këto të dhëa, a jaë këto të dhëa sasore apo clësore. Dagostkm është jë proces që zbulo problemet ë model dhe a sugjero përmrësme Formulm problemt Në praktkë ë përgjthës fllojmë me jë problem, vazhdojmë me mbledhje e të dhëave, vazhdojmë me aalzë e të dhëave dhe përfudojmë me kokluzoet. Një gabm përbashkët papërvojë statstceëve është zhytja ë jë aalzë komplekse pa kushtuar vëmedje për atë që objektvat jaë ose edhe ëse të dhëat jaë të përshtatshme për aalzë e propozuar. Formulm jë problem është shpesh më rëdësshëm sesa zgjdhja e tj, e cla mud të jetë thjesht jë çështje e aftësve matematkore apo ekspermetale. Albert Este. Në fllm duhet kuptuar mjeds fzk problemt, përcaktm objektvave dhe çfarë kërkohet që të aalzohet. Shtrojmë problem ë terma statstkorë. Pas problem është përkthyer ë gjuhë e statstkës, zgjdhja është shpesh rutë. 40

54 3.1. Mbledhja e të dhëave Një çështje e rëdësshme para se të xjerrm vedme është të kuptuart se s jaë mbledhur të dhëat. Jaë vëzhgmore të dhëat apo ekspermetale? A jaë të dhëat jë zgjedhje e rastt? S jaë mbledhur të dhëat ka jë dkm të rëdësshëm ë atë që mud të bëhe kokluzoe apo vedme. Të dhëat që uk shohm mud të jeë po aq e rëdësshme sa të dhëat që uk shohm. A ka vlerat të humbura? Ky është jë problem që është mudmshëm dhe kohë për t'u marrë me të. S jaë të koduar të dhëat? Në veçat, se s jaë përfaqësuar dryshoret clësore. Clat jaë jëstë e matjes? Ndojëherë të dhëat jaë mbledhur ose jaë matur me më shumë shfra se sa jaë të evojshme. Kosderojmë rrumbullakm ë qoftë se kjo do të dhmojë ë thjeshtm e terpretmt ose ruajtjes. Kujdes ga gabmet e regjstrmt të të dhëave ose gjatë rmarrjes së të dhëave ga jë studm mëparshëm Aalza fllestare e të dhëave Ky është jë hap rëdësshëm që duhet gjthmoë të kryhet. Përmbledhjet umerke mesatarja artmetke, gabm stadard, kuartlet, korrelacoet. Përmbledhjet grafke. jë dryshore-boxplot, hstogram, etj. Dy dryshore-skaterplot. Shumë dryshore-grafkë të dërthurur. Shko për vlera të veçuara, ekstreme, gabmet e të dhëave, pjerrësë apo shpërdarjet të pazakota. Marrja e të dhëave ë jë formë të përshtatshme për aalza ga pastrm ga gabmet dhe shmaget është shpesh kosumo kohë. Ajo shpesh merr më shumë kohë se vetë aalza e të dhëave. Aalzojmë të dhëat e Tabelës 1 Shtojca, duke supozuar që kem bërë dojë gabm ë hedhje e të dhëave. Për arsye se mud të kem bërë gabme gjatë hedhjes së të dhëave, jë mëyrë për të verfkuar të dhëat për gjatësë e krahëve përdorm komadë: summary(matje.ko$gj.krahet) M. 1st Qu. Meda Mea 3rd Qu. Max Vlera e mmumt të të dhëave të gjatësve të krahëve është 1.55 do të thotë që kem jë gabm ë jësë matëse të gjatëssë. Për të verfkuar për gabme të tjera përdorm komadë që trego vlerat e redtura: sort(matjeko$gj.krahet) # redtja e vlerave 41

55 Tabela 3.1 Redtja e gjatësve të studetëve spas madhëssë , , , , Duket qartë ë këtë rast se dy vlerat e para jaë gabm, e para ka jësë matëse të gabuar, kurse e dyta, duhet të jetë gatërruar vlera 174 me 74. Bëjmë korrgjm e këtyre të dhëave ë tabelë fllestare. Komada summary () është jë mëyrë e shpejtë për të marrë formaco e zakoshme për të gjtha dryshoret. Në këtë fazë, e jem duke kërkuar për dçka të pazakotë apo të paprtur doshta trego jë gabm të regjstrmt të të dhëave. Për këtë qëllm, jë vështrm afërt ë vlerat mmale dhe maksmale të çdo varabël është vlefshëm. Një gatërresë që mud të bëhet me të dhëat është gatërrm vlerave të muguara me vlerë zero. Koleksost të dhëave ë ved të vlerës që mugo mud të vedos vlerë zero, për këtë arsye duhet të gjykohet para se të aalzohe të dhëat për të xjerrë përfudme ëse këto vlera jaë të vërteta apo jaë vlera të muguara. Për të gjtha vlerat e dryshoreve që umr zero duhet të jetë pamudur, e përdorm komadat e pasqyruara ë shtojcë 1 pka A.9: Në praktkë ka dryshore që marr vetëm dy vlera, ë përgjthës vlerë zero dhe vlerë jë. Duhet të kem kujdes që këto vlera zero të mos kosderohe s vlera të humbura. Ndryshorja seks uk është dryshore sasore por dryshore kategorke, dryshore të tlla ë statstkë quhe dryshore faktor. matje.ko$seks <- factor(matje.ko$seks)# dryshore faktor summary(matje.ko$seks) f m Për aalza të mëtejshme, s dërtmet e hstogramt, gjetje e karakterstkave të dryshoreve të rastt, regreso lear, kotroll hpotezash etj do të pasqyrohe ë temat e tjera të këtj pum. 3. Regres lear katrorëve më të vegjël Në këtë pjesë do të paraqtm model e regrest lear të thjeshtë. Regres lear është jë qasje për modelm e ldhjes mds jë dryshoreje të varur Y, zakosht e quajmë dryshore e shpjeguar (përgjgje) dhe jë ose më shumë dryshore shpjeguese (regresor, faktor) që shëohet me X. Në model e regres lear fute dhe dsa kostate, që shpreh ldhje mds dryshores së shpjeguar dhe dryshoreve shpjeguese. Këto kostate quhe parametra të regresot. Në model lear, kur kem jë dryshore shpjeguese dhe jë dryshore e shpjeguar, kem të bëjmë me regreso e thjeshtë lear. 4

56 Ideja kryesore e metodës së katrorëve më të vegjël është të mmzojë shumë e katrorëve të shmageve. Këto shmage jaë dstacat e vlerave të vrojtuara ga vlerat e modelt. Le të jeë dhëë ( x, y), 1,...,, ku çftet e vëzhgmeve këaq ldhjet e mëposhtme (3.1) dhe (3.): Y 0 1 X, 1,..., (3.1) ku të jaë të pakorreluara me prtje matematke zero dhe dsperso të barabartë. E V j j (3.) ( ) 0, ( ), cov(, j) 0,,1, Në qoftë se dryshueshmëra e Y vje vetëm ga dryshueshmëra e dhe dsperso uk varet ga umr vrojtmeve, as ga vlerat e dryshores shpjeguese X, atëherë kjo vet quhet homoskedastctet. Ndryshorja shpjeguese X do kosderohet me vlera të fksuara, pra dryshore jo e rastt, kurse dryshorja e rastt Y do kosderohet dryshore rast. Në qoftë se përsërtm vrojtm për jë vlerë të dhëë ga dryshorja shpjeguese, uk do kem patjetër të jëjtë vlerë ga dryshorja e shpjeguar, pra mud të kem jë vlerë tjetër, sepse dryshorja e shpjeguar do kosderohet dryshore rast. Vlerësuest e katrorëve më të vegjël për parametrat 0 dhe 1 jaë: X Y ( X )( Y ) ( X X ) Y ˆ ( ) ( ) X X X X Vlerësues të pazhvedosur për dsperso do marrm: s ku e jaë mbetjet: 0 1 e 1 dhe ˆ ˆ 0 Y 1X (3.3) 1 (3.4) e y ˆ (3.5) ˆ ˆ x është prtja matematke e vlerësuar për dryshore e shpjeguar për ˆ vlerat e vëzhguara x. Kujtojmë E( Y ) 0 1X prtja matematke për Y. Vettë bazke për vlerësuest e parametrave ˆ 0, ˆ 1, të clat merre ë supozm e modelt (3.1), (3.), jaë: 43

57 E( ˆ ) ( X X ) E( Y Y ) ( X X )( 0 1X 0 1X ) ( X X ) ( X X ) ( X X ) ( X X ) E( ˆ ) E( Y ˆ X ) E( Y ) E( ˆ X ) X X, dhe ( X X ) Y var[ ( X X ) Y ] ( X X ) var( Y ) ˆ ( X X ) [ ( X X ) ] [ ( X X ) ] ( X X ) var( ) var( ) 0 Y 1X Y X 1 X Y 1 X var( ˆ ) var( ˆ ) var( ) var( ˆ ) cov(, ˆ ) sepse: 1 ( X X) ( X X ) Y 1 1 ˆ 1 cov( Y, 1) cov( Y, ) ( )cov(, ) X X Y Yj ( X X ) ( X X ) ( ) 0 X X 1 ( X X ) 1 cov( Y, Yj ) 0, kur j,cov( Y, Y ), ( X X ) 0 ) 1 Pra të përmbledhura këto rezultate do kshm: E( ˆ ), X, dhe E( ˆ 1) 1, var( ˆ 0) ( ) SXX 1 XX ( ). 1 1 kem shëuar me X X dhe S X X var( ˆ ) (3.6) Vlerësuest kaë shpërdarje ormale, ë qoftë se gabmet kaë shpërdarje ormale. Në qoftë se gabmet uk kaë shpërdarje ormale ose kem vlera të veçuara të dryshores së shpjeguar, atëherë kjo metode uk mud të jetë e sgurt për kokluzoe të sakta. 1 S XX 44

58 3.3 Modfkm mbetjeve Mbetjet e (3.5) jaë vlerësues të gabmeve të rastësshme. Në model (3.1) këto mbetje jaë paraqtur ga Davso dhe Hkley [11] ë formë: ku h k e h (3.7) k k k1 1 ( x x)( xk x) k mek 1 ë qoftë se k dhe k 0 ë qoftë se S XX k. Do shëojmë me h h për lehtës të pamjes së formulave. Vettë e mbetjeve jaë: ku Ee ( ) 0 dhe var( e) (1 h) (3.8) XX 1 ( X X) h jaë quajtur leverages. Vlerësues s përcaktuar ë (3.4) S ka prtje matematke, sepse 1 ( X X) (1 ) [1 ( ] h 1 1 SXX. Shëojmë se kur kem term të lrë 0 ë model, atëherë 45 e 0 ë mëyrë automatke. Mbetjet e mud të modfkohe ë mëyra të dryshme për t marrë ato ë mëyrë të përshtatshme për t përdorur ë metodat e dagostkmt. Modfkm më përshtatshëm për qëllmet toa ë përdorm e metodave bootstrap është t dryshojmë ato ë mëyrë që të keë dsperso kostat: r e ˆ y (1 h) (1 h) 1 (3.9) e E( e) E( r ) E( ) 0, dhe (1 h) (1 h) 1 (1 h ) var( r) var( e) 1 ( 1 h ) (1 h ) Grafku Q-Q plot mbetjeve të modfkuara r do të dallojë vlerat e veçuara ë j mëyrë të dukshme, ose jo ormaltet e gabmeve të rastt. Në qoftë se leverages h jaë mjaft homogjee, e mud t modfkojmë mbetjet ë këtë mëyrë: ë ved të 1 e vedosm1 h ( ) /, ku mesatarja e leverageve është 1 h 1 h. h Në qoftë se model (3.1) gabmet e rastt jaë homoskedastke dhe ë qoftë se këto gabme të rastt kaë shpërdarje ormale, atëherë e mud të përdorm

59 rezultatet e shpërdarjes ormale stadarde për të xjerrë kokluzoe me aë të vlerësueseve të katrorëve më të vegjël. Por ë qoftë se gabmet uk kaë shpërdarje ormale ose jaë heteroskedastke, do me thëë qe uk kaë dsperso të barabartë atëherë këto rezultate uk do jeë të besueshme. Dy metoda bootstrap mud të a dhmojë, metoda e rzgjedhjes së gabmeve dhe metoda e rzgjedhjes së çfteve Davs dhe Hkley (1997) [11] Dy metoda bootstrap për regres lear Në regres lear me gabme të rastt që kaë vetë e homoskedastctett, kaë dsperso kostat dhe uk vare ga vlerat e faktort X dhe jaë me shpërdarje ormale, atëherë e mud të përdorm metodë e katrorëve më të vegjël për të vlerësuar koefcetet e regrest. Në qoftë këto gabme jaë me shpërdarje jo ormale ose jaë heteroskedastke (dsperso jo kostat), atëherë teora stadarde e katrorëve më të vegjël mud të mos jetë e besueshme. Në këtë pjesë do paraqesm dy metoda r-zgjedhjeje, rzgjedhja e gabmeve dhe rzgjedhja e rasteve. Për të bërë bootstrap ë jë problem regres, mbetjet ose çftet e dryshores shpjeguese dhe të shpjeguar mud të r-zgjdhe, kur dryshorja shpjeguese (factor) mud të jetë e rastt ose me vlera të fksuara. Rast kur dryshoret shpjeguese jaë me vlera jo të rastt, jaë trajtuar ga Efro dhe Tbshra[1], mbetjet e stadardzuar Bckel dhe Freedma (1983), mbetjet e studetzuar Weber (1984), metodat dagostkuese jaë përshkruar ga Cook dhe Wesberg (1983). Algortmet për zbatm e këtyre metodave bootstrap jaë pasqyruar ga Davso dhe Hkley (1997) [11] Metoda bootstrap që bazohet ë rzgjedhje e gabmeve Në qoftë se përsërtm vrojtm, uk duhet të presm qe të marrm të jëjtë vlerë të dryshores së rastt të shpjeguar për të jëjtë vlerë të dryshores së rastt shpjeguese x. Ndryshorja e shpjeguar do kosderohet dryshore rast, pra mud të marrm dsa vlera të dryshores së rastty, për të jëjtë vlerë të X -t. Është e mudur që ë çdo vlerë të x -t, përgjgjet Y mud të zgjdhe ga jë shpërdarje Fx ( y ), prtja matematke dhe dsperso të clës jaë ( x) dhe ( x), e tllë që ( x) 0 1x. Mud të gjejmë, parametr e lrë 0 (0) dhe parametr e pjerrëssë: 1 1 ( x x) ( x ) S XX x (3.10) Regreso lear thjeshtë me gabme homoskedastke korrespodo ( x) dhe F ( ) { ( )} x y G y x (3.11) 46

60 G është shpërdarje e gabmeve të rastt, me prtje matematke zero dhe dsperso. Çdo aplkm veçatë karakterzohet ga vlerat x,..., 1 x dhe ga shpërdarja përkatëse Fx prtjet matematke e të clave jaë përcaktuar ga regreso lear. Për të xjerrë algortm e rzgjedhjes të regresot ë fllm duhet të detfkojmë model F. Në qoftë se vlerat e dryshores shpjeguese x do te kosderohe të fksuara, atëherë G do të jetë shpërdarja e zakoshme e gabmeve. Model F është ser e shpërdarjeve F x për x ( x1,..., x ), të përcaktuara ga (3.10). Model rzgjedhjes është sera përkatëse e shpërdarjeve të vlerësuara F ë të cl çdo ( ) është zëvedësuar ga regreso ˆx përshtatur ˆ( x ) dhe G është vlerësuar ga të gjtha mbetjet. x Në rast e rzgjedhjes parametrke e mud të vlerësojmë G duke supozuar formë e shpërdarjeve të gabmeve, për shembull, mud të supozojmë se ato kaë shpërdarje ormale. Ky rast uk është evojshëm për rzgjedhje sepse teora ormale jep rezultate të gatshme. Në rast e rzgjedhjes joparametrke, e kem mbetjet rresht e të clat jaë vlerësues të dhe fukso shpërdarjes emprke tyre do të shte pajtueshëm për G. Për përdorm praktk është më mrë të përdorm mbetjet r të përcaktuar ë (3.9), sepse dsperso tyre përputhet me ato të e. Duke vëë ë dukje se G është supozuar të ketë prtje matematke zero ë model, atëherë vlerësojmë G me aë të fuksot të shpërdarjes emprke të r r, ku r është mesatarja e r. Këto mbetje të qedërzuara kaë prtje matematke zero dhe e u referohem fuksoeve të shpërdarjes emprke të tyre s Ĝ. Model rzgjedhjes është marrë që të ketë të jëjtë dzaj të të dhëave, që do të * * thotë x x, kjo specfko shpërdarje me kusht të Y ë ldhje me x ëpërmjet versot të vlerësuar të (3.1), e cla është: Y ˆ, 1,..., (3.1) * * * me ˆ ˆ x dhe ˆ 0 1 * e zgjedhur rastëssht ga Ĝ. Algortm rzgjedhjes së mbetjeve ë regreso lear, bazuar ë algortm e bërë ga A.C.Davso ad D.V.Hkley (1997) [11]. Për r 1,,..., R 1. Për 1,..., *. Vedos x x *. Zgjedhje e rastësshme ga r 1 r,..., r r ; atëherë * *. Llogart y ˆ ˆ x

61 * * * *. Përshtat regres e katrorëve më të vegjël ga ( x1, y1),...,( x, y ), duke dhëë * * * vlerësuest ˆ, ˆ, s. 0, r 1, r r * Prtjet matematke dhe dsperso rzgjedhjes e ˆ * 0 dhe ˆ 1 do të jeë afër me teorë stadarde e katrorëve më të vegjël. Tregojmë këtë për vlerësues e pjerrëssë, vlera e zgjedhjes bootstrap mud të shkruhet: ˆ * * ( x x) y ( x1 x) * 1 ˆ SXX ( x x) 1 E ( ˆ ) ˆ. * * 1 1, meqë * * 1 E ( ) ( r r ) 0, rrjedh se 1 * * ( x x) var ( ) ( ) * * 1 1 r r 1 s 1 SXX SXX SXX * * 1 r r për të gjtha -të, ku SXX ( x x) 1 1 Gjthashtu, var ( ˆ ) var ( ) ( ) jetë përafërssht barabartë me s S XX sepse, meqë. Barazm do të 1 1. ( r r ) e s 1 1 Në qoftë se h zëvedësohe ga mesatarja e tyre h, atëherë prtjet matematke * dhe dsperso ˆ * 0 dhe ˆ 1 jepe saktëssht s ë formulat (3.6) me vlerësues ˆ 0, ˆ 1 dhe s që kaë zëvedësuar vlerat e parametrave. Një avatazh rzgjedhjes është përmrësm vlerësmt kuatl kur shpërdarjet e teorsë ormale për vlerësuest ˆ 0, ˆ 1, s uk jaë të sakta, ë rastet kur gabmet uk kaë shpërdarje ormale Metoda bootstrap që bazohet ë rzgjedhje e rasteve Në qoftë se çftet jaë marrë ga jë zgjedhje bvarate F, atëherë regres lear referohet leartett të prtjes matematke me kusht të Y kur jepet X x, pra: E( Y / X x) y ( x x),, (3.13) me EX ( ), EY ( ), var( X ), dhe cov( XY, ). x y x Kjo prtje me kusht (3.1), me 0 y x, 1. Me shpërdarje bvarate F të (, ) XY, është e përshtatshme të marrm ˆF s fukso shpërdarje emprke të çfteve të të dhëave dhe rzgjedhja do të jetë ga ky fukso shpërdarës emprk. xy x xy 48

62 Smulm rzgjedhjeve përfsh zgjedhje e çfteve me përsërtje ga * * ( x1, y1),...,( x, y ). Vlerat e smuluara të koefceteve ˆ ˆ 0, 1 jaë llogartur ga * * * * ( x1, y1),...,( x, y ) duke përdorur metodë e katrorëve më të vegjël, ë mëyrë të jëjtë sç llogarte vlerësuest orgjalë ga zgjedhja fllestare ˆ ˆ 0, 1. Algortm për të marrë rzgjedhje e çfteve ë regres lear Për r 1,..., R 1) zgjedhm *,..., * 1 rastëssht me kthm ga{1,..., } * * ) për j 1,...,, vedosm x x *, y y * ; atëherë j j j j * * * * 3) përshtatm regres e katrorëve më të vegjël ga ( x1, y1),...,( x, y ) duke dhëë * * * vlerësmet ˆ, ˆ, s. 0, r 1, r r Metoda bootstrap që përdor rzgjedhje e çfteve quhet metodë joparametrke. 3.5 Dagostkm mbetjeve. Kotroll për ormaltet e gabmeve Verfkojmë ëse këto të dhëa (gabmet) jaë marrë ga jë popullm me shpërdarje ormale. Një mëyrë për të kotrolluar ëse të dhëat vjë ga jë shpërdarje ormale është test Shapro-Wlk dhëë ga Shapro dhe Wlk (1965) [1]. Le të jetë dhëe jë zgjedhje x, 1, x. Statstka test është: ku W ( ax () ) 1 ( x x) 1 (3.14) x () është statstka e -të e redtur. a, jepe ga x T 1 1 ( m V V m) 1 x 1 mesatarja e zgjedhjes. Kostatet T 1 mv ( a1,, a), ku m ( m1,, m ) T. dhe m 1,, m jaë vlerat e prtura të statstkave të redtura të shpërdarjeve të rastt me shpërdarje të jëjtë dhe të pavarura të zgjedhura ga shpërdarja ormale, kurse V është matrca e kovaracave të këtyre statstkave të redtura. Test Shapro-Wlk është jë fukso stadard ë R që mud ta përdorm. Kur p- vlera është më e vogël se 0.05 trego që popullm uk ka shpërdarje ormale, kurse kur p- vlera është më e madhe se 0.05 kjo trego se uk e refuzo hpotezë 49

63 e shpërdarjes ormale. Një rast kokret për të kotrolluar ëse të dhëat vjë ga shpërdarja ormale mud të përdorm të dhëat e tabelës 3. pka 3.7 e pumt. Ndërtojmë regres e katrorëve më të vegjël të dhëë ë shtojcë 1 pka A.11 dhe kotrollojmë ormaltet e mbetjeve të këtj regres. shapro.test(loglog.reg.p$resduals) P-vlera = trego që uk hdhet poshtë hpoteza që gabmet kaë shpërdarje ormale. Një test tjetër është test Kolmogorov-Smrov rast jë zgjedhje. Komada ë R: ks.test(fsh.lm$resduals,"porm",mea(fsh.lm$resduals),sqrt(var(fsh.lm$r esduals))) P-vlera= trego të jëjtë gjë që hpoteza që gabmet kaë shpërdarje ormale uk refuzohet. 3.6 Kotroll për dsperso e gabmeve. Heteroskedastctet Një test që kotrollo dsperso e gabmeve ë jë regres quhet Breusch- Paga test bërë ga Breusch, dhe Paga, (1979) [13], cl kotrollo hpotezë ëse dsperso gabmeve është kostat përkudrejt hpotezës alteratve që dsperso drysho dhe varet ga vlerat e dryshoreve të pavarura. Në rast alteratv kem të bëjmë me heteroskedastctet. Metoda klaske, metoda e katrorëve më të vegjël kërko përveç supozmeve të tjera edhe supozm e homoskedastctett që të kem vlerësme të pazhvedosura dhe efkase, them vlerësme BLUE (best lear ubsed estmator). Supozojmë se kem jë model regres: Y 0 1X1 px p, 1,, (3.15) Kem këto dy raste, rast parë var( X ) dhe rast dytë (3.16) var( X ) h( X ) (3.17) Nëse fukso h(.) do të jetë lear ë ldhje me dryshoret e pavarura, atëherë barazm e fudt mud ta shkruajmë ë formë: var( X ) ( 0 1X1 px p) (3.18) Vlerësojmë me metodë e katrorëve më të vegjël koefcetet e regrest dhe mbetjet. Ndërtojmë regres dhmës: ˆ 0 1X1 pxp (3.19) 50

64 Kotrollojmë hpotezë që të gjtha koefcetet e ekuacot të regrest (3.19), përveç koefcett të parë marr vlerë zero. H0 1 p : 0 Hpoteza alteratve: H : ekzsto të paktë jë ku 0, 1,, p a Ndërtojmë statstkë: Vlera e H R / p 0 F ~ F( p, p 1) (1 R ) / ( p 1) R përket regrest të dytë dhmës (3.19). Një mëyrë tjetër alteratve është ëpërmjet statstkës test: H0 (3.0) LM R ~ ( p) (3.1) LM (Lagrage multpler) cl ka shpërdarje afërssht h-katror me p shkallë lre Paraqtja grafke e dsa rasteve kur kem heteroskedastctet dhe komada ë R Hap parë që mud të bëjmë për kotroll e homoskedastctett është kotroll ëpërmjet grafkut. Paraqesm rastet kur kem homoskedastctet dhe kur jem ë rast e heteroskedastctett. Të dhëat kem të smuluara ë program R shko shtojcë1 pka A.10. Gabmet jaë marrë ga jë shpërdarje ormale me prtje matematke zero dhe dsperso 9, kurse ekuaco regrest të vërtetë do marrm ekuaco: y5 3x (3.) Rast kur kem gabme me dsperso kostat y 5 3x (3.3) Rast kur kem gabme që vare ga dryshorja X y 5 3x x (3.4) Futm ë regres jëherë gabme që kaë dsperso kostat dhe jëherë që dsperso tyre të vare ga vlerat e x-t. Paraqtja grafke do jetë: 51

65 Fgura 3.1 Grafku ë të majtë trego rast kur kem gabme me dsperso kostat, kurse grafku ë të djathtë trego kur gabmet dryshojë me dryshm e vlerave të x-t. Kur gabmet jaë me dsperso kostat, atëherë pkat e çfteve të dryshores së pavarur dhe asaj të varur ë rast toë do të shtrhe përgjatë drejtues së regrest ë mëyrë uforme. Në rast tjetër, kur kem të bëjmë me homoskedastctet, këto çfte pkash shpërdahe jo ë mëyrë uforme por dryshojë spas velt të vlerave të x-t. Në qoftë se bëjmë grafku e mbetjeve spas dekst të tyre atëherë paraqtja grafke e tyre do jepet ë fgurë 3.. Fgura 3. Grafku mbetjeve ë të majtë trego homoskedastctet, kurse grafku ë të djathtë trego heteroskedastctet. 5

66 Që të kem mudës ekzekutm të komadës ë R të testt fllmsht duhet të stalojmë paketë car. cvtest(reg1) jep p-vlerë =0.497, trego që hpoteza e homoskedastctett qëdro ë fuq me vel rëdëse cvtest(reg) jep p-vlerë = e-1 trego që hpoteza e homoskedastctett uk praohet me vel Regres peshuar Metoda e katrorëve më të vegjël të peshuar WLS Supozm që dsperso var( Y / X ) të jetë jëjtë për të gjtha vlerat e termave X mud të mos jetë vërtetë, pra a mud të dryshojë për çdo rast. Në qoftë se dodh kjo atëherë ë ved të metodës së katrorëve më të vegjël përdorm metodë e katrorëve më të vegjël të peshuar WLS (Weghted least square). Në rast më të thjeshtë fukso prtjes matematke të regrest për rast e -të do jepej ga: Ku T E( Y / X x ) x (3.5) var( Y / X x) var( ) (3.6) w w për =1,, jaë umra të johur. Model që përdorm është: Y X, var( ) 1 W (3.7) Duke përdorur të jëjtë smbolkë për koefcetet, mud të shkruajmë shumë e katrorëve të mbetjeve të peshuar të clë duhet ta mmzojmë. T (3.8) T RSS( ) ( Y X ) W( Y X ) w ( y x ) Vlerësuest WSL do gjede me formulë: ˆ ( ) T 1 T X WX X WY (3.9) 1 Në qoftë se ekuaco e parë të (3.7) e shumëzojmë të dy aët me W e cla është jë matrcë katrore me përmasa me elemet të dagoales kryesore w do marrm: W Y W X W (3.30) Në qoftë se do kotrollojmë 1 V W Y, 1 P W X dhe 1 var( W ) e do dal e barabartë me 1 g W e ekuaco (3.7) do bëhet: V P g (3.31) I paraqesm matrcat V dhe P ë formë më të plotë për qartës. 53 I. Përcaktojmë

67 V wy 1 1 dhe P wy w w x w x p w w x w x 1 p Ky model r mud të zgjdhet me metodë e katrorëve më të vegjël duke përdorur vektorët e rj dhe po të kryejmë veprmet vlerësuest e koefceteve gjede me aë e formulës (3.9). Në qoftë se dryshorja e shpjeguar është mesatarja e vëzhgmeve (zgjedhje) të dryshme, atëherë var( ), marrm w. Në qoftë se y është total 1. w y zgjedhjeve, atëherë var( y ) dhe Në qoftë se dsperso është proporcoal me jë dryshore shpjeguese x 1 atëherë var( y ) x dhe w. x 3.7. Regres peshuar ë të dhëa të smuluara Ndërtojmë jë ldhje leare të thjeshtë artfcale mds dy dryshoreve X, Y, ku X dryshorja e varur dhe Y dryshorja e pavarur: y 5 x Vlerat e dryshores së rastt X marrm ga shpërdarja ormale me prtje matematke 0 dhe dsperso 9. Gabmet marrm të pakurreluara me prtje matematke zero por me dsperso jo kostat, cl varet ga vlerat e x-t ëpërmjet barazmt: x ( x ) 1 Përdorm metodë e katrorëve më të vegjël OLS dhe metodë e katrorëve më të vegjël të peshuar WLS për të krahasuar rezultatet. # Regres ols, peshuar dhe vërtetë ë program R rm(lst=ls()) emr <-c("regres vërtetë","regres OLS", "Regres WLS") gjyra <- c("red", "blue", "black") tp.vjës <- c(1,, 4) gjerësa.vjës <- c(3,, 4) x = rorm(100,0,3) y = 5+*x + rorm(100,0,sapply(x,fucto(x){1+0.5*x^})) plot(x,y, ma = "Regres vërtetë, regres OLS dhe WLS",lwd=1, bty="o") 54

68 Grafku regrest të vërtetë able(a=3,b=,col=gjyra[1],lty = tp.vjës[1],lwd =gjerësa.vjës[1] ) Regres OLS ft.ols = lm(y~x) able(ft.ols$coeffcets, col=gjyra[], lty = tp.vjës[], lwd =gjerësa.vjës[]) ft.wls = lm(y~x, weghts=1/(1+0.5*x^)) able(ft.wls$coeffcets,col=gjyra[3],lty = tp.vjës[3],lwd =gjerësa.vjës[3]) Regres WLS summary(ft.ols) Koefcetet OLS: Vlerësues Gabm stadard t vlera Pr(> t ) (Ndërprerës) e-09*** x *** Gabm stadard mbetjeve: me 98 df. R -: , R - rregulluar: , statstka F= 1.95 me 1 dhe 98 df, p-vlera= summary(ft.wls) Koefcetet WLS: Vlerësues Gabm stadard t vlera Pr(> t ) (Ndërprerës) < e-16*** x e-1 *** Gabm stadard mbetjeve:.615 me 98 df. R = 0.331, statstka F= 48.5 me 1 dhe 98 df, p-vlera = 7.36e-1. Fgura 3.3 Grafku regrest të vërtetë, grafku regrest gjetur me metodë OLS dhe grafku regrest të gjetur me metodë WLS. 55

69 3.8 Aplkm tre metodave ë jë regres lear kokret. Në ketë pjesë zbatojmë tre metodat e dskutuara më lart, metodë e katrorëve më të vegjël, metodë e rzgjedhjes së mbetjeve dhe metodë e rzgjedhjes së rasteve. Regres bazohet ë model teork të regrest që shpreh ldhje mds peshës dhe gjatëssë të peshqve. Me aë të metodave të pasqyruar më lart kotrollojmë dhe kushtet që duhet të plotësojë gabmet ë regres Regres katrorëve më të vegjël ë të dhëat për peshku Një studm kryer ë lqe e Ohrt dhe ë rezervatet e rrtjes së peshkut ë Zagorça është marrë me studm e ldhjes së peshës së peshkut Kora (Salmo Latca) dhe gjatësve të tyre Prft V., Palla I. (015) [6]. Të dhëat pasqyrohe ë tabelë më poshtë. Tabela 3. Të dhëat për peshku ë rezervat e Zagorçat dhe lqet të Ohrt. Në rezervat e Zagorçat Pesha (gram) 1100, 330, 30, 330, 340, 30, 50, 450, 30, 450, 740, 30, 470, 330, 310, 730, 580, 1100 Në lqe e Ohrt 750, 30, 00, 500, 600, 750, 300, 300, 500, 300, 330, 50, 00, 50, 510, 360, 1100, 300, 780, 40, 40, 300, 550, 950, 750, 350, 850, 700, 50, 300 Gjatësa (cm) 56,9, 8, 8, 30, 8, 9, 36, 7, 35, 4, 6, 39, 3.5, 7.5, 4, 38.5, , 9, 7.5, 36.8, 41, 41, 30, 30.5, 37.7, 31, 33.5, 31, 6.5, 3, 39, 34, 47, 3, 44, 35, 31, 7, 38.3, 4.5,41.5, 33.4, 4, 40.4, 30, 31.7 Ldhja mds gjatëssë L dhe peshës W shprehet ëpërmjet ekuacot (Pauly, 1983) [14]: W a( L) b (3.3) ku W pesha e peshkut e matur ë gram, L gjatësa e peshkut e matur ë cetmetra, a, b koefcetet që do të vlerësohe. Logartmojmë të dy aët e ekuacot (3.13) për ta kthyer ë formë e jë ekuaco lear: l( W) l( a) bl( L) (3.33) Model regrest lear është: y 0 1 x, 1, jaë gabmet të supozuara të jeë me shpërdarje ormale, të pakorreluara dhe me dsperso kostat. Në qoftë se uk kotrollojmë këto kushte, atëherë duke përdorur program R, komadat gjede ë shtojcë 1 pka A.11, do xjerrm rezultate me metodë e katrorëve më të vegjël për të dhëat ë lqe e Ohrt. 56

70 Fgura 3.4 Në të majtë skaterplot për ldhje mds gjatëssë dhe peshës së peshqve. Në të djathtë ldhja mds vlerave të logartmuar të gjatësve dhe vlerave të logartmuar të peshave. Nga grafku majtë fgurës 3.4 së mëspërme duket që ldhja mds gjatëssë dhe peshës ë këtë rast uk është leare. Nga grafku djathtë fgurës varësa leare mds dy dryshoreve ë shqyrtm duket qartë. Tabela 3.3 Rezultatet përmbledhëse të regrest lear për të dhëat log të peshqve. Koefcetet: Vlerësm Gabm stadard t vlera Pr(> t ) (Ndërprerja) e-09 *** log(gjatës) < e-16 *** Kodet e domethëes: 0 *** ** 0.01 * Gabm stadard mbetjeve: me 8 shkallë lre R : 0.983, R rregulluar: F-statstka: 36.3 me 1 dhe 8 shkallë lre, p-vlera: <.e-16. Me aë të komadës së mëposhtme bëjmë aalzë e dspersoeve për të dhëat e peshkut aova(loglog.reg.p) 57

71 Tabela 3.4 Tabela e aalzës së dspersoeve për të dhëat e peshkut. Ndryshorja e varur: log(pesha.peshk) Df Sum Sq Mea Sq F value Pr(>F) log(legth.fsh) <.e-16** Mbetjet Në supozm që gabmet e regrest kaë shpërdarje ormale, të pavarura dhe me dsperso kostat, atëherë edhe koefcetet e regrest gjthashtu kaë shpërdarje ormale. Këto supozme a vlejë që të kem mudës për të bërë kotroll hpotezash dhe për të gjetur tervalet e besmt. Var( ˆ 0) dhe Var( ˆ 1) Për terval e besmt përdorm komadë coft(loglog.reg.p) ë program R. Itervalet e besmt 95% jaë: për dërprerës ( , ), për koefcet e pjerrëssë (.6785, 3.345). Koefcet R =0.983 trego çfarë pjese të shpërhapjes së dryshores së varur (Pesha e peshkut) shpjego ekuaco regrest me varabël të pavarur (Gjatësa e peshkut). Testojmë hpotezë zero NH: 1 0 përkudrejt hpotezës alteratve AH: 1 0. Përdorm krter Studet ose krter Fsher për këto të dhëa, kem T= dhe t (8) , pra kjo hpotezë hdhet poshtë. Regres lear thjeshtë xjerrë me metodë e katrorëve më të vegjël do jetë: Y X. Parametrat e vlerësuar jaë: a exp( 4.69) dhe b Ekuaco (3.13) me vlerat e gjetura do jetë: W ( L) Aplkm metodës bootstrap bazuar ë rzgjedhje e mbetjeve Aplkojmë metodë bootstrap për të vlerësuar koefcetet e regrest ë ldhje mds peshës dhe gjatësve ë të dhëat e studmt për peshku Palla.I, Butka A., (016), [3]. Kur duam të përdorm metodë bootstrap ë program R ë fllm duhet të shkarkojmë paketë boot dhe bootstrap. Për dagostkm e mbetjeve grafksht përdorm komadat ë R të pasqyruara ë shtojcë 1 pka A11. lbrary(car) cvtest(loglog.reg.p) # Kujdes, kjo kërko objekt lm jo glm. H-katror = , shkallët e lrsë = 1, p = , sugjero që gabmet uk kaë dsperso kostat. plot(ftted(peshk.lm),resd(peshk.lm), xlab=" Peshat e logartmuara",ylab="mbetjet",lwd=3) # Tukey-Ascombe's ttle(ma = "Dagostkm mbetjeve") able(h = 0, lty = 1,lwd=3) qqorm(resd(peshk.lm)); qqle(resd(peshk.lm),lwd=3) 58

72 Fgura 3.5 Grafku dagostkues për mbetjet e regrest për të dhëat peshqt. Rast Zagorçat. Statstkat bootstrap: Orgjalja zhvedosja Gabm stadard t1* t* Gjejmë tervalet e besmt bootstrap 95% për koefcet e dërprerjes. boot.c(peshk.boot.re) Normal Bazk Studetzuar Përqdësh BCa (-5.7,-3.5) (-5.7,-3.5) (-5.8,-3.6) (-5.7,-3.4) (-5.7,-3.5) Shëm: vlerat e kufjve të tervaleve kem rrumbullakosur ë vetëm e jë shfër pas presjes dhjetore. Mud të bëjmë jë kotroll për shpërdarje bootstrap të koefcett të pjerrëssë të regrest të xjerrë ga metoda bootstrap duke u bazuar ë rzgjedhje e mbetjeve dhe paraqtm këtë shpërdarje grafksht. Kotroll e hpotezës e bëjmë ëpërmjet testt Kolmogorov-Smrov rast jë zgjedhje burm ga Marsagla, Tsag ad Wag (003)[16]. 59

73 ks.test(peshk.boot.re$t[,],"porm",mea(peshk.boot.re$t[,]), sqrt(var(peshk, boot.re$t[,]))) p-vlera del që do të thotë se: hpoteza që këto të dhëa jaë me shpërdarje ormale uk hdhet poshtë. Fgura 3.6 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të mbetjeve. Vja e kuqe trego përafrm me shpërdarje ormale. Në të jëjtë mëyrë mud të dërtojmë grafku e shpërdarjes bootstrap për koefcet e dërprerjes dhe mud të kotrollojmë për hpotezë ëse këto të dhëa kaë shpërdarje ormale. Iterval përqdësh me vel 95% për koefcet e pjerrëssë të regrest të gjetur me metodë bootstrap. boot.c(peshk.boot.re,dex=, type = "perc") Iterval përqdësh 95% del (.675, 3.311) cl është afërssht barabartë me terval e koefcett të pjerrëssë të gjetur me metodë e katrorëve më të vegjël. 60

74 3.8.3 Aplkm metodës bootstrap bazuar ë rzgjedhje e rasteve. Në këtë pjesë zbatojmë metodë bootstrap bazuar ë rzgjedhje e rasteve për të dhëat e peshkut ë lqe e Ohrt. Shko për komadat ë Shtojcë A8. Statstkat bootstrap: Orgjalja zhvedosja Gabm stadard t1* t* Iterval besmt përqdësh bootstrap me vel 95% për koefcet e parë: ( ,-3.31). Iterval besmt përqdësh bootstrap me vel 95% për koefcet e dytë: ( ). Poshtë paraqesm grafksht shpërdarje bootstrap për koefcet e pjerrëssë, koefcet e dytë. Fgura 3.7 Shpërdarja bootstrap koefcett të pjerrëssë ë metodë e përsërtjeve të rasteve. Vja e kuqe trego përafrm me shpërdarje ormale. Rezultatet vedosm jë tabelë përmbledhëse për t krahasuar ato. Në tabelë vedosm koefcetet e regrest gabmet stadarde përkatëse dhe terval e besmt me vel 95% të koefcett të pjerrëssë. Rezultatet tregojë se ë këtë rast të tre metodat jap vlera të përafërta. Iterval besmt për koefcet e 61

75 pjerrëssë regrest lear xjerrë me metodë e përsërtjeve të rasteve është pak më madh se dy rastet e tjera. Tabela 3.5: Të dhëat përmbledhëse për tre metodat e përdorura për gjetje e regrest ë të dhëat e peshkut ë lqe e Ohrt. Metoda përdorur e Metoda e katrorëve më të vegjël Metoda bootstrap bazuar ë përsërtje e mbetjeve Metoda bootstrap bazuar ë përsërtje e rasteve Koefcet dërprerjes Koefcet pjerrëssë Gabm stadard koef. d Gabm stadard koef.pj Iterval besmt për koefcet e pjerrëssë (.68, 3.3) (.67, 3.31) ( ) Aplkm bootstrapt për të dhëat ë rezervat e peshkut Në tabelë 3.1 dodhe të dhëat për peshqt ë rezervat e peshkut ë Zagorça. Ldhja mds gjatëssë L dhe peshës W shprehet ëpërmjet ekuacot (Pauly, 1983) [14]: W a( L) b Rezultatet xjerrm duke përdorur program R dhe dsa paketa të gatshme të dërtuara ë këtë program. 6

76 Fgura 3.8 Hstogram për mbetjet dhe krahasm me shpërdarje ormale. Vlerësues gabm stad vlera F Pr(> t ) (Ndërprerja) log(l..z) e-11 Regreso thjeshtë lear për ldhje peshë - gjatës do jetë: Y= X. Nxjerrm a exp( ) , b Ekuaco: W gabmet plotësojë kushtet e supozuara ë (3.) ( L). Këto rezultate do të kosderohe të sakta me supozm se Një metodë për të kotrolluar shpërdarje është ëpërmjet kotrollt të hpotezave ëpërmjet testt Patrck Roysto (198) [15]: shapro.test. p-vlera = Ky test uk e hedh poshtë hpotezë me sgur 0.05, që mbetjet uk kaë shpërdarje ormale sepse p-vlera është , pra më e madhe se megjthatë dyshmet që këto mbetje të mos keë shpërdarje ormale gele. Një metodë tjetër është ëpërmjet paketës glm.dag.plots e cla bë dagostkm e këtyre mbetjeve. Kjo bë grafkm e mbetjeve të devjuara jackkfe kudrejt dryshores parashkuese leare, grafku ormal për mbetjet e 63

77 h stadardzuara, grafku statstkave të përafërta dhe Cook kudrejt, ku h 1 h jaë leverage të dskutuar ë pkë 3.3 për modfkm e mbetjeve. Grafku fudt është rasteve kudrejt statstkave Cook. fsh.dag<-glm.dag.plots(fsh.lm,ret=t) Fgura 3.9 Grafku dagostkues për mbetjet e regrest për te dhëat e peshqve ë rezervat. Regreso lear thjeshtë për të dhëat Peshku ë rezervat e Zagorçat xjerrë me metodë e katrorëve më të vegjël: Y= X, kështu që a exp( ) dhe b Ekuaco ekspoecal: W ( L). Rezultatet bazuar ë metodë bootstrap të rzgjedhjes së mbetjeve. Rast rezervatt. Statstkat bootstrap, hstogram vlerave bootstrap dhe grafku Q-Q plot: orgjalja zhvedosja gabm stadard t1* t*

78 Fgura 3.10 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të lrë ë regreso lear për të dhëat e peshkut me R=999, umr rzgjedhjeve të mbetjeve. Vja e kuqe trego përafrm me shpërdarje ormale. Fgura 3.11 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut ë rezervat me R=999 umr rzgjedhjeve të mbetjeve. Vja e kuqe trego përafrm me shpërdarje ormale. 65

79 Statstkat bootstrap, rast përsërtjeve të çfteve Orgjalja zhvedosja gabm stadard t1* t* Fgura 3.1 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të lrë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të çfteve (rasteve). Vja e kuqe jep përafrm e shpërdarjes ormale. Fgura 3.13 Hstogram dhe grafku Q-Q plot për vlerësues e koefcett të pjerrëssë ë regreso lear për të dhëat e peshkut me R=999 umr rzgjedhjeve të çfteve. Vja e kuqe trego përafrm e shpërdarjes ormale. 66

80 Ka dy dallme të rëdësshme mds këtyre dy metodave bootstrap. Dallm parë është se ë metodë e rzgjedhjes së çfteve uk merret supozm që dsperso është homogje dhe e dyta që zgjedhjet e smuluara kaë jë dzaj të dryshëm, * * sepse vlerat x,..., 1 x jaë zgjedhje të rastt. Në të jëjtë mëyrë s ë rast e regrest të dalë ga të dhëat e peshqve të lqet të Ohrt, e mud të gjejmë tervalet e besmt për koefcetet e regrest të r Aplkme të tjera të metodës bootstrap Ekoom L, Margo L., Mlo E., Doefsk E, Palla I., (013) [3] paraqes metodë bootstrap me blloqe të përbërë ga ckle ë dy raste, rast kur blloqet merre jo të mbvedosur (jo të rrëshqtshëm) dhe rast kur blloqet merre të rrëshqtshëm. Vlerësmet bootstrap kosstojë të qëdrueshme dhe jaë kosstote ë sertë kohore stacoare kur plotësohe dsa kushte. Në aplkm të metodës bootstrap e kem bërë ë jë autoregreso [8] Palla I. A Aalyss of the Number of Wome ad Number of Me Albaa. (014). Materal paraqtur ë këtë koferecë përbëhet ga dy pjesë. Pjesa e parë përmba jë aalzë mb umr e popullssë së Shqpërsë përgjatë vteve dhe ldjet dhe vdekjet përgjatë vteve Jepet jë përshkrm tredt të ldjeve, vdekjeve dhe umrt të përgjthshëm të popullssë ëpërmjet grafkëve të serve kohore përkatëse. Të dhëat jaë sguruar ga Isttut Statstkave INSTAT. Për të aalzuar serë kohore ë këtë rast kem përdorur skemë autoregresve të redt të parë. Në pjesë e dytë kem vlerësuar koefcetet e sersë me aë e metodës së katrorëve më të vegjël, kurse për vlerësm e gabmt stadard të vlerësuese përdorm metodë bootstrap të rzgjedhjes së gabmeve. Model autorergresv me koefcete të vlerësuar ka rezultuar: P t Ku P umr popullssë së Shqpërsë, t vtet që marr vlera ga 1der 13. Një vlerësm për popullsë për vt pasardhës 014 të clë e gjejmë për t=14 rezulto: e cla e krahasuar me vlerë e vërtetë është jë vlerësm shumë mrë. Metodat bootstrap jaë përdorur edhe ë rast e serve kohore të korreluara perodksht kur vlerësohe koefcetet e zbërthmet Fourer të parametrave ë modelet PAR dhe PARMA [7]. Butka A., Puka Ll., Palla. I., (014) [5] prezatua jë procedurë testm gjysëmparametrke për zbulm e LRD, prezecë e memores së gjatë ë jë proces stokastk. Bootstrap jep jë metodë praktke për të korrgjuar madhësë e deformmt të testt asmptotk cl është zhvlluar ga A.W. Lo (1991) [4]. 3.9 Regreso lear shumëfshtë Shtrm problemt Shtrm problemt ka të bëjë me studm e ldhjes mds jë dryshoreje dhe dsa dryshoreve të tjera. Do përdorm këto emërtme, dryshore e varur do ta quajmë dryshore të shpjeguar dhe do përdorm smbol Y, dërsa dryshoret e 67

81 tjera, dryshore shpjeguese do t shëojmë me X,, 1 X p. Model regrest lear shumëfshtë për dsa dryshore shpjeguese do shte: E Y X X X (3.34) ( / ) p p var( Y / X) Në këtë rast smbol ë të majtë trego prtje matematke me kusht. Ky ekuaco është lear ë ldhje me parametrat. Ekuaco (1) mud të rshkruhet: E Y X X X X (3.35) ( / ) p p Ku X 0 është jë dryshore e rastt kostate që merr vetëm vlerë 1. Në qoftë se fukso prtjes matematke uk përmba parametr e dërprerjes 0, atëherë këtë term uk e përfshjmë. Forma vektorale: Y X e, E( Y / X ) X, C( Y / X ) C( e) I, Ee ( ) 0, ku Ce () është matrca e kovaracave, I matrcë me 1 ë dagoale kryesore dhe 0 ë vedet e tjera, kurse 0 vektor zero Vlerësuest e katrorëve më të vegjël Vlerësues katrorëve më të vegjël ˆ për gjedet duke mmzuar shumë: p T ( ) ( j j ) ( ) ( ) 1 j0 (3.37) RSS y x Y X Y X Nxjerrm vlerësues e katrorëve më të vegjël: ˆ ( ) T 1 T X X X Y (3.38) 1 X X ekzsto. Ekuaco Y X T kur ( ) quhet ekuaco teork regrest, kurse Y Xˆ ekuaco emprk. Duke shëuar vlerat e vlerësuara me Ŷ Xˆ dhe ê Y Yˆ, ekuaco që jep shumë mmale të katrorëve mbetjet (resduals) me ë (4) do jetë: ˆ T ( ) m[ ( )] ˆ ˆ ( ˆ T RSS RSS e e Y X ) ( Y X ˆ ) (3.39) Në bazë të teoremës Gaus-Markov vlerësuest e katrorëve më të vegjël do të jeë vlerësues të pazhvedosur me dsperso mmal ë klasë e vlerësuesve lear të pazhvedosur. Duke supozuar që Ee ( ) 0 dhe E( ˆ ) dhe C e () I var( ˆ ) ( ), atëherë vlerësues ˆ ka këto vet: T 1 X X (3.40) Një vlerësues pazhvedosur për dsperso jepet ga: RSS( ˆ ) ˆ (3.41) ( p 1) 68

82 Ekuaco dytë ë (7) është matrca varacë-kovarcë. Në qoftë se duam vetëm gabm stadard për jë kompoet të veçatë atëherë a do shte 1 barabartë me ˆ T se( ) ( ) ˆ X X. Gabm stadard koefcett ˆ gjede duke shumëzuar ˆ me rrëjë katrore të elemett që dodhet ë dagoale e T 1 matrcës ( X X), rresht -të shtylla e -të. Duke zëvedësuar ë formulë e dytë të (7) ˆ ë ved të. Ne gjejmë jë vlerësues për dsperso e ˆ, të clë po e shëojmë me ˆ ( ˆ 1 var ): ˆ ( ˆ) ˆ ( T var X X ) Kotroll hpotezës për krahasm e modeleve Në qoftë se supozojmë se gabmet kaë shpërdarje ormale atëherë: ˆ RSS( ) ˆ [ ( p 1)] [ ( p 1)] (3.4) e N I (0, ) Duke supozuar se plotësohe supozmet fllestare dhe ormaltet e gabmeve e mud të gjejmë vlerësme tervalore për koefcetet dhe kotroll hpotezash. Kosderojmë jë model të madh me q parametra dhe jë model më të vogël me p parametra, cl përbëhet ga jë ëbashkës e dryshoreve shpjeguese të. Duke u sur ga prcp lgjt të kursmt, e do të preferom të përdorm model ëse të dhëat do ta mbështes atë. Në qoftë se shëojmë me L(, / y) fukso e përgjassë, atëherë dërtojmë statstkë s raport të fuksoeve të përgjasve: max L(, / y) max L(, / y) (3.43) Nga teorema e Cochra-t, ë qoftë se hpoteza zero është e vërtetë dhe veç kësaj kem RSS RSS RSS ( q p) dhe q p p jaë të pavarura. Raport: ( q) dhe të dyja këto madhës ( RSS RSS ) / ( q p) F F( q p, p) (3.44) RSS / ( q) ka shpërdarje Fsher me q-p dhe -p shkallë lre. Ne do ta refuzojmë hpotezë zero ë qoftë se F F ( q p, p), ku vel rëdëssë. T 1 Në qoftë se ë matrcë ( X X) elemetët e saj dryshojë shumë ë madhësë e vlerës absolute mds jëra tjetrë, atëherë ë ved të kësaj matrce përdorm T 1 matrcë ( ), ku me kem shëuar këtë matrcë. Shko S. Wesberg (005) [17]: 69

83 ( x11 x1 ) ( x1 p xp) ( x1 x1 ) ( x p xp) ( x 1x1) ( xp xp ) (3.45) y1 y y y Shëojmë me y atëherë të gjtha formulat e mëspërme zëvedësohe y y 1 me vektorët e rj. Kjo do të japë koefcetet e rj: ˆ T ( ) T y dhe ˆ y ˆ x 0 Përmbledhje për pjesë e regrest lear Vlerësm koefceteve mud të bëhet me aë e katrorëve më të vegjël. Në qoftë se supozojmë më tej se gabmet kaë shpërdarje ormale me prtje matematke zero dhe dsperso kostat, mud të testojmë hpoteza rreth koefceteve të regrest, dërtojmë zoat e besmt për koefcetet, tervale besm për parashkues. Çfarë mud të shkojë keq? Mud të kem jë zgjedhje të zhvedosur. Shpjegues të rëdësshëm uk kem vëzhguar. Kjo do të thotë se parashkmet toa mud të jeë të varfra, ose e mud të keqterpretojë ldhje dërmjet shpjeguesve dhe të shpjeguarës. Ragu dhe atyra clësore e te dhëave mud të kufzojë predktor efektv. Kompoetët e gabmeve. Gabmet mud të jeë heterogjee, pra me dsperso jo të barabartë Gabmet mud të jeë të korreluara Gabmet mud të mos keë shpërdarje ormale. Kjo është më pak problem se dy të parat, sepse ëse kem jë sas të madhe të dhëash vlerësmet e koefceteve do të tetojë tek ormaltet, duke u bazuar ë teoremë qedrore lmte. Kompoet strukturor. Pjesa strukturore e modelt lear mud të mos jetë korrekte 70

84 4.1 Llojet e hpotezave KAPITULLI IV KONTROLLI I HIPOTEZAVE Idetë themelore të kotrollt të hpotezave ka dhëë Nejma (J. Neyma) dhe Prso (E.S. Pearso) ë vtet Në statstkë deshem me shumë lloje të dryshme hpotezash. Hpoteza H 0 kur është e thjeshtë përcakto ë mëyrë të vetme shpërdarje, për shembull hpoteza prtja matematke e jë shpërdarje ormale është barabartë me jë vlerë të caktuar kur johm dsperso. Kur kem jë zgjedhje të vetme x,..., 1 x ga jë popullm me fukso destet kumulatv F, atëherë H0 specfko që F F0, ku F 0 uk përmba parametra të pajohur. Stuata më e zakoshme ë praktkë është që H 0 është jë hpotezë zero e përbërë e cla ëkupto që dsa aspekte të F uk jaë të përcaktuara dhe mbete të pajohura kur H 0 është e vërtetë. Një shembull do te shte shpërdarja ormale me prtje matematke 1, dsperso shpërdarjes ormale uk specfkohet. Hpoteza e përberë e përcakto shpërdarje s jë shpërdarje të jë famlje shpërdarjesh. Në këtë pjesë e do të përshkruajmë se s metodat e rzgjedhjes mud të përdore për të krjuar testet e besmt ë rastet parametrke dhe jo parametrke. Supozojmë se vrojtm X ka destet px ( ; ),. Fukso përgjassë është: L( ; x) p( x; ), (4.1) Për të kotrolluar hpotezë: H0: 0 kudrejt hpotezës alteratve a : 1 71 H (4.) ë rastet parametrke, zakosht përdorm raport e përgjasve: sup{ L( ; x) : } ( x) sup{ L( ; x) : } 0, x R X (4.) Për jë vrojtm X, vlera e këtj raport [0,1]. Kur vlera e raportt është afër zeros trego që bashkësa e vlerave 0 është larg bashkëssë së vlerave të vërteta të, për këtë arsye hpoteza zero duhet refuzuar. Në rast se vlera e raportt për këtë vrojtm është afër vlerës 1, atëherë 0 është mjaft afër bashkëssë së vërtetë të vlerave të, për këtë arsye hpoteza uk duhet të refuzohet. Test raportt të përgjasve për testm e hpotezës s ë (4.) është jë test me zoë krtke të formës: 1 { x : ( x) k} (4.3) Ku k është jë umër mds 0 dhe 1-t. Test do të jetë me vel ëse k mud të zgjdhet tllë që të këaq barazm: sup{ P( ( X ) k; } (4.4) 0

85 Nëse hpoteza zero është e thjeshtë 0 { 0}, barazm (4.4) shkruhet: P( ( X ) k; ) (4.5) 0 Meqeëse fukso ( x) l ( x) është jë fukso zbrtës zoa krtke e testt të përgjassë mud të shprehet ë formë: 1 { x : ( x) c} (4.6) Statstka ( x) quhet statstka e raportt të përgjasve. k Nëse vrojtm X ka destet p( x; ), R, që plotëso kushtet e ekzstecës dhe të uctett të vlerësuest të përgjassë maksmale VPM, atëherë kur është e vërtetë hpoteza zero, statstka: kur, ku ( x) ( k r) (4.7) k dm dhe r dm 0. Kur kem hpotezë të thjeshtë statstka e raportt të përgjasve ka shpërdarje asmptotke (1). 4. Kotroll hpotezës mb barazmt e prtjeve matematke Supozojmë se jaë dhëë dy dryshore rast X dhe Y, ku Y N, ~ ( Y, Y) Kotroll hpotezës: H kudrejt H :. : 0 X Y a X Y X ~ N(, ) dhe Nëse dspersoet jaë të johur. Në këtë rast e mud të përdorm krter: Z X Y m X Y Kur hpoteza H 0 është e vërtetë Z ka shpërdarje ormale të ormuar. Zoa e lejuar është ] z/ ; z/[, ku ( z /) (1 ) /, fukso Laplast, vel domethëes. Nëse dspersoet jaë të pajohur, por dmë që jaë të barabartë, atëherë: X Y m( m ) T S( m ), kur H 0 është e ( 1) sx ( m 1) s m Y vërtetë. X X 7

86 Zoa e lejuar ] t/ ; t/[, ku t / gjedet ë tabelë e shpërdarjes së studett me / dhe me m shkallë lre. Nëse dryshoret e rastt jaë të çftuara, ë këtë rast vëllmet e zgjedhjeve jaë të barabarta, atëherë futm varabl e rastt Z X Y. Z N ~ ( X Y, X Y ) Ky rast mud të trajtohet s rast me jë zgjedhje dhe mud të përdorm krter e Studett. Dspersoet jaë të pajohur dhe uk mud të quhe të barabartë. Përdorm krter Welch (Welch 1938, 1947) [18], [19]: T X Y s s m X Y ~ S( ) ku 0 sx / sy / m sx / / 1 sy / m / m 1 0 Të gjtha këto raste jaë të johura s raste parametrke duke supozuar se të dyja dryshoret kaë shpërdarje ormale. Më poshtë trajtojmë rast jo parametrk kur shpërdarja e këtyre dy dryshoreve të rastt uk jhet. 4.3 Nvel arrtur domethëes, p-vlera Supozojmë se kem dy zgjedhje të rastt të pavarura x ( x1,, x ) dhe y ( y1,, y m ) të marra mudëssht ga shpërdarje probabltare të dryshme F dhe G. Kotrollojmë hpotezë: H : 0 0 F G përkudrejt Ha : F G 0 (4.8) Shëojmë me ˆ x y dhe ˆ* dryshore e rastt që ka shpërdarje e hpotezës zero, pra shpërdarje e ˆ kur hpoteza zero është e vërtetë. Nvel domethëes së arrtur (acheved sgfcace level), shëohet shkurt ASL përcaktohet ë këtë mëyrë: Kur p vlera P ˆ ˆ H (4.9) * ( 0) p vlera 0.05 kem jë provë të arsyeshme kudër hpotezës zero p vlera 0.05 kem jë provë të fortë kudër hpotezës zero p vlera 0.01 kem jë provë shumë të fortë kudër hpotezës zero Në qoftë se e supozojmë se dy zgjedhjet toa jaë marrë ga dy shpërdarje ormale me dsperso të johur dhe të barabartë, atëherë ë supozm që H është e vërtetë, dryshorja e rastt 0 73

87 Në këtë rast ˆ x y ~ N(0, ) (4.10) m ˆ ˆ p vlera P( Z 1 ( ) m 1 1 m (4.11) ku është fukso shpërdarjes kumulatv të dryshores së rastt ormale të ormuar. Komadat ë program R për këtë rast jaë: p.vlera<-1-porm((t.obs)/(sqrt(var.x*(1/.x)+var.y*(1/.y)))) Në qoftë se uk johm dsperso, atëherë marrm jë vlerësues për me aë të formulës: m [ ( x x) ( y y) ] / ( m ) 1 j1 (4.1) Nëse kosderohet s kostate e fksuar, atëherë: x y p vlera 1 ( ) 1/ 1/ m (4.13) Nëse është e pajohur, shhet s madhës e rastt përdorm t-test e Studett. x y p vlera P{ tm } 1/ 1/ m Llogartja e ASL ose p-vlerës ë program R: t.test(x,y,alteratve="greater", var.equal=true)$p.value 4.4 Test përkëmbmt (4.14) Test përkëmbmt u prezatua ga R.A. Fsher ë vtet 1930, e cl shte argumet mbështetës teork testt t-studet. Duam të testojmë hpotezë H 0 që uk ka dferecë mds dy shpërdarjeve duke u bazuar vetëm ë dy zgjedhjet e vëzhguara. Test perkëmbmt Fsher është jë mëyrë për të testuar hpotezë duke përdorur vlerë e p-vlerës. Kombojmë +m vëzhgmet prej të dy grupeve së bashku dhe marrm jë zgjedhje me masë pa kthm e cla përfaqëso grup e parë, dërsa m vëzhgmet e mbetura formojë grup e dytë. Llogarsm dferecë mds mesatareve të grupeve dhe këtë proces e përsërtm ë jë umër të madh herësh. Nëse dfereca orgjale e mesatareve të zgjedhjeve be jashtë 95% të shpërdarjes së dferecave, test përkëmbmeve me dy bshta refuzo hpotezë zero me vel domethëe 5%. Llogartja e p-vlerës dhëë ga Efro dhe Tbshra (1993), faqe 07 [1] bëhet me formulë: 74

88 ku pperk p ˆ * ˆ* ˆ umr ( ) përk P( ) (4.15) Cm kem shëuar p-vlerë kur përdorm test e përkëmbmt. ˆ Në praktkë ppërk përafrohet ga metodat Mote Karlo, duke marrë vetëm jë umër R vektorësh ë secl ga të clët kosstojë vlera të x-t dhe m vlera të y-t, secl prej tyre zgjedhur rastëssht ga bashkësa e mudshëm të tllë. pˆ përk C vektorëve të m ˆ* umr ( ˆ ) (4.16) R 4.5 Dy metoda bootstrap për krahasm e dy qedrave Kjo pjesë përmba metodat bootstrap për të testuar hpotezë e barazmt të dy prtjeve matematke të dy dryshoreve të rastt. Ky problem është quajtur problem me dy zgjedhje. Metodat bootstrap mud të përdoret kur kem supozme ë ldhje me dspersoet e dy dryshoreve te rastt ashtu edhe ë rast kur uk kem supozm që dryshoret e rastt kaë dspersoe të barabarta. Nëse shëojmë me T( Z) X Y statstkë test atëherë atëherë vel domethëes së arrtur p-vlera do llogartet me formulë: * 0 (4.17) p. vlera P{ T( Z ) t( z) H } Madhësa tzështë () e fksuar, vlera e vëzhguar e saj dhe dryshorja * Z ka F. shpërdarje të specfkuar ga hpoteza zero H 0 dhe e shëojmë me 0 Bootstrap përdor prcp plug- për të vlerësuar shpërdarje e dferecave. Në supozm që hpoteza zero është e vërtetë dhe dspersoet e barabarta, mud të bëjmë jë vlerësm joparametrk bootstrap të shpërdarjes të clë e shëojmë me ˆF 0. Këtë metodë bootstrap po e quajmë metoda bootstrap 1 për ta përdorur s referecë ë smulme. Algortm për llogartje e p-vlerës (B. Efro ad R.j Tbshra, 1993, p. 1) jepet s më poshtë: 1. Rzgjedhm R zgjedhje me vëllm m me kthm ga Z. vëzhgmet e para * * quajmë X dhe m të mbeturat Y. * r * *. Llogarsm T( Z ) X Y, r 1,..., R. 3. Përafrojmë p boot ga pˆ boot * r umber{ T( Z ) tobs} (4.18) R Kur duam të përdorm test me dy bshta dhe duke supozuar që shpërdarja e T është shpërdarje smetrke rrotull zeros, atëherë p-vlera llogartet ë këtë mëyrë: 75

89 pˆ boot * r umber{ T( Z ) tobs} (4.19) R Nëse uk do të bëjmë këtë supozm e mud të përdorm p-vlerë bootstrap (MacKo 007, 4) [0]: * r * r umber{ T( Z ) tobs} umber{ T( Z ) tobs} pˆ boot m, R R 76 (4.0) Një përcaktm tjetër të gjashëm për p-vlerë jepet ga A.C. Davso dhe D.V. * Hkley 1997, faqe 148 [11]: p Prob( T t Fˆ ). Mud të përdorm test boot joparametrk boootstrap p boot të përafruar ga p boot duke përdorur * r 1 umber{ t t} R 1 *1 * * R t, t,..., t ga R rzgjedhjet bootstrap. 0 (4.1) Një saktës më të madhe mud të marrm duke përdorur statstkë e studetzuar. Nëse e uk supozojmë që dspersoet e dy popullmeve jaë të barabartë, atëherë për të kotrolluar hpotezë mb barazm e prtjeve matematke të dy dryshoreve të rast kur kaë shpërdarje ormale mud të përdorm test Welch. Për testm bootstrap të kësaj hpoteze përdorurm algortm tjetër (B. Efro ad R.J. Tbshra, 1993, p. 4)[1]: 1. Ndërtojmë zgjedhjet X X X Z, 1,..., dhe Y Y Y Z, 1,..., m, ku X dhe Y jaë mesataret e zgjedhjeve, kurse Z është mesatarja e zgjedhjes së kombuar. * * *. Formojmë R zgjedhje bootstrap ( X, Y ) ku X është zgjedhje me kthm ga X,..., 1 X * dhe Y është zgjedhje me kthm ga Y,..., 1 Y m. 3. Llogarsm T (.) për çdo zgjedhje bootstrap, TZ * r ( ) * * X Y, r 1,..., R (4.) s / s / m * * X Y * r 4. Përafrojmë p boot ga pˆ boot umr{ T( Z ) tobs}/ R, ku t obs është vlera e vëzhguar e statstkës. 4.6 Zbatm metodave bootstrap ë kotroll e hpotezave Metodë bootstrap e kem zbatuar ë kotroll e hpotezës për barazm e prtjeve matematke të jë grup pacetësh të clëve ju është matur vel kolesterolt ë fllm dhe pas trajtmt me medkamete Palla.I., (015) [30]. Para_trajtmt<-c(37,89,57,8,303,75,6,304,44,33) Pas_trajtmt <- c(194,40,30,186,65,,4,81,40,1) Krahasojmë ë fllm të dhëat me aë të dagrameve kut e mustaqe, meqeëse këto të dhëa kaë atyrë të jëjtë.

90 Fgura 4.1 Nvel kolesterolt para dhe pas trajtmt me medkamete Në fgurë 4.1 dallohe shpërhapja e velt të kolesterolt për pacetët para trajtmt dhe pas trajtmt me medkamete. Kotrollojmë ëse këto të dhëa vjë ga shpërdarja ormale. Përdorm test: shapro.test, Roysto (1995). shapro.test(para_trajtmt) Sugjero që të dhëat kaë shpërdarje ormale, sepse p-vlera=0.37. shapro.test(pas_trajtmt) Në rast e dytë p-vlera= 0.90 do të thotë që uk e hedhm poshtë hpotezë se të dhëat kaë shpërdarje ormale. Meqeëse të dhëat jaë të çftuara e mud të përdorm metodë t-test rast të dhëave të çftuara. data.frame(para_trajtmt,pas_trajtmt) df_est<-mea(para_trajtmt)-mea(pas_trajtmt) t.test(para_trajtmt,pas_trajtmt,pared=true,alteratve="greater",mu= 0) 77

91 Rezultate: t = , df = 9, p-vlera = 5.0e-05. Meqeëse p-vlera dol shumë e vogël, atëherë praojmë hpotezë alteratve. Hpoteza alteratve: dfereca e vërtetë për prtjet matematke është më e madhe se 0. Iterval besmt për dferecë e prtjeve matematke me vel besm 95%: ;. Kotrollojmë këtë hpotezë me metodë bootstrap. lbrary(boot) dff <- fucto(x,) {mea(x[[1:10]]) - mea(x[[11:0]])}# Fukso d<-boot(total,dff,r=9999)# Vlerat bootstrap p.value<-(1+sum(d$t>d$t0))/(1+d$r) # p-vlera Rezultate: p-vlera= trego që hpoteza zero hdhet poshtë, do të thotë që praojmë hpotezë alteratve se dfereca e prtjeve matematke është më e madhe se zero. Efekt medkameteve ka dhëë rezultat. hst(d$t, ma = 'Hstogram dferecave bootstrap', xlab = "Vlerat e dferecave bootstrap",ylab = 'Dedurtë') able(v=d$t0,col="red",lwd=3,lty=1) Fgura 4. Hstogram 9999 dferecave bootstrap. Vja e kuqe trego dferecë e vëzhguar. 78

92 Smulme ga shpërdarje të johura Marrm dy zgjedhje të rastt, X ~ N(10,5) me vëllm 10, Y ~ N (10,8) me vëllm 15. Ne dmë që dfereca e prtjeve të tyre ë këtë rast është e barabartë me zero, kurse dspersoet kem marrë të dryshme. Kotrollojmë hpotezë: H : 0 0 X Y kudrejt Ha : X Y 0 (4.3) Me vel domethëe Përdorm metodë bootstrap dhe test perkëmbmt për të kotrolluar hpotezë e mëspërme. Komadat ë R jaë ë shtojcë A11. Kur përdorëm metodë bootstrap p-vlera rezulto 0.189, e cla është më e madhe se Me aë të testt të përkëmbmeve: p-vlera rezulto 0.177, e cla është me e madhe se Të dy testet uk e refuzojë hpotezë zero, ashtu sc e prsm, sepse dhe zgjedhjet u morë ga shpërdarja ormale me prtje matematke të barabartë. Fgura 4.3 Hstogram shpërdarjes bootstrap për dferecat e mesatareve të dy dryshoreve të rastt të marra ga shpërdarje ormale me prtje matematke të jëjtë por me dspersoe të dryshme. Vja vertkale trego vlerë e vëzhguar të dferecës së mesatareve. Kotroll hpotezës mb barazm e peshave të peshqve të lqet të Ohrt dhe peshave ë rezervat. Për kotroll e peshave të peshqve (Palla. I, 015) [31] është përdorur metoda bootstrap dhe test Welch Two Sample t-test. Në fllm krahasojmë peshat duke përdorur dagram kut e mustaqe. w.z<-c(1100,330,30,330,340,30,50,450,30,450,740,30,470,330,310,730,580,1100) 79

93 w.<c(750,30,00,500,600,750,300,300,500,300,330,50,00,50,510,360,1100,300,780,40,4 0,300,550,950,750,350,850,700,50,300) #ku w.z, w. jaë peshat e peshqve përkatëssht ë rezervat dhe ë habtat atyror. t.obs<-mea(w.z)-mea(w.) boxplot(w.z,w., ma=" Boxplotet për peshat e peshqve ",col = '5', ames = c("peshat e peshqve ë rezervat", "Peshat e peshqve ë lqe"),ylab='peshat ë gram') t.test(w.z,w.,cof.level=0.95) Me aë të metodës t.test: p-vlera=0.8885, e cla trego që uk hedhm poshtë hpoteze zero që prtjet matematke të peshave jaë të dryshme. # Metoda bootstrap total<-c(w.z,w.) R=9999 dff <- fucto(x,) mea(x[[1:18]]) - mea(x[[19:48]]) d <- boot(total, dff, R) p.vlera<- sum((abs(d$t) > abs(t.obs))/(r+1)) p.vlera rezulto , pra praohet hpoteza zero që uk ka dryshm mds mesatareve të peshave të peshqve ë rezervat dhe atyre ë lqe. 80

Analiza Statistikore. Ligjërata e 10. Regresioni linear i thjeshtë II. Qëllimet e mësimit. Në këtë ligjëratë ju do të mësoni:

Analiza Statistikore. Ligjërata e 10. Regresioni linear i thjeshtë II. Qëllimet e mësimit. Në këtë ligjëratë ju do të mësoni: Analza Statstkore Lgjërata e 10 Regreson lnear thjeshtë II Qëllmet e mësmt Në këtë lgjëratë ju do të mëson: S të përdorn analzën e regresonnt për të parashkuar vlerën e e varablës së varur bazuar në varablën

More information

UNIVERSITETI POLITEKNIK I TIRANES METODA STATISTIKORE DHE ZBATIMET E TYRE

UNIVERSITETI POLITEKNIK I TIRANES METODA STATISTIKORE DHE ZBATIMET E TYRE UNIVERSITETI POLITEKNIK I TIRANES METODA STATISTIKORE DHE ZBATIMET E TYRE "Ndërtm dhe analza e një model probabltaro - statstkor për studmn e efektt të ndotjes në gjendjen shëndetësore të banorëve në zona

More information

UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE NATYRORE DEPARTAMENTI I MATEMATIKËS APLIKUAR

UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE NATYRORE DEPARTAMENTI I MATEMATIKËS APLIKUAR UNIVERSITETI I TIRANËS FAKULTETI I SHKENCAVE NATYRORE DEPARTAMENTI I MATEMATIKËS APLIKUAR Tema: NJË MODEL MARKOVIAN PËR SHPËRNDARJEN UNIVARIATE DHE MULTIVARIATE TË PORTOFOLIT NË RISK TË KREDISË Program:

More information

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS Exam: ECON430 Statstcs Date of exam: Frday, December 8, 07 Grades are gve: Jauary 4, 08 Tme for exam: 0900 am 00 oo The problem set covers 5 pages Resources allowed:

More information

Tema e Disertacionit: NDËRTIMI DHE ANALIZA E MODELEVE STATISTIKE PËR STUDIMIN E HOMOGJENITETIT TË BASHKËSISË ME NDIHMËN E SHPËRNDARJEVE ASIMPTOTIKE

Tema e Disertacionit: NDËRTIMI DHE ANALIZA E MODELEVE STATISTIKE PËR STUDIMIN E HOMOGJENITETIT TË BASHKËSISË ME NDIHMËN E SHPËRNDARJEVE ASIMPTOTIKE REPUBLIKA E SHQIPËRISË UNIVERSITETI POLITEKNIK I TIRANËS FAKULTETI I INXHINIERISË MATEMATIKE DHE FIZIKE DEPARTAMENTI I INXHINIERISË MATEMATIKE Disertacio për Gradë Shkecore Doktor ë Matematikë Tema e Disertacioit:

More information

Lecture 7. Confidence Intervals and Hypothesis Tests in the Simple CLR Model

Lecture 7. Confidence Intervals and Hypothesis Tests in the Simple CLR Model Lecture 7. Cofdece Itervals ad Hypothess Tests the Smple CLR Model I lecture 6 we troduced the Classcal Lear Regresso (CLR) model that s the radom expermet of whch the data Y,,, K, are the outcomes. The

More information

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS

UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS UNIVERSITY OF OSLO DEPARTMENT OF ECONOMICS Postpoed exam: ECON430 Statstcs Date of exam: Jauary 0, 0 Tme for exam: 09:00 a.m. :00 oo The problem set covers 5 pages Resources allowed: All wrtte ad prted

More information

Econometric Methods. Review of Estimation

Econometric Methods. Review of Estimation Ecoometrc Methods Revew of Estmato Estmatg the populato mea Radom samplg Pot ad terval estmators Lear estmators Ubased estmators Lear Ubased Estmators (LUEs) Effcecy (mmum varace) ad Best Lear Ubased Estmators

More information

Elasticiteti i ofertes dhe kerkeses

Elasticiteti i ofertes dhe kerkeses C H A P T E R 5 Elasticiteti i ofertes dhe kerkeses Prepared by: Dr. Qazim TMAVA Fernando Quijano and Yvonn Quijano Msc. Besart Hajrizi Elasticiteti: Një matës i reagimit Zgjedhjet racionale dhe vendimet

More information

Module 7. Lecture 7: Statistical parameter estimation

Module 7. Lecture 7: Statistical parameter estimation Lecture 7: Statstcal parameter estmato Parameter Estmato Methods of Parameter Estmato 1) Method of Matchg Pots ) Method of Momets 3) Mamum Lkelhood method Populato Parameter Sample Parameter Ubased estmato

More information

Summary of the lecture in Biostatistics

Summary of the lecture in Biostatistics Summary of the lecture Bostatstcs Probablty Desty Fucto For a cotuos radom varable, a probablty desty fucto s a fucto such that: 0 dx a b) b a dx A probablty desty fucto provdes a smple descrpto of the

More information

Uncertainty, Data, and Judgment

Uncertainty, Data, and Judgment Ucertaty, Data, ad Judgmet Sesso 06 Structure of the Course Topc Sesso Probablty -5 Estmato 6-8 Hypothess Testg 9-10 Regresso 11-16 1 Mcrosoft AND Itel (50-50) You vest $,500 MSFT ad $,500 INTC X = Aual

More information

Functions of Random Variables

Functions of Random Variables Fuctos of Radom Varables Chapter Fve Fuctos of Radom Varables 5. Itroducto A geeral egeerg aalyss model s show Fg. 5.. The model output (respose) cotas the performaces of a system or product, such as weght,

More information

ENGI 3423 Simple Linear Regression Page 12-01

ENGI 3423 Simple Linear Regression Page 12-01 ENGI 343 mple Lear Regresso Page - mple Lear Regresso ometmes a expermet s set up where the expermeter has cotrol over the values of oe or more varables X ad measures the resultg values of aother varable

More information

Chapter 8: Statistical Analysis of Simulated Data

Chapter 8: Statistical Analysis of Simulated Data Marquette Uversty MSCS600 Chapter 8: Statstcal Aalyss of Smulated Data Dael B. Rowe, Ph.D. Departmet of Mathematcs, Statstcs, ad Computer Scece Copyrght 08 by Marquette Uversty MSCS600 Ageda 8. The Sample

More information

Chapter 4 Multiple Random Variables

Chapter 4 Multiple Random Variables Revew for the prevous lecture: Theorems ad Examples: How to obta the pmf (pdf) of U = g (, Y) ad V = g (, Y) Chapter 4 Multple Radom Varables Chapter 44 Herarchcal Models ad Mxture Dstrbutos Examples:

More information

ρ < 1 be five real numbers. The

ρ < 1 be five real numbers. The Lecture o BST 63: Statstcal Theory I Ku Zhag, /0/006 Revew for the prevous lecture Deftos: covarace, correlato Examples: How to calculate covarace ad correlato Theorems: propertes of correlato ad covarace

More information

Chapter 5 Properties of a Random Sample

Chapter 5 Properties of a Random Sample Lecture 6 o BST 63: Statstcal Theory I Ku Zhag, /0/008 Revew for the prevous lecture Cocepts: t-dstrbuto, F-dstrbuto Theorems: Dstrbutos of sample mea ad sample varace, relatoshp betwee sample mea ad sample

More information

STK4011 and STK9011 Autumn 2016

STK4011 and STK9011 Autumn 2016 STK4 ad STK9 Autum 6 Pot estmato Covers (most of the followg materal from chapter 7: Secto 7.: pages 3-3 Secto 7..: pages 3-33 Secto 7..: pages 35-3 Secto 7..3: pages 34-35 Secto 7.3.: pages 33-33 Secto

More information

22 Nonparametric Methods.

22 Nonparametric Methods. 22 oparametrc Methods. I parametrc models oe assumes apror that the dstrbutos have a specfc form wth oe or more ukow parameters ad oe tres to fd the best or atleast reasoably effcet procedures that aswer

More information

IFYMB002 Mathematics Business Appendix C Formula Booklet

IFYMB002 Mathematics Business Appendix C Formula Booklet Iteratoal Foudato Year (IFY IFYMB00 Mathematcs Busess Apped C Formula Booklet Related Documet: IFY Mathematcs Busess Syllabus 07/8 IFYMB00 Maths Busess Apped C Formula Booklet Cotets lease ote that the

More information

X ε ) = 0, or equivalently, lim

X ε ) = 0, or equivalently, lim Revew for the prevous lecture Cocepts: order statstcs Theorems: Dstrbutos of order statstcs Examples: How to get the dstrbuto of order statstcs Chapter 5 Propertes of a Radom Sample Secto 55 Covergece

More information

Variabla e rastit dhe shpërndarjet e. probabilitare

Variabla e rastit dhe shpërndarjet e. probabilitare Variabla e rastit dhe shpërndarjet probabilitare Ligjërata e pestë Variabla e rastit dhe shpërndarjet e probabilitetit Qëllimet: Pas përfundimit të ligjëratës ju duhet të jeni në gjendje që të : Definoni

More information

Mean is only appropriate for interval or ratio scales, not ordinal or nominal.

Mean is only appropriate for interval or ratio scales, not ordinal or nominal. Mea Same as ordary average Sum all the data values ad dvde by the sample sze. x = ( x + x +... + x Usg summato otato, we wrte ths as x = x = x = = ) x Mea s oly approprate for terval or rato scales, ot

More information

b. There appears to be a positive relationship between X and Y; that is, as X increases, so does Y.

b. There appears to be a positive relationship between X and Y; that is, as X increases, so does Y. .46. a. The frst varable (X) s the frst umber the par ad s plotted o the horzotal axs, whle the secod varable (Y) s the secod umber the par ad s plotted o the vertcal axs. The scatterplot s show the fgure

More information

Multivariate Transformation of Variables and Maximum Likelihood Estimation

Multivariate Transformation of Variables and Maximum Likelihood Estimation Marquette Uversty Multvarate Trasformato of Varables ad Maxmum Lkelhood Estmato Dael B. Rowe, Ph.D. Assocate Professor Departmet of Mathematcs, Statstcs, ad Computer Scece Copyrght 03 by Marquette Uversty

More information

STA302/1001-Fall 2008 Midterm Test October 21, 2008

STA302/1001-Fall 2008 Midterm Test October 21, 2008 STA3/-Fall 8 Mdterm Test October, 8 Last Name: Frst Name: Studet Number: Erolled (Crcle oe) STA3 STA INSTRUCTIONS Tme allowed: hour 45 mutes Ads allowed: A o-programmable calculator A table of values from

More information

Chapter 14 Logistic Regression Models

Chapter 14 Logistic Regression Models Chapter 4 Logstc Regresso Models I the lear regresso model X β + ε, there are two types of varables explaatory varables X, X,, X k ad study varable y These varables ca be measured o a cotuous scale as

More information

Comparison of Dual to Ratio-Cum-Product Estimators of Population Mean

Comparison of Dual to Ratio-Cum-Product Estimators of Population Mean Research Joural of Mathematcal ad Statstcal Sceces ISS 30 6047 Vol. 1(), 5-1, ovember (013) Res. J. Mathematcal ad Statstcal Sc. Comparso of Dual to Rato-Cum-Product Estmators of Populato Mea Abstract

More information

Simulation Output Analysis

Simulation Output Analysis Smulato Output Aalyss Summary Examples Parameter Estmato Sample Mea ad Varace Pot ad Iterval Estmato ermatg ad o-ermatg Smulato Mea Square Errors Example: Sgle Server Queueg System x(t) S 4 S 4 S 3 S 5

More information

Line Fitting and Regression

Line Fitting and Regression Marquette Uverst MSCS6 Le Fttg ad Regresso Dael B. Rowe, Ph.D. Professor Departmet of Mathematcs, Statstcs, ad Computer Scece Coprght 8 b Marquette Uverst Least Squares Regresso MSCS6 For LSR we have pots

More information

STATISTICAL PROPERTIES OF LEAST SQUARES ESTIMATORS. x, where. = y - ˆ " 1

STATISTICAL PROPERTIES OF LEAST SQUARES ESTIMATORS. x, where. = y - ˆ  1 STATISTICAL PROPERTIES OF LEAST SQUARES ESTIMATORS Recall Assumpto E(Y x) η 0 + η x (lear codtoal mea fucto) Data (x, y ), (x 2, y 2 ),, (x, y ) Least squares estmator ˆ E (Y x) ˆ " 0 + ˆ " x, where ˆ

More information

Special Instructions / Useful Data

Special Instructions / Useful Data JAM 6 Set of all real umbers P A..d. B, p Posso Specal Istructos / Useful Data x,, :,,, x x Probablty of a evet A Idepedetly ad detcally dstrbuted Bomal dstrbuto wth parameters ad p Posso dstrbuto wth

More information

Simple Linear Regression

Simple Linear Regression Statstcal Methods I (EST 75) Page 139 Smple Lear Regresso Smple regresso applcatos are used to ft a model descrbg a lear relatoshp betwee two varables. The aspects of least squares regresso ad correlato

More information

ENGI 4421 Joint Probability Distributions Page Joint Probability Distributions [Navidi sections 2.5 and 2.6; Devore sections

ENGI 4421 Joint Probability Distributions Page Joint Probability Distributions [Navidi sections 2.5 and 2.6; Devore sections ENGI 441 Jot Probablty Dstrbutos Page 7-01 Jot Probablty Dstrbutos [Navd sectos.5 ad.6; Devore sectos 5.1-5.] The jot probablty mass fucto of two dscrete radom quattes, s, P ad p x y x y The margal probablty

More information

Statistics MINITAB - Lab 5

Statistics MINITAB - Lab 5 Statstcs 10010 MINITAB - Lab 5 PART I: The Correlato Coeffcet Qute ofte statstcs we are preseted wth data that suggests that a lear relatoshp exsts betwee two varables. For example the plot below s of

More information

Qualifying Exam Statistical Theory Problem Solutions August 2005

Qualifying Exam Statistical Theory Problem Solutions August 2005 Qualfyg Exam Statstcal Theory Problem Solutos August 5. Let X, X,..., X be d uform U(,),

More information

Linear Regression with One Regressor

Linear Regression with One Regressor Lear Regresso wth Oe Regressor AIM QA.7. Expla how regresso aalyss ecoometrcs measures the relatoshp betwee depedet ad depedet varables. A regresso aalyss has the goal of measurg how chages oe varable,

More information

Probability and. Lecture 13: and Correlation

Probability and. Lecture 13: and Correlation 933 Probablty ad Statstcs for Software ad Kowledge Egeers Lecture 3: Smple Lear Regresso ad Correlato Mocha Soptkamo, Ph.D. Outle The Smple Lear Regresso Model (.) Fttg the Regresso Le (.) The Aalyss of

More information

residual. (Note that usually in descriptions of regression analysis, upper-case

residual. (Note that usually in descriptions of regression analysis, upper-case Regresso Aalyss Regresso aalyss fts or derves a model that descres the varato of a respose (or depedet ) varale as a fucto of oe or more predctor (or depedet ) varales. The geeral regresso model s oe of

More information

best estimate (mean) for X uncertainty or error in the measurement (systematic, random or statistical) best

best estimate (mean) for X uncertainty or error in the measurement (systematic, random or statistical) best Error Aalyss Preamble Wheever a measuremet s made, the result followg from that measuremet s always subject to ucertaty The ucertaty ca be reduced by makg several measuremets of the same quatty or by mprovg

More information

CHAPTER VI Statistical Analysis of Experimental Data

CHAPTER VI Statistical Analysis of Experimental Data Chapter VI Statstcal Aalyss of Expermetal Data CHAPTER VI Statstcal Aalyss of Expermetal Data Measuremets do ot lead to a uque value. Ths s a result of the multtude of errors (maly radom errors) that ca

More information

Multiple Choice Test. Chapter Adequacy of Models for Regression

Multiple Choice Test. Chapter Adequacy of Models for Regression Multple Choce Test Chapter 06.0 Adequac of Models for Regresso. For a lear regresso model to be cosdered adequate, the percetage of scaled resduals that eed to be the rage [-,] s greater tha or equal to

More information

BASIC PRINCIPLES OF STATISTICS

BASIC PRINCIPLES OF STATISTICS BASIC PRINCIPLES OF STATISTICS PROBABILITY DENSITY DISTRIBUTIONS DISCRETE VARIABLES BINOMIAL DISTRIBUTION ~ B 0 0 umber of successes trals Pr E [ ] Var[ ] ; BINOMIAL DISTRIBUTION B7 0. B30 0.3 B50 0.5

More information

Chapter 13 Student Lecture Notes 13-1

Chapter 13 Student Lecture Notes 13-1 Chapter 3 Studet Lecture Notes 3- Basc Busess Statstcs (9 th Edto) Chapter 3 Smple Lear Regresso 4 Pretce-Hall, Ic. Chap 3- Chapter Topcs Types of Regresso Models Determg the Smple Lear Regresso Equato

More information

Example: Multiple linear regression. Least squares regression. Repetition: Simple linear regression. Tron Anders Moger

Example: Multiple linear regression. Least squares regression. Repetition: Simple linear regression. Tron Anders Moger Example: Multple lear regresso 5000,00 4000,00 Tro Aders Moger 0.0.007 brthweght 3000,00 000,00 000,00 0,00 50,00 00,00 50,00 00,00 50,00 weght pouds Repetto: Smple lear regresso We defe a model Y = β0

More information

Lecture Notes Types of economic variables

Lecture Notes Types of economic variables Lecture Notes 3 1. Types of ecoomc varables () Cotuous varable takes o a cotuum the sample space, such as all pots o a le or all real umbers Example: GDP, Polluto cocetrato, etc. () Dscrete varables fte

More information

Objectives of Multiple Regression

Objectives of Multiple Regression Obectves of Multple Regresso Establsh the lear equato that best predcts values of a depedet varable Y usg more tha oe eplaator varable from a large set of potetal predctors {,,... k }. Fd that subset of

More information

ESS Line Fitting

ESS Line Fitting ESS 5 014 17. Le Fttg A very commo problem data aalyss s lookg for relatoshpetwee dfferet parameters ad fttg les or surfaces to data. The smplest example s fttg a straght le ad we wll dscuss that here

More information

: At least two means differ SST

: At least two means differ SST Formula Card for Eam 3 STA33 ANOVA F-Test: Completely Radomzed Desg ( total umber of observatos, k = Number of treatmets,& T = total for treatmet ) Step : Epress the Clam Step : The ypotheses: :... 0 A

More information

Bayes Estimator for Exponential Distribution with Extension of Jeffery Prior Information

Bayes Estimator for Exponential Distribution with Extension of Jeffery Prior Information Malaysa Joural of Mathematcal Sceces (): 97- (9) Bayes Estmator for Expoetal Dstrbuto wth Exteso of Jeffery Pror Iformato Hadeel Salm Al-Kutub ad Noor Akma Ibrahm Isttute for Mathematcal Research, Uverst

More information

Comparing Different Estimators of three Parameters for Transmuted Weibull Distribution

Comparing Different Estimators of three Parameters for Transmuted Weibull Distribution Global Joural of Pure ad Appled Mathematcs. ISSN 0973-768 Volume 3, Number 9 (207), pp. 55-528 Research Ida Publcatos http://www.rpublcato.com Comparg Dfferet Estmators of three Parameters for Trasmuted

More information

Faculty Research Interest Seminar Department of Biostatistics, GSPH University of Pittsburgh. Gong Tang Feb. 18, 2005

Faculty Research Interest Seminar Department of Biostatistics, GSPH University of Pittsburgh. Gong Tang Feb. 18, 2005 Faculty Research Iterest Semar Departmet of Bostatstcs, GSPH Uversty of Pttsburgh Gog ag Feb. 8, 25 Itroducto Joed the departmet 2. each two courses: Elemets of Stochastc Processes (Bostat 24). Aalyss

More information

A New Family of Transformations for Lifetime Data

A New Family of Transformations for Lifetime Data Proceedgs of the World Cogress o Egeerg 4 Vol I, WCE 4, July - 4, 4, Lodo, U.K. A New Famly of Trasformatos for Lfetme Data Lakhaa Watthaacheewakul Abstract A famly of trasformatos s the oe of several

More information

X X X E[ ] E X E X. is the ()m n where the ( i,)th. j element is the mean of the ( i,)th., then

X X X E[ ] E X E X. is the ()m n where the ( i,)th. j element is the mean of the ( i,)th., then Secto 5 Vectors of Radom Varables Whe workg wth several radom varables,,..., to arrage them vector form x, t s ofte coveet We ca the make use of matrx algebra to help us orgaze ad mapulate large umbers

More information

Lecture 3. Sampling, sampling distributions, and parameter estimation

Lecture 3. Sampling, sampling distributions, and parameter estimation Lecture 3 Samplg, samplg dstrbutos, ad parameter estmato Samplg Defto Populato s defed as the collecto of all the possble observatos of terest. The collecto of observatos we take from the populato s called

More information

Ordinary Least Squares Regression. Simple Regression. Algebra and Assumptions.

Ordinary Least Squares Regression. Simple Regression. Algebra and Assumptions. Ordary Least Squares egresso. Smple egresso. Algebra ad Assumptos. I ths part of the course we are gog to study a techque for aalysg the lear relatoshp betwee two varables Y ad X. We have pars of observatos

More information

hp calculators HP 30S Statistics Averages and Standard Deviations Average and Standard Deviation Practice Finding Averages and Standard Deviations

hp calculators HP 30S Statistics Averages and Standard Deviations Average and Standard Deviation Practice Finding Averages and Standard Deviations HP 30S Statstcs Averages ad Stadard Devatos Average ad Stadard Devato Practce Fdg Averages ad Stadard Devatos HP 30S Statstcs Averages ad Stadard Devatos Average ad stadard devato The HP 30S provdes several

More information

Bias Correction in Estimation of the Population Correlation Coefficient

Bias Correction in Estimation of the Population Correlation Coefficient Kasetsart J. (Nat. Sc.) 47 : 453-459 (3) Bas Correcto Estmato of the opulato Correlato Coeffcet Juthaphor Ssomboothog ABSTRACT A estmator of the populato correlato coeffcet of two varables for a bvarate

More information

STK3100 and STK4100 Autumn 2017

STK3100 and STK4100 Autumn 2017 SK3 ad SK4 Autum 7 Geeralzed lear models Part III Covers the followg materal from chaters 4 ad 5: Sectos 4..5, 4.3.5, 4.3.6, 4.4., 4.4., ad 4.4.3 Sectos 5.., 5.., ad 5.5. Ørulf Borga Deartmet of Mathematcs

More information

Estimation of Stress- Strength Reliability model using finite mixture of exponential distributions

Estimation of Stress- Strength Reliability model using finite mixture of exponential distributions Iteratoal Joural of Computatoal Egeerg Research Vol, 0 Issue, Estmato of Stress- Stregth Relablty model usg fte mxture of expoetal dstrbutos K.Sadhya, T.S.Umamaheswar Departmet of Mathematcs, Lal Bhadur

More information

9 U-STATISTICS. Eh =(m!) 1 Eh(X (1),..., X (m ) ) i.i.d

9 U-STATISTICS. Eh =(m!) 1 Eh(X (1),..., X (m ) ) i.i.d 9 U-STATISTICS Suppose,,..., are P P..d. wth CDF F. Our goal s to estmate the expectato t (P)=Eh(,,..., m ). Note that ths expectato requres more tha oe cotrast to E, E, or Eh( ). Oe example s E or P((,

More information

Some Applications of the Resampling Methods in Computational Physics

Some Applications of the Resampling Methods in Computational Physics Iteratoal Joural of Mathematcs Treds ad Techoloy Volume 6 February 04 Some Applcatos of the Resampl Methods Computatoal Physcs Sotraq Marko #, Lorec Ekoom * # Physcs Departmet, Uversty of Korca, Albaa,

More information

Mathematics HL and Further mathematics HL Formula booklet

Mathematics HL and Further mathematics HL Formula booklet Dploma Programme Mathematcs HL ad Further mathematcs HL Formula booklet For use durg the course ad the eamatos Frst eamatos 04 Mathematcal Iteratoal Baccalaureate studes SL: Formula Orgazato booklet 0

More information

Point Estimation: definition of estimators

Point Estimation: definition of estimators Pot Estmato: defto of estmators Pot estmator: ay fucto W (X,..., X ) of a data sample. The exercse of pot estmato s to use partcular fuctos of the data order to estmate certa ukow populato parameters.

More information

( ) = ( ) ( ) Chapter 13 Asymptotic Theory and Stochastic Regressors. Stochastic regressors model

( ) = ( ) ( ) Chapter 13 Asymptotic Theory and Stochastic Regressors. Stochastic regressors model Chapter 3 Asmptotc Theor ad Stochastc Regressors The ature of eplaator varable s assumed to be o-stochastc or fed repeated samples a regresso aalss Such a assumpto s approprate for those epermets whch

More information

Random Variate Generation ENM 307 SIMULATION. Anadolu Üniversitesi, Endüstri Mühendisliği Bölümü. Yrd. Doç. Dr. Gürkan ÖZTÜRK.

Random Variate Generation ENM 307 SIMULATION. Anadolu Üniversitesi, Endüstri Mühendisliği Bölümü. Yrd. Doç. Dr. Gürkan ÖZTÜRK. adom Varate Geerato ENM 307 SIMULATION Aadolu Üverstes, Edüstr Mühedslğ Bölümü Yrd. Doç. Dr. Gürka ÖZTÜK 0 adom Varate Geerato adom varate geerato s about procedures for samplg from a varety of wdely-used

More information

1. The weight of six Golden Retrievers is 66, 61, 70, 67, 92 and 66 pounds. The weight of six Labrador Retrievers is 54, 60, 72, 78, 84 and 67.

1. The weight of six Golden Retrievers is 66, 61, 70, 67, 92 and 66 pounds. The weight of six Labrador Retrievers is 54, 60, 72, 78, 84 and 67. Ecoomcs 3 Itroducto to Ecoometrcs Sprg 004 Professor Dobk Name Studet ID Frst Mdterm Exam You must aswer all the questos. The exam s closed book ad closed otes. You may use your calculators but please

More information

12.2 Estimating Model parameters Assumptions: ox and y are related according to the simple linear regression model

12.2 Estimating Model parameters Assumptions: ox and y are related according to the simple linear regression model 1. Estmatg Model parameters Assumptos: ox ad y are related accordg to the smple lear regresso model (The lear regresso model s the model that says that x ad y are related a lear fasho, but the observed

More information

STK3100 and STK4100 Autumn 2018

STK3100 and STK4100 Autumn 2018 SK3 ad SK4 Autum 8 Geeralzed lear models Part III Covers the followg materal from chaters 4 ad 5: Cofdece tervals by vertg tests Cosder a model wth a sgle arameter β We may obta a ( α% cofdece terval for

More information

Analysis of Variance with Weibull Data

Analysis of Variance with Weibull Data Aalyss of Varace wth Webull Data Lahaa Watthaacheewaul Abstract I statstcal data aalyss by aalyss of varace, the usual basc assumptos are that the model s addtve ad the errors are radomly, depedetly, ad

More information

Arithmetic Mean Suppose there is only a finite number N of items in the system of interest. Then the population arithmetic mean is

Arithmetic Mean Suppose there is only a finite number N of items in the system of interest. Then the population arithmetic mean is Topc : Probablty Theory Module : Descrptve Statstcs Measures of Locato Descrptve statstcs are measures of locato ad shape that perta to probablty dstrbutos The prmary measures of locato are the arthmetc

More information

2SLS Estimates ECON In this case, begin with the assumption that E[ i

2SLS Estimates ECON In this case, begin with the assumption that E[ i SLS Estmates ECON 3033 Bll Evas Fall 05 Two-Stage Least Squares (SLS Cosder a stadard lear bvarate regresso model y 0 x. I ths case, beg wth the assumto that E[ x] 0 whch meas that OLS estmates of wll

More information

Simple Linear Regression and Correlation. Applied Statistics and Probability for Engineers. Chapter 11 Simple Linear Regression and Correlation

Simple Linear Regression and Correlation. Applied Statistics and Probability for Engineers. Chapter 11 Simple Linear Regression and Correlation 4//6 Appled Statstcs ad Probablty for Egeers Sth Edto Douglas C. Motgomery George C. Ruger Chapter Smple Lear Regresso ad Correlato CHAPTER OUTLINE Smple Lear Regresso ad Correlato - Emprcal Models -8

More information

Lecture 1 Review of Fundamental Statistical Concepts

Lecture 1 Review of Fundamental Statistical Concepts Lecture Revew of Fudametal Statstcal Cocepts Measures of Cetral Tedecy ad Dsperso A word about otato for ths class: Idvduals a populato are desgated, where the dex rages from to N, ad N s the total umber

More information

Part 4b Asymptotic Results for MRR2 using PRESS. Recall that the PRESS statistic is a special type of cross validation procedure (see Allen (1971))

Part 4b Asymptotic Results for MRR2 using PRESS. Recall that the PRESS statistic is a special type of cross validation procedure (see Allen (1971)) art 4b Asymptotc Results for MRR usg RESS Recall that the RESS statstc s a specal type of cross valdato procedure (see Alle (97)) partcular to the regresso problem ad volves fdg Y $,, the estmate at the

More information

THE ROYAL STATISTICAL SOCIETY GRADUATE DIPLOMA

THE ROYAL STATISTICAL SOCIETY GRADUATE DIPLOMA THE ROYAL STATISTICAL SOCIETY 3 EXAMINATIONS SOLUTIONS GRADUATE DIPLOMA PAPER I STATISTICAL THEORY & METHODS The Socety provdes these solutos to assst caddates preparg for the examatos future years ad

More information

Dr. Shalabh. Indian Institute of Technology Kanpur

Dr. Shalabh. Indian Institute of Technology Kanpur Aalyss of Varace ad Desg of Expermets-I MODULE -I LECTURE - SOME RESULTS ON LINEAR ALGEBRA, MATRIX THEORY AND DISTRIBUTIONS Dr. Shalabh Departmet t of Mathematcs t ad Statstcs t t Ida Isttute of Techology

More information

Law of Large Numbers

Law of Large Numbers Toss a co tmes. Law of Large Numbers Suppose 0 f f th th toss came up H toss came up T s are Beroull radom varables wth p ½ ad E( ) ½. The proporto of heads s. Itutvely approaches ½ as. week 2 Markov s

More information

NUMERICAL SOLUTION FOR A WAVE EQUATION WITH BOUNDARY DAMPING

NUMERICAL SOLUTION FOR A WAVE EQUATION WITH BOUNDARY DAMPING NUMERICAL SOLUTION FOR A WAVE EQUATION WITH BOUNDARY DAMPING M.Sc. Ardian NAÇO, Prof. Lulëzim HANELLI *, M.Sc. Bendise HUTI Departamenti i Matematikës, Universiteti Politeknik, Tiranë SHQIPERI E-mail:

More information

Parameter, Statistic and Random Samples

Parameter, Statistic and Random Samples Parameter, Statstc ad Radom Samples A parameter s a umber that descrbes the populato. It s a fxed umber, but practce we do ot kow ts value. A statstc s a fucto of the sample data,.e., t s a quatty whose

More information

Simple Linear Regression and Correlation.

Simple Linear Regression and Correlation. Smple Lear Regresso ad Correlato. Correspods to Chapter 0 Tamhae ad Dulop Sldes prepared b Elzabeth Newto (MIT) wth some sldes b Jacquele Telford (Johs Hopks Uverst) Smple lear regresso aalss estmates

More information

Maximum Likelihood Estimation

Maximum Likelihood Estimation Marquette Uverst Maxmum Lkelhood Estmato Dael B. Rowe, Ph.D. Professor Departmet of Mathematcs, Statstcs, ad Computer Scece Coprght 08 b Marquette Uverst Maxmum Lkelhood Estmato We have bee sag that ~

More information

Lecture 2: The Simple Regression Model

Lecture 2: The Simple Regression Model Lectre Notes o Advaced coometrcs Lectre : The Smple Regresso Model Takash Yamao Fall Semester 5 I ths lectre we revew the smple bvarate lear regresso model. We focs o statstcal assmptos to obta based estmators.

More information

1 Solution to Problem 6.40

1 Solution to Problem 6.40 1 Soluto to Problem 6.40 (a We wll wrte T τ (X 1,...,X where the X s are..d. wth PDF f(x µ, σ 1 ( x µ σ g, σ where the locato parameter µ s ay real umber ad the scale parameter σ s > 0. Lettg Z X µ σ we

More information

{ }{ ( )} (, ) = ( ) ( ) ( ) Chapter 14 Exercises in Sampling Theory. Exercise 1 (Simple random sampling): Solution:

{ }{ ( )} (, ) = ( ) ( ) ( ) Chapter 14 Exercises in Sampling Theory. Exercise 1 (Simple random sampling): Solution: Chapter 4 Exercses Samplg Theory Exercse (Smple radom samplg: Let there be two correlated radom varables X ad A sample of sze s draw from a populato by smple radom samplg wthout replacemet The observed

More information

Continuous Distributions

Continuous Distributions 7//3 Cotuous Dstrbutos Radom Varables of the Cotuous Type Desty Curve Percet Desty fucto, f (x) A smooth curve that ft the dstrbuto 3 4 5 6 7 8 9 Test scores Desty Curve Percet Probablty Desty Fucto, f

More information

Chapter 4 Multiple Random Variables

Chapter 4 Multiple Random Variables Revew o BST 63: Statstcal Theory I Ku Zhag, /0/008 Revew for Chapter 4-5 Notes: Although all deftos ad theorems troduced our lectures ad ths ote are mportat ad you should be famlar wth, but I put those

More information

Econometrics. 3) Statistical properties of the OLS estimator

Econometrics. 3) Statistical properties of the OLS estimator 30C0000 Ecoometrcs 3) Statstcal propertes of the OLS estmator Tmo Kuosmae Professor, Ph.D. http://omepre.et/dex.php/tmokuosmae Today s topcs Whch assumptos are eeded for OLS to work? Statstcal propertes

More information

Lecture 3 Probability review (cont d)

Lecture 3 Probability review (cont d) STATS 00: Itroducto to Statstcal Iferece Autum 06 Lecture 3 Probablty revew (cot d) 3. Jot dstrbutos If radom varables X,..., X k are depedet, the ther dstrbuto may be specfed by specfyg the dvdual dstrbuto

More information

ECON 5360 Class Notes GMM

ECON 5360 Class Notes GMM ECON 560 Class Notes GMM Geeralzed Method of Momets (GMM) I beg by outlg the classcal method of momets techque (Fsher, 95) ad the proceed to geeralzed method of momets (Hase, 98).. radtoal Method of Momets

More information

BAYESIAN INFERENCES FOR TWO PARAMETER WEIBULL DISTRIBUTION

BAYESIAN INFERENCES FOR TWO PARAMETER WEIBULL DISTRIBUTION Iteratoal Joural of Mathematcs ad Statstcs Studes Vol.4, No.3, pp.5-39, Jue 06 Publshed by Europea Cetre for Research Trag ad Developmet UK (www.eajourals.org BAYESIAN INFERENCES FOR TWO PARAMETER WEIBULL

More information

Sampling Theory MODULE X LECTURE - 35 TWO STAGE SAMPLING (SUB SAMPLING)

Sampling Theory MODULE X LECTURE - 35 TWO STAGE SAMPLING (SUB SAMPLING) Samplg Theory ODULE X LECTURE - 35 TWO STAGE SAPLIG (SUB SAPLIG) DR SHALABH DEPARTET OF ATHEATICS AD STATISTICS IDIA ISTITUTE OF TECHOLOG KAPUR Two stage samplg wth uequal frst stage uts: Cosder two stage

More information

Construction and Evaluation of Actuarial Models. Rajapaksha Premarathna

Construction and Evaluation of Actuarial Models. Rajapaksha Premarathna Costructo ad Evaluato of Actuaral Models Raapaksha Premaratha Table of Cotets Modelg Some deftos ad Notatos...4 Case : Polcy Lmtu...4 Case : Wth a Ordary deductble....5 Case 3: Maxmum Covered loss u wth

More information

UNIVERSITETI I PRISHTINËS FAKULTETI I INXHINIERISË MEKANIKE PUNIM DIPLOME (STUDIMET MASTER)

UNIVERSITETI I PRISHTINËS FAKULTETI I INXHINIERISË MEKANIKE PUNIM DIPLOME (STUDIMET MASTER) UNIVERSITETI I PRISHTINËS FAKULTETI I INXHINIERISË MEKANIKE PUNIM DIPLOME (STUDIMET MASTER) TEMA: ANALIZA E FAKTORËVE QË NDIKOJNË NË OPTIMIZIMIN E TRANSMETUESVE ME DHËMBËZORË Kandidati: Inxh. Bch. Riad

More information

Lecture 02: Bounding tail distributions of a random variable

Lecture 02: Bounding tail distributions of a random variable CSCI-B609: A Theorst s Toolkt, Fall 206 Aug 25 Lecture 02: Boudg tal dstrbutos of a radom varable Lecturer: Yua Zhou Scrbe: Yua Xe & Yua Zhou Let us cosder the ubased co flps aga. I.e. let the outcome

More information

Midterm Exam 1, section 1 (Solution) Thursday, February hour, 15 minutes

Midterm Exam 1, section 1 (Solution) Thursday, February hour, 15 minutes coometrcs, CON Sa Fracsco State Uversty Mchael Bar Sprg 5 Mdterm am, secto Soluto Thursday, February 6 hour, 5 mutes Name: Istructos. Ths s closed book, closed otes eam.. No calculators of ay kd are allowed..

More information

The expected value of a sum of random variables,, is the sum of the expected values:

The expected value of a sum of random variables,, is the sum of the expected values: Sums of Radom Varables xpected Values ad Varaces of Sums ad Averages of Radom Varables The expected value of a sum of radom varables, say S, s the sum of the expected values: ( ) ( ) S Ths s always true

More information

4. Standard Regression Model and Spatial Dependence Tests

4. Standard Regression Model and Spatial Dependence Tests 4. Stadard Regresso Model ad Spatal Depedece Tests Stadard regresso aalss fals the presece of spatal effects. I case of spatal depedeces ad/or spatal heterogeet a stadard regresso model wll be msspecfed.

More information

Chapter -2 Simple Random Sampling

Chapter -2 Simple Random Sampling Chapter - Smple Radom Samplg Smple radom samplg (SRS) s a method of selecto of a sample comprsg of umber of samplg uts out of the populato havg umber of samplg uts such that every samplg ut has a equal

More information