Strojno učenje 7 Linearne metode & SVM. Tomislav Šmuc

Similar documents
Strojno učenje. Metoda potpornih vektora (SVM Support Vector Machines) Tomislav Šmuc

Strojno učenje. Metoda potpornih vektora (SVM Support Vector Machines) Tomislav Šmuc

KLASIFIKACIJA NAIVNI BAJES. NIKOLA MILIKIĆ URL:

EKSPERIMENTALNA EVALUACIJA UTJECAJA ODABIRA ZNAČAJKI NA REZULTATE RASPOZNAVANJA PROMETNIH ZNAKOVA

Heuristika i generalizacija Heronove formule u dva smjera

DETEKCIJA I RASPOZNAVANJE PROMETNIH ZNAKOVA U VIDEO SNIMCI

Fajl koji je korišćen može se naći na

PRIPADNOST RJEŠENJA KVADRATNE JEDNAČINE DANOM INTERVALU

Upravljački prometni sustavi

FIZIKALNA KOZMOLOGIJA VII. VRLO RANI SVEMIR & INFLACIJA

Support Vector Machines. Vibhav Gogate The University of Texas at dallas

Support Vector Machines

Projektovanje paralelnih algoritama II

Lecture 11 SVM cont

Lecture 3: Dual problems and Kernels

Which Separator? Spring 1

O homomorfizam-homogenim geometrijama ranga 2

An introduction to Support Vector Machine

Linear, threshold units. Linear Discriminant Functions and Support Vector Machines. Biometrics CSE 190 Lecture 11. X i : inputs W i : weights

Chapter 6 Support vector machine. Séparateurs à vaste marge

Support Vector Machines

Rješavanje simultanih jednadžbi kao ekonometrijskog modela pomoću programskog paketa EViews

1. Kolokvij - DODATAK

Safet Penjić, mr sc Filozofski fakultet u Zenici

Perceptron Revisited: Linear Separators. Support Vector Machines

SVEUČILIŠTE U ZAGREBU FAKULTET STROJARSTVA I BRODOGRADNJE

SUPPORT VECTOR MACHINE

TEORIJA SKUPOVA Zadaci

Kernel Methods and SVMs Extension

Support Vector Machines

Support Vector Machines II. CAP 5610: Machine Learning Instructor: Guo-Jun QI

ZANIMLJIV NAČIN IZRAČUNAVANJA NEKIH GRANIČNIH VRIJEDNOSTI FUNKCIJA. Šefket Arslanagić, Sarajevo, BiH

Natural Language Processing and Information Retrieval

Linear Classification, SVMs and Nearest Neighbors

CS 3710: Visual Recognition Classification and Detection. Adriana Kovashka Department of Computer Science January 13, 2015

Advanced Machine Learning & Perception

TEORIJE IZBORA U UVJETIMA NEIZVJESNOSTI

Miroslav Josipović. Množenje vektora i struktura 3D euklidskog prostora

Umjetne neuronske mreže

CHAPTER 10: LINEAR DISCRIMINATION

Ekonometrija 6. Ekonometrija, Osnovne studije. Predavač: Aleksandra Nojković

Geometrijski smisao rješenja sustava od tri linearne jednadžbe s tri nepoznanice

ZEYNEP CAN. 1 Introduction. KoG Z. Can, Ö. Gelişgen, R. Kaya: On the Metrics Induced by Icosidodecahedron...

CROSS ENTROPY METHOD FOR MULTICLASS SUPPORT VECTOR MACHINE

Algoritam za množenje ulančanih matrica. Alen Kosanović Prirodoslovno-matematički fakultet Matematički odsjek

Bayes rule for a classification problem INF Discriminant functions for the normal density. Euclidean distance. Mahalanobis distance

CS145: INTRODUCTION TO DATA MINING

A L A BA M A L A W R E V IE W

Image classification. Given the bag-of-features representations of images from different classes, how do we learn a model for distinguishing i them?

CS434a/541a: Pattern Recognition Prof. Olga Veksler. Lecture 4

Machine Learning. What is a good Decision Boundary? Support Vector Machines

Kristin P. Bennett. Rensselaer Polytechnic Institute

24. Balkanska matematiqka olimpijada

C o r p o r a t e l i f e i n A n c i e n t I n d i a e x p r e s s e d i t s e l f

Scripture quotations marked cev are from the Contemporary English Version, Copyright 1991, 1992, 1995 by American Bible Society. Used by permission.

Support Vector Machines

NAPREDNI FIZIČKI PRAKTIKUM 1 studij Matematika i fizika; smjer nastavnički MJERENJE MALIH OTPORA

Strojno učenje 3 (II dio) Struktura metoda/algoritama strojnog učenja. Tomislav Šmuc

Red veze za benzen. Slika 1.

( ) [ ] MAP Decision Rule

Osobine metode rezolucije: zaustavlja se, pouzdanost i kompletnost. Iskazna logika 4

Uvod u planiranje i analizu pokusa

Support Vector Machines

Funkcijske jednadºbe

Introduction to Boosting

Support Vector Machine & Its Applications

SVMs: Duality and Kernel Trick. SVMs as quadratic programs

Intro to Visual Recognition

Zoran Popović ORIGINALNI NAUČNI RADOVI / SCIENTIFIC PAPERS. Klasifikacija prema JEL: D50, D52, C60, E25

Uvod u relacione baze podataka

Slika 1. Slika 2. Da ne bismo stalno izbacivali elemente iz skupa, mi ćemo napraviti još jedan niz markirano, gde će

Strojno učenje 3 (I dio) Evaluacija modela. Tomislav Šmuc

SPH SIMULACIJA POISEULLEOVOG STRUJANJA PRI NISKIM REYNOLDSOVIM BROJEVIMA

Mathcad sa algoritmima

Decepcijski i teški optimizacijski problemi za genetske algoritme

Karakterizacija problema zadovoljenja uslova širine 1

FACIAL IMAGE FEATURE EXTRACTION USING SUPPORT VECTOR MACHINES

Umjetne neuronske mreže

Clustering (Bishop ch 9)

Ksenija Doroslovački KOMBINATORIKA INTERPRETIRANA FUNKCIJAMA I NJIHOVIM OSOBINAMA MASTER RAD. NOVI SAD jun 2008

Zadatci sa ciklusima. Zadatak1: Sastaviti progra koji određuje z ir prvih prirod ih rojeva.

Recap: the SVM problem

17 Support Vector Machines

Sveučilište J. J. Strossmayera u Osijeku Odjel za matematiku DIOFANTSKE JEDNADŽBE

CS249: ADVANCED DATA MINING

Iskazna logika 1. Matematička logika u računarstvu. oktobar 2012

Neke klase maksimalnih hiperklonova

ANALYSIS OF THE RELIABILITY OF THE "ALTERNATOR- ALTERNATOR BELT" SYSTEM

Regularized Multiple-Criteria Linear Programming Via Second Order Cone Programming Formulations

1 Konveksni skupovi i konveksne funkcije

Uvod u analizu (M3-02) 05., 07. i 12. XI dr Nenad Teofanov. principle) ili Dirihleov princip (engl. Dirichlet box principle).

Software Process Models there are many process model s in th e li t e ra t u re, s om e a r e prescriptions and some are descriptions you need to mode

AIR CURTAINS VAZDU[NE ZAVESE V H

APPLICATION OF THOMAS-FERMI MODEL TO FULLERENE MOLECULE AND NANOTUBE UDC 547. Yuri Kornyushin

SVM Tutorial: Classification, Regression, and Ranking

Pattern Classification (III) & Pattern Verification

Cyclical Surfaces Created by a Conical Helix

O aksiomu izbora, cipelama i čarapama

Discriminative classifier: Logistic Regression. CS534-Machine Learning

Transcription:

Srojno učenje 7 Lnearne meode & Tomslav Šmuc

Leraura Lnearne meode The Elemens of Sascal Learnng Hase, Tbshran, Fredman s ed - ch. 4 The Elemens of Sascal Learnng Hase, Tbshran, Fredman s ed - ch. A Tuoral on Suppor Vecor Machnes for Paern Recognon 998 Chrsopher J. C. Burges A User's Gude o Suppor Vecor Machnes, Ben-Hur & Weson T. Joachms, Learnng o Classfy Te usng Suppor Vecor Machnes. Kluer, 00. Classc Reuers daa se: hp://.davddles.com /resources /escollecons/reuers578/ Sofare: hp://.kernel-machnes.org/ 7-Apr- TS: Srojno učenje Lnearne meode &

Generavn dskrmnavn model Dskrmnavn Generavn Učenje lnje koja razdvaja klase Učenje modela za svaku pojednu klasu TS: Srojno učenje Lnearne meode & 7-Apr- 3

Dskrmnavna funkcje C Granca zmeđu klasa d.funkcja C TS: Srojno učenje Lnearne meode & 7-Apr- 4

Lnearne dskrmnavne meode Fsherova lnearna dskrmnanna meoda Skup N d-dmenzonalnh prmjera,, 3,..., N očaka N broj prmjera u podskupu D klase y N broj prmjera u podskupu D klase y Tražmo lnearnu funkcju od.j. : y= Koja najbolje razdvaja dvje klase. TS: Srojno učenje Lnearne meode & 7-Apr- 5

Fsherova lnearna dskrmnavna meoda Osnovna deja nać projekcju na lnju u d- dmenzonalnnom prosoru ako da se prmjerc razlčh klasa mogu na nkjoj lako odvoj loša projekcja dobra projekcja 7-Apr- TS: Srojno učenje Lnearne meode & 6

Fsherova lnearna dskrmnavna meoda Neke velčne: N D Srednja vrjednos u d-dmenzonalnom prosoru za klasu N yy y N D Srednja vrjednos za očke klase projcrane na Udaljenos zmeđu projcranh srednjh vrjednos za dvje klase 7-Apr- TS: Srojno učenje Lnearne meode & 7

Fsherova lnearna dskrmnavna meoda Kolko je dobra mjera separacje? Koja od os je bolja za razdvajanje klasa, l? 7-Apr- TS: Srojno učenje Lnearne meode & 8

Fsherova lnearna dskrmnavna meoda Kolko je dobra mjera separacje? je bolja, no: problem je šo ne uzma u obzr varjancu dsrbucje prmjera. 7-Apr- TS: Srojno učenje Lnearne meode & 9

Fsherova lnearna dskrmnanna meoda Ako defnramo: y projcran prmjer ~ s s y Cl y Cl y y raspršenje prmjera klase raspršenje prmjera klase Možemo raspršenje kors za normalzacju udaljenos projcranh cenara zmeđu klasa! 7-Apr- TS: Srojno učenje Lnearne meode & 0

Fsherova lnearna dskrmnanvna meoda Moramo normalzra korseć raspršenje klase klase! FLD dakle svod se na pronalaženje projekcje na lnju koja maksmzra J: J ~ s ~ s želmo da brojnk bude šo već a nazvnk šo manj! 7-Apr- TS: Srojno učenje Lnearne meode &

Fsherova lnearna dskrmnanvna meoda 7-Apr- TS: Srojno učenje Lnearne meode & Kako zraz J kao funkcju rad se zapravo o opmzacj J, - u ovsnos o! Treba eksplcno prkaza J u ovsnos o! Defnramo marce raspršenja za svaku klasu prje projekcje - za orgnalne prmjere ~ ~ s s J Cl Cl S S

Fsherova lnearna dskrmnanvna meoda 7-Apr- 3 TS: Srojno učenje Lnearne meode & ~ S S S Cl y W y y s Defnramo marcu raspršenja unuar klasa za svaku klasu Uz prehodnu defncju I ako korsmo: Dobvamo: S ~ Cl y Cl y Cl y Cl y s

Fsherova lnearna dskrmnanvna meoda 7-Apr- 4 TS: Srojno učenje Lnearne meode & S S S S S S B B s s s ~ ~ ~ W Slčno kao za klasu Dakle Ako defnramo marcu raspršenja zmeđu klasa S B kao mjeru separacje zmeđu srednjh vrjednos zmeđu klasa prje projekcje A razlka zmeđu projcranh srednjh vrjednos je:

Fsherova lnearna dskrmnanvna meoda Na kraju je naša funkcja clja J ~ ~ s s S S Da b je opmral, našl mamum prva dervacja po se mora zjednač s nulom d J 0 d Na koncu se o svede na problem određvanja svojsvenh vrjednos B W S B S W 7-Apr- TS: Srojno učenje Lnearne meode & 5

Fsherova lnearna dskrmnanvna meoda 7-Apr- 6 TS: Srojno učenje Lnearne meode & S S S W W B Ako posoj nverzna marca - nakon sređvanja: Za porebe klasfkacje - još je porebno odred grančnu vrjednos : y y y y

Lnearna dskrmnavna analza 7-Apr- 7 TS: Srojno učenje Lnearne meode & K klasa, X n p marca podaaka, k k c k p c p Svaka klasa se modelra kao mul-varjanna normalna dsrbucja / / k k T k e c p k p k Σ Σ LDA preposavlja da je za sve k, pa vrjed: k log log l k T l k T l k l k l k c p c p c p c p Σ Σ Lnearna dskrmnavna analza

Lnearna dskrmnavna analza 7-Apr- 8 TS: Srojno učenje Lnearne meode & log k k T k k T k c p Σ Σ U klasfkacj klasa se određuje prema lnearnoj dskrmnannoj funkcj : arg ma k klasa

Lnearna dskrmnavna analza 7-Apr- TS: Srojno učenje Lnearne meode & 9

Koja hper-ravnna je najbolja? 7-Apr- TS: Srojno učenje Lnearne meode & 0

- Suppor Vecor Machnes Meoda jezgrenh funkcja nalaz opmalnu ravnnu razdvajanja - Maksmzrajuć udaljenos zmeđu hperravnna krčnh očaka blzu ravnne razdvajanja en. decson boundary Inuvno: Ako ne posoje očke blzu površne razdvajanja, o znač da nemamo nesgurnh klasfkacjskh odluka!? 7-Apr- TS: Srojno učenje Lnearne meode &

Druga nucja Ako posavmo šo je moguće već razmak margnu zmeđu dvju klasa, posoj manje mogućnos zbora za funkcju razdvajanja kapace modela se smanjuje manje šanse za overfng TS: Srojno učenje Lnearne meode & 7-Apr-

dakle maksmzraju margnu m oko hperravnne plohe razdvajanja. en. large margn classfers Poporn vekor Usvar je funkcja odluke defnrana preko podskupa prmjera z skupa za učenje zv. Popornh vekora en. suppor vecors Problem određvanja SV: kvadran opmzacjsk problem en. quadrac programmng Ma. margna TS: Srojno učenje Lnearne meode & 7-Apr- 3

Separabln neseparabln problem Ako se pokaže da problem nje lnearno separablan: - Dozvoljene su greške uz penalzranje Osnovn prncp osaje: - Ploha razdvajanja u prncpu mora šo bolje razdvaja klase TS: Srojno učenje Lnearne meode & 7-Apr- 4

Formalzacja- određvanje maksmalne margne : normala na hperravnnu razdvajanja : prmjer očka y : klasa prmjera +/- Klasfkaor je određen funkcjom sgn T + b margna je određena sa y T + b Funkconalna margna cjelog skupa očaka je mnmum y T + b TS: Srojno učenje Lnearne meode & 7-Apr- 5

Pojam - geomerjske margne Udaljenos zmeđu plohe očke r Prmjer najblže ploh su poporn vekor. b Margna ρ plohe razdvajanja je šrna razdvajanja zmeđu popornh vekora supronh klasa ρ T r TS: Srojno učenje Lnearne meode & 7-Apr- 6

Lnearn - zvod Preposavmo da vrjed da se sve očke nalaze barem na dsanc od plohe razdvajanja Tada vrjede dva ogrančenja na skupu prmjera za učenje {,y } T + b ako je y = T + b - ako je y = - Za poporne vekore koj se nalaze na margn, ove nejednakos su jednakos; S obzrom da je udaljenos svakog prmjera od plohe razdvajanja: T b r Margna je: TS: Srojno učenje Lnearne meode & 7-Apr- 7

Lnearn - zvod ρ T a + b = Ploha razdvajanja T + b = 0 T b + b = - Uz ogrančenja: mn =,,n T + b = Dolazmo do vrjednos za margnu razdvajanja: T a b = ρ = a b = / T + b = 0 TS: Srojno učenje Lnearne meode & 7-Apr- 8

Lnearn - zvod Ovaj se problem može formulra kao kvadran opmzacjsk problem: Pronađ b ako da je maksmalna a za sve zadane {, y } mora vrjed: T + b ako je y =; T + b - ako je y = - TS: Srojno učenje Lnearne meode & 7-Apr- 9

Lnearn - zvod Bolja formulacja kao mnmzacjsk problem: mn = ma / Nać b - akve da je: Φ =½ T s mnmalno; A za sve {,y } vrjed : y T + b TS: Srojno učenje Lnearne meode & 7-Apr- 30

Rješavanje opmzacjskog problema Nađ b - akve da je: Φ =½ T - mnmalno; A za sve {,y } vrjed : y T + b Ova formulacja mnmzacja kvadrane funkcje uz lnearna ogrančenja Dobro pozna rješv problem puno vše l manje složenh algorama za nhovo rješavanje MATLAB, MATHEMATICA Usvar rješavanje se pčno rad nakon prevođenja u zv. dualn problem u kjojem se zv. Lagrange-ovm mulplkaorma α penalzra svako ogrančenje z prmarnog problema TS: Srojno učenje Lnearne meode & 7-Apr- 3

Rješavanje opmzacjskog problema Dualna formulacja: Nać α α N ako da je: Qα =Σα - ½ΣΣα α j y y j T j - maksmalno Te da vrjed Σα y = 0 α 0 α TS: Srojno učenje Lnearne meode & 7-Apr- 3

Rješenje opmzacjskog problema =Σα y b= y k - T k za blo koj k za koj je α k 0 Svak α koj je razlč od 0 zapravo znač da je aj poporn vekor. Konačno klasfkacjska funkcja ma ovaj oblk: f = Σα y T + b Rješenje je proporconalno sum umnožaka - unuarnjh produka T zmeđu nove očke prmjera svh popornh vekora! Treba zapam da je u rješavanju opmzacjskog problema akođer koršen produk T j zmeđu svh parova očaka skupa za učenje. TS: Srojno učenje Lnearne meode & 7-Apr- 33

Šo ako problem nje lnearno separablan? Dodajemo nove varjable ξ en. slack varables - dozvoljavanje krvh klasfkacja za eške l šumove prmjere ξ ξ TS: Srojno učenje Lnearne meode & 7-Apr- 34

Izvod s mekanom margnom en. Sof margn Sara formulacja: Nađ b - akve da je: Φ =½ T s mnmalno; A za sve {,y } vrjed : y T + b Nova formulacja sa ξ : Nađ b - akve da je: Φ =½ T + CΣξ - mnmalno; A za sve {,y } vrjed: y T + b ξ e da vrjed ξ 0 za sve TS: Srojno učenje Lnearne meode & 7-Apr- 35

Rješenje - s mekanom margnom en. Sof margn Dualn problem za s mekanom margnom : Nađ α α N ako da je Qα =Σα - ½ΣΣα α j y y j T j - maksmalno Te da vrjed Σα y = 0 0 α C α N ξ al n Lagrange-ov mulplkaor se ne nalaze u dualnoj formulacj! No, dalje vrjed: sa α >0 su poporn vekor. Rješenje dualnog problema sof margn: =Σα y b= y k - ξ k - T k gdje je k = argma α k k nje poreban kod procesa klasfkacje kao prje! f = Σα y T + b TS: Srojno učenje Lnearne meode & 7-Apr- 36

Klasfkacja Uz novu očku,, Odred projekcju na normalu plohe razdvajanja: dmenzje: p = + +b. To usvar znač + b = Σα y T + b Ako savmo neku grančnu mjeru >0 pouzdanos p > : => p < -: => - Inače: suzdržan TS: Srojno učenje Lnearne meode & 7-Apr- 37

Lnearn - sažeak Klasfkaor je posebno određena ploha razdvajanja en. separang hyperplane Najvažnje očke - očke z skupa za učenje koje defnraju plohu razdvajanja - poporn vekor Poporn vekor se pronalaze opmzacjskm algormma Rješavan problem je kvadran opmzacjsk problem s lnearnm ogrančenjma. U dualnoj formulacj problema rješenja poporn vekor odnosno očke z skupa za učenje se pojavljuju u skalarnm produkma: Nađ α α N ako da je Qα =Σα - ½ΣΣα α j y y j T j - maksmalno vrjed: Σα y = 0 0 α C α f = Σα y T + b TS: Srojno učenje Lnearne meode & 7-Apr- 38

Nelnearn Za problem koj su lnearno separabln uz razumn šum Lnearn je OK : No, šo ako o ne vrjed? 0 0 mapranje podaaka u još vše-dmenzonaln prosor? : 0 TS: Srojno učenje Lnearne meode & 7-Apr- 39

Nelnearn : prosor novh dmenzja arbua Osnovna deja: orgnaln prosor varjabl možemo mapra u nov-všedmenzonaln prosor - gdje će naš problem b lnearno separablan rješv Φ: φ TS: Srojno učenje Lnearne meode & 7-Apr- 40

Kernel rk Lnearn - skalarn produk zmeđu vekora K, j = T j Transformacja kojom svaku očku mapramo u nek nov prosor Φ: φ Sada b skalarn produk rebao zgleda drukčje: K, j = φ T φ j Kernel funkcja - funkcja koja korespondra nuarnjem produku u nekom ekspandranom prosoru novh varjabl TS: Srojno učenje Lnearne meode & 7-Apr- 4

Kernel rk Prmjer: orgnaln prosor -dmenzonaln vekor =[ ]; Neka je K, j = + T j, Pokažmo da vrjed K, j = φ T φ j : K, j = + T j,= + j + j j + j + j + j = = [ ] T [ j j j j j j ] = φ T φ j gdje je φ = [ ] TS: Srojno učenje Lnearne meode & 7-Apr- 4

Kernel Zašo? Omogućavaju prevaranje neseparablnh problema u separablne. Mapranje u bolje reprezenacjsk prosore Uobčajen kernel Lnearn Polnomjaln K,z = + T z d RBF K, j e j TS: Srojno učenje Lnearne meode & 7-Apr- 43

Lnearn efek razlčh vrjednos paramera C TS: Srojno učenje Lnearne meode & 7-Apr- 44

Odabr kernela efek Polnmn kernel C=cons. TS: Srojno učenje Lnearne meode & 7-Apr- 45

Odabr parameara kernela efek Gaussan kernel, C=cons. TS: Srojno učenje Lnearne meode & 7-Apr- 46

Odabr parameara parameara kernela fakora C RBF kernel, C=, = RBF kernel, C=0, = RBF kernel, C=00, = RBF kernel, C=, =0 RBF kernel, C=0, =0 RBF kernel, C=00, =0 TS: Srojno učenje Lnearne meode & 7-Apr- 47

Karakerske -a Po mnogma najbolja meoda ukupno gledajuć Popularna vrlo dobr rezula e mnng U praks mnoge druge meode rade oprlke so dobro Posoj mnogo komparacja koje o pokazuju Važno je: Razumjevanje skusvo za efekvno koršenju Odabr kernela, odabr parameara C, paramer kernela Dobro je kombnra selekcju varjabl u prak RapdMner vše varjan + vzualzacja TS: Srojno učenje Lnearne meode & 7-Apr- 48

Sažeak Defnranje plohe razdvajanja preko popornh vekora Poporn vekor = krčne očke prmjer najblž ploh razdvajanja Pojam kernela: Moćan ala za mapranje u vsoko-dmenzonalne prosore, kao redefnranje merka slčnos Samosaln pake sofare: Torch; Lgh; Lb RapdMner, WEKA, MATLAB, R....kernel-machnes.org 7-Apr- TS: Srojno učenje Lnearne meode & 49