Ing. Tomasz Kanik. doc. RNDr. Štefan Peško, CSc.

Similar documents
Klasifikácia. Obchodný dom = oddelenia (typ/druh tovaru) alternatívne kritériá výberu príznakov vedú k rôznemu výsledku klasifikácie

DIPLOMOVÁ PRÁCA ŽILINSKÁ UNIVERZITA V ŽILINE. Ján Rabčan Aplikácia na vyhodnocovanie dotazníkov pomocou hĺbkovej analýzy dát

Computer Applications in Hydraulic Engineering

Computation of Information Value for Credit Scoring Models

Homomorphic Encryption. Liam Morris

Transactions of the VŠB Technical University of Ostrava, Mechanical Series No. 2, 2010, vol. LVI article No. 1776

SPECIAL PROJECT PROGRESS REPORT

Teória grafov. RNDr. Milan Stacho, PhD.

REPORT, RE0813, MIL, ENV, 810G, TEMP, IN-HOUSE, , PASS

ENVIRONMENTÁLNE FAKTORY V HODNOTENÍ EFEKTÍVNOSTI V POĽNOHOSPODÁRSTVE ENVIRONMENTAL FACTORS IN EFFICIENCY ASSESMENT IN AGRICULTURE.

Strojové učenie. Princípy a algoritmy. Kristína Machová

BRNO UNIVERSITY OF TECHNOLOGY

Solution Methods for Beam and Frames on Elastic Foundation Using the Finite Element Method

VMware VMmark V1.1 Results

ADM a logika. 4. prednáška. Výroková logika II, logický a sémantický dôsledok, teória a model, korektnosť a úplnosť

One Optimized I/O Configuration per HPC Application

Parallelization of the Molecular Orbital Program MOS-F

Faculty of Mechanical Engineering, Technical University of Liberec Ph.D. Thesis Topics for academic year 2018/2019. Study programme: Applied Mechanics

Experience in Factoring Large Integers Using Quadratic Sieve

Modeling and Simulation of Dispersion Particle Fuels in Monte Carlo Neutron Transport Calculation

ArcGIS Enterprise: What s New. Philip Heede Shannon Kalisky Melanie Summers Shreyas Shinde

A Data Communication Reliability and Trustability Study for Cluster Computing

Bohuš Leitner, Jaromír Máca 1

Lucia Fuchsová Charakteristiky pravděpodobnostních

Toward High Performance Matrix Multiplication for Exact Computation

Kľúčové slová: SAR, šum spekl noise, evolučná PDR, lineárna difúzia, Perona-Malikova rovnica, štatistickéfiltre, Leeho filter

Alternative Approaches: Bounded Storage Model

Claude Tadonki. MINES ParisTech PSL Research University Centre de Recherche Informatique

Súťaž PALMA junior a programovanie v jazyku Python

Performance evaluation of scalable optoelectronics application on large-scale Knights Landing cluster

verdex pro Series Performance and Power Technical Reference

Vplyv minimálnej mzdy na trh práce

štatistika I. Doc. RNDr. Katarína Kozlíková, CSc. ÚLFBFIaTM LF UK v Bratislave

P214 Efficient Computation of Passive Seismic Interferometry

Video: Lenovo, NVIDIA & Beckman Coulter showcase healthcare solutions

Estimates for factoring 1024-bit integers. Thorsten Kleinjung, University of Bonn

HYCOM and Navy ESPC Future High Performance Computing Needs. Alan J. Wallcraft. COAPS Short Seminar November 6, 2017

Hybrid modeling of plasmas

The Golden Ratio and Signal Quantization

The Hash Function JH 1

AKTUÁLNE OTÁZKY HODNOTENIA KVALITY VÝSKUMU V SR. Štefan Tkačik

Factorisation of RSA-704 with CADO-NFS

The Memory Intensive System

ERLANGEN REGIONAL COMPUTING CENTER

CSE 20: Discrete Mathematics

THE COMMUNICATIONS COMPLEXITY HIERARCHY IN DISTRIBUTED COMPUTING. J. B. Sidney + and J. Urrutia*

T h e C S E T I P r o j e c t

Objavovanie znalostí v databázach. Ján Paralič

VIACKRITERIÁLNE (MULTIKRITERIÁLNE) ROZHODOVANIE (ROZHODOVACIA ANALÝZA)

DEA modely a meranie eko-efektívnosti

Pipeline no Prediction. Branch Delay Slots A. From before branch B. From branch target C. From fall through. Branch Prediction

Polynomial multiplication and division using heap.

COMPUTATIONAL COMPLEXITY

ECM at Work. Joppe W. Bos 1 and Thorsten Kleinjung 2. 1 Microsoft Research, Redmond, USA

UNIVERZITA KOMENSKÉHO V BRATISLAVE FAKULTA MATEMATIKY, FYZIKY A INFORMATIKY KONTEXTUÁLNE PREMENNÉ ŠKOLSKEJ ÚSPEŠNOSTI

Advanced Vectorization of PPML Method for Intel Xeon Scalable Processors

Parallel Transposition of Sparse Data Structures

Segmentace textury. Jan Kybic

Moores Law for DRAM. 2x increase in capacity every 18 months 2006: 4GB

Matematika 17. a 18. storočia

S0214 : GPU Based Stacking Sequence Generation For Composite Skins Using GA

Software implementation of ECC

Utility Maximizing Routing to Data Centers

CprE 281: Digital Logic

Vplyv testosterónu na prežívanie lásky v romantických vzťahoch u mladých mužov

e-companion ONLY AVAILABLE IN ELECTRONIC FORM

Shortest Lattice Vector Enumeration on Graphics Cards

Elektrický prúd a náboj. Elektrické napätie. Indukčnosť. Kapacita. Meranie v elektronike a telekomunikáciách. Odpor

1 Overview. 2 Adapting to computing system evolution. 11 th European LS-DYNA Conference 2017, Salzburg, Austria

The Green Index (TGI): A Metric for Evalua:ng Energy Efficiency in HPC Systems

Cse547. Chapter 1 Problem 16 GENERALIZATION

Background. Another interests. Sieve method. Parallel Sieve Processing on Vector Processor and GPU. RSA Cryptography

Roman Słowiński. Rough or/and Fuzzy Handling of Uncertainty?

CRYPTOGRAPHIC COMPUTING

Weather Research and Forecasting (WRF) Performance Benchmark and Profiling. July 2012

Public Key Compression and Modulus Switching for Fully Homomorphic Encryption over the Integers

NÁSTROJE NA HARMONIZÁCIU GEOGRAFICKÝCH NÁZVOV

Coded Computation over Heterogeneous Clusters

Benchmarking program performance evaluation of Parallel programming language XcalableMP on Many core processor

Comenius University in Bratislava Faculty of Mathematics, Physics and Informatics. Learning in finance. Master s thesis Bc.

TAGUCHI S APPROACH TO QUALITY ENGINEERING TAGUCHIHO PR STUP K INZINIERSTVU KVALITY

Domain Decomposition-based contour integration eigenvalue solvers

TR A Comparison of the Performance of SaP::GPU and Intel s Math Kernel Library (MKL) for Solving Dense Banded Linear Systems

Fast similarity searching making the virtual real. Stephen Pickett, GSK

Katedra Informatiky Fakulta Matematiky, Fyziky a Informatiky Univerzita Komenského, Bratislava. Multiparty Communication Complexity (Master thesis)

Piz Daint & Piz Kesch : from general purpose supercomputing to an appliance for weather forecasting. Thomas C. Schulthess

IMPORTANT GEOGEBRA ATTRIBUTES FROM MATHEMATICS TEACHERS PERSPECTIVE VÝZNAMNÉ ATRIBÚTY SYSTÉMU GEOGEBRA Z POHĽADU UČITEĽOV MATEMATIKY

UNCONDITIONAL CLASS GROUP TABULATION TO Anton Mosunov (University of Waterloo) Michael J. Jacobson, Jr. (University of Calgary) June 11th, 2015

Generating Urban Mobility Data Sets Using Scalable GANs

VYSOKÉ UČENÍ TECHNICKÉ V BRNĚ

IMPLEMENTATION OF PRESSURE BASED SOLVER FOR SU2. 3rd SU2 Developers Meet Akshay.K.R, Huseyin Ozdemir, Edwin van der Weide

A Tale of Two Erasure Codes in HDFS

Factorization of RSA-180

MPI at MPI. Jens Saak. Max Planck Institute for Dynamics of Complex Technical Systems Computational Methods in Systems and Control Theory

Design and Implementation of Multi-Context Rewriting Induction. Haruhiko Sato and Masahito Kurihara Hokkaido University, Japan

Programming with SIMD Instructions

Radio Propagation Channels Exercise 2 with solutions. Polarization / Wave Vector

ICS 233 Computer Architecture & Assembly Language

1. Write a program to calculate distance traveled by light

Introduction to HPC. Lecture 20

Transcription:

Ing. Tomasz Kanik Školiteľ: doc. RNDr. Štefan Peško, CSc. Pracovisko: Študijný program: KMMOA, FRI, ŽU 9.2.9 Aplikovaná informatika 1

identifikácia problémovej skupiny pacientov, zlepšenie kvality rozhodovacích modelov, zvýšenie celkovej úspešností diagnóz. 2

Pacient Príznak A Príznak B Príznak C Stav P 1 5 7 9 dobrý P 2 6 7 8 zlý P 3 4 7 4 dobrý P 4 7 3 4 priemerný P 5 9 2 4 priemerný P 6 8 9 3 priemerný P 7 1 5 8 dobrý P 8 1 4 9 zlý P 9 1 6 7 zlý P 10 6 7 8 priemerný 3

Pacient Príznak A Príznak B Príznak C Stav P 1 5 7 9 dobrý P 2 6 7 8 zlý P 3 4 7 4 dobrý P 4 7 3 4 priemerný P 5 9 2 4 priemerný P 6 8 9 3 priemerný P 7 1 5 8 dobrý P 8 1 4 9 zlý P 9 1 6 7 zlý P 10 6 7 8 priemerný 4

Pacient Príznak A Príznak B Príznak C Stav P 1 5 7 9 dobrý P 2 6 7 8 zlý P 3 4 7 4 dobrý P 4 7 3 4 priemerný P 5 9 2 4 priemerný Nekonzistencia údajov P 6 8 9 3 priemerný P 7 1 5 8 dobrý P 8 1 4 9 zlý P 9 1 6 7 zlý P 10 6 7 8 priemerný 5

Pacient Príznak A Príznak B Príznak C Stav P 1 5 7 9 dobrý P 2 6 7 8 zlý P 3 4 7 4 dobrý P 4 4 3 4 priemerný P 5 9 2 4 priemerný P 6 8 9 3 priemerný Zmena hodnoty podmienených atribútov môže spôsobiť zmenu stavu P 7 1 5 8 dobrý Aj poradie hodnôt rozhodovacieho atribútu je významné pre lekára P 8 1 4 9 zlý P 9 1 6 7 zlý P 10 6 7 8 priemerný 6

VC-DRSA: používa rozhodovacie pravidla (teória RSA); zohľadňuje poradie preferencie v rozhodovacích pravidlách (teória DRSA); umožňuje relaxáciu striktných pravidiel DRSA pomocou miery konzistencie; Identifikácia nekonzistentných inštancii vedie k určení problémovej skupiny pacientov Modifikácie teórie Rough Set sú často aplikované v expertných systémoch (napr. WMSS) 7

Problémová skupina pacientov Nekonzistentné inštancie Kvalita rozhodovacích modelov Kvalita rozhodovacích pravidiel Celková úspešnosť diagnóz Celková úspešnosť klasifikácie 8

Miera konzistencie objektu vyjadruje informáciu o jeho príslušností do zvolenej množiny rozhodnutí. Miery rozdeľujeme na maximalizačné a minimalizačné. Pre maximalizačnú mieru konzistencie platí, že čim je hodnota vyššia tým viac konzistentný je skúmaný objekt. Pre minimalizačnú mieru konzistencie platí opak. 9

10

Inuiguchi et al., 2009 11

Błaszczyński et al., 2007 & 2009 12

q 1, q 2, q 3 podmienené atribúty d rozhodovací atribút X 1, X 2, X 3 triedy rozkladu 13

14

15

Autori Deng et al., 2011 Definovali kvantitatívne vyjadrenie globálnej nekonzistencie objektu Miera neistoty objektu vyjadruje do akej miery objekt patri vyššej alebo nižšej triedy rozkladu podľa poradia preferencie tried 16

Deng et al., 2011 & 2013 17

18

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN V 9 30 I 56 F 9,5 GN V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 19

20

21

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD 2,0 V 16 132 I 10 F 8,9 GN 1,0 V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN 0,5 V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN 0,5 V 8 511 I 55 F 9,5 GN 3,0 V 19 30 I 52 F 8,2 AN 2,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN 1,0 V 22 8 C 60 M 8,8 PKD 22

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD 2,0 V 16 132 I 10 F 8,9 GN 1,0 V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN 0,5 V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN 0,5 V 8 511 I 55 F 9,5 GN 3,0 V 19 30 I 52 F 8,2 AN 2,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN 1,0 V 22 8 C 60 M 8,8 PKD 23

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD 2,0 V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN 0,5 V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN 1,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 24

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD 2,0 V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN 0,5 V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN 1,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 25

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD 2,0 V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN 0,5 V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN 1,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 26

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN 1,0 V 9 30 I 56 F 9,5 GN 1,0 V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 27

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 5 245 I 17 F 8,9 OKD V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 8 511 I 55 F 9,5 GN V 19 30 I 52 F 8,2 AN V 9 30 I 56 F 9,5 GN V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 28

Q 1 Q 2 Q 3 Q 4 Q 5 d α Q 1 Q 2 Q 3 Q 4 Q 5 d α V 1 8 I 28 M 7,7 OKD V 12 46 C 43 F 9,0 AN V 2 30 I 10 M 8,5 OKD V 13 40 I 43 M 9,3 AN V 3 12 I 10 M 8,5 OKD V 14 113 C 57 F 9,5 AN V 4 24 I 16 F 8,9 OKD V 15 201 I 58 F 9,5 AN V 16 132 I 10 F 8,9 GN V 6 7 I 51 M 7,0 OKD V 17 156 I 10 F 8,9 GN V 7 - I 51 M 7,0 GN V 18 34 I 52 F 8,2 AN V 19 30 I 52 F 8,2 AN V 20 2 I 53 M 8,5 GN V 10 53 I 69 F 9,3 AN V 21 16 C 42 F 9,3 OKD V 11 39 I 42 F 9,0 AN V 22 8 C 60 M 8,8 PKD 29

30

31

32

33

Zrýchlenie vyhľadávania nekonzistentných objektov znížením počtu testovaných podmienok zo 7 na 3. Efektívna implementácia vyhľadávania nekonzistentných objektov. 34

35

Instance Family Instance Type Processor Arch Compute optimized c3.8xlarge 64-bit vcpu 32 ECU 108 Memory (GiB) 60 Instance Storage (GB) 2 x 320 SSD EBS-optimized Available - Network Performance Physical Processor Intel AES-NI Intel AVX Intel Turbo 10 Gigabit*4 Intel Xeon E5-2680 v2 Yes Yes Yes 36

37

38

39

40

Ostatné miery Navrhované riešenie 41

42

43

Navrhované riešenie Ostatné algoritmy 44

Jednoduchý spôsob identifikácie skupiny problémových pacientov Štatisticky významné zlepšenie kvality rozhodovacích pravidiel (modelov) Zvýšenie celkovej úspešnosti klasifikácie Návrh metodiky porovnávania mier neistoty pre budúce výskumy 45

46

47

48

49

50

Pôvodne vynechaný krok 51

52

53

Pôvodne 7 podmienok IF 54