UNIVERZA V MARIBORU FAKULTETA ZA ORGANIZACIJSKE VEDE. Magistrsko delo ODKRIVANJE ZAKONITOSTI MENJAVE S TUJINO Z METODAMI PODATKOVNEGA RUDARJENJA

Size: px
Start display at page:

Download "UNIVERZA V MARIBORU FAKULTETA ZA ORGANIZACIJSKE VEDE. Magistrsko delo ODKRIVANJE ZAKONITOSTI MENJAVE S TUJINO Z METODAMI PODATKOVNEGA RUDARJENJA"

Transcription

1 UNIVERZA V MARIBORU FAKULTETA ZA ORGANIZACIJSKE VEDE ODKRIVANJE ZAKONITOSTI MENJAVE S TUJINO Z METODAMI PODATKOVNEGA RUDARJENJA Mentor: izred. prof. dr. Marko Bohanec Kandidat: Janez Fabijan Kranj, november 2006

2

3 ZAHVALA Zahvaljujem se mentorju izred. prof. dr. Marku Bohancu, iz Instituta Jožef Stefan v Ljubljani, za strokovno pomoč in napotke pri pripravi in izdelavi naloge ter za nasvete glede strokovne literature. Iskrena hvala tudi za razumevanje mojih službenih obveznosti in prilagajanje dinamike izdelave naloge tem okvirom. Zahvaljujem se tudi lektorju g. Simonu Kreku s Filozofske fakultete v Ljubljani. Moji družini za dragocen skupni čas: Špeli, Živi, Lučki in Joštu! ii

4 POVZETEK Plačilna bilanca Slovenije je zelo pomembna makroekonomska informacija o zunanjem ravnotežju slovenske ekonomije, kot majhnega odprtega gospodarstva. Od osamosvojitve Slovenije temelji na zaprtem sistemu posrednega poročanja preko plačilnega prometa s tujino. Vstop Slovenije v EU in EMU zahteva drugačen način zbiranja podatkov v ta namen. V nalogi smo obravnavali problem prehoda iz starega sistema v nov sistem poročanja za potrebe priprave plačilno-bilančne statistike. Analizirali smo zakonitosti starega sistema in na tej osnovi predlagali način prehoda v nov sistem. V ta namen smo izgradili večdimenzionalno podatkovno skladišče za podatke obdobja , pridobljene preko starega načina poročanja, izvedli smo metode enostavne statistike, analizo tipa MOLAP ter nenazadnje uporabili metodi podatkovnega rudarjenja: odločitvena drevesa in razvrščanje v skupine. Na osnovi odkrivanja strukturnih vzorcev iz podatkov starega sistema smo predlagali številne konkretne rešitve za izgraditev novega sistema poročanja. Predstavljeno metodologijo in model želimo uporabiti pri nadaljnjem procesu sprejemanja odločitev pri prehodu na nov konceptualni okvir plačilne bilance Slovenije, z namenom ohranitve kvalitetne ravni plačilno-bilančne statistike. Naloga prinaša tudi številne splošne koristi v smislu poznavanja izgradnje in funkcionalnosti podatkovnih skladišč. Ključne besede - Plačilna bilanca - Neposredno poročanje - Podatkovno skladišče - Podatkovno rudarjenje - Analiza tipa MOLAP iii

5 ABSTRACT The information on Balance of Payments (BoP) for Slovenia as a small and open economy is of crucial importance for decision support to the economic policy of the country. From independency of Slovenia, the conceptual framework for preparation of BoP has been based on a closed system using mainly data from international transactions reporting system organized via banks. By entering into the European Union and soon into the European Monetary Union there is an unavoidable need to refuse old reporting system and move to the so-called direct reporting system. The study has been dealing with the problem of transition from one data collecting system to another, keeping in mind the need for high quality of final information. For that purpose we have developed multidimensional data warehouse for huge amount of data related to the observed period ( ). Analysis starts by simple statistical methods, continue with MOLAP and finally we have applied two data-mining methods: decision trees and clustering. The discovering of interesting patterns from old data-collecting systems give us many ideas and solutions for implementing and using new reporting system. The intention is to use developed methodology and proposed methods for monitoring transition period towards direct reporting system which should result in preserving the quality of BoP information. There are many positive side effects of our research; the most important is acquiring the knowledge on Data Warehouses. Keywords - Balance of Payments - Direct Reporting System - Data Warehouse - Data Mining - MOLAP analysis iv

6 KAZALO VSEBINE 1. UVOD UTEMELJITEV RAZISKAVE Izhodišče raziskave in delovna hipoteza Opredelitev problema Cilj in namen raziskave Utemeljitev raziskave, predvideni prispevek k razvoju znanosti Metode dela Vsebinski pregled naloge 8 2. INFORMACIJSKI VIDIKI SPREMLJANJA PLAČILNE BILANCE Pregled razpoložljivih virov podatkov Osrednji viri podatkov za raziskavo Delovanje obstoječega sistema Problematika Iskanje kratkoročne rešitve v dogovarjanju s poročevalci Obdobje proučevanja sistema PODATKOVNA SKLADIŠČA IN PODATKOVNO RUDARJENJE Metode razvoja podatkovnih skladišč Od podatkovnega skladiščenja k podatkovnemu rudarjenju Metode podatkovnega rudarjenja Odločitvena drevesa Razvrščanje v skupine IZGRADNJA PODATKOVNEGA SKLADIŠČA Viri podatkov Baza podatkov Atributi Izbor podatkovnih kock Dimenzije Čas Valuta Država Dejavnost Vrsta poročil Metodološka klasifikacija namena plačil Rezidenti Sektor Druge navidezne dimenzije Dejstva Opis podatkovnih kock Test vsebinske ustreznosti modela Sheme modelov podatkovnih kock 51 v

7 Funkcionalnost podatkovnih kock STATISTIČNE ANALIZE PODATKOV Analiza ustreznosti atributov Analiza ustreznosti izbranih atributov Primer izračuna informacijskega prispevka Primerjava in razvrščanje razredov podatkovnih zapisov Statistične analize Variabilnost vrednosti izvoza posamezne vrste storitev Variabilnost področij dejavnosti rezidenta Variabilnost povprečne vrednosti izvoza posamezne vrste storitev ANALIZA TIPA MOLAP UPORABA METOD PODATKOVNEGA RUDARJENJA Poročevalci, namen plačil Izbor hierahične ravni dimenzij Uporaba metode gradnje odločitvenih dreves Izvoz transportnih storitev Uvoz transportnih storitev Druge vrste storitvene menjave s tujino Bodoči šifrant namena plačil in register poročevalcev Koeficienti povprečne izgube podatkov na osnovi podatkovnega skladišča Uporaba metode razvrščanja v skupine ZAKLJUČKI Neposredni rezultati raziskave Napotki za nadaljnje delo in širše koristi naloge 116 LITERATURA IN VIRI 119 PRILOGE 122 Priloga 1: Poskus podatkovnega rudarjenja 122 Priloga 2: Tabela Plačilni promet s tujino (dekadno) 125 Priloga 3: Podatki za izračun informacijskega prispevka 126 Priloga 4: Primerjava in razvrščanje razreda "Tekoči transferi" 127 Priloga 5: Primerjava in razvrščanje razreda: "Dohodki" 128 Priloga 6: SKIS in SKD 129 KAZALO SLIK 130 KAZALO TABEL 132 POJMOVNIK 133 KRATICE IN AKRONIMI 134 vi

8 1. UVOD UTEMELJITEV RAZISKAVE 1.1. IZHODIŠČE RAZISKAVE IN DELOVNA HIPOTEZA Plačilna bilanca neke države je sistematičen zapis vseh transakcij med rezidenti neke države in ostalim svetom (nerezidenti) v določenem časovnem obdobju (IMF, 1993). Z vidika virov podatkov pa tudi metod ocenjevanja je plačilno-bilančna statistika zelo kompleksna oziroma zahtevna statistika. Informacija je pomembna za odločanje na ravni denarne ali širše ekonomske politike države. Za pripravo plačilne bilance v osnovi ločimo med sistemom posrednega in neposrednega poročanja oziroma zbiranja podatkov. Neposredno poročanje predstavlja sistem zbiranja podatkov neposredno od poročevalskih enot, na katere se podatki nanašajo. Posredno poročanje predstavlja sistem zbiranja podatkov o posameznih ekonomskih subjektih preko drugih ekonomskih subjektov (poročevalskih enot). Neposredno poročanje, glede na obravnavano problematiko naloge opisano v poglavju 2.3, predstavlja alternativni sistem posrednemu poročanju. Posredno poročanje v našem primeru pomeni, da so podatki pridobljeni ob izvajanju nekaterih drugih funkcij (ne le statističnega poročanja) ter od ne nujno neposrednih udeležencev v transakcijah z nerezidenti. Praviloma gre za podatke, zajete od bank, ki izvajajo funkcijo plačilnega prometa z nerezidenti, za svoje stranke komitente. Slednji so najpogosteje udeleženci v transakcijah s tujino, na primer izvozniki ali uvozniki blaga in storitev pravne osebe nefinančnega sektorja ekonomije (ESA, 1995). Neposredno poročanje v našem primeru pa pomeni, da bi podjetje, ki je udeleženo v transakciji z nerezidentom, posredovalo ustrezne podatke, instituciji, pristojni za njihovo zbiranje, brez posredovanja nekoga tretjega, na primer bank. V Sloveniji je po Zakonu o državni statistiki in Programu statističnih raziskovanj za zbiranje podatkov in pripravo plačilno-bilančne statistike zadolžena Banka Slovenije. Objektivne okoliščine, opisane v nadaljevanju, narekujejo odpravo posrednega sistema poročanja in možnost uporabe le neposrednega načina poročanja. Ker pa še ni splošno uveljavljenih in zadovoljivih rešitev v praksi, postavljamo delovno hipotezo, da je natančnejše poznavanje starega sistema nujen pogoj za izgradnjo kvalitetnega novega sistema. Iz starega sistema lahko pridobimo informacije, ki so bistvene za izgradnjo in delovanje novega sistema. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 1

9 1.2. OPREDELITEV PROBLEMA Slovenija je 1. maja 2004 postala polnopravna članica Evropske Unije, kar med drugim tudi pomeni, da pravni red EU velja neposredno na ozemlju Republike Slovenije. Z vidika obravnavanja problema pričujoče naloge je pomembna Uredba Evropskega parlamenta in Sveta ES št. 2560/2001 o čezmejnih plačilih v evrih (v nadaljevanju Uredba). Čezmejna plačila po tej Uredbi so plačila v evrih, med državami članicami EU, ko sta izvajalec plačilnega prometa nalogodajalca in izvajalec plačilnega prometa prejemnika plačila v različnih državah članicah. Uredba v nacionalnem pravnem redu posamezne članice EU učinkuje neposredno in takoj. Sprejeta je bila predvsem kot dodatna vzpodbuda pri oblikovanju enotnega plačilnega območja v evrih. Pomemben dejavnik je stroškovni vidik čezmejnih plačil, saj so stroški za taka plačila še vedno občutno višji kot jih sicer zaračunavajo izvajalci za plačila v evrih v domačem plačilnem prometu. Cilj, ki ga zasleduje uredba, je torej izenačevanje stroškov "domačih" in "čezmejnih " plačil v evrih, ne pa izenačevanje stroškov čezmejnih plačil v evrih s stroški za domača plačila v domači valuti. Uredba se na primer tudi ne uporablja za čezmejna plačila med institucijami za njihov račun. Zaradi izenačevanja pogojev procesiranja nalogov za čezmejna plačila uredba tudi zapoveduje ukinitev vseh (administrativnih) ukrepov, ki so povezani s čezmejnimi plačili v evrih in ki izvajalcem povzročajo dodatne stroške pri procesiranju. Z vidika možnosti izenačevanja stroškov med domačimi in čezmejnimi plačili v evrih Uredba v 6. členu nalaga državam članicam, da odpravijo kakršnekoli obveznosti poročanja bank o čezmejnih plačil do vrednosti evrov za plačilno-bilančne statistike. Uredba je predvidevala, da se prag za plačila malih vrednosti s poviša z na evrov. Evropska centralna banka je v okviru postopka po členu 8 Uredbe, ki se nanaša na poročanje za plačilno-bilančno statistiko, predlagala povišanje praga iz prvega odstavka člena 6 Uredbe s na evrov. Metodologija slovenske plačilne bilance sloni, podobno kot v bližnji preteklosti metodologije plačilnih bilanc večine držav članic EMU (CMFB, 2003), na plačilnem prometu s tujino, kot osnovnem viru podatkov. Za pripravo pretežnega dela plačilne bilance izvajalci plačilnega prometa s tujino (banke) posredujejo podatke o izvedenih plačilih med rezidenti in nerezidenti skupaj s šiframi namena plačil, ki omogočajo dvostavno razvrščanje v skladu s konceptom plačilne bilance. Zato uveljavitev Uredbe neposredno znižuje kvaliteto najpomembnejšega vira podatkov za pripravo plačilno-bilančne statistike v Sloveniji. Zaradi nižje povprečne vrednosti posameznega plačila so z uveljavitvijo Uredbe najbolj izpostavljene osenčene postavke v sliki 1: plačila storitev, tekoči in kapitalski transferi. Izgubimo pa na primer tudi informacije za napovedovanje in kontrolo na postavkah blagovne menjave, komercialnih kreditov in posojil. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 2

10 Ob postopnem uvajanju alternativnih virov podatkov (Banka Slovenije, PHARE, 2001) iz neposrednega poročanja so delno že zagotovljeni viri podatkov na šrafiranih osenčenih poljih na sliki 1. predhodni podatki z dne: tokovi v mio EUR tokovi v mio EUR januar - mesec t januar - mesec t LETO t- 1 LETO t LETO t- 1 LETO t I. Tekoči račun II. Kapitalski in finančni račun 1. Blago A. Kapitalski račun 1.1. Izvoz blaga 1. Kapitalski transferi Izvoz f.o.b. 2. Patenti in licence Prilagoditev zaobjema B. Finančni račun 1.2. Uvoz blaga 1. Neposredne naložbe Uvoz c.i.f. Domače v tujini Prilagoditev c.i.f./f.o.b. Tuje v Sloveniji Prilagoditev zaobjema 2. Naložbe v vrednostne papirje 2. Storitve Domače v tujini Izvoz storitev Tuje v Sloveniji Uvoz storitev 3. Ostale naložbe 2.1. Transport 3.1. Komercialni krediti 2.2. Potovanja 3.2. Posojila 2.3. Konstrukcijske storitve 3.3. Gotovina in vloge 2.4. Ostale poslovne storitve 3.4. Ostalo 2.5. Ostalo 3. Dohodki 4. Mednarodne denarne rezerve Prejemki Zlato, SDR in rezervna imetja pri MDS Izdatki Devize 4. Tekoči transferi Gotovina in vloge V Slovenijo Vrednostni papirji V tujino III. Neto napake in izpustitve Slika 1: Vpliv Uredbe EU o čezmejnih plačilih na kvaliteto plačilne bilance v Sloveniji Očitno nam bo uvedba praga poročanja za posamično transakcijo nad evrov tako prizadela kvaliteto plačilne bilance, da bi bila makroekonomska informacija za podporo odločanju na tem področju, ob sedanjem sistemu poročanja, nesprejemljiva. Uvajanje alternativnega sistema neposrednega poročanja je torej neizbežno CILJ IN NAMEN RAZISKAVE V raziskavi smo na zgoraj opredeljenem področju (posamezne postavke plačilne bilance glede na vrsto vira podatkov), ki ga omejuje problem uvedbe Uredbe EU, Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 3

11 uporabili metode podatkovnega rudarjenja. Z ustreznimi metodami smo izvedli bolj poglobljene in natančne analize baz podatkov, katerih vir in način poročanja se bo v prihodnosti zamenjal. Želja je, da bi poskušali ohraniti kvalitetni nivo in konsistentnost zelo pomembne makroekonomske informacije za Slovenijo, kot članice EMU, tudi v bodoče. Glede na pomen področja in velikost problematike menimo, da je bila izvedba raziskave smiselna in nujna. Po drugi strani pa gre za spreminjanje relativno stabilnega in zanesljivega sistema v nov»vsiljen«sistem poročanja za potrebe sestave plačilne bilance Slovenije. V izhodišče smo postavili naslednje stališče: Poglobljeno oziroma natančno poznavanje obstoječega sistema je nujni pogoj za uspešno izgradnjo novega koncepta. Poleg poznanih klasično statistično obdelanih in standardiziranih procedur prikaza in analize informacije smo želeli odgovoriti vsaj na sledeča tri širša vprašanja: 1. Ali v množici podatkov obstajajo zakonitosti do sedaj neznane, ki nam lahko bistveno pomagajo pri graditvi novega kvalitetnega sistema? Kako izgraditi model podatkovnega skladišča, ki bi nam omogočal tovrstno iskanje zakonitosti? 2. Ali je mogoče z metodami podatkovnega rudarjenja pridobiti koristne informacije za vzdrževanja registra poročevalcev in pripravo ustreznih vzorcev? 3. Kako je v pravno dovoljenih okvirih še smiselno ohraniti šifriranje namena plačil v kontrolne in registrske namene? 1.4. UTEMELJITEV RAZISKAVE, PREDVIDENI PRISPEVEK K RAZVOJU ZNANOSTI Zaradi Uredbe večina držav članic EMU oz. EU uvaja alternativni sistem neposredno poročanje, ki bo zaobšel izvajalce plačilnega prometa pri poročanju v tujem imenu in bo breme poročanja prenesel na neposredne udeležence v transakcijah z nerezidenti (najbolj se bo pri tem obremenil nefinančni sektor). K slednjemu je pristopila tudi Banka Slovenije kot nosilka statistične naloge priprave plačilne bilance v Sloveniji. Terminski načrti uvedbe alternativnega sistema poročanja za plačilno-bilančno statistiko sovpadajo z načrti večine držav članic EMU ( ). Praviloma se vse države, ki uvajajo sistem neposrednega poročanja na dolgi rok, v celoti odpovedujejo možnosti uporabe sistema posrednega poročanja nad pragom, ki ga določa Uredba ( evrov). Države članice EU v posebnih delovnih skupinah še iščejo najboljšo Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 4

12 prakso uvedbe alternativnega sistema poročanja z vidika zagotavljanja ustrezne kvalitete. V ta namen je statistični komite ECB skupaj z Eurostat (CMFB, 2004) ustanovil posebno delovno skupino (»Task Force on Direct Reporting«). Države starejše članice EU, kjer Uredba velja že od leta 2002, so uvedle različne načine poročanja za čezmejna plačila do praga poročanja. V Avstriji so na primer sklenili z bankami podoben dogovor (ÖNB, 2001), kot ga je dosegla Banka Slovenije. Za zneske, manjše od lastno definiranega praga poročanja (7.000 evrov), so uvedli posebno šifro transakcije, ki omogoči ločitev nevtralnih transakcij od plačilnobilančnih. Za vse ostale transakcije banke poročajo šifre namena plačil (tudi tiste med in evrov). Sistem neposrednega poročanja so uvedli V Grčiji so prav tako sklenili posebni dogovor z bankami o poročanju vseh transakcij ne glede na prag, uvedli pa so poenostavitve pri poročanju transakcij pod pragom. V Italiji, Portugalski in Španiji imajo za transakcije pod pragom prav tako poenostavljeno poročanje. Popolno opustitev poročanja transakcij pod pragom za posle komitentov bank so takoj uvedle Belgija, Nemčija, Francija, Luksemburg, Nizozemska in Danska (Ovi, Elkjar, 2005). Države članice EU imajo različne sisteme zbiranja podatkov za plačilno-bilančno statistiko: ocene, direktno poročanje, poročila bank, različne kombinacije zgornjih treh načinov. Podobno velja tudi za obstoječo metodologijo plačilne bilance Slovenije. Ključna predpostavka v nalogi glede odnosa do»starega«vira podatkov je, da bomo tudi v Sloveniji v večji meri morali opustiti plačilni promet s tujino kot vir podatkov za plačilno-bilančno statistiko. To pomeni, da po drugi strani ne bomo imeli zajema podatkov iz plačilnega prometa s tujino pod pragom poročanja, ki ga dopušča Uredba Sveta EU 2650/01. V drugem poglavju pokažemo izpad podatkovnega vira ob upoštevanju Uredbe. Rešitve na zastavljena vprašanja smo torej iskali v smeri izgradnje popolnoma alternativnega sistema sistemu neposrednega poročanja za izgubljene vire podatkov. Za nov sistem poročanja se še niso oziroma so se zelo pozno odločile tudi nekatere države iz bivše petnajsterice EU (Italija, Grčija) oz. je večina njih spremembe izvedla ali načrtuje njihovo izvedbo v letih : Avstrija, Portugalska, Belgija, Francija. V letu 2003 sta uvedli nov sistem poročanja le Nizozemska (Claassen, 2004) in Švedska, prej tudi Finska (Myller, Syrjänen, 2004). V januarju 2005 je to uspelo Danski. Obstoječi način poročanja je ustrezen v Veliki Britaniji in na Irskem (Fitzpatrick, 2002). Nemčija in Luksemburg še nista povsem definirali novega sistema. Na tem mestu lahko zapišemo, da smo s spoznanji sprejeli boljše odločitve (podpora odločanju) v smeri izgradnje novega sistema poročanja za plačilno-bilančno statistiko. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 5

13 Glede na številna nepojasnjena vprašanja lahko upamo, da smo tako tudi aktivno prispevali k oblikovanju in iskanju konkretnih in splošnih rešitev (značilnosti) novega sistema poročanja v EU. Do sedaj so le redki prispevki, ki opisujejo novo izgrajene sisteme neposrednega poročanja za potrebe plačilno-bilančne statistike. Ni pa zaslediti neke resne kvalitativne primerjave med novim in starim sistemom v državah, ki so zamenjale koncept poročanja za plačilno-bilančno statistiko. Prispevek naloge je tudi ta primerjava METODE DELA Osnovna metoda, ki jo bomo uporabili v nalogi, je podatkovno rudarjenje. To je netrivialen proces odkrivanja implicitnega, doslej neznanega in potencialno uporabnega znanja iz podatkov (Witten, Frank, 1999). Osredotočili smo se na vire podatkov posrednega poročanja, ki so predmet zamenjave oziroma nadomestitve. V središču pozornosti so v sliki 1 označene postavke plačilne bilance. V obravnavanem obdobju govorimo o Sloveniji kot malem odprtem gospodarstvu s popolno liberalizacijo mednarodne trgovine ter kapitalskega in finančnega računa. V nalogi smo obravnavali podatkovne vire neposrednega poročanja podatkov na osnovi plačilnega prometa s tujino ter po vsebini podoben vir neposrednega poročanja podatkov o transakcijah na računih pravnih oseb v tujini. Oboje skupaj namreč na obravnavnih postavkah plačilne bilance tvori celoto v smislu zaprtega sistema poročanja. Slednje pomeni, da zajamemo vse transakcije posameznega rezidenta z nerezidenti, ne glede na plačilo iz računa doma ali v tujini. Podatki za potrebe statistike plačilne bilance prihajajo skozi tako imenovana "produkcijska" okolja, kjer poteka vhodna kontrola kvalitete, v relacijsko bazo podatkov. Slednja je izgrajena iz tabel podatkovnih zapisov. Atributi posameznih podatkovnih zapisov imajo lahko nabore vrednosti standardizirane v posameznih šifrantih. Slednje omogoča povezljivost različnih tabel v bazi. V našem primeru so predvsem pomembni šifranti (npr. šifrant držav od Urada za standardizacijo in meroslovje po ISO standardu 3166, predpisani šifrant namena plačil plačilnem prometu s tujino s strani Banke Slovenije, šifrant sektorjev ekonomije, povzet po evropskem sistemu računov ESA 95 ipd). Šifranti so v osnovi zasnovani na nivoju analitičnega okolja v skladu z pravili enotne relacijske baze podatkov. V tem pogledu naj le omenimo pomen enotnih opisnikov podatkov»metadata«podatki o podatkih za potrebe obvladovanja in delovanja enotne analitične baze podatkov v skladu z njenimi temeljnimi načeli: podatek enkrat zajet, enotno opisan in povezljiv z drugimi podatki, vsem razpoložljiv za obdelavo iz različnih zornih kotov (funkcij oddelkov centralne banke) itd. Posebej izdelan program potem omogoča metodološko delo in obdelavo podatkov v smeri priprave izhodne informacije plačilno-bilančne statistike. Ne glede na program, ki zagotavlja pripravo končne informacije, pa je omogočeno neposredno poizvedovanje podatkov iz tabel v relacijski bazi podatkov. Takšen pristop Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 6

14 in osredotočenje na zgoraj omenjena vira podatkov v kontekstu izgradnje podatkovnega skladišča v metodološkem smislu pomeni dejansko obravnavo devizne in ne plačilne bilance Slovenije. Devizna bilanca (IMF, 1993) pomeni obravnavo vseh plačil med rezidenti in nerezidenti v tujem denarju. Glede na opisnike podatkov in šifrante smo v fazi priprave podatkov za predhodno definiran namen uporabili orodje "Oracle Discoverer" v začetni fazi selekcije in čiščenja podatkov. V nadaljevanju selekcije in integracije pa smo si pomagali predvsem z uporabo MS Access-a. Glede na tehnično-tehnološko zagotovljeno integracijo različnih virov podatkov v statističnem informacijskem podsistemu BS tudi faza transformacije ni bila posebej zahtevna. Tako smo že z orodjem "Access" lahko pripravljali različna poizvedovanja in preoblikovali vhodne tabele. Rezultate poizvedovanj pa smo lahko tudi neposredno uporabili kot podatkovne tabele podatkovnega skladišča. Zelo pomembna je priprava in izvedba koncepta podatkovnega skladišča, v smeri doseganja zastavljenih ciljev. Ključen je izbor atributov in proces posploševanja ter ustrezen nivo granulacije podatkov v podatkovnem skladišču. Ustreznost atributov glede na zastavljene cilje naloge tudi kvantificiramo. Z enostavnimi statistikami in neposredno povezavo programskih orodij (v osnovi uporaba programov "Excel" ali "Statistica 7") na izgrajeno podatkovno skladišče smo prišli do razmeroma dosti poglobljenih in zanimivih ugotovitev ter značilnosti, na primer v menjavi storitev Slovenije z drugimi državami. Vendar je pristop lahko zelo enkraten oziroma parcialen po posameznih atributih. Da bi preizkusili našo hipotezo o smiselnosti uporabe metod podatkovnega rudarjenja z vidika obravnavane teme smo predhodno, pred pripravo obsežnega podatkovnega skladišča, z orodjem WEKA (priloga 1), na manjšem vzorcu podatkov izvedli poskus. Z uporabo metod podatkovnega rudarjenja na nivoju celovitega podatkovnega skladišča pa smo prikazali relativno avtomatično obdelavo podatkov v smeri odkrivanja strukturnih vzorcev, kar je bistvena prednost pri obdelavi velike množice podatkovnih zapisov in atributov. Naloge sledijo po (CRISP-DM, 1999) metodologiji, ki definira bistvene oziroma splošne korake v procesu odkrivanja znanja v podatkih, ki so lahko uporabljene na različnih področjih ekonomije ali širše družbe. Z vidika celovite problematike raziskave smo izgradili obsežno podatkovno skladišče in se poslužili uporabe programskega paketa Microsoft SQL Server 2000 Analysis Services z vgrajeno funkcijo neposrednega analitičnega procesiranja OLAP. Razvito podatkovno skladišče razumemo kot prototip za razvoj podatkovnih skladišč na sistemskem nivoju informacijske tehnologije. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 7

15 Časovno je raziskava omejena na obdobje Raziskava je bila opravljena v obdobju od maja 2005 do junija Nov koncept poročanja in plačilno-bilančne metodologije pa se dejansko razvija v obdobju , zato rezultati naloge lahko bistveno pripomorejo k praktičnim vidikom izgradnje novega sistema. Pričakujemo pa tudi splošne koristi obvladovanja metod podatkovnega rudarjenja na tem področju za kvalitetno delo v bodoče VSEBINSKI PREGLED NALOGE Uvodoma, v prvem in drugem poglavju je predstavljen problem uvedbe praga poročanja. Opisano je iskanje rešitev v širšem evropskem prostoru. V drugem poglavju je v nadaljevanju podana tudi razlaga področja naloge, to je plačilno-bilančne statistike kot sestavnega dela pomembne makro ekonomske informacije za podporo odločanju na ravni ekonomske in monetarne politike države. Podana je tudi osnovna kvantitativna analiza vpliva Uredbe na izpad najpomembnejšega podatkovnega vira. Poglavje obsega kratko predstavitev dosedanjega vedenja z vidika podatkovne oziroma informacijske podpore na obravnavanem področju. Na ta način je predstavljena trenutna situacija na plačilnobilančnem področju z vidika zajema podatkov, metodološke obravnave in priprave izhodne informacije. Statistična analiza v drugem poglavju naj bi nam poleg prikaza situacije na obravnavanem ekonomskem področju omogočila predvsem vsebinsko identifikacijo posameznih segmentov tega področja, ki potrebujejo»pomoč«podatkovnega rudarjenja. Tretje poglavje predstavlja teoretične osnove razvoja podatkovnih skladišč in metode podatkovnega rudarjenja, relevantnih za našo raziskavo. Predstavljamo bolj poglobljeno obravnavanje metod podatkovnega rudarjenja tudi v teoretičnem pogledu in poskus identifikacije najustreznejših metod za empirično delo. Z vidika metod podatkovnega rudarjenja gre predvsem za uporabo metod po načelu»decision support for data mining«(bohanec, Lavrač, 2003) odločitveni proces v podporo podatkovnemu rudarjenju. Predpogoj pravilnega odločanja o izboru metod po našem mnenju, sloni predvsem na dobrem poznavanju podatkov o podatkih»metadata«ter koncepta in metodologije priprave plačilne bilance. Četrto poglavje prikazuje izgradnjo podatkovnega modela. Delo je v praktičnem pogledu zelo zahtevno z vidika priprave velikih baz podatkov, zlasti na področju statistike plačilnega prometa s tujino. Delo dejansko zajema fazo čiščenja in predobdelave: oblikovanje posameznih pomembnejših podatkovnih sklopov (npr. združevanja in povezovanje šifrantov za posamezne atribute podatkovnih zapisov), iskanje pomembnih značilnosti (npr. oblikovanje dodatnih atributov in zaloge njihovih vrednosti v posamezen šifrant), postavitev pomembnih vrednostnih kriterijev za posamezne atribute itd. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 8

16 Peto poglavje predstavlja analizo ustreznosti izbranih atributov v smeri iskanja odgovorov na zastavljena vprašanja. Enostavne mere nam iz strukture podatkovnega skladišča na želeni ravni abstrakcije dajo številne temeljne informacije o proučevanem pojavu. Nadalje področje proučevanja analiziramo še z osnovnimi statističnimi analizami, merami variacije in koncentracije. V šestem poglavju najprej uporabljamo funkcijo MOLAP, ki nam omogoča pregledovanje oziroma analiziranje vzrokov za posamezne pojave s pregledovanjem po različnih nivojih abstrakcije večdimenzionalnega podatkovnega skladišča. S tem prihajamo do novih spoznanj. Namizno orodje Excel povežemo neposredno na podatkovno skladišče in se ukvarjamo s takojšnjo vizualizacijo odgovorov na postavljena vprašanja. Veliko uporabnost takšnih analiz vidimo predvsem v hitri razlagi ekstremnih pojavov. Na podatkovnem skladišču potem v sedmem poglavju neposredno uporabimo metode rudarjenja, pri tem pa izkoriščamo prednosti široko zastavljenega konceptualnega okvira priprave podatkovnega skladišča. Omogočeno je rudarjenje na različnih ravneh abstrakcije obravnavanih pojavov, zlasti pa na različnih ravneh metodološke hierarhije plačilne bilance. Glede na pričakovani novi sistem nas posebej zanima, kaj vemo na primer o populaciji poročevalcev, načinu prehoda iz prihodnjih vzorčnih informacij na celotno populacijo, nivoju poznavanja področij, kjer bodo sedanji podatki z praktičnim izvajanjem uredbe v celoti izgubljeni itd. V osmem poglavju ovrednotimo in interpretiramo rezultate naloge. V poglavju oblikujemo priporočila za uvajanje novega sistema poročanja za namene plačilnobilančne statistike. Faza torej predstavlja»data mining for decison support«podatkovno rudarjenje za pomoč pri sprejemu odločitev o novem sistemu poročanja in izpolnjuje namen raziskave. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 9

17 2. INFORMACIJSKI VIDIKI SPREMLJANJA PLAČILNE BILANCE V plačilni bilanci neke države je pomemben odnos med rezidenti te države in nerezidenti (ostali svet) v določenem časovnem obdobju (IMF, 1993). Rezidenti neke države se opredelijo glede na sedež firme (pravne osebe) oz. kraj in čas stalnega bivališča (fizične osebe). Glede odnosa med rezidenti in nerezidenti so v središču pozornosti transakcije med njimi, ki imajo za posledico pravno-formalno spremembo lastnine nad predmetom menjave. Posebej nas zanima vrednostno spremljanje pojava. Večina transakcij med rezidenti, na primer Slovenije in rezidenti ostalega sveta, je originalno izraženo v tuji valuti v primeru Slovenije, zato se po tekočem tržnem tečaju preračunajo transakcije v SIT ali katerokoli»svetovno«valuto (zlasti v evro kot našo bodočo valuto). Z uporabo tečajnega razmerja na dan transakcije se izloči vpliv tečajnih sprememb, posamične transakcije pa se sistematično po načelu dvostavnega knjigovodstva evidentira v plačilno bilanco Slovenije. Dvostavno knjigovodstvo pomeni, da se na primer povečanje izvoza blaga ne odrazi le na tekočem računu (knjižba v dobro na tekočem računu postavka izvoz blaga), marveč tudi na kapitalskem in finančnem računu plačilne bilance, in sicer v povečanju terjatev iz naslova danih kratkoročnih komercialnih kreditov (knjižba v breme). Plačilna bilanca (slika 2) ima, podobno kot v poslovnih financah izkaz poslovnega izida ali bilanca stanja, lahko dvostranski izgled (lahko tudi zaporedni). Levo stran bilance predstavljajo transakcije tekočega računa: izvoz blaga in storitev, faktorski dohodki (od dela in kapitala) ter tekoči transferi. Desno stran predstavlja kapitalski in finančni račun, na katerem so poleg kapitalskih transferov razvrščeni finančni instrumenti: neposredne naložbe, porfolio investicije, komercialni krediti, posojila, vloge, ostali kratkoročni instrumenti. Vse navedene postavke tekočega in finančnega računa lahko podobno kot v poslovnih financah predstavljajo temeljni konto. Velja temeljno načelo dvostavnega knjigovodstva, da se po vsaki transakciji ohranja bilančno ravnotežje. Slednje je torej mogoče tudi z avtonomnimi transakcijami znotraj tekočega računa ali le kapitalskega in finančnega računa. Znotraj kapitalskega in finančnega računa se to na primer zgodi, kadar rezidenti prihranke v tuji valuti (deviza je po definiciji terjatev do izdajatelja tuje centralne banke) uporabijo za nakupe vrednostnih papirjev, izdanih s strani nerezidentov (enostavneje tujih vrednostnih papirjev). Praviloma so pogostejše "avtonomne" transakcije znotraj kapitalskega in finančnega računa, je pa to odvisno od številnih dejavnikov, ki definirajo makroekonomsko situacijo neke države, katere plačilno-bilančno situacijo želimo spremljati. Posebno mesto znotraj kapitalskega in finančnega računa plačilne bilance predstavljajo Mednarodne denarne rezerve. To so prvovrstne naložbe centralne banke oziroma države v konvertibilne vloge ali vrednostne papirje. Glede na tečaj deviznega režima je Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 10

18 v osnovi potrebno vedeti, da čim bolj kot je tečaj fiksen, tem bolj neposredna je povezava z saldom tekočega računa. Primanjkljaj tekočega računa ob pomanjkanju drugih pritokov na finančnem računu v razmerah fiksnega režima deviznega tečaja neposredno zmanjšuje mednarodne denarne rezerve. Matematično mora biti saldo tekočega računa v obdobju enak saldu kapitalskega in finančnega računa skupaj s statistično napako. Ali po (Dornbusch, Fischer, 1994): "Current account deficit + net capital inflow = 0". Dolgoročnejše predhodno opisane razmere pa lahko postavijo pod vprašaj vzdržnost oz. nivo fiksnega deviznega tečaja. Iz bližnje skupne zgodovine so nam poznani primeri devalvacije takratnega jugoslovanskega dinarja. I. Tekoči račun II. Kapitalski in finančni račun 1. Blago A. Kapitalski račun 1.1. Izvoz blaga 1. Kapitalski transferi Izvoz f.o.b. 2. Patenti in licence Prilagoditev zaobjema B. Finančni račun 1.2. Uvoz blaga 1. Neposredne naložbe Uvoz c.i.f. Domače v tujini Prilagoditev c.i.f./f.o.b. Tuje v Sloveniji Prilagoditev zaobjema 2. Naložbe v vrednostne papirje 2. Storitve Domače v tujini Izvoz storitev Tuje v Sloveniji Uvoz storitev 3. Ostale naložbe 2.1. Transport 3.1. Komercialni krediti 2.2. Potovanja 3.2. Posojila 2.3. Konstrukcijske storitve 3.3. Gotovina in vloge 2.4. Ostale poslovne stor Ostalo 2.5. Ostalo 3. Dohodki 4. Mednarodne denarne rezerve Prejemki Zlato, SDR in rezervna imetja pri MDS Izdatki Devize 4. Tekoči transferi Gotovina in vloge V Slovenijo Vrednostni papirji V tujino III. Neto napake in opustitve Slika 2: Shematični prikaz plačilne bilance Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 11

19 Slovenija je ob koncu junija 2004, kot nova članica EU, stopila v evropski tečajni mehanizem in vzpostavila centralno pariteto tečaja tolarja nasproti evru. S tem je zamenjala režim drsečega (uravnavanega) tečaja tolarja z režimom ERM 2, ki dovoljuje odstopanje tečaja tolarja od centralne paritete za 15 % navzgor oz. navzdol. Centralna banka od tega dne z mednarodnimi denarnimi rezervami»brani«ohranja centralno pariteto. V kolikor bi slednja ne odražala neke»naravne«oziroma tržne ravni tečaja tolarja do evra, bi bile intervencije centralne banke zelo pogoste. Praksa v dvoletnem obdobju je pokazala, da intervencije niso bile potrebne, tečaj pa je bil zelo stabilen okrog centralno postavljene paritete. Tržnost tečaja centralne paritete se je očitno oblikovala v daljšem obdobju prilagajanja tečaja skozi sistem uravnavanega drsečega deviznega tečaja. Slovenija je kandidatka za prevzem evra že v letu 2007 in je kot edina nova članica v letu 2006 zadostila vsem pogojem konvergence, med drugim tudi režimu ERM 2. Razumljivo je, da lahko, glede na obseg zajetja transakcij:»vse transakcije med rezidenti in nerezidenti v določenem časovnem obdobju«, ki naj jih meri plačilna bilanca, iz povsem praktičnih razlogov upravičeno pričakujemo tudi določen del nezajetja le teh. Zlasti težko je pričakovati, da bi na primer natančno merili gotovinske transakcije med rezidenti in nerezidenti, še posebej, če je v neki državi obseg sive ekonomije in davčne evazije relativno visok. V tem primeru z različnimi statističnimi metodami ocenjujemo tovrstne pojave. V sami shemi plačilne bilance pa obstaja tudi postavka, ki bilanco izravna»neto napake in opustitve«(slika 2). Interes metodologov na plačilno-bilančni statistiki je, da bi ta postavka bila čim manjša oziroma, da bi se vsaj v času (v kumulativi) tudi na medletni ravni izravnavala PREGLED RAZPOLOŽLJIVIH VIROV PODATKOV Baze podatkov za pripravo plačilno-bilančne statistike obsegajo naslednja vsebinska področja: transakcije v plačilnem prometu s tujino preko računov doma in v tujini, transakcije med rezidenti in nerezidenti na področju trga vrednostnih papirjev, druge poslovne dogodke med rezidenti in nerezidenti na ekonomski kategoriji kapitala v finančnem pomenu, pomembnejše bilančne postavke in druge podatke rezidentov v mednarodni menjavi. Ker v nalogi obravnavamo problem nujnega prehoda iz pretežno posredno pridobljenih virov podatkov (plačilni promet s tujino) na neposredno pridobitev tovrstnih podatkov, je smiselno osnovne vire za izdelavo plačilne bilance razvrstiti v naslednje sklope podatkovnih virov: a) Podatki na osnovi posrednega poročanja: Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 12

20 poročila o stanjih na računih in transakcijah med rezidenti in nerezidenti, podatki o plačilih preko računov domačih bank v tujini (tudi računov centralne banke), plačila preko računov nerezidentov pri domačih bankah, drugih domačih podjetij pri bankah v tujini, podatki o poslovanju preko drugih odprtih računov med rezidenti in nerezidenti kontokorentni računi, plačila nerezidentom v SIT gotovina. Poročati so dolžne vse banke, ki opravljajo plačilni promet s tujino in vsi rezidenti, ki imajo odprte račune v tujini. Izjema so fizične osebe. Pravilen podatek o vrsti transakcije je sicer dolžan posredovati rezident nalogodajalec oziroma upravičenec plačila, pri čemer so banke zavezane k izvajanju kontrole. Uredba EU, omenjena uvodoma, pa banke iz stroškovnih vidikov te naloge razbremenjuje. Posledično zato upravičeno pričakujemo kvantitativni in kvalitativni izpad podatkov iz plačilnega prometa s tujino kot najpomembnejšega vira za plačilno-bilančno statistiko. b) Podatki na osnovi neposrednega poročanja: podatki o črpanjih/odplačilih kreditnih poslov s tujino iz evidence o registriranih kreditih, najetih v tujini oz. danih tujini, poročila o kratkoročnih komercialnih kreditih, poročila o naložbah kot vir za reinvestirane dobičke neposrednih naložb, računovodski podatki Banke Slovenije, računovodski podatki bank, v zadnjem času tudi že matrično poročanje, mesečna anketa prostocarinskih prodajaln, letna poročila o naknadnih odpisih izvoza in uvoza blaga in storitev (anketa vzorec), poročila o nakupih in prodajah vrednostnih papirjev med rezidenti in nerezidenti preko pooblačenih udeležencev trga vrednostnih papirjev v Sloveniji. c) Modeli ocene: odkupov tuje gotovine in čekov od tujcev v menjalnicah (del postavke potovanja), izdatkov za potovanja v tujino vključno z»prekomejnimi«nakupi blaga, plačil iz tujine slovenskim delavcem dnevnim migrantom, italijanskih pokojnin (UMAR) do konca leta 1998, transakcij s tujo gotovino in vlogami slovenskih gospodinjstev. d) Zunanji viri (druge institucije): enotne carinske listine (ECL) in Intrastat (od vstopa Slovenije v EU) so glavni vir podatkov o blagovni menjavi (mesečno), podatki o vlogah fizičnih oseb rezidentov v tujini (Banka za mednarodne poravnave). Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 13

21 OSREDNJI VIRI PODATKOV ZA RAZISKAVO Kot navedeno v razdelku 1.5., se osredotočamo na podatke o transakcijah rezidentov po namenu plačil z nerezidenti tabele plačilnega prometa s tujino in na tovrstne transakcije preko računov v tujini tabele računov v tujini. Podatki se preko produkcijskih baz podatkov na vhodu statističnega informacijskega sistema (kontrola kvalitete) prenašajo v relacijske baze podatkov, namenjene statistični in analitični obdelavi (metodološkemu delu in pripravi izhodnih informacij). Baza podatkov s tabelo plačilnega prometa s tujino je zelo obsežna, polni se z dekadno frekvenco poročanja in mesečno obsega preko transakcij. Vsaka transakcija pa je lahko potencialno razčlenjena na več zapisov v primeru, da je bilo plačilo izvedeno za več namenov hkrati (specifikacije). Posamezen podatkovni zapis ima 52 atributov. Faza selekcije in čiščenja podatkov kot predpriprava za našo raziskavo je zahtevna predvsem pri omenjenem podatkovnem viru, saj želimo pripraviti dovolj fleksibilen prototipni model. Želeno je bilo, da bi skupni vir podatkov za obdobje ne presegal 1,5 GB. Drugi vir podatkov so računi v tujini. Po obsegu je manj zahteven, polni se z mesečno frekvenco, podatkovni zapis pa zajema 18 atributov. Poleg navedenih področij smo glede na namen raziskave iz relacijske baze za model uporabili še register poročevalcev ter tabele, ki nam omogočajo proučevanje njihovih lastnosti (računovodski izkazi, neposredne naložbe). Pri slednjih smo, tako zaradi obsega baze kot vsebinske analize, atribute izbirali še bolj selektivno DELOVANJE OBSTOJEČEGA SISTEMA Dejstvo je, da je metodološko delo sestavni in zelo pomemben del procesa v okviru dela na področju finančne statistike pri pripravi končne plačilno-bilančne informacije. Slovenija je v zadnjem desetletju, vsaj v ekonomskem pogledu, prešla skozi zelo velike strukturne spremembe. Na tem mestu lahko v kontekstu naše naloge zlasti omenimo celovito liberalizacijo kapitalskega in finančnega računa. Na primer, poznani so ukrepi odprave omejitev za odpiranje računov v tujini, najema posojil, portfeljskega investiranja nerezidentov, itd (Banka Slovenije, 1999). Poleg deregulacije pa se z globalizacijo, finančnimi inovacijami in tehničnim napredkom močno spreminjajo tudi objektivne zunanje ekonomske okoliščine poslovanja slovenske ekonomije. K vsemu skupaj pa v zadnjih letih močno prispevajo tudi politično ekonomski integracijski procesi povezovanja Slovenije z evropsko unijo (EU) in vstopanje v evropsko monetarno unijo (EMU). Kvalitetna plačilna bilanca pa mora odražati»poslovanje«slovenije v tako»turbulentnem«okolju. Metodološko delo je zato neprestano tudi pred novimi izzivi pravilnega zajema, obravnave in klasifikacije novih transakcij med rezidenti Slovenije in ostalim svetom. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 14

22 Po strukturi virov podatkov za pripravo plačilne bilance Slovenije, navedenih v razdelku 2.1., je razvidno, da se že uporablja heterogen pristop, na kar opozarjajo v zadnjih letih razviti nekateri elementi sistema neposrednega poročanja; npr. zajem kratkoročnih komercialnih kreditov preko poročanja vzorca podjetij, uporabljeni vir na področju vrednostnih papirjev ipd. Za metodologijo slovenske plačilne bilance je značilen sistem tako imenovanega zaprtega poročanja znotraj posrednega načina poročanja. Zaprt sistem poročanja pomeni, da se spremljajo vse transakcije, na primer na računih rezidentov v tujini, tudi takšne, ki se potem metodološko ne vključijo v samo plačilno bilanco. Imenujemo jih»nevtralne transakcije«, omogočajo pa celovit zajem poslovanja rezidenta preko določenega računa. Samo uvajanje sistema neposrednega poročanja pa pomeni tudi odpravljanje koncepta zaprtega sistema poročanja. Ker je plačilna bilanca, podobno kot v poslovnih financah knjigovodstvo, vrednostno spremljanje in evidentiranje že opravljenih (prenos lastnine nad predmetom menjave) transakcij med rezidenti in nerezidenti, je na tem mestu pomembno, da opredelimo relativni pomen posameznih temeljnih ekonomskih kategorij tekočega računa. Približno 60 % vrednosti izvoza blaga in storitev predstavljajo podatki zunanje trgovine (blagovna menjava), ki jih zagotavlja Statistični urad RS. Vse ostale vire podatkov zagotavlja Banka Slovenije. Drugo najpomembnejšo postavko na tekočem računu predstavlja storitvena menjava (30 % celotnega izvoza oziroma kreditnega prometa). Preostali dve temeljni kategoriji (dohodki, tekoči transferi) predstavljata približno 20 % celotnega letnega izvoza oziroma kreditnega prometa na tekočem računu plačilne bilance. Slednje tri postavke v osnovi temeljijo na podatkih plačilnega prometa s tujino oz. sistemu posrednega poročanja preko bank. Relativni vrednostni pomen posameznih postavk kapitalskega in finančnega računa plačilne bilance ni v ospredju. Na kapitalskem in finančnem računu plačilne bilance naj z vidika pomembnejše uporabe podatkov posrednega poročanja omenimo zlasti postavke: neposredne naložbe, portfolio naložbe, ter z vidika odplačevanja tudi postavko posojila. Konec leta 2005 imamo zagotovljene kvalitetne nadomestne vire za področje vrednostnih papirjev, ki jih je potrebno, v povezavi z dohodkovnim delom na tekočem računu, pravilno metodološko vključiti v pripravo plačilne bilance. Ker se vse transakcije ne glede na naravo predmeta menjave (tekoči ali kapitalski račun) med rezidenti in nerezidenti odrazijo posledično na računih gotovine in vlog rezidentov, nam zaprti sistem plačilne bilance omogoča njeno uravnoteženje in s tem čim manjšo postavko "neto napake in opustitve". Približno takšen kontrolni način uravnoteženja bo potrebno ohraniti tudi v razmerah prevladujočih virov neposrednega poročanja ter naše vključitve v širše denarno področje. Valuta menjave ne bo več pomemben kriterij ločevanja pri ugotavljanju neto terjatev do nerezidentov iz naslova gotovine in vlog rezidentskih sektorjev ekonomije. Vsekakor navedeni problem predstavlja najtežji metodološki izziv pri pripravi celovitega konceptualnega okvira plačilne bilance Slovenije (Banka Slovenije, 2005). Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 15

23 2.3. PROBLEMATIKA Velikost izpada podatkov, zaradi uveljavitve Uredbe, iz še vedno prevladujočega vira posrednega poročanja smo po vrednosti in številu transakcij simulirali na preteklih podatkih za leto 2003 (zadnje leto izven EU) ter glede na povečano število članic EU 25 v letu Izvoz / Kredit Uvoz / Debet Vsa (od Vsa (od Prag poročanja bank) bank) Storitve Transport Potovanja Komunikacijske Gradbene Zavarovalne Finančne Računalniške Licence, patenti Ostale poslovne Kulturne Državne Dohodki Tekoči transferi Skupaj Delež v Skupaj (%) 100,0 74,0 3,2 100,0 68,0 3,3 Tabela 1: Število plačilno-bilančnih transakcij, evidentiranih na izvozu in uvozu storitev, dohodkov in tekočih transferov v letu 2003 (simulacija za prag poročanja evrov in evrov za EU-25), Vir: Banka Slovenije, Finančna statistika Predhodna analiza podatkov za Slovenijo za leto 2003 pokaže, da je delež vrednosti čezmejnih plačil do evrov 9 %, delež števila nalogov pa 75 %. To pomeni, da imamo po pričakovanju opraviti z velikim številom plačil manjših vrednosti. Uredba predvideva, da se prag neporočanja malih plačil s poveča na evrov, kar bi, zlasti po vrednosti, pomenilo še večji izpad podatkov za postavke plačilne bilance, ki temeljijo na podatkih plačilnega prometa s tujino pridobljenih preko poslovnih bank (posredno poročanje). Za najbolj občutljive postavke plačilne bilance Slovenije, z vidika učinkov obravnavane Uredbe, ki so prikazane v sliki 1, ugotavljamo v tabeli 1 skupni izpad v višini 74 % oz. dodatnih 3,2 % števila kreditnih transakcij (izvoz storitev) v primeru uvedbe prvega oz. drugega praga poročanja. Na uvozni oziroma debetni strani pa je izpad po številu transakcij zelo podoben in znaša 68 % oz. dodatnih 3,3 % v primeru praktične uvedbe prvega oziroma drugega praga poročanja. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 16

24 Podobno močan je izpad zajema transakcij na glavnih postavkah storitvene menjave in tekočih transferjih. Nekoliko manjši je izpad (nekaj pod 50 %) na dohodkovnem delu tekočega računa. Izpad je torej neposredno odvisen od prisotnosti pojava plačil majhnih vrednosti na posamezni postavki. Tipično je to značilno na primer za ostale transfere prebivalstva v tujino (npr. rente, preživnine, invalidnine, nakazila zdomcev, ipd). Uvedba drugega praga poročanja nam po pričakovanju prinaša bistveno večji izpad v vrednosti posamezne postavke in relativno zanemarljiv izpad z vidika zajema po številu transakcij, glede na izpad pri prvem pragu poročanja ( evrov). Takšen razvoj dogodkov pa ne deluje v smeri racionalizacije poročanja, ta je verjetno bistveno smotrnejša pri uvedbi prvega praga poročanja. Pri tem mislimo predvsem na vzorčenje poročevalcev. Prvi prag poročanja pa, zaradi narave plačil (plačila velikih vrednosti) ne prinaša izpada podatkov na z vidika Uredbe občutljivejših postavkah kapitalskega in finančnega računa plačilne bilance: neposredne naložbe, portfolio naložbe. Simulacije so pokazale približno 9 % izgubo informacij po vrednosti plačil za potrebe plačilne bilance pri prvem pragu poročanja. Standardni odklon od povprečja je zelo velik in najbolj so prizadete postavke storitvene menjave, kjer gre za veliko število plačil manjših vrednosti. Absolutni prag poročanja pa ob različni stopnji gospodarske razvitosti članic praviloma prinaša neenakomerno distribucijo izgube podatkov po članicah. Posebej pa to velja s 1. majem 2004 za nove članice EU. Kako močna je problematika uveljavitve Uredbe za statistično področje, nam nakaže naslednja objava stališča Evropske centralne banke (ECB, 2003): Recital 7 of the proposed regulation mentions that Regulation (EC) No 2560/2001 of the European Parliament and of the Council of 19 December 2001 on cross-border payments in euro has a direct impact on the collection of statistics. In particular, Article 8 thereof refers to the possibility of raising the threshold for reporting cross-border payments by banks from 12,500 euros to 50,000 euros. This raises some concerns, in particular because such a rise of the threshold may affect the quality of the balance of payments of EU Member States and countries that will become EU Member States, for which balance of payments statistics are important in assessing whether the convergence criteria are met., Done at Frankfurt am Main on 1 December The President of the ECB: Jean- Claude TRICHET." Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 17

25 v mio SIT skupaj prag v EU-25 prag v EU-25 izvoz 2003 Delež postavke v nadrejeni postavki Podatki bank Skupaj Delež podatkov bank v postavki Delež podatkov bank v Podatki bank postavki Podatki bank Delež podatkov bank v postavki Storitve , ,7 57,4% ,5 15,5% ,7 16,4% Transport 27,6% , ,3 67,4% ,1 28,4% ,8 12,6% Potovanja 48,0% , ,1 34,9% ,4 9,3% ,3 18,4% Komunikacijske 2,5% 9.710, ,1 67,4% 375,8 2,8% 715,3 5,6% Gradbene 2,8% , ,7 93,4% 945,6 6,6% 1.895,9 15,7% Zavarovalne 0,2% 534, ,9 39,9% 36,7 2,9% 56,5 4,7% Finančne 0,7% 3.580, ,1 89,6% 618,4 26,3% 278,8 8,5% Računalniške 3,2% , ,6 98,5% 825,1 5,2% 1.443,8 9,9% Licence, patenti 0,4% 2.206, ,1 99,8% 353,8 25,1% 170,6 9,9% Ostale poslovne 13,7% , ,1 93,2% , ,3 - Kulturne 0,7% 4.307, ,5 100,0% 855,8 38,0% 619,3 21,8% Državne 0,2% 0, ,3 0,0% 0,0 0,0% 0,0 0,0% Dohodki , ,7 67,7% 4.141,2 3,7% 6.324,7 5,8% od dela 38,3% 6.159, ,5 13,1% 855,8 1,9% 619,3 1,3% od kapitala 61,7% , , , ,4 - Transferi , ,0 80,4% ,1 48,2% 5.087,7 5,4% Privatni sektor 84,9% , ,6 78,4% ,7 68,3% 4.732,0 6,0% Državni sektor 15,1% , ,3 91,8% 147,4 1,0% 355,7 2,4% Neposredne naložbe Domače v tujini - LASTN. KAP (zmanjšanje) , ,3 97,6% 64,6 0,8% 774,5 12,9% Tuje v Sloveniji - LASTN. KAP (povečanje) , ,5 64,7% 212,5 0,4% 630,5 1,2% Tabela 2: Vrednost plačilno bilančnih transakcij, evidentiranih na izvozu in uvozu storitev, dohodkov, tekočih transferov in neposrednih naložb v letu 2003 (simulacija deleža vrednostnega izpada podatkov za prag poročanja evrov in evrov za cel svet in za EU-25), Vir: Banka Slovenije, Finančna statistika V tabeli 2 vidimo na primer kar povprečni 48 % oziroma le dodatni 5,4 % izpad informacije po vrednostnem zajetju na postavki tekočih transferov v primeru prvega in dodatnega drugega praga poročanja. Pričakovano je zaradi narave plačil izpad velik pri privatnem sektorju. Nasprotno so transferi sektorja splošne države v tujino oziroma iz tujine plačila velikih vrednosti. Prav tako je vrednostni izpad na postavki dohodkov relativno zanemarljiv. Uvedba dviga praga poročanja na evrov več kot za polovico poveča že tako nezanemarljiv izpad vrednostne informacije o menjavi storitev (iz 15,5 % na skupaj 31,9 %). Pri neposrednih investicijah je relativno visok izpad informacije le na slovenskih investicijah v tujino šele pri drugem pragu poročanja. Znano je, da so naše neposredne investicije številčno večje, vendar vrednostno bistveno nižje od tujih neposrednih investicij pri nas. To dejstvo je v neposredni povezavi z deželnim rizikom države prejemnice tuje neposredne investicije. ECB v letu 2005 ponovno objavi svoje stališče do navedene problematike iz Uredbe in predlaga preložitev dviga praga poročanja na 1. januar Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 18

26 Če izgubljamo zelo pomembne vire podatkov in jih želimo nadomestiti s približno enako kvalitetnimi viri neposrednega poročanja, pa moramo precej podrobno poznati poročevalce v preteklem sistemu in njihove značilnosti. K iskanju informacijskih rešitev s smeri podpore odločanju pri gradnji novega sistema pa je usmerjana naša raziskava ISKANJE KRATKOROČNE REŠITVE V DOGOVARJANJU S POROČEVALCI Iz razpoložljivih gradiv in primerjalne študije EU (CMFB, 2004) ugotavljamo, da se države članice EMU (ECB, 2004) v prehodnem obdobju uvajanja alternativnega sistema poročanja praviloma dogovarjajo s poročevalci (bankami) zaradi potreb plačilno-bilančne statistike, hkrati pa so ti dogovori tudi usmerjeni k dejanskim praktičnim realizacijam zniževanja stroškov, kar nalaga Uredba. Slovenija je v primerjavi s članicami EMU še v posebnem položaju, saj je v obravnavanem obdobju vstopila v tečajni mehanizem ERM2 in bo posledično prevzela evro s 1. januarjem Ker bi upoštevanje uredbe glede prvega praga poročanja povzročilo relativno velik izpad podatkov ter ob upoštevanju zgoraj navedenih argumentov in odgovorov na anketo bank glede načina uvedbe določil uredbe, je bil pred vstopom Slovenije v EU dosežen dogovor z bankami, predvsem v dveh smereh: da do uvedbe evra oz. do vstopa Slovenije v Evropsko monetarno unijo, poročanje bank v tehničnem smislu ostaja nespremenjeno, da se uvede poenostavitev poročanja, za čezmejna nakazila v evrih, pri katerih znesek ne presega evrov. Poenostavitev pomeni, da banke pri takih zneskih lahko poročajo posebno šifro osnove plačila. To šifro banke lahko uporabijo v primerih, ko prava šifra osnove plačila ni znana oziroma ni brez zahteve banke posredovana od nalogodajalca oz. koristnika plačila. Taka rešitev je zahtevala minimalne posege v programske rešitve, hkrati pa je bankam omogočala, da dejansko znižajo stroške, ker jim ni potrebno pridobivati manjkajočih podatkov (potrebnih izključno za statistične namene) od komitentov. Banka Slovenije je na ta način ohranila potrebno informacijo za ohranjanje konsistentnosti plačilnobilančne statistike v posebej občutljivem obdobju. Razlogi za dogovor z bankami so bili naslednji: Vpliv izpada podatkov na merjenje plačilno-bilančnih tokov ob vstopanju in delovanju v ERM 2. Mnenje bank glede implementacije Uredbe o čezmejnih plačilih v praksi anketa Banke Slovenije. Praksa v državah EU glede poročanja ob uvedbi Uredbe dogovarjanje za prehodno obdobje zamenjave virov. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 19

27 Problemi uvajanje alternativnega sistema poročanja neposredno poročanje v EMU ni še celovitih rešitev. Drugo: npr. omejenost Uredbe zgolj na valuto evro in čezmejni plačilni promet (le države članice EU) v pogojih domače valute onemogoča sistematično odpravljanje poročanja za plačilno bilanco (npr. niso vključena plačila v evru pod z nerezidentskih računov v državi na rezidentske račune v državi ipd). Ob predpostavki, da ohranimo star koncept poročanja je očitno, da nam bo uvedba praga poročanja za posamično transakcijo nad evri tako prizadela kvaliteto plačilne bilance, da bi bila makroekonomska informacija za podporo odločanju na tem področju nesprejemljiva. Uvajanje alternativnega sistema neposrednega poročanja je torej neizbežno OBDOBJE PROUČEVANJA SISTEMA Relevantno obdobje proučevanja zajema začetek leta 2003 in bo segalo najmanj do konca leta Predlagano petletno časovno okno predstavlja časovni okvir, v katerem je potrebno nadomestiti obstoječi sistem, ki temelji na posrednem viru podatkov, z novim, ki bo temeljil na neposrednem (direktnem) poročanju. Okolica sistema je, kot omenjeno, v proučevanem obdobju zelo dinamična, oziroma so vplivi nanj zelo močni. Upravljanje sistema je postopek, s katerim želimo dinamičnemu sistemu spremeniti dinamiko obnašanja v skladu z njegovim ciljem in dejanskim stanjem (Kljajić, 1994). Leto 2003 je zadnje leto, ko Slovenija še ni bila članica EU. V letu 2004 Slovenija vstopi v EU, odpravijo se carine v menjavi z 24 državami ter se posledično spremenijo carinski režimi v trgovanju z drugimi državami. Prav tako v letu 2004 Slovenija vstopi v tečajni mehanizem ERM 2 in s tem nakaže želeni prevzem evra kot nacionalne valute že v letu Leto 2005 je leto doseganja konvergenčnih kriterijev, ki so pogoj za vstop v evrsko denarno območje. Leto 2006 je predvideno zadnje leto obstoja slovenske nacionalne denarne enote tolarja. Leto 2007 bo prvo leto delovanja v evro območju. Glede zamenjave virov je načrtovana zamenjava vira na področju vrednostnih papirjev v prvi polovici leta 2006, v letu 2007 pa dokončen prehod na nov konceptualni okvir plačilne bilance (zamenjave virov tudi na postavkah storitev in transferov ter novo uravnoteženje plačilne bilance). Slika 3 nazorno prikazuje ključne dejavnike, ki iz okolice sistema močno vplivajo na odločitveni proces oziroma s tem dinamiko izgradnje novega sistema zbiranja podatkov in priprave plačilno-bilančne statistike. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 20

28 VALUTA SIT EVRO TAČAJNI MEHANIZEM Uravnavani drseči ERM 2 FIKSNI ČAS Uredba EU 2650/01 Marec 2004 Dogovor z bankami Veljavnost Uredbe Prag Banke v RS Prag Stališče ECB Slika 3: Časovno okno proučevanja sistema Uvodoma k temu poglavju smo poenostavljeno obrazložili povezanost zunanjega ravnovesja neke države, ki se izraža v saldu tekočega računa plačilne bilance, z režimom tečajnega mehanizma. Slovenija v proučevanem časovnem oknu menja kar tri tečajne mehanizme in posledično zamenja nacionalno valuto z vstopom v širše denarno območje. Slednje predstavlja tudi poseben izziv novemu konceptu, saj originalna valuta posla ni več posredni kriterij za določanje pozicije rezidentov na finančnem instrumentu gotovine in vlog. V takšnih objektivnih okoliščinah je najmanj "neresno", če že ne kaj več, menjati metodologijo plačilno-bilančne statistike. Konsistentnost in preglednost morata biti temeljni načeli statističnega dela v takšnih razmerah. Pomen zunanjega ravnotežja za doseganje realne finančne stabilnosti, poudarjen s strani ECB, ter njeno popolno razumevanje položaja novih članic v podajanju uradnih stališč dajeta možnosti za pripravo relativno kontroliranega prehoda v nov sistem plačilno-bilančne statistike. Za Slovenijo so časovni roki pri tem najkrajši, saj bo med novimi članicami EU prva prevzela evro. Cilj bo dosežen, če bo zagotovljena primerljiva kvalitetna raven nacionalne plačilne bilance. Pričakujemo, da se bo pomen te makroekonomske informacije z našim vstopom v širše denarno območje še povečal. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 21

29 3. PODATKOVNA SKLADIŠČA IN PODATKOVNO RUDARJENJE 3.1. METODE RAZVOJA PODATKOVNIH SKLADIŠČ Definicije podatkovnega skladišča so različne. V grobem zapisano se podatkovno skladišče nanaša na baze podatkov, ki so praviloma ločene od operativnih baz podatkov, pomembnih za vsakodnevno delovanje posamezne organizacije. Poleg tega pa so tudi usmerjene v posamezen predmet proučevanja (v našem primeru denimo gre za transakcije med rezidenti in nerezidenti), so integrirane z drugimi bazami podatkov (veliko različnih virov podatkov za podatkovno skladišče) in imajo tudi časovno komponento. Slednje pomeni, da ima vsaka ključna struktura v podatkovnem skladišču tudi časovno dimenzijo (v našem primeru proučujemo transakcije med rezidenti in nerezidenti v določenem časovnem obdobju). Podatkovna skladišča, kot ločena baza podatkov, so tudi relativno nespreminjajoča se, ob izjemi osveževanja virov podatkov. Po (Han, Kamber, 2001) lahko zapišemo, da je podatkovno skladišče semantično konsistentna baza podatkov, ki omogoča fizično implementacijo modela za podporo odločanju (analitično) in predstavlja shrambo podatkov za podporo odločanju tudi na strateškem nivoju vodenja organizacije. Pojem "podatkovno skladiščenje" pa predstavlja samo gradnjo in uporabo podatkovnega skladišča. Ker v našem primeru gradimo prototipni model, se poslužujemo tako imenovane metode razvoja skladišča preko različnih poizvedb na različnih vsebinsko, glede na cilje naloge primernih virih podatkov. V fazi potencialne izgradnje trajnega podatkovnega skladišča na tem področju pa pričakujemo pristop izgradnje preko uporabe različnih orodij za povezavo baz podatkov. V splošnem pa oblikovanje podatkovnega modela zahteva: 1. Izbor predmeta proučevanja. Pri tem gre za pojav, ki ga proučujemo: npr. plačilne transakcije med rezidenti in nerezidenti. Predmet proučevana je torej posamezna transakcija. 2. Definiranje najnižje granulacije podatkov. Zanima nas, kako natančno proučujemo posamezno lastnost proučevanega predmeta. Zanima nas, na primer, ali rezident trguje z nerezidenti Evropske unije, ali bolj natančno z rezidenti Nemčije. 3. Izbor dimenzij. Definiramo lastnosti predmeta proučevanja, ki nas zanimajo: na primer država nerezidenta, valuta plačila med rezidentom in nerezidentom, čas transakcije, namen plačila itd. 4. Izbor mer oziroma tabele dejstev. V tej fazi definiramo, kako merimo predmet proučevanja: na primer vrednost transakcije, število plačil. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 22

30 Klasične operativne oz. transakcijske baze podatkov s funkcijo OLTP (neposredna obdelava transakcij), ki omogočajo osredotočenje na predmet poslovanja in enostavno poizvedovanje, so torej praviloma ločene od podatkovnih skladišč. Transakcijske baze podatkov pridobivajo tudi ustrezne vire iz drugih baz podatkov in so zato zelo obsežne. Podatkovna skladišča niso nujno tako ažurna kot transakcijske baze. Informacije, ki jih pridobivamo, so namenjene le pasivnemu informiranju branju, časovne frekvence podatkov so nižje, vendar je poizvedovanje večdimenzionalno in hkrati je omogočeno neposredno analiziranje (OLAP). Slednji funkciji pa, kot izhaja tudi iz naše naloge, omogočata zelo učinkovito podlago za podporo odločanju. Podatkovna skladišča s tehnologijo OLAP temeljijo na večdimenzionalnih bazah podatkov. Pri tem pravimo, da so podatki urejeni uskladiščeni v obliki podatkovnih kock. Tridimenzionalna geometrična lastnost kocke pa je lahko zavajajoča, saj podatkovna skladišča omogočajo več kot le tri dimenzije. Dimenzije predstavljajo atribute, po katerih neka organizacija želi spremljati nek pojav (dejstva) v svojem poslovanju. Poleg same uporabe različnega števila dimenzij pa se vire podatkov ureja in razčlenjuje v podatkovnem skladišču tudi s pomočjo konceptualne hierarhije posamezne dimenzije. Praviloma so dimenzije hierarhično urejene. Tako v podatkovnih skladiščih pridemo do pojava "granulacije" podatkov. Praktični nivo granulacije nam seveda omejuje razpoložljivost z vidika vhodnih virov podatkov. Učinkovitost izvedbe pa je odvisna od vsebinsko pravilno zastavljenih konceptov urejanja dimenzij. Le ta pa je odvisna od poznavanja področja, ki ga proučujemo. Dimenzije so lahko pravilno ali delno hierarhično urejene. Npr. frekvenca "teden" v dimenziji časa nam onemogoča čisto hierarhično ureditev, če uporabimo v hierarhiji tudi mesec. Praviloma pa nam, vsaj za dimenzije tipa "čas", razpoložljiva programska oprema nudi že vgrajene rešitve (na primer uporabo fiskalnega leta, akademskega leta ipd). Mogoče je urediti tudi numerične atribute, ki jih sicer navadno uporabimo kot mere v podatkovnih skladiščih. Konceptualna hierarhija dimenzij nam omogoča obvladovanje podatkovnih skladišč na različnih nivojih abstrakcije, kar je temeljna funkcionalnost OLAP. Večdimenzionalni podatkovni model za razvoj podatkovnega skladišča je tipično zasnovan oziroma osredotočen na osrednji pojav proučevanja (ang. "fact" dejstvo). Pestrost vrednosti atributov, ki opredeljujejo posamezen podatkovni zapis v tabeli dejstev, nam okvirja možnosti razvoja podatkovnih skladišč oziroma konceptualne sheme urejanja dimenzij. Tabele dimenzij povežemo s tabelo dejstev v model podatkovnega skladišča. Glede na zahtevnost raziskave lahko pripravljamo z obstoječimi dimenzijami podatkovnega skladišča različne podatkovne modele (sheme). Takšen model lahko obstaja praviloma v dveh oblikah shemah: 1. Zvezda: Okrog podatkovno bogate tabele dejstev so povezane tabele dimenzij, za posamično dimenzijo pa obstaja samostojna tabela. Kadar povezujemo več zvezdnatih modelov, lahko govorimo o modelu tip: galaksija. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 23

31 2. Snežinka: Je izvedena oblika zvezdnate sheme z normalizacijo posameznih dimenzij, v smeri dodatnih tabel, povezanih na dimenzijo. Izvajanje konceptualne hierarhije dimenzij in oblikovanje praktičnega modela podatkovnega skladišča, z vidika vsebine raziskave in zasledovanja ciljev raziskave, podrobno opisujemo v razdelku 4. V tej fazi lahko še zapišemo, da oblikovanje učinkovitega podatkovnega skladišča zahteva zelo dobro poznavanje področja raziskave. Samo podatkovno skladiščenje pa lahko po zahtevnosti primerjamo s kompleksno gradnjo neke zgradbe, pri kateri imajo praviloma lastnik-naročnik, arhitekt in izvajalec različne poglede na končno implementacijo. V tem kontekstu je potrebno pri gradnji podatkovnega skladišča upoštevati štiri različne vidike: 1. Pogled od zgoraj navzdol; omogoča selekcijo relevantnih informacij za izgradnjo podatkovnega skladišča. Te informacije vključujejo sedanje in prihodnje zahteve po funkcionalnosti podatkovnega skladišča. 2. Vidik virov podatkov zahteva informacije o razpoložljivosti, načinu zajema, hranjenju in obdelavi podatkov. 3. Vidik podatkovnega skladišča vključuje tabele dejstev in dimenzij, pa tudi informacije shranjene znotraj podatkovnega skladišča (predizračuni, štetja transakcij pri predhodnem agregiranju podatkovnih zapisov, identificiranje časovnih sprememb pri ažuriranju, npr. šifrantov ipd). 4. Vidik poslovnih zahtev končnega uporabnika podatkovnega skladišča OD PODATKOVNEGA SKLADIŠČENJA K PODATKOVNEMU RUDARJENJU Podatkovna skladišča uporabljajo podjetja iz različnih dejavnosti, zlasti močno so v svetu prisotna v bančništvu in ostalem finančnem posredništvu, v trgovini na drobno in predelovalni dejavnosti, kjer je elastičnost proizvodnje na povpraševanje zelo velika. V Sloveniji smo se v letu 2005 na primer spraševali po vzrokih (Terzič, 2005): "Zakaj ima tako malo slovenskih bank izdelano podatkovno skladišče?". Praviloma je učinkovitost izrabe podatkovnega skladišča premo sorazmerna s časom njegovega obstoja. Tudi razvoj podatkovnih skladišč je šel skozi številne faze (Han, Kamber, 2001). Prvotno so se podatkovna skladišča uporabljala za pripravo poročila ali iskanja odgovorov na predhodno definirana poizvedovanja. S časom je prišla v ospredje analiza na agregatni in detajlni ravni, kjer so rezultati predstavljeni v obliki poročil in grafov. Dobri rezultati pripeljejo do rabe na strateškem nivoju vodenja ob izvajanju večdimenzionalnih analiz in bolj kompleksnih operacij po podatkovnem skladišču. Končno razvoj podatkovnih skladišč pripelje do uporabe orodij za podatkovno rudarjenje v smeri iskanja implicitnih zakonitosti v množici podatkov in tovrstne podpore na strateškem nivoju odločanja. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 24

32 3.3. METODE PODATKOVNEGA RUDARJENJA Podatkovno rudarjenje je proces odkrivanja zanimivih oziroma uporabnih vzorcev v podatkih, ki predstavljajo implicitne, prvotno nepoznane zakonitosti ali informacije v obravnavanih podatkih.»data mining is the extraction of implicit, previously unknown, and potentially useful information from data Data mining is defined as the process of discovering patterns in data. The process must be automatic or (more usually) semi-automatic. The patterns discovered must be meaningful in that they lead to some advantage, usually an economic advantage. The data is invariably present in substantial quantities. (Witten, Frank,1999). Pomembna značilnost podatkovnega rudarjenja je uporaba številnih in raznovrstnih metod. Z njihovo pomočjo želimo v fazi procesa odkrivanja zakonitosti v podatkih v skladu z nameni naloge, opisanimi v uvodu, odkriti na primer strukturne vzorce, odločitvena drevesa itd., ki bi nam pomagali pri globljem razumevanju obravnavanega področja ter pri prihodnjih odločitvah v zvezi s statističnim procesom na tem segmentu priprave makroekonomske informacije. Proces podatkovnega rudarjenja izvajamo v skladu s predvidenimi fazami, ponazorjenimi v sliki 4. 1d. Transformacija 1c. Selekcija Pod. skladišče 1b. Integracija 1a. Čiščenje Baze podatkov Datoteke Zun. viri Slika 4: Faze procesa KDD Vir: (Bohanec, 2002) V okviru obdelave podatkov obravnavanega področja poskušamo slediti sosledju faz procesa KDD (Knowledge Data Discovery), ki definirajo naš postopek bolj podrobno, glede na metodo CRISP-DM. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 25

33 V nalogi podatke strukturiramo, prav tako pa se poslužujemo tudi časovne komponente ( ). Iz praktičnih razlogov smo pristopili k delu z najpreprostejšimi tehnikami in poglobili zahtevnost glede na ocenjeno smiselnost in pričakovane rezultate. Upravičenost uporabe metod podatkovnega rudarjenja na področju menjave s tujino, zaradi obsežnosti gradnje celovitega večdimenzionalnega modela plačilno-bilančne statistike, najprej preizkusimo na ožjem segmentu storitvene menjave v krajšem časovnem obdobju na enem viru podatkov (priloga 1). Za lažji sistematični pristop pri iskanju ustreznih metod glede na postavljene cilje naloge pa smo se oprijeli osnovnega ločevanja med metodami nadzorovanega (usmerjenega) učenja na eni in metodami nenadzorovanega (neusmerjenega) učenja na drugi strani (Mladenić in dr., 2003). Med prvimi, ki jih bolj ali manj pokrijemo z algoritmom odločitvenih dreves, omenimo predvsem klasifikacijo in napovedovanje, med drugimi pa grupiranje po privlačnosti (asociacijska pravila), analizo skupin (segmentiranje), opisne in vizualizacijske metode. Na kratko v nadaljevanju teoretično poglejmo po eno metodo obeh vrst učenja s pomočjo podatkovnega rudarjenja, ki ju sicer tudi praktično uporabimo za potrebe raziskave ODLOČITVENA DREVESA V nalogi uporabimo metodo podatkovnega rudarjenja z gradnjo odločitvenih dreves oziroma iskanjem odločitvenih pravil pri proučevanem razredu podatkov (na primer storitve). Rezultati so dejansko predstavljeni v obliki dreves, obrnjenih navzdol, od korena na vrhu preko vozlišč do listov. Listi predstavljajo dejanske podatkovne zapise (razrede), ki ustrezajo določenim pravilom v vozliščih, ki potekajo od korena v smeri zadevnih listov. Kadar proučujemo diskretne slučajne spremenljivke, govorimo o algoritmu klasificiranja (vsak podatkovni zapis klasificiramo), v primeru zveznih slučajnih spremenljivk pa govorimo o napovedovanju (regresija). Pri klasifikacijskih pravilih se zvezne slučajne spremenljivke prevedejo na diskretne z vpeljavo na primer frekvenčnih razredov (na primer zneske plačil, število plačil v našem primeru). Vozlišča predstavljajo pogoje (teste). Praviloma gre za preverjanje vrednosti atributa, pogosto v smislu binarne vejitve (Bohanec, 2002). Algoritem, ki omogoči izgradnjo odločitvenih dreves, poteka v naslednjem zaporedju (Han, Kamber, 2001): Drevo se začne v enem korenu, ki predstavlja vse obravnavane podatkovne zapise. V kolikor vsi proučevani podatkovni zapisi pripadajo istemu proučevanemu razredu, potem je rezultat list, ki ponazarja ta razred, Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 26

34 sicer algoritem izbere atribut, ki omogoča najboljšo delitev proučevane množice na čim bolj čiste podmnožice. Kriterij je največji informacijski prispevek (ang. "information gain"). Informacijski prispevek nam pove, kako dober je posamezen atribut za napoved izbranega dogodka oz. koliko pridobimo ob členitvi. Izbrani atribut je odločitveni atribut. V tej fazi morajo biti zvezne spremenljivke prevedene na diskretne. Izdela se veja za vsako vrednost (frekvenčni razred) izbranega atributa. Glede na vrednost tega atributa se klasificirajo podatkovni zapisi. Algoritem se ponavlja na vseh nivojih odločitvenega drevesa; dokler ni več podatkovnih zapisov oziroma vsi pripadajo določenemu razredu ali pa ni več atributov, po katerem bi členili podatkovne zapise v listu. V poskusnem rudarjenju (priloga 1) smo pri spoznavanju orodij in metod podatkovnega rudarjenja uporabili tudi programsko opremo WEKA (University of Waikato, 2002). To orodje uporablja algoritem C4.5, ki so ga razvili iz klasifikatorja ID3 (opisani algoritem). Izboljšave se kažejo predvsem v metodah za obdelavo atributov z numeričnimi, manjkajočimi in šumnimi podatki (Witten, Frank, 1999). Na primer Weka 3 reže veje na podlagi minimalnega števila primerov v listih, ki ga določimo s parametrom "M". Z večanjem vrednosti tega parametra se drevo manjša, točnost pa veča, dokler ne doseže optimalne vrednosti. Če vrednost parametra "M" preseže optimalno vrednost, se točnost drevesa začne manjšati. Kakovost odločitvenih dreves vrednotimo na podlagi različnih mer kvalitete (Caruana, 2005): klasifikacijske točnosti, razumljivosti oz. velikosti modela, zanimivosti, novosti, uporabnosti. V naši nalogi smo se z vidika poznavanja vsebine problematike osredotočili na kvalitativne kriterije in s tem zmanjšali problem preobsežnih odločitvenih dreves. Ker gre v našem primeru za integracijo podatkovnega rudarjenja in podatkovnega skladišča ter izgradimo relativno obsežno večdimenzionalno podatkovno skladišče, uporabimo ustrezno programsko opremo, ki omogoča integracijo obojega (MS SQL Analysis Services, 2000). Uporabljeno programsko orodje omogoča kombinacijo tabelarične in grafične ponazoritve podatkov, kar omogoča uporabniku prosto gibanje po hierarhiji dreves. Barvna grafika, s poudarjanjem gostote oziroma verjetnosti pojava, pripomore k hitri orientaciji uporabnika. V našem primeru so drevesa lahko oblikovana z izhodiščem na poljubni hierarhični ravni (ang "interactive multilevel mining") metodologije plačilne bilance (obravnavanega področja). Podatkovne kocke in skrito znanje v konceptualni hierarhiji (poglavje 4) omogočata pregledovanje odločitvenih dreves na različnih ravneh abstrakcije obravnavanega pojava (metodologije plačilne bilance). Ko so odločitvena drevesa (kasneje uporabljamo besedno zvezo "gozd dreves") pripravljena, nam programska oprema omogoča, tudi z funkcionalnostjo OLAP, interaktivno odkrivanje zanimivih odločitvenih dreves. Pri omenjeni integraciji bi posploševanje atributov na zelo podrobni ravni, privedlo do preobsežnih, težko berljivih oziroma nerazumljivih odločitvenih dreves. Po drugi strani bi pretirano posploševanje atributov dalo malo Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 27

35 razčlenjena odločitvena drevesa, praviloma z osnovnimi informacijami. Izbrana programska oprema in izgradnja podatkovnega skladišča nam ob dobrem poznavanju obravnavane problematike, dajeta možnosti hitrega identificiranja zanimivih do sedaj neznanih zakonitosti na obravnavanem področju RAZVRŠČANJE V SKUPINE Razvrščanje v skupine je proces razvrščanja (podatkov) podatkovnih zapisov, katerih razred ni znan, po podobnosti posameznih vrednosti atributov v skupine (Caruana, 2005). Skupina je torej zbir podatkovnih zapisov s podobnimi vrednostmi opazovanih atributov in se po njih loči od drugih skupin. Razvrščanje v skupine temelji na ugotavljanju razlik v vrednosti atributov med podatkovnimi zapisi. Algoritem zato vključuje računanje matrike razlik. Zelo pomembni pri tem pa so tipi posameznih atributov. V našem poskusnem primeru (priloga 1) smo imeli opravka z zelo pestrim naborom različnih tipov spremenljivk: nominalne (dejavnost, sektor, kategorija, storitev, podskupina), binarne simetrične (uvoz/izvoz, skupina), binarna nesimetrična (transport), zvezne (vrednost prometa), diskretna (število transakcij). Ni prisotne spremenljivke z ordinalno skalo. Matrika diferenc med posameznimi podatkovnimi zapisi se lahko izračuna posebej po tipih atributov ali pa skupaj, ne glede na tip atributa. V algoritmih praviloma prevladuje slednje (Han, Kamber, 2001). V poskusu smo uporabili popularno metodo "K mean" oziroma metodo voditeljev kot nehierarhično metodo razvrščanja v skupine. Algoritem poteka v sledečem zaporedju: V naprej smo določili število skupin: k = 10. Program je začetno naključno izbral 10 podatkovnih zapisov voditeljev (centroidi). Vsak od njih začetno predstavlja lastnosti ene skupine po vrednosti svojih atributov. Ostali podatkovni zapisi se priključujejo v skupino k tistemu voditelju, s katerim so razlike do njegovih lastnosti (vrednosti atributov) najmanjše. Pri spremenljivkah z na primer nominalno skalo algoritem poišče najpogostejšo vrednost v skupini (modus). Na podlagi dobljenih razdalj (diferenc) se oblikujejo začetne skupine. Po razvrščanju algoritem za podatkovne zapise vsake skupine izračuna povprečne vrednosti (pri numeričnih atributih) atributov. V primeru, da centroidi niso v sredini vsake skupine, se določijo nove središčne točke. Te vrednosti atributov v posamezni skupini, v naslednjem koraku, postanejo novi voditelji, na osnovi katerih se ponovno prerazvrsti vse podatkovne zapise. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 28

36 Z iteracijami se doseže stacionarno stanje, ki predstavlja rezultat uporabljene metode. V tem primeru je vsota kvadratov odklonov od "povprečij" za vse skupine skupaj najnižja. Izračun diference je seveda omogočen med podatkovnima zapisoma z različnimi tipi atributov (Han, Kamber, 2001): d( i, j) p δ = p ( f ) ij f = 1 δ d ( f ) ij ( f ) ij (3.1) ) Oznaka p pomeni število spremenljivk različnega tipa. Indikator δ ( f ij ima vrednost 0, če ni podatka za spremenljivko f pri podatkovnem zapisu i oziroma j, ali pa sta obe vrednosti enaki 0 in je spremenljivka binarna asimetrična; sicer je vrednost indikatorja ( f ) ) δ ij =1. Prispevek spremenljivke f k razliki d ( f ij, med vrednostjo te spremenljive ( x if ) pri podatkovnem zapisu i in vrednostjo te spremenljive pri podatkovnem zapisu j x ), je odvisen od tipa spremenljivke f: ( jf ( f ) ) Za binarno spremenljivko f velja: d ij =0, če x if = x jf ; sicer d ( f ij =1. xif x ( f ) jf Za zvezno spremenljivko f velja: d ij =, kjer h teče le max h xhf min h xhf preko podatkovnih zapisov z nemanjkajočimi vrednostmi spremenljivke f. Za spremenljivko f z ordinalno oziroma nelinearno skalo (npr. eksponencialno) se za vrednost x if določi rang r if in iz njega standardizira vrednost rif 1 spremenljivke na način: z if =, kjer je M f vrednost najvišjega ranga za M f 1 proučevano spremenljivko. Diferenca za standardizirani vrednosti z if in z jf se potem izračuna na enak način kot za zvezno spremenljivko. Metoda K-mean je primerna za obdelavo velikih baz podatkov, saj delovanje algoritma ni zahtevno. Ima pa slabost, da je občutljiva na podatkovne zapise, katerih vrednosti posameznih atributov močno odstopajo od povprečja. V tem pogledu so razvili bolj robustno metodo "k-medoid" (PAM Partitioning around Medoids). "Medoid" je definiran kot najbolj centralni podatkovni zapis v skupini. Algoritem se razlikuje od K- mean po tem, da se ne približuje le podatkovni objekt posameznemu voditelju, ampak se v primeru, ko je prispevek k vsoti kvadratov odklonov (celotna vsota zamenjav) vseh ostalih podatkovnih objektov (ne le v skupini) negativen, zamenja tudi medoid. Problem te metode je v obsežnosti računanja in je zato manj primerna za velike baze podatkov. Razvoj rešitve problema je šel v smeri kombiniranja naključnega vzorčenja Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 29

37 z algoritmom PAM (Algoritem CLARANS Clustering Large Applications base upon RANdomized Search). V našem primeru izbranih osnovnih atributov oziroma mer za proučevanje obravnavane teme uporabljamo zgolj zvezne in nominalne spremenljivke. Programska oprema MS Analysis Services nam v tem pogledu daje zadovoljive oziroma razumljive rezultate. Zlasti nekatere lastnosti podjetij je v bodoče smiselno (glej razdelek ) pretvoriti v ordinalno skalo (npr. lastnina, velikost podjetja, dobička, prihodkov, tujih neposrednih naložb itd.). V nalogi uporabljamo metodo razvrščanja v skupine ob kombinaciji neposrednega analitičnega procesiranja na večdimenzionalnem podatkovnem skladišču. Problemu podatkovnih zapisov, ki močno odstopajo, se izognemo s pomočjo hitre detekcije in vsebinske razlage ob uporabi OLAP funkcionalnosti. Sistem Analysis Services za razvrščanje v skupine uporablja Expectation Maximization (EM) klasifikator (Soni, et al., 2001). Klasifikacija se izvede v dveh korakih: Za vsak primer se izračuna verjetnost za pripadanje določeni skupini. Za izračun te verjetnosti se uporablja normalna porazdelitev. Algoritem nato želi povečati verjetnost, izračunano v prvem koraku. Proces se ponavlja, dokler skupina ni optimalna. Podatki v vsaki skupini so porazdeljeni po Gaussovi porazdelitvi. Klasifikator EM je sicer po načinu delovanja zelo podoben klasifikatorju K-mean. Bistvena razlika je v tem, da EM klasifikator nima centroida na sredini skupine, kar je sicer značilno za metodo K-mean. Ker nas zanima bodoče oziroma pričakovano obnašanje in poročanje v novem sistemu glede na pretekle izkušnje, oziroma ali so si posamezna podjetja z določenimi lastnostmi podobna po načinu poročanja, nam še posebej ustreza vpeljava koncepta verjetnosti porazdelitve v posamezno skupino. Zato menimo, da je metoda v MS Analysis Services za naše proučevanje primerna. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 30

38 4. IZGRADNJA PODATKOVNEGA SKLADIŠČA V tem poglavju opišemo izgradnjo podatkovnega skladišča, od uporabljenih virov, preko faz procesa KDD (slika 4), do oblikovanja dimenzij in definiranja dejstev ter končne priprave različnih modelov znotraj podatkovnega skladišča podatkovnih kock. Cilj je izgraditi takšno podatkovno skladišče, ki na urejen način obravnava stare podatkovne vire za pripravo plačilno-bilančne statistike. Zaradi obsežnosti podatkovnih virov, ki jih nadomeščamo z novim načinom neposrednega poročanja, je potrebna selekcija atributov. V obsežnem večdimenzionalnem prostoru podatkovnega skladišča potem neposredno izvajamo metode podatkovnega rudarjenja. Med številnimi arhitekturami sistemov za podatkovno rudarjenje izpostavimo, tudi v kontekstu ciljev naše naloge, tako imenovani sistem neposrednega analitičnega podatkovnega rudarjenja (OLAM "on-line analytical mining"), ki združuje neposredno analitično obdelavo podatkov (OLAP) in podatkovno rudarjenje v večdimenzionalni bazi podatkov (podatkovnem skladišču). Takšno arhitekturo baze podatkov želimo zagotoviti na obravnavanem področju finančne statistike. Zato pa je potrebno izpolniti štiri pogoje: 1. visoka kvaliteta podatkov v podatkovnem skladišču, 2. ustrezna informacijska infrastruktura okrog podatkovnega skladišča, 3. zagotoviti funkcionalnost OLAP ter 4. zagotoviti funkcionalnost orodja za podatkovno rudarjenje. Funkcionalnost OLAP in orodij podatkovnega rudarjenja je mogoče obravnavati tudi ločeno. Prvo nam zagotavlja lažje in hitrejše analiziranje s hitro večdimenzionalno agregacijo oziroma dezagregacijo, drugo pa avtomatično iskanje implicitnih vzorcev in skritega znanja v veliki množici podatkov. Vendar pa sta obe funkcionalnosti pogojeni z ustrezno arhitekturo podatkovnega skladišča v smislu prvih dveh navedenih pogojev. Faza izgradnje modela podatkovnega skladišča močno definira njegovo uporabnost. Standardizacija merjenja proučevanih pojavov in vsebinsko poznavanje področja proučevanja sta predpogoj za izgradnjo kvalitetnega podatkovnega skladišča. Smiselno je zagotoviti tudi večjo razsežnost podatkovnega skladišča, da bi imeli pri proučevanja pojava več možnosti obravnave z različnih vsebinskih vidikov (model tipa "snežinka" v želenem atributu). Z enostavnim povpraševanjem in vizualizacijo pridemo neposredno do želenih rezultatov (poveza podatkovnega skladišča z npr. vrtilno tabelo v Excelu), uporabimo osnovne statistične metode (obdelava v Statistica). Za nadzor nad poglobljenim poznavanjem celotnega področja uporabimo metode odločitvenih dreves in razvrščanj v skupine. Metodi je mogoče neposredno izvesti na večdimenzionalnem podatkovnem modelu (MS Analysis Services). Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 31

39 4.1. VIRI PODATKOV BAZA PODATKOV Po vsebini predstavljajo bazo podatkov trije sklopi podatkov: 1. Tabela transakcij plačilnega prometa s tujino, ki vsebuje vsa plačila med rezidenti in nerezidenti preko slovenskih poslovnih bank v obravnavanem obdobju. 2. Tabela računov v tujini, ki vsebuje vse transakcije z nerezidenti preko rezidentskih računov v tujini (pri tujih bankah). 3. Drugi podatkovni viri, ki na eni strani zajemajo osnovne lastnosti rezidentnih podjetij (sedež podjetja, število zaposlenih, velikost podjetja ipd.), po drugi strani pa omogočajo razširitev uporabnosti podatkovnega skladišča in metod podatkovnega rudarjenja na način, predlagan v naši nalogi. V tem pogledu smo izbrali predvsem tabele temeljnih računovodskih izkazov podjetij ter tabele o neposrednih tujih investicijah. V razdelku smo opisali velikost tabele, ki zajema transakcije plačilnega prometa s tujino preko slovenskih poslovnih bank. Podatki o transakcijah na računih v tujini so dopolnilni podatki podatkom iz plačilnega prometa preko bančnega sistema. Potrebno se je zavedati, da so posamezne specifične aktivnosti koncentrirane na poročanje preko takšnega vira podatkov in ga je zato nujno vključiti v analizo kot sestavni del odločitvenega procesa o novem sistemu poročanja. Pri tem pa je potrebno izhajati iz zasnov novega sistema neposrednega poročanja, ki ne bo poznal tovrstnega razločevanja podatkovnih virov. Slednje bo temeljilo le na institucionalnih sektorjih in finančnih instrumentih (Banka Slovenije, 2005) v smislu pravne osnove definiranja zahtev poročanja. Z drugimi podatkovnimi viri smo omogočili nadaljnji razvoj posameznih modelov, predvsem v smeri pridobivanja podatkov o rezidentih iz različnih drugih statistik. Iz Oracle relacijske baze podatkov s povpraševanjem z orodjem Oracle Dicoverer (Oracle Corporation, 2003) selekcioniramo atribute in prenašamo podatkovne zapise iz navedenih podatkovnih sklopov, v podatkovno bazo v okolju Access (Munda, 1999). Na to bazo neposredno povežemo podatkovna skladišča z orodjem MS SQL Services. Seveda je mogoča tudi neposredna povezava podatkovnega skladišča na relacijsko bazo Oracle. Faze procesa KDD: čiščenje, selekcijo, integracijo in transformacijo podatkov večinoma izvajamo s pomočjo programskega orodja Access, deloma pa tudi že z orodjem Oracle Discoverer, zlasti fazi selekcije in čiščenja. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 32

40 ATRIBUTI Konceptualni opis izgradnje podatkovnega skladišča obsega poleg faz procesa KDD tudi opis atributov na osnovi posploševanja in združevanja. V tem pogledu je usmerjen že k pripravi dimenzij podatkovnega skladišča, ki jih opišemo v razdelku 4.3. V pogledu analiz ustreznosti pa konceptualni opis zajema tudi analizo ustreznosti izbranih atributov ter primerjavo in razvrščanje razredov podatkovnih zapisov (razdelek 5.1.) Pripravili smo konceptualni opis izgradnje podatkovnega skladišča na osnovi zelo obsežne zbirke podatkov o transakcijah plačilnega prometa s tujino preko slovenskih bank s pomočjo različnih preprostih metod. S tem smo omogočili predpripravo za izgradnjo podatkovnega skladišča na način, ki bo preko funkcije OLAP zagotavljal hitro poglobljeno opisovanje značilnosti podatkovne zbirke, ki je predmet naše raziskave, v smeri zastavljenih ciljev naloge. Osrednje mesto koncepta izgradnje podatkovnega skladišča predstavljajo transakcije med rezidenti in nerezidenti Slovenije v proučevanem obdobju. Konceptualni opis podaja izbor atributov in dimenzij za potrebe analize ter definira ravni posploševanja v smeri iskanja čim bolj zanimivih informacij oziroma znanj v podatkih. Predstavlja nekoliko širši pojem glede na analize tipa OLAP (ang. "On-Line Analytical Processing"), na primer z vidika širine uporabe različnih tipov atributov. Konceptualni opis je usmerjen k pripravi podatkovnih zapisov tako za opisovanje značilnosti same podatkovne zbirke (ang. "characterization") kot tudi za izvedbo primerjave (ang. "comparison") med različnimi razredi podatkovnih zapisov. Podatkovni zapisi tvorijo razred po enaki vrednosti posameznega opazovanega atributa (ang. "class"). Razred podatkovnih zapisov pa se po ostalih atributih primerja z drugimi razredi. Sklopa podatkov o računih v tujini ter drugih podatkovnih virov sta z vidika priprave konceptualnega opisa relativno enostavnejša in je razumevanje modela v tem pogledu mogoče preko predstavljenega razvoja konceptualnega opisa za primer podatkovnih zapisov transakcij plačilnega prometa s tujino preko slovenskih bank. Poleg navedenega je, zlasti z vidika obsega zadevne podatkovne zbirke, priprava konceptualnega okvira nujna, da bi bila sploh mogoča obdelava tipa OLAP. Iz obsežne relacijske baze podatkov želimo s povpraševanjem izbrati le relevantne podatke, podatkovne zapise z izbranimi atributi, za doseganje ciljev naše naloge. Obravnavani podatkovni vir transakcije plačilnega prometa s tujino preko slovenskih poslovnih bank je zelo kompleksen, saj je posamezen podatkovni zapis sestavljen kar iz 52 atributov. Frekvenca podatkov je desetdnevna, tako da je baza podatkov po obsegu neprimerna za neposredno uporabo. Posplošitev se izvaja bodisi z izločanjem nepotrebnih atributov ali z vsebinsko poenostavitvijo izbranih atributov. Agregacija podatkovnih zapisov pomeni seštevanje Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 33

41 podatkovnih zapisov z enako vsebino izbranih atributov, pri čemer dodamo poseben atribut, ki podaja informacijo o številu združenih prvotnih podatkovnih zapisov na nivoju definirane agregacije. Posledično dobimo tabelo z manjšim številom podatkovnih zapisov. Priprava ustrezne tabele podatkovnih zapisov (ang."task relevant table") je potekala v grobem v naslednjih korakih: Najprej smo izvedli vsebinsko analizo relevantnosti posameznih atributov podatkovnega zapisa v širšem kontekstu naše naloge. Širša vsebinska analiza atributov omogoča celovito obravnavanje področja raziskovanja in ne zasleduje le treh uvodnih ciljev naše naloge. Omogočeno je na primer proučevanje evidentiranja transakcij s knjigovodskega vidika plačilne bilance kot vrednostno zaprtega sistema (dvostavno knjigovodstvo). Tudi na tak način je naš model vsebinsko odprt za nadaljnje modeliranje podatkovnih skladišč na tem področju (priloga 2). Sledi ožji izbor atributov, ki smo jih dejansko uporabili v nalogi. Število atributov naj bi bilo čim manjše. Naredimo selekcijo na nivoju vrednosti atributa "Vrsta zapisa" le za vrednosti "60"(priliv) in "70"(odliv), kar omogoča izenačitev z atributom tipa osnove namena plačil "Ttt_Tip_Osn" in izločitev prvega, ne da bi pri tem izgubili podatke relevantne za doseganje ciljev naše naloge. Od prvotnih 52 atributov (priloga 6) pridemo tako na končnih 10 (tabela 3). Z orodjem Oracle Discoverer naredimo enostavno poizvedovanje po podatkovnih zapisih z izbranimi atributi, pri čemer v izboru podvojimo atribut z matično številko rezidenta in mu dodamo funkcijo štetja originalnih podatkovnih zapisov v posameznem podatkovnem zapisu na želeni ravni agregacije. Zahtevamo podatke za obdobje Rezultat predstavlja ustrezna tabela s podatkovnimi zapisi. Gre za tabelo na kateri bo proces podatkovnega posploševanja (nabor vrednosti atributov) šele izveden (ang. "attribute generalization"). Podatkovno posploševanje je definirano kot proces, ki abstrahira velik del relevantnih podatkovnih zapisov v bazi podatkov iz relativno nizke konceptualne ravni na višjo konceptualno raven (Han, Kamber, 2001). Obstajata dva načina učinkovitega podatkovnega posploševanja: atributna indukcija neposredno na tabeli relevantnih podatkovnih zapisov, posredna metoda z izgradnjo podatkovnih kock oz. OLAP pristop. V našem primeru smo določeno podatkovno posploševanje dosegli že z izborom vsebinsko ustreznih atributov (ang. "attribute removal"). Pri tem smo na primer izločili tudi atribute, ki se podvajajo (npr. zneske v originalni valuti, preračune v USD) ter atribute, ki imajo preveliko število različnih vrednosti in jih ni mogoče posplošiti (npr. naziv tujega partnerja). Izberemo le en atribut tipa datum, ki se nanaša na zadnji dan dekade, v katerem je prišlo do transakcije. Manjša posplošitev je omogočena z agregacijo, saj želimo ohraniti poizvedovanje do nivoja udeleženca v transakciji pri Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 34

42 neposrednem analitičnem poizvedovanju. Posploševanje vrednosti izbranih atributov pa smo zagotovili preko izgradnje podatkovnega skladišča oziroma podatkovnih kock s funkcijo OLAP. Da bi nadzorovali proces posploševanja v smeri ustreznosti glede na želeno uporabo metod podatkovnega rudarjenja, smo uporabili dve tehniki posploševanja: Prag števila različnih vrednosti atributa. Posploševanje na nivoju različnih vrednosti posameznega atributa upošteva splošno pravilo za potrebe podatkovnega rudarjenja: 2 8 različnih vrednosti posameznega atributa. Pravilo pravi, da je postopek posploševanja potrebno nadaljevati, dokler kriterija ne dosežemo (Han, Kamber, 2001). Prag števila različnih podatkovnih zapisov na relacijskem nivoju najnižje ravni posplošitve atributov. Za podatkovno rudarjenje je ta prag praviloma postavljen na različnih podatkovnih zapisov. Število različnih podatkovnih zapisov (po vsebini) na najvišjem nivoju posplošitve je v pozitivni korelaciji s številom izbranih atributov. Pri tem kriteriju v tabeli 3 seveda ne upoštevamo atributa "Ppd Zn evrov" (znesek transakcij(e), izražen v evrih) in atributa "Ppd_Id_COUNT" (število združenih podatkovnih zapisov), ki nastopata kot elementa skladišča v podatkovni kocki, pripravljeni na tem področju. Prav tako ne upoštevamo atributa "Ppd_Leto" in "Tob_Sif" (vrsta zapisa), ki sta v smislu dimenzij in kriterijev povpraševanja po relacijski bazi podvojena z atributoma "Ppd_Dek" (zadnji dan dekade) oziroma "Ttt_Tip_Osn" (tip osnove namena plačil). V praksi ti tehniki izvedemo v navedenem zaporedju pri gradnji podatkovnega skladišča (podatkovnih kock). V naši nalogi smo omejeni s standardnimi hierarhijami dimenzij, ki so mednarodno opredeljene in omogočajo neposredno tovrstno primerjavo. Zlasti to velja za atribut "Ttt_Sif" (Šifra osnove namena plačila), ki ga moramo posploševati v smeri mednarodno predpisane metodologije za plačilnobilančno statistiko (IMF, 1993). Tudi sicer mora biti, ne glede na navedena kriterija v okviru uporabljenih tehnik posploševanja, v ospredju konceptualni opis obravnavanega področja. Če kljub temu preverimo tabelo dejstev, v smislu zgoraj navedenih tehnik posploševanja ob upoštevanju razvoja dimenzij in podatkovnega modela na obravnavnem področju, potem lahko zapišemo, da je upoštevan priporočljivi prag različnega števila vrednosti posameznega atributa. Na posamezni ravni, zlasti pa na najvišji ravni posploševanja, smo v celoti sledili standardnim kriterijem. Tako smo na primer ne glede na standardne hierarhije dodatno posplošili dimenzijo "Rezident" (dejavnost, regija) ter dimenzijo "Dejavnost", kot je opisano v razdelku 4.3. Kot vidimo iz tabele 3, na najvišjem konceptualnem nivoju posploševanja vrednosti izbranih atributov zadostimo tudi drugemu kriteriju procesa posploševanja z vidika relacije dveh atributov, saj le v primeru kombinacije dimenzije države nerezidenta (6 različnih vrednosti atributa) in lokacije (5 različnih vrednosti atributa) dobimo lahko teoretično največ 30 različnih podatkovnih zapisov, v vseh ostalih kombinacijah pa manj kot 30. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 35

43 Največje število različnih vrednosti atributa - najvišji nivo posplošitve Število ravni hierarhije Zap. Št. Atribut Tip Opis 1 Ppd_Leto D Leto 2 Tob_Sif N2 Vrsta zapisa 3 Val_Sif N3 Šifra originalne valute transakcije Psd_Sif_Uponal N8 Matična številka rezidenta lokacija 5 4 sektor 2 4 dejavnost Drz_Sif_Part N3 Šifra države nerezidenta Ttt_Sif N3 Šifra osnove namena plačil Ttt_Tip_Osn N1 Tip osnove namena plačil Ppd_Dek D Zadnji dan dekade Ppd_Id_Count N Število združenih podatkovnih zapisov 10 Ppd Zn Eur N Znesek transakcije v Tabela 3: Struktura tabele relevantnih podatkovnih zapisov in nadzorovanje procesa podatkovnega (atributnega) posploševanja V primerih, ko nastopa manj kot 10 možnih kombinacij dveh dimenzij (na primer namen plačil, tip osnove), je smiselno preiti na nižji konceptualni nivo posploševanja vsaj pri eni od dimenzij. V nekaterih primerih v tabeli 3 (npr. lokacija sektor šifra osnove namena plačil) zadostimo drugemu kriteriju procesa nadzorovanja atributnega posploševanja na relacij treh atributov, kar je zelo pomembno z vidika zagotavljanja ustrezne tovrstne vizualizacije v fazi uporabe funkcije OLAP IZBOR PODATKOVNIH KOCK V osnovi smo pripravili podatkovni kocki "Plačilni promet" in "Računi v tujini". Opravili smo njuno združitev v navidezno podatkovno kocko, ki ne zahteva sistemskih kapacitet (ang. virtual cube). Za namene analiziranja vpliva delovanja Uredbe smo pripravili posebne členitve podatkovnih kock: transakcije nad in transakcije nad evrov. Razvili smo tudi podatkovno kocko za pomembne postavke računovodskih izkazov rezidentov ter pripravili vire za podatkovno kocko za obravnavanje področja neposrednih tujih investicij. Prvo podatkovno skladišče omogoča ekonomsko obravnavanje poslovanja podjetja v splošnem, drugo pa obravnavo poslovnega subjekta glede na posamezen finančni vidik njenega poslovanja. Slednje je mogoče potem razširiti na podoben način na ostale finančne elemente itd. Značilnost teh elementov skladišč so tabele z velikim številom numeričnih atributov, ki so predmet proučevanja v obravnavanem obdobju. Omogočajo pa zelo pestro ekonomsko vsebino za podatkovno rudarjenje v smeri ciljev naše naloge. V nalogi se omejimo na krovne elemente omenjenih področij, pri tem pa zagotovimo ustrezno mednarodno metodološko primerljivost: na primer z izračuni kazalnikov funkcija "calculated Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 36

44 members", na osnovi, na primer, finančnih kazalnikov, opredeljenih pri Združenju bank Slovenije. Zasnova modela podatkovnega skladišča pa seveda omogoča nadaljnji razvoj v tej smeri, zlasti ob dejanski implementaciji podatkovnih skladišč z ustrezno sistemsko podporo. Slika 5, združena iz nekaj faz povpraševanja po bazi, predstavlja predpripravo vrtilne tabele kot vhodne datoteke v podatkovno skladišče. S pogoji izborom obdobja (KBP_DAT) in posameznih postavk računovodskih izkazov (KTBP_SIF) omogočimo prikaz podatkovnih zapisov na nivoju posameznega ekonomskega subjekta (PSD_SIF) rezidenta. Atributi podatkovnega zapisa (KTBP_SIF) so izraženi numerično kot vrednosti v evrih (KBP_ZN_EVROV). Postavke računovodskih izkazov (atributi) so vsebinsko izbrane na način, da je moč pripraviti izračune za temeljne kazalnike: Kazalnike izračunamo v podatkovnem skladišču in ne že z poizvedovanjem, kar bi bilo sicer tudi mogoče. V tej fazi je pomemben nabor selekcija postavk računovodskih izkazov, ki jo zahteva omejenost prototipnega modela naloge v pogledu strojnih kapacitet. Tudi sicer pa je vsebinska selekcija smiselna, saj omogoča osredotočenje na osnovi dosedanjih spoznanj iz obravnavanega področja. Slika 5: Povpraševanje po relacijski bazi podatkov s pomočjo orodja Oracle Discoverer (Medina, C., 1998) in tvorjenje vrtilne tabele za potrebe podatkovnega skladišča Manjkajoče vrednosti na nivoju posameznega ekonomskega subjekta v dobljeni vrtilni tabeli nadomestimo z vrednostjo "0". Število manjkajočih vrednosti na nivoju posameznega atributa pa nam dejansko omogoča tudi dodatni kriterij za odločitev o izboru posameznega atributa postavke računovodskega izkaza, saj bi bilo sicer nesmiselno izračunavati kazalnike oziroma izvajati podatkovno rudarjenje, kjer je omogočena obravnava na primer manj kot 90 % populacije rezidentov, po vrednosti menjave s tujino. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 37

45 V nadaljevanju (razdelek 4.5.) se osredotočimo na koncept priprave podatkovnih kock na podatkih tabele transakcij plačilnega prometa s tujino in tabele transakcij preko računov v tujini, na katerih tudi izvedemo analize in metode podatkovnega rudarjenja DIMENZIJE Šifranti, ki predstavljajo vrednosti posameznih atributov, v našem poskusu izvedbe podatkovnega rudarjenja (priloga 1) še niso urejeni oziroma standardizirani. Gradnje podatkovnega skladišča pa si ni moč predstaviti brez enotnih standardiziranih šifrantov, ki omogočajo ustrezno urejenost dimenzij. Z uporabljenim programskim orodjem je mogoče dimenzije tudi tvoriti avtonomno, tako da se posamezna dimenzija uporabi le v določeni podatkovni kocki in jo ni moč deliti oziroma uporabiti v primerih drugih podatkovnih kock. Za namene naloge, pa tudi v splošnem velja uporabiti možnosti tvorjenja dimenzij na način njihove splošne uporabnosti. Tudi vsebinsko gledano so naše dimenzije v nadaljevanju takšne narave. Izjemo na primer predstavlja dimenzija Vrsta poročila, ki je namenjena le specializiranemu poročilu o stanju in prometu na računih v tujini podatkovna kocka Računi v tujini. Ker gre za temeljno členitev vira podatkov, je ne opredelimo kot navidezno dimenzijo. Poglejmo tvorjenje konceptualne hierarhije dimenzij v našem primeru: - standardni tipi: čas, država, valuta, dejavnost, vrsta poročil, metodološka klasifikacija namena plačil, - hierarhija na osnovi več med seboj povezanih tabel: rezident, - hierarhija tipa "starši otroci", iz dveh stolpcev ene tabele: sektor, - navidezne dimenzije: npr. priliv odliv, vključenost vira v metodologijo ipd. Opis vseh standardnih dimenzij v nadaljevanju je podan tudi oziroma predvsem zaradi vsebinskega pomena posameznih dimenzij v kontekstu naše naloge ČAS Uporabimo pravilno hierarhijo časa brez tedenske frekvence. Zanimivo je, da imamo vir podatkov z dekadno frekvenco poročanja, vendar so dekade natančno opredeljene z 10., 20. in zadnjim dnem meseca. Ker gre za skupno dimenzijo (ang. Shared dimension) dveh podatkovnih kock, zadnji nivo "dekada" ni uporaben v primeru podatkovne kocke Računi v tujini, kjer se podatki nanašajo le na posamezen mesec na najnižji ravni hierarhije. Dimenzija Čas je posplošena za različne vire podatkov, glede na frekvenco poročil Banki Slovenije. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 38

46 VALUTA Vsaka transakcija z nerezidenti oziroma posel med rezidentom Slovenije in nerezidentom je preko obravnavanih virov zabeležena tudi s podatkom o originalni valuti posla. Po dnevnem tečaju pa je potem preračunana oziroma izražena na enotni imenovalec, v našem primeru evro. Dimenzijo bomo, glede na aktualno vključevanje Slovenije v EMU, ponovno uredili na način, ki je po našem mnenju najprimernejši z vidika ciljev raziskave. Iz strukturnega kroga v okviru grafa na sliki 6 je v proučevanem obdobju razvidno, da v transakcijah kapitalskega in finančnega računa, zajetih preko plačilnega prometa med rezidenti Slovenije in ostalega sveta, kot originalna valuta nastopa evro, v povprečju z okrog 80 % celotne vrednosti transakcij v proučevanem obdobju. Po celotni vrednosti prednjačijo transakcije kapitalskega in finančnega računa. Po številu transakcij je situacija obratna. Z rastjo vrednostnega obsega (vstavljeni strukturni krog v grafu) menjave s tujino, merjenega preko plačilnega prometa v letu 2005, predstavlja EUR 79 %, USD 13 %, SIT 4 %, GBP (britanski funt) 2 % in ostale valute 2 %. Slika 6: Originalna valute posla med rezidenti in nerezidenti v plačilnem prometu s tujino Ne glede na relativno stabilnost originalne valute pa je urejenost dimenzije Valuta vsekakor usmerjena v prihodnje, iz najmanj dveh razlogov: prevzema evra v letu 2007 kot domače valute, spreminjanja relativne moči drugih svetovnih valut (ameriški dolar, kitajski juan, ruski rubelj itd.) v hitro spreminjajoči se zunanji menjavi Slovenije ter globalnem okolju. Na sliki 6 vidimo na primer, da se v letu 2005 pojavi ruski rubelj Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 39

47 (RUB) kot dodatna valuta oz. skupina valut na prvem nivoju hierarhije. V splošnem pa je to ena temeljnih prednosti podatkovnih skladišč, ki zagotavljajo izvajanje večdimenzionalnega neposrednega analitičnega procesiranja (MOLAP). Zaradi koncentracije plačil po vrednosti prometa v originalnih valutah in večje posplošitve dimenzije na prvem nivoju v smeri učinkovitejše izvedbe metod podatkovnega rudarjenja preuredimo hierarhijo dimenzije Valuta tako, da na prvem nivoju podamo le 4 možnosti: evro, ameriški dolar, tolar in ostale valute. Na drugem nivoju pa so ostale valute razčlenjene v smislu predhodno omenjene analize novo pojavljajočih se svetovnih valut DRŽAVA Za potrebe našega modela ne najdemo že zadovoljive ureditve obravnavane dimenzije, zato dimenzijo uredimo v celoti. V osnovi se osredotočimo na ekonomsko geografsko klasifikacijo Statističnega urada RS, pri čemer za namene te raziskave preuredimo klasifikacijo celine Evropa v smeri ekonomsko političnih grupacij, zlasti z zornega kota EU in EMU. Hierarhijo ohranimo simetrično na treh nivojih. Prvi nivo je celina, pri čemer nekaj deviacij med celino in ekonomsko grupacijo EU odpravimo v smeri priključitve k celini Evropa. Na primer Ciper sodi v geografskem smislu na azijsko celino v skupino Bližnji vzhod, vendar ga vključimo pod celino Evropa in potem v EU in ERM2 na nižjih nivojih, ki sledijo. Podobno se zgodi na primer z Madeiro in Kanarskimi otoki. Najnižji nivo znotraj Evrope je razčlenjen glede na različne stopnje vključenosti posameznih držav v evropske integracijske procese. Največjo stopnjo v tem pogledu predstavlja Evropska monetarna unija EMU. Konceptualni okvir nove plačilne bilance Slovenije v pogojih EMU namreč tudi posebej zahteva ločeno dimenzijo EU na EMU in ne-emu države. Na ta način lahko tudi dobimo pomembne informacije o vrednosti menjave znotraj EMU v evrih. Ker bo v metodološkem pogledu zelo težko pridobiti informacijo o stanju terjatev rezidentov v evru (finančni instrument "gotovina in vloge"), kot takrat (predvidoma z ) domače valute, do (nerezidentov) ostalih držav znotraj enotnega denarnega območja, je predhodno omenjena členitev ostalih postavk tekočega in kapitalskega oz. finančnega računa v tem pogledu še posebej pomembna. Izven Evrope so v nadaljevanju države strukturirane po geografski klasifikaciji (Encarta, 2000). Na najnižjem nivoju posameznega geografskega območja držav (na primer: Vzhodna Azija) izločimo pomembnejše države (na primer: Japonska, Kitajska) od ostalih v skupini, glede na priporočila (Eurostat, 2005). Slabosti takšnega pristopa so, da je razviti svet izven Evrope geografsko manj razčlenjen kot manj razviti svet. Vendar je sama standardizacija takšna, da imajo na primer cele ZDA eno kodo za državo. Za bolj natančno spremljanje dinamike trgovinske menjave in odkrivanja novih trendov glede na prostorsko koncentracijo, bi bilo potrebno pridobiti dodatne atribute. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 40

48 DEJAVNOST Standardna klasifikacija dejavnosti (SKD, 1995) je obvezen nacionalni standard, ki se uporablja pri evidentiranju, zbiranju, obdelovanju, analiziranju, posredovanju in izkazovanju podatkov, pomembnih za spremljanje stanj in gibanj na ekonomskem, demografskem in socialnem področju ter na področju okolja in naravnih virov. Uporablja se za določanje dejavnosti oziroma za razvrščanje poslovnih subjektov in njihovih delov za potrebe različnih uradnih in drugih administrativnih zbirk podatkov (evidence, registri, baze podatkov ipd.) ter za potrebe statistike in analitike v državnem in mednarodnem okolju. Standardna klasifikacija dejavnosti temelji na klasifikaciji dejavnosti NACE Rev. 1 (Noménclature statistique des activitiés économiyues dans la Communauté européenne), ki je obvezen statistični standard Evropske unije. Določene so naslednje ravni dejavnosti: področje (označeno z eno črko). podpodročje (označeno z dvema črkama) oddelek (označen z dvomestno numerično šifro) skupina (označena s trimestno numerično šifro) razred (označen s štirimestno numerično šifro) podrazred (označen s petmestno numerično šifro). Iz navedenega sledi, da imamo opraviti s klasično hierarhično strukturo, povsem ustrezno za izgradnjo dimenzije Dejavnost. Ker gre za nesimetrično strukturo, je smiselna uporaba tipa dimenzije "starši otroci" v kolikor so podatki v tabeli urejeni v dveh med seboj, v smislu predhodno opredeljene hierarhije, povezanih stolpcev. Glede na tako razpoložljive vire podatkov (dve tabeli) pripravimo posebej dimenzijo Področje dejavnosti (področja podpodročja) ter dimenzijo panoge dejavnosti (oddelek skupina razred podrazred). Na razpolago pa imamo tudi tabelo, ki omogoča relacijo med dvema dimenzijama tipa "starši otroci". Vključitev zgoraj opredeljenih dimenzij v model za testiranje vsebinske ustreznosti, prikazanim v razdelku 4.5.1, pa nam ne daje ustreznih rezultatov, podatki se namreč multiplicirajo. Ob podrobnem pregledu uradne klasifikacije ugotovimo veliko neustreznosti hierarhične strukture za njeno neposredno uporabo v podatkovnih skladiščih. Med njimi najbolj izstopa problem, ki je sicer naveden kot uvodno pojasnilo (SKD, 1995): "Da bi zagotovili enotnost pri šifriranju, so tudi šifre za tiste razrede dejavnosti, ki se ne razčlenjujejo na podrazrede, izpisane enako kot šifre za podrazrede dejavnosti, tj. kot petmestne numerične šifre, zato imajo na zadnjem mestu dodano ničlo". Ugotavljamo, da se s tem pravzaprav poruši pravilna hierarhična struktura, zato nam test ustreznosti, ob uporabi dimenzij tipa "starši otroci", pravilno javi nepravi rezultat oz. njegovo ustrezno multipliciranje, glede na dejansko strukturo poslovnih subjektov (rezidenti) po dejavnostih v proučevanem modelu. Prav tako se s Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 41

49 tem pojavljajo enaki tekstualni opisi na različnih ravneh hierarhije. Glede na navedeno smo se odločili pripraviti standardni tip hierarhije, ki vključuje le oba nivoja področij dejavnosti in zadnja dva nivoja hierarhije panoge dejavnosti v skupni dimenziji Dejavnost. Rezultati testiranja nam potrjujejo pravilnost odločitve VRSTA POROČIL Dimenzija je hierarhične strukture in nastopa le v večdimenzionalnem modelu "Računi v tujini". Podajamo jo v celoti (Banka Slovenije, 2001): "Vrsta poročila": 1. račun v tujini, v kolikor ima odprt račun pri banki v tujini; 2. kontokorentni račun, v kolikor ima vzpostavljen kontokorentni račun s tujim partnerjem; 3. razno, v primeru danih ali prejetih plačilih nerezidentom oziroma od nerezidentov v tolarski ali devizni gotovini na blagajni rezidenta ali direktno na žiro račun rezidenta, stanja devizne gotovine v blagajni rezidenta ter izplačil vseh stroškov rezidentom za službene poti v tujino v tolarjih. "Podvrsta poročila": "1. račun v tujini": I za vse tiste transakcije, ki se nanašajo na izvajanje investicijskih del v tujini oziroma O za vse ostale transakcije. "2. kontokorentni račun": K za vse transakcije, ki se nanašajo na poslovanje s plačilnimi karticami (o prometu s plačilnimi karticami poročajo samo rezidenti, ki so izdajatelji tujih plačilnih kartic v Sloveniji in tisti domači izdajatelji, ki imajo promet s plačilnimi karticami s tujino) oziroma O za vse ostale transakcije. "3. razno": vedno O. Slika 7: Hierahija dimenzije "Vrst poročil" Dimenzija, prikazana na sliki 7, nam v funkciji neposrednega analitičnega procesiranja (OLAP) omogoča relativno hitro ugotavljanje obsega in dinamike pojava neto plačevanja, na primer pri izbiri vrste poročila: "Kontokorentni račun". Relativno Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 42

50 največji pomen in hitra rast tega pojava nas navajata k zaključku o nujnosti uvajanja sistemov neposrednega poročanja (model "Plačilni promet s tujino") METODOLOŠKA KLASIFIKACIJA NAMENA PLAČIL Obravnavana dimenzija je z vsebinskega vidika proučevanja predmeta naloge najpomembnejša. Njena izgradnja je bila tudi najzahtevnejša. Za nesimetrično hierarhično metodologijo bi ustrezal tip dimenzije "starši otroci". Zanj pa se nismo odločili iz dveh razlogov: problema šifre namena plačil, opisanega v nadaljevanju, ter dodatnih atributov lastnosti, ki jih želimo proučevati v okviru te dimenzije (npr. vključenost vira v metodologijo kot navidezne dimenzije). Slika 8: Dimenzija MKNP Metodološka klasifikacija namena plačil V fazi procesa nadomeščanja podatkovnih virov, ki slonijo na posrednem merjenju transakcij z nerezidenti po namenu plačil preko zajema podatkov iz plačilnega prometa s tujino pri bankah, z neposrednim zajemom podatkov od udeležencev v transakcijah z nerezidenti, imamo konec leta 2005 še vedno prevladujoči vir podatkov na osnovi posrednega zajema. Vendar je v letu 2006 predvidena zamenjava podatkov plačilnega prometa na področju spremljanja nakupa in prodaj vrednostnih papirjev med rezidenti in nerezidenti. V metodološki klasifikaciji namena plačil (MKNP) bodo zamenjani viri podatkov na prvem nivoju predstavljene hierarhije. Navedene postavke plačilno bilančne metodologije so v sliki 8 prikazane bolj razčlenjeno na nižje nivoje. Kot Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 43

51 vidimo, ima dimenzija MKNP kar 6-nivojsko hierarhijo. Kot omenjeno, gre za nesimetrično hierarhijo. Strategija postopnega nadomeščanja vira zahteva natančen "monitoring" dogajanj v preteklosti in sedanjosti, da bi se lahko ustrezno odločili glede priprave sistema direktnega poročanja po posameznih segmentih v bodoče. V ta namen poglejmo osnovno statistiko uporabljenega šifriranja namena plačil po posameznih šifrah, ločeno za promet preko računov v tujini (že neposredno poročanje) in klasičen plačilni promet s tujino preko bank. Predhodno pa oblikujmo strukturo najpomembnejše dimenzije v našem kasnejšem večdimenzionalnem modelu, ki nam bo hkrati tudi služila pri hitrem analiziranju šifer namena plačil. Tabela oz. šifrant namena plačil, poimenovana "Koda računi / Koda promet", je obsegala konec oktobra 2005 natančno 205 različnih trimestnih numeričnih šifer namena plačil (atribut "koda promet"). Vsaka takšna šifra oz. koda lahko nastopa na prilivni (prejem plačil) oz. odlivni (plačilo nerezidentu) strani (atribut "Priliv / Odliv"). Vendar sistem v celoti zaradi vsebine plačilne bilance ni simetričen, tako da se posamezna šifra lahko pojavi le kot priliv oz. le kot odliv. Atribut "Koda računi" pa je pravzaprav združitev prvih dveh atributov in se uporablja kot enovita koda namena plačil na področju sledenja transakcij na računih v tujini. Zaradi navedenega je bilo takšnih kod koncu oktobra Kot vidimo, je torej šifrant namena plačil precej obsežen in je zato zanesljivost izbora pravilne šifre s strani poročevalca tem bolj vprašljiva, čim bolj se zmanjšuje kontrola s strani bank. V novem sistemu se zaradi navedb Uredbe prenaša ta odgovornost z banke na nalogodajalca oz. upravičenca plačila, kar lahko vpliva le v smeri nadaljnjega zmanjševanja zanesljivosti. Manjše število kod bi lahko bil pravi odgovor na zaustavitev takšnega procesa. Tabela 4 predstavlja jedro modeliranja v smeri doseganja zastavljenih ciljev nadzorovanega procesa zamenjave virov podatkov, ob odkrivanju do sedaj neznanih zakonitosti v starem modelu oziroma metodologiji plačilne bilance, s pomočjo metod podatkovnega rudarjenja. Struktura šifranta namena plačil v tabeli 4 odraža klasično hierarhično urejeno dimenzijo, same vrednostni pa so urejene tako, da omogočajo granulacijo na najnižji nivo. Upoštevamo pravilo, da naj bo generalizacija narejena po principu, da ima posamezen atribut na višjih nivojih ne več kot 8 vrednosti (Han, Kamber, 2001). Dejansko je z njim in na ta način popisana metodologija plačilne bilance z vidika vključenih šifer namena plačil v posamezno postavko plačilne bilance na najnižjem nivoju. Najvišji nivo hierarhije predstavlja atribut "Račun", ki lahko vsebuje vrednosti: "Tekoči" tekoči račun plačilne bilance; "Kap. In Fin. Rač" Kapitalski in finančni račun plačilne bilance ter "Kontrola" kontrola za nevtralne šifre namena plačil zaprti sistem poročanja, ki bo odpravljen. Sledi Nivo 1, ki dejansko podaja osnovne postavke plačilne bilance: "Blago", "Storitve", "Dohodki", "Transferi", "Neposredne Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 44

52 naložbe", "Vrednostni papirji", "Ostale naložbe", "Mednarodne denarne rezerve". Nivo 2 ima predvsem pomen za kasnejše poglobljeno analiziranje in kontroliranje uporabe dvostavne tehnike v evidentiranju transakcij z nerezidenti. Nivo 3 in Nivo 4 omogočata zelo poglobljeno vsebinsko razumevanje namena plačil in sta uporabna pri poizvedovanjih. Nivo 5 in Nivo 6 sta zelo podrobna in primerna predvsem za izvajanje OLAP funkcije v kasneje oblikovanem večdimenzionalnem podatkovnem modelu. Metodologija Račun Nivo 1 Nivo 2 Nivo 3 Nivo 4 Nivo 5 Nivo 6 Priliv / Odliv Knjižba Koda računi Koda promet OD Od naložb v vrednostne Od ostalih Obresti za kratkoročne DA TEKOČI DOHODKI Izdatki KAPITALA papirje naložb kredite 2 V dobro DA TEKOČI DOHODKI Izdatki OD KAPITALA Od naložb v vrednostne papirje Od ostalih naložb Zamudne obresti 2 V dobro DA TEKOČI DOHODKI Izdatki OD KAPITALA Od naložb v vrednostne papirje Od ostalih naložb Obresti za vpogledne in vezane vloge 2 V dobro DA TEKOČI DOHODKI Izdatki DA TEKOČI TRANSFERI V Slovenijo DA TEKOČI TRANSFERI V Slovenijo DA TEKOČI TRANSFERI V Slovenijo DA TEKOČI TRANSFERI V Slovenijo OD KAPITALA URADNI SEKTOR URADNI SEKTOR URADNI SEKTOR OSTALI SEKTORJI Od naložb v vrednostne papirje Od ostalih naložb Pripis obresti na deviznih računih 2 V dobro Pomoči in darila 1 V breme Ostali uradni transferi 1 V breme Sodni depoziti, kazni, takse 1 V breme Nakazila Nakazila delavcev zdomcev 1 V breme Delno TEKOČI TRANSFERI V Slovenijo OSTALI SEKTORJI Zavarovanja Premije - zavarovalnice 1 V breme Delno TEKOČI TRANSFERI V Slovenijo OSTALI SEKTORJI Zavarovanja Provizije - zavarovalnice 1 V breme Tabela 4: Atributi metodološke klasifikacije namena plačil izsek metodologije Dodane so tudi razdružene postavke metodologije plačilne bilance, ki sicer ne vsebujejo nobene šifre namena plačil, ampak na primer le ocene, vendar nam bodo služile v smislu preglednosti (celovitosti posamezne agregatne postavke, glede na podpostavke) pri izvajanju OLAP funkcije v našem večdimenzionalnem modelu. Šifrant namena plačil tabela MNKP pa ima, poleg hierarhije nivoja postavk v metodologiji plačilne bilance, dodane tudi nekatere atribute kot: vknjižba, metodologija, ki nam bodo služili pri lažjem kontroliranju postopnosti zamenjave virov v bodoče. Pričakujemo namreč, da bo model uporaben v praksi v bodoče in bomo redno ažurirali tabelo MNKP glede na zamenjavo virov, tako da bo pod atributom "Metodološka klasifikacija namena plačil" vedno več postavk plačilne bilance na vedno višjih nivojih imelo vrednost "Delno" oz. "NE". Slednja bo pomenila, da je vir posrednega zajema podatkov nadomeščen z neposrednim zajemom. Osrednji atribut povezljivosti tabel v model predstavlja sama šifra koda namena plačil, ki jo enkrat poimenujemo "Koda računi" in drugič "Koda promet". Žal gre za hibo obstoječega sistema, ki predstavlja za naš namen resno težavo in predvsem dodatno delo za ustrezno ureditev modela. Gre za eno in isto zadevo, pri čemer velja sledeča povezava, prikazana v tabeli 5. Kot vidimo v tabeli 5, je pravzaprav v izhodišču šifrant namena plačil v strukturi različen za uporabo pri šifriranju namena plačil preko računov v tujini od tistega, ki se Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 45

53 uporablja za šifriranje namenov plačil preko računov doma. Tabela s podatki plačilnega prometa bank torej vsebuje dva stolpca oziroma atributa (Priliv/Odliv, Koda promet), ki skupaj tvorita enak pomen kot en atribut v tabeli računov v tujini (Koda računi). Prvi numerični znak ima lahko vrednost 1 priliv ali 2 odliv. Sledijo trije numerični znaki, ki pomenijo dejanski namen plačila. Takšna ureditev v bazi podatkov nam tudi narekuje odločitev za klasično hierarhično urejeno dimenzijo, čeravno bi sicer, ob normalnosti sistema, bolj ustrezal izbor dimenzije tipa "starši otroci". Metodologija plačilne bilance je torej nesimetrična hierarhična dimenzija namena plačil med rezidenti in nerezidenti. Področje Računi v tujini Plačilni promet bank Atribut Koda računi Priliv / Odliv Koda promet Format N4 N1 N3 Primer Tabela 5: Koda račun = Priliv / Odliv + Koda promet Da bi analiza potekala po enakih postopkih za enako časovno obdobje na obeh področjih (plačilni promet, računi v tujini), smo v tabelo MNKP dodali vse tri atribute. V petem poglavju podajamo osnovne statistične značilnosti glede uporabe šifranta na področju zajema transakcij z nerezidenti tako preko računov v tujini kot preko domačih bank REZIDENTI Dimenzija Rezidenti je sicer hierarhičnega tipa, vendar je hierarhija oblikovana iz več povezanih tabel v sliki 9. V tem primeru želimo predvsem doseči tekstualne vrednosti atributov Regija in Občina, saj je na ta način neposredno poizvedovanje bolj pregledno in hitrejše. Slika 9: Dimenzija Rezidenti kot zvezdnati model Tudi sicer je, zaradi ciljev naloge, ki jih zasledujemo, dimenzija Rezidenti z vidika zvezdnatega podatkovnega modela zelo pomemben člen modela (lastnosti poročevalcev). Na to dimenzijo praviloma povezujemo druge dimenzije tako, da model Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 46

54 prehaja v tip modela "snežinka" zlasti na tej dimenziji. V prihodnosti je pričakovati vsebinsko dograjevanje obravnavane dimenzije v našem podatkovnem skladišču (oblikovanje pokrajin), pa tudi dinamično spreminjanje šifranta občin z vidika vpliva evropskih razvojnih politik. Poleg osnovnih lokacijskih atributov (regija, občina) smo v sliki 9 pri oblikovanju dimenzije Rezidenti s pomočjo programske opreme MS Analysis Services uporabili funkcijo "member properties" in na nivoju posameznega rezidenta dodali lastnosti: lastnina, velikost in število zaposlenih. Način uporabe navedenih atributov nam omogoča dodatno učinkovito podatkovno rudarjenje v smeri proučevanja lastnosti rezidentov, ki so pomembni pri poročanju v novem sistemu direktnega poročanja za plačilno-bilančno statistiko. Na sliki 10 vidimo, da so na nivoju matične številke posameznega poslovnega subjekta rezidenta (atribut "Psd Sif") definirane številne lastnosti (atributi) za namene izvajanja metod podatkovnega rudarjenja. Zaradi velikega števila vrednosti atributa na najvišjem nivoju hierarhije smo izvedli dodatno posplošitev na dimenziji Regija, tako da smo vpeljali 5 skupin regij glede na geografsko lego v Sloveniji: severovzhodna Slovenija (Pomurska, Podravska, Koroška, Savinjska, Zasavska), jugovzhodna Slovenija (Spodnjeposavska, Dolenjska), osrednja Slovenija (Osrednjeslovenska), severozahodna Slovenija (Gorenjska, Notranjskokraška), jugovzhodna Slovenija (Goriška, Obalnokraška). Slika 10: Lastnosti rezidentov, organiziranih v okviru dimenzije Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 47

55 SEKTOR Dimenzija sektor je oblikovana na osnovi metodologije Evropskega sistema računov (ESA, 1995). Razpoložljiv vir nam omogoča, da dimenzijo oblikujemo v tipu "starši otroci", saj med seboj povezana stolpca tabele "SEKT_SIF" in "SEKT_SIF 1" omogočata tvorjenje nesimetrične hierarhije klasifikacije institucionalnih sektorjev, v katere razvrščamo ekonomske subjekte, udeležence v transakcijah, ki so predmet našega proučevanja DRUGE NAVIDEZNE DIMENZIJE Potek hierarhije Slika 11: Ureditev hierarhije tipa "starši otroci" V sliki 11 je razvidno, da je atribut "SEKT_SIF 1" nadrejeni atribut atributu "SEKT_SIF". Takšna ureditev zlasti pri obsežnih klasifikacijah zahteva obsežne tabele, saj mora biti izražena vsaka relacija v posebnem podatkovnem zapisu. Nabora vrednosti obeh atributov sta enaka, z izjemo izhodiščne vrednosti, ki lahko nastopa le v nadrejenem atributu (SEKT_SIF 1), in vrednosti na najnižjem nivoju, ki lahko nastopa le v podrejenem atributu (SEKT_SIF). Z uporabo navideznih dimenzij lahko analiziramo podatkovne kocke na osnovi lastnosti enot, ki jih urejamo z obstoječimi dimenzijami. Prednosti pri tem so, da uporaba tega tipa dimenzije ne zahteva dodatnih programskih in strojnih kapacitet, kar je pomembno v našem primeru izgradnje prototipnega modela. V osnutku modela smo navidezni tip dimenzije uporabili za izgradnjo dveh dimenzij: "Priliv Odliv", s katero omogočamo razlikovanje med prilivnimi in odlivnimi transakcijami na različnih nivojih večdimenzionalnih agregacij našega modela, ter "Vir v metodologiji, s katero spremljamo dejansko uporabo vira v uradni metodologiji plačilne bilance Slovenije. Slednja navidezna dimenzija bo še posebej pomembna z vidika spremljanja postopne zamenjave posrednih z neposrednimi podatkovnimi viri. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 48

56 Navidezne dimenzije je smiselno vključevati glede na potrebe prikazov v neposrednem analitičnem procesiranju (razdelek 6.) DEJSTVA Dejstva predstavljajo tisti atributi v tabelah podatkovnih virov, s katerimi merimo proučevani pojav (MS SQL Analysis Services, 2000). V tabeli plačilnega prometa preko bank merimo vrednosti v evrih in število transakcij. V podatkovnem skladišču izpeljemo tudi povprečno vrednost plačila na osnovi predhodnih dejstev. V tabeli računov v tujini imamo uporabno le vrednost plačil v evrih, saj gre za agregirano poročanje na mesečni ravni in ni razpoložljivega podatka o številu že agregiranih podatkovnih zapisov (plačil). V tabelah drugih podatkovnih virov pa imamo na voljo veliko število dejstev v obliki atributov, ki predstavljajo vrednosti posamezni postavk računovodskih izkazov poročevalcev ali vrednosti posameznih vrst neposrednih investicij. Na njihovi osnovi lahko tvorimo oziroma izpeljemo zelo koristne kazalnike za proučevanje lastnosti poročevalcev s pomočjo predstavljenih metod podatkovnega rudarjenja v naši nalogi OPIS PODATKOVNIH KOCK TEST VSEBINSKE USTREZNOSTI MODELA Model gradimo na le nekaj podatkovnih zapisih, ki nam omogočajo sprotno preverjanje pravilnosti izračunov oz. delovanja postavljenega modela. Postopno gradnjo modela je nemogoče izvajati na proučevanih nekaj več kot 7,5 milijona podatkovnih zapisih, saj so vmesne obdelave prezahtevne in trajajo dalj časa. Iz baze smo glede na pestrost vrednosti atributov po posameznih obravnavanih dimenzijah izbrali 12 podatkovnih zapisov, predstavljenih v tabeli 6, ter jim priredili zneske. Prav tako smo prekrili identifikatorje poročevalcev. Poročevalci, zajeti v testnih podatkovnih zapisih, sodijo v različne sektorje ekonomije ter se ukvarjajo z različnimi dejavnostmi. Transakcije so vezane na nerezidente iz različnih držav, predstavljajo pa prilivne in odlivne šifre osnov po različnih namenih plačilno-bilančne klasifikacije. Pestrost in enostavnost primera nam hkrati omogoča kontrolirano vsebinsko pravilno izgradnjo večdimenzionalnega modela oziroma podatkovnega skladišča. Pri testiranju z metodo postopnega dodajanja posameznih dimenzij v model opazimo na primer problem ažurnosti metodologije plačilne bilance v proučevanem obdobju. Šifre namena plačil se lahko ukinejo oziroma se uvedejo nove. V proučevanem obdobju je bilo uvedenih le 9 novih šifer namena plačil. Nobena šifra pa ni bila Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 49

57 ukinjena. Od navedenih devetih šifer le dve služita kontrolnemu namenu, preostale so vključene v metodologijo plačilne bilance. Ker je šifra namena plačil unikatna, je moč problem dodajanja rešiti z unijo vseh uporabljenih šifer v metodološki klasifikaciji namena plačil. Dimenzija časa pa glede na dekado poročanja omogoča pravilno časovno klasificiranje transakcij. Leto Valuta Rezident Država Šifra namena Priliv / Odliv Dekada Št. Zapisov Znesek v Eur A feb B feb C feb C feb B feb C feb A feb B feb C feb A feb C feb B feb SKUPAJ Tabela 6: Izbrani podatkovni zapisi za preverjanje vsebinske pravilnosti modela V testnem primeru v tabeli 6 imamo v letu 2003 šifre namena plačil 502 in 569 (osenčeno rumeno), ki nista vključeni v dimenzijo "Metodološka klasifikacija namena plačil", zato je pravilno, da brez upoštevanja treh podatkovnih zapisov (osenčenih rumeno pri atributih Šifra namena in Znesek v Eur) po izvedbi obdelave tipa MOLAP dobimo skupni znesek transakcij v sliki 12 v višini evrov ter le 11 transakcij in ne pričakovani znesek evrov ter 16 transakcij, izračunan v tabeli 6. Slika 12: Urejevalnik večdimenzionalnega podatkovnega skladišča Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 50

58 S pogledom v globino (ang. "drillthrough") na sliki 12 sproti kontroliramo pravilnost združevanja po uporabljenih dimenzijah v modelu, na merah: znesek (atribut "Ppd Zn evrov") in število transakcij (atribut "Ppd Id Count") ter glede na značilnosti posameznih transakcij in lastnosti poročevalcev po proučevanih atributih. Pri postopni izgradnji modela oziroma testiranju njegove vsebinske ustreznosti je prav tako pomembno časovno sosledje dodajanja dimenzij, zlasti v primeru vira podatkov plačilnega prometa. Začnemo z osnovnimi in enostavnejšimi tipi dimenzij: čas, države, valute, sektor, dodamo metodološko klasifikacijo namena plačil in na koncu rezidente. V kolikor register poročevalcev ali Metodološka klasifikacija namena plačil nista popolni, bi ob testiranju različnih vzorcev to morali ugotoviti. V ta namen pripravimo še nekaj enostavnih poskusnih vzorcev podatkovnih zapisov. Dimenzija tipa "starši otroci" (sektor) zahteva še posebno pozornost z vidika pravilne logične povezljivosti v model. Druge lastnosti poročevalcev (regija, občina, velikost, kapital ipd.) bomo vključili v tako imenovane navidezne dimenzije (ang. "virtual dimension"), ki ne zahtevajo porabo, strojnih kapacitet, hkrati pa je omogočena analiza tipa OLAP. Za potrebe podatkovnega rudarjenja po zgoraj opredeljenih metodah bomo lastnosti poročevalcev definirali znotraj dimenzije "Rezidenti" z uporabo ustrezne funkcije ("Customer Member Property") uporabljene programske opreme (MS SQL Analysis Services, 2000). Klasične in navidezne dimenzije omogočajo hierarhijo različnih atributov, ki jo izvajamo v smeri rezultatov modelov podatkovnega rudarjenja, tako da je zagotovljena tudi ustrezna vizualizacija tipa OLAP v analizah. Testno tabelo dejstev v produkcijskem okolju zamenjamo s pravo obsežno bazo podatkov o plačilnem prometu s tujino. Naredimo proceduro s postopno osvežitvijo modela "incremental update", kar omogoča ohraniti definirane povezave podatkovnega modela v testnem okolju SHEME MODELOV PODATKOVNIH KOCK Osnovni model podatkovnega skladišča, prikazanega na sliki 13, ima zvezdnato shemo. Tabelo dejstev (rumeno obarvani naslov tabele) oziroma elemente skladišča predstavlja tabela skrbno izbranih desetih atributov in enega izvedenega atributa (število podatkovnih zapisov po osnovni agregaciji). Okoli tabele dejstev so v obliki zvezdnatih žarkov razporejene temeljne dimenzije: Čas, Država, Valuta, Metodološka klasifikacija namena plačil (MKNP) ter Rezidenti. Na dimenziji Rezidenti shema prehaja v tip snežinke, saj je na dimenzijo Rezident vezanih nekaj dimenzij. Predvsem pa dve osnovni: dejavnost in sektor. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 51

59 Slika 13: Shema prototipnega modela podatkovnega skladišča za statistiko plačilnega prometa s tujino Opisana shema izraža dejstvo, da pri izgradnji podatkovnega skladišča zasledujemo cilje naše naloge v smeri proučevanja rezidentov in njihovih značilnosti glede na njihovo aktivnost na področju menjave s tujino. Izgradnja novega sistema direktnega poročanja zahteva dober izbor poročevalcev (rezidentov) v vzorec poročanja, da bi le ta odražal značilnosti populacije v menjavi s tujino. Stari vir podatkov (plačilni promet s tujino) nam torej nudi možnost poznavanja obnašanja celotne populacije, zato pa moramo oblikovati ustrezna podatkovna skladišča, ki omogočajo tovrstno kompleksno in sistematično proučevanje hkrati. Shema modela Računi v tujini na sliki 14 je glede na vsebino tabele dejstev bolj zvezdnatega tipa, vendar zopet s poudarkom na dimenziji Rezident. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 52

60 Slika 14: Shema prototipnega modela podatkovnega skladišča za statistiko računov v tujini Oblikovali smo še shemo za podatkovno kocko: Računovodski izkazi. Ker v elementih skladišč prevladujejo numerični atributi, primerni za analizo ekonomskih kategorij, je shema na sliki 15 še izrazitejša v poudarku dimenzije Rezidenti. Pri shemi Računovodski izkazi bi seveda lahko razvili hierarhijo postavk računovodskih izkazov v posebni dimenziji, vendar bi strojne kapacitete presegale omejenost prototipnega pristopa, zato se je bilo v fazi selekcije potrebno osredotočiti na izbrane osnovne postavke, ki omogočajo izračun temeljnih kazalnikov uspešnosti in gospodarnosti poslovanja. Podobno velja za proučevanje lastnosti rezidentov z vidika tujih neposrednih investicij. Zasnovano podatkovno skladišče omogoča torej razvoj novih shem za delo na obravnavanem področju. V nalogi pa, tako kot pri dimenzijah, uporabimo še možnost oblikovanja navideznih podatkovnih kock. Preden lahko podatke uporabimo, moramo seveda izvesti njihovo obdelavo. Pri tem imamo na voljo tri možnosti, ki rezultirajo v različnih način hranjenja in dostopa do podatkov izračunov. V našem primeru izvedemo procedure tipa MOLAP ("Multi dimensional On-Line Analytical Processing"), ki omogoča relativno hitrejše izračunavanje agregacij na različnih nivojih dimenzij. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 53

61 Slika 15: Shema prototipnega modela podatkovnega skladišča za proučevanje računovodskih izkazov poročevalcev FUNKCIONALNOST PODATKOVNIH KOCK V tabeli 7 imamo dimenzije: Čas (leto), Metodološka klasifikacija namena plačil (MKNP) in navidezna dimenzija, ki loči smer plačilnega prometa z nerezidenti (priliv, odliv). V našem primeru tako spremljamo transakcije med rezidenti in nerezidenti Slovenije. Transakcije, izražene vrednostno (števno ipd.), predstavljajo osrednji predmet proučevanja oz. so shranjene v tako imenovani tabeli dejstev (ang. "Fact table"). Tabela 7 predstavlja število transakcij (dejstvo, ki ga proučujemo) v plačilnem prometu med rezidenti in nerezidenti preko domačega bančnega sistema, v času (dimenzija 1), glede na metodološko klasifikacijo posamezne transakcije (kapitalski in finančni ali tekoči račun; dimenzija 2) ter smer plačilnega prometa za rezidenta (priliv, odliv; dimenzija 3). Po vsebini je zanimiva informacija z vidika rasti obsega transakcij v proučevanem obdobju, ne le na tekočem, marveč tudi na kapitalskem računu plačilne bilance. Na tem mestu lahko zapišemo, da informacija odraža tudi vsebinsko pravilno in smiselno gibanje glede na dejanska dogajanja v proučevanem obdobju, kar potrjuje pravilnost izgradnje podatkovnega skladišča. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 54

62 Tabela 7: Tridimenzionalna tabela; plačilni promet s tujino po številu transakcij, ki jih metodološko spremljamo med rezidenti in nerezidenti Slovenije v času in glede na smer plačila Vendar nas, pri proučevanem pojavu, poleg omenjenih dimenzij, zlasti z vidika aktualnega vstopa Slovenije v EMU, zanima na primer še originalna valuta transakcije (dimenzija 4) in država nerezidenta (dimenzija 5). Priliv Odliv Priliv Odliv Priliv Odliv TEK. RAČ. KAP. In FIN TEK. RAČ. KAP. In FIN TEK. RAČ. KAP. In FIN Slika 16: Več dimenzionalnost podatkovnega skladišča (4 D podatkovna kocka), Vir: Han, Kamber, 2001 Prva kocka v sliki 16 ponazarja podatke iz tabele 7 v pogledu tri dimenzionalne (3-D) podatkovne kocke. V kolikor dodamo novo dimenzijo (na primer "Valuta"), potem vizualno 4-D podatkovno kocko predstavimo kot serijo 3-D podatkovnih kock. Za vsako valuto dobimo novo 3-D kocko. S tem multipliciramo število podatkov glede na število različnih vrednosti atributa valuta. Če nadaljujemo v tej smeri z dodajanjem novih dimenzij (npr. država nerezidenta) lahko prikažemo vsak n-dimenzionalen podatek kot serijo (n-1) dimenzionalnih podatkovnih "kock". Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 55

63 Podatkovna kocka je torej le metafora za n-dimenzionalnost. V nalogi smo na primer na statistiki plačilnega prometa s tujino uporabili kar 8 dimenzij. Večdimenzionalnost podatkovnega skladišča pomeni razpolaganje s podatki o proučevanem pojavu (dejstvu) na različnih nivojih agregacije. Če nas v obravnavanem primeru zanima le celotno število transakcij kapitalskega in finančnega računa za leto 2003, pomeni, da smo v povpraševanju zahtevali le podatke po dveh dimenzijah iz tabele 7: "metodološka klasifikacija namena plačil" in "čas", ne pa tudi po dimenziji "smer plačila". Pravimo, da smo zahtevali agregacijo na 2-dimenzionalni ravni, ne pa tudi na 3, 4, 8-dimenzionalni ravni. Slednja je v naši raziskavi, kot smo videli v razdelkih 4.3. in , bazična raven, saj je to maksimalno število uporabljenih dimenzij. V kolikor ne zahtevamo agregacije po nobeni od razpoložljivih dimenzij, govorimo o 0 dimenzionalni oz. izhodiščni ravni agregacije. V tabeli 7 nam takšen podatek predstavlja število: transakcij. V sliki 17 s pomočjo mreže kockastega telesa prikažemo različne nivoje dimenzionalne agregacije proučevanih podatkov. vse čas metodologija smer plačila valuta čas, metodologija čas, valuta čas, smer plačila metodologija, valuta metodologija smer plačila smer plačila, valuta čas, metodologija, smer plačila čas, valuta, metodologija čas, smer valuta plačila, metodologija, smer plačila, valuta čas, metodologija, smer plačila, valuta Slika 17: Mreža kockastega telesa za 4 D podatkovno "kocko" z dimenzijami: čas, metodologija metodološka klasifikacija namena plačil, smer plačila, valuta. Vir: (Han, Kamber, 2001) Dimenzije smo hierarhično uredili. Tako smo dimenzijo Čas v naši raziskavi glede na proučevano obdobje in frekvenco zbiranja uporabljenih podatkov uredili na sledeč način: leto, četrtletje, mesec in dekada. Takšno razčlenjevanje znotraj dimenzij nam v sliki 17 omogoča nadaljnje "risanje" večdimenzionalnih povezav med nivoji znotraj posameznih dimenzij. Atribut numeričnega tipa lahko preuredimo v dimenzijo s Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 56

64 pomočjo oblikovanja frekvenčnih razredov. Tako bi lahko na primer v našem primeru posebej proučevali plačila med rezidenti in nerezidenti, urejena v frekvenčne razrede po vrednosti plačil: do evrov, od do evrov, evrov in več. V primeru tabele 7 predstavljata dejstvo podatkovnega skladišča število transakcij med rezidenti in nerezidenti. V raziskavi proučujemo tudi vrednost in izvedemo tudi podatek o povprečni vrednosti posamezne transakcije. Navedene mere najdemo v tabelah relacijske baze podatkov z razpoložljivimi podatkovnimi zapisi o posameznih transakcijah med rezidenti in nerezidenti. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 57

65 5. STATISTIČNE ANALIZE PODATKOV Statistične analize podatkov zajemajo relativno preproste metode analize ustreznosti izbranih atributov (informacijski prispevek, verjetnosti pojava) ter izračunavanje mer variacije in koncentracije. Uporabljene metode nam omogočijo pridobiti hitro in zanimivo sliko obravnavanega področja na eni strani, na drugi pa tudi že posamezna zanimiva odkritja v smislu nadaljnjega podatkovnega rudarjenja. Za potrebe naše naloge se osredotočimo predvsem na storitveno menjavo s tujino. Poizvedovanja v našem podatkovnem skladišču (razdelek 4.) opravimo neposredno preko povezave Excelovih delovnih listov na podatkovne kocke. Z uporabo statističnih metod variacije in koncentracije se nadalje povežemo s programskim orodjem Statistica ANALIZA USTREZNOSTI ATRIBUTOV Izbor atributov za uporabo metod podatkovnega rudarjenja je smiselno definirati na podlagi izračuna informacijskih prispevkov in postavitve ustreznih kriterijev. V nalogi se osredotočimo na preproste atribute, deloma tudi zaradi bolj razumljive predstavitve metod izgradnje podatkovnega skladišča (oblikovanje dimenzij). Z dodajanjem drugih elementov podatkovnemu skladišču, pri čemer mislimo predvsem na ekonomske značilnosti proučevanih enot (npr. dobiček, prihodki, tuje neposredne investicije obravnavanih podjetij), je mogoče določiti precej bolj zahtevne prage informacijskih prispevkov za proučevanje posameznega segmenta menjave s tujino (npr. tuje neposredne investicije) ANALIZA USTREZNOSTI IZBRANIH ATRIBUTOV Sodimo, da je atribut zelo pomemben za našo analizo s pomočjo izbranih metod podatkovnega rudarjenja (odločitvena drevesa, združevanje v skupine), če je velika verjetnost, da nekatere transakcije rezidentov bistveno loči od drugih. Namen plačil je osrednji atribut naše analize. Upravičeno pričakujemo, da je lahko, na različni ravni konceptualne hierarhije dimenzije Metodološka klasifikacija namena plačil (atribut "Ttt_Sif" šifra osnove namena plačil), ločevanje proučevanega razreda podatkovnih zapisov (na primer razred je izbran namen plačil) od drugih podatkovnih zapisov različne jakosti. To pomeni, da je za ustreznost analize potrebno vključevanje različnih oziroma najbolj relevantnih konceptualnih ravni proučevane dimenzije. Ko proučujemo na primer analizo plačilno-bilančnih transakcij preko plačilnega prometa, posebej v sklopu obravnavane problematike, izpostavljamo plačila storitev (razred podatkovnih zapisov; ang. "target class") nasproti ostalim transakcijam rezidentov z Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 58

66 nerezidenti po namenu plačila v skladu z mednarodno primerljivo metodologijo vsaj na tretji ravni konceptualne hierarhije obravnavane dimenzije (ne-storitvene transakcije; nasprotni razred ang. "contrasting class"). Na vsebinskem področju naše naloge takšna raven hierarhije bolj loči posamezen proučevani razred podatkovnih zapisov od ostalih. Za potrebe naše naloge moramo torej izbrati tudi druge atribute, ki delijo proučevane transakcije med rezidenti in nerezidenti Slovenije na čim bolj "čiste" podmnožice (Quinlan, 1986). Namen analize ustreznosti izbranih atributov je v izračunavanju mer, ki kvantificirajo ustreznost izbora nekega atributa glede na proučevani razred oziroma obravnavani koncept, kot na primer: mere "nečistoče": entropija, napaka prevladujočega razreda, indeks Gini, ter informacijski prispevek PRIMER IZRAČUNA INFORMACIJSKEGA PRISPEVKA Izračunali smo informacijski prispevek atributa Dejavnost (dimenzija Dejavnost) glede na proučevani razred podatkovnih zapisov (transakcije storitvene menjave s tujino). Atribut vključimo na najvišji ravni abstrakcije. Priprava podatkov temelji na uporabi podatkovnega skladišča in funkcije MOLAP (priloga 3). Najprej izračunamo pričakovano informacijo I(S) po formuli za število transakcij v proučevanem razredu (storitve "+") in nasprotnem razredu (ne-storitve " "): m si si I( s1, s2,..., sm ) = log 2 (4.1) s s j= 1 I(S) = I( , ) = = ( / ) log 2 ( / ) ( / ) log 2 ( / ) = 0, V nadaljevanju izračunamo entropijo atributa E(S DEJAVNOST ). Za atribut Dejavnost imamo naslednje izračune na najvišji konceptualni ravni hierarhije (I primarne dejavnosti, II sekundarne dejavnosti (predelovalne), III tercialne dejavnosti (storitvene), IV kvartarne dejavnosti): I(S DEJAVNOST = "I" )= I(7.941+, ) = 0,958584, I(S DEJAVNOST = "II" )= I( , ) = 0,972337, I(S DEJAVNOST = "III" )= I( , ) = 0,898074, I(S DEJAVNOST = "IV" )= I( , ) = 0, Entropijo E(A) za celoten atribut Dejavnost na najvišji hierarhiji dimenzije izračunamo kot ponderirano povprečje dobljenih rezultatov. Kot utež nastopa koeficient števila Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 59

67 transakcij v proučevanem obdobju treh let v posamezni veji dejavnosti glede na celotno število opazovanih transakcij. Dobimo: E(Dejavnost) = 0, Gain A) = I( s, s,..., sm ) E( ) (4.2) ( 1 2 A Informacijski prispevek = I(S) E(Dejavnost) = 0,00368 Število transakcij Koeficient ,66 0,34 1,00 I(S) 0, Gain t_utež Storitve Ne - storitve Skupaj d_utež V celoti E (Dejavnost) 0, , ,004 0, ,62 0,38 0,0041 I 0, , ,162 0, ,60 0,40 0,1807 II 0, , ,709 0, ,69 0,31 0,6878 III 0, , ,124 0, ,65 0,35 0,1273 IV 0, ,01511 E (Lokacija) 0, , ,049 0, ,57 0,43 0,0572 J-V 0, , ,142 0, ,77 0,23 0,1223 J-Z 0, , ,442 0, ,65 0,35 0,4497 O 0, , ,231 0, ,64 0,36 0,2394 S-V 0, , ,136 0, ,69 0,31 0,1314 S-Z 0, ,02489 E (Sektor) 0, , ,067 0, ,53 0,47 0,0847 S.13 0, , ,105 0, ,57 0,43 0,1219 S.12 0, , ,080 0, ,57 0,43 0,0940 S.14 0, , ,735 0, ,71 0,29 0,6872 S.11 0, , ,012 0, ,68 0,32 0,0122 S.15 0, ,01309 E (Država) 0, , ,003 0, ,76 0,24 0,0027 Afrika 0, , ,022 0, ,83 0,17 0,0174 Azija 0, , ,929 0, ,66 0,34 0,9361 Evropa 0, , ,001 0, ,68 0,32 0,0014 J. Amerika 0, , ,002 0, ,37 0,63 0,0037 Oceanija 0, , ,043 0, ,74 0,26 0,0387 S. in Lat. Amerika 0, ,08878 E (Valuta) 0, , ,798 0, ,68 0,32 0,7824 EUR 0, , ,080 0, ,75 0,25 0,0709 Ostale 0, , ,031 0, ,29 0,71 0,0710 SIT 0, , ,090 0, ,79 0,21 0,0757 USD 0, ,18679 E (Priliv / Odliv) 0, , ,519 0, ,69 0,31 0,4996 1_Priliv 0, , ,481 0, ,64 0,36 0,5004 2_Odliv 0, ,02358 E (Čas) 0, , ,295 0, ,68 0,32 0, , , ,338 0, ,67 0,33 0, , , ,366 0, ,65 0,35 0, , ,01219 Tabela 8: Informacijski prispevki glede na razred podatkovnih zapisov (storitvene transakcije po namenu plačil) V delovni tabeli (ang. "task relevant data") obravnavamo izvirnih transakcij (podatkovnih zapisov) v proučevanem časovnem obdobju, ki jih po osnovnem posploševanju s seštevanjem, ob vpeljavi funkcije štetja podatkovnih zapisov, združimo na zapisov. V pripravi podatkovnega modela tipa MOLAP smo vpeljali dimenzijo Metodološka klasifikacija namena plačil, ki omogoča selekcijo podatkovnih zapisov po atributu namena plačil. Vrednost atributa je obvezna pri vseh podatkovnih zapisih. Zaradi v razdelku 2.2. opisanega, zaprtega sistema plačilno- Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 60

68 bilančne metodologije nam dimenzija Metodološka klasifikacija namena plačil, preko modela podatkovnega skladišča, opisanega v razdelku , vključuje v posamezne postavke plačilne bilance le ustrezne transakcije (podatkovne zapise) glede na šifro namena plačil. Nekatere šifre (nevtralne transakcije) pa niso vključene v metodologijo plačilne bilance, temveč služijo kontrolnim namenom. Tako v tabeli 8 zajamemo transakcij v proučevanem obdobju, ki jih razčlenimo na obravnavani razred "storitve" in nasprotni razred "ne-storitve". Za lažje razumevanje tabel in analiz v prilogi 6 prikazujemo Standardno klasifikacijo institucionalnih sektorjev (SKIS) in Standardno klasifikacijo dejavnosti (SKD). Informacijski prispevki pri nadaljnjem razčlenjevanju razreda podatkovnih zapisov po posameznih izbranih atributih so relativno nizki na najvišji hierarhični ravni posameznih dimenzij, opredeljenih v poglavju 4.2. Kljub temu pa, ob poznavanju vsebine obravnavnega področja, omogočajo osredotočenje na posamezne atribute oz. vrednosti in nadaljnje hierarhične ravni njihovih dimenzij ob uporabi metod podatkovnega rudarjenja. Ob upoštevanju minimalnega praga 0,003 za informacijski prispevek (izločimo atributa: "Priliv / Odliv" in "Čas") na tej ravni konceptualne hierarhije lahko za atribut Dejavnost ugotovimo, da je pričakovan najvišji informacijski prispevek pri obravnavanju storitvene menjave pri podjetjih, ki so za prevladujočo dejavnost registrirana znotraj terciarnih dejavnosti. To pa je že zelo pomembna ugotovitev tudi v kontekstu zasledovanja ciljev naše naloge, saj pove, da je pri določanju vzorca poročevalcev na storitveni statistiki v novem sistemu direktnega poročanja smiselno izhajati iz načela registracije prevladujoče (osnovne) dejavnosti posameznega ekonomskega subjekta (rezidenta). Pri podjetjih, ki imajo prevladujočo predelovalno dejavnost (vrednost atributa = II), pa je potrebno prenesti le ustrezen odstotek neposrednih odvisnih stroškov (npr. zavarovanje, transport, skladiščenje, ipd.) kot sestavni del uvoza ali izvoza blaga v posamezno vrsto storitvene menjave. V okviru členitve po atributu "Lokacija" v tabeli 8 vidimo, da je informacijski prispevek pri obravnavanju storitvenih transakcij že relativno pomemben (0,14759) za jugozahodno področje Slovenije (vrednost atributa na tej ravni hierarhije = "J-Z"). Rezultat je pričakovan, ob poznavanju dejstva, da je izvoz potovanj turistične storitve vrednostno še vedno prevladujoča storitvena dejavnost v poletni sezoni. Glede na delne informacijske prispevke ostalih geografskih področij Slovenije (posplošitev regij) pa bo potrebna obravnava storitvene menjave na nižjih nivojih konceptualne hierarhije, kar na narekujejo uteži, zlasti za osrednjo ("O": 0,4497) in severnovzhodno ("S-V": 0,2394) Slovenijo. V največ transakcijah plačilnega prometa s tujino v obravnavanem obdobju nastopa na rezidentni strani ekonomski subjekt, ki pripada nefinančnemu sektorju slovenske ekonomije (sektor S.11 nefinančne družbe). Zelo majhen pozitivni informacijski prispevek je pri členitvi storitvenih transakcij na sektorje slovenske ekonomije zaznati Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 61

69 tudi pri neprofitnih institucijah (sektor S.15 neprofitni izvajalci storitev gospodinjstvom). Ob poznavanju finančnega sektorja in načina poročanja podatkov lahko zapišemo, da izračunani informacijski prispevek ne odraža dejanskega stanja, saj plačilni promet ni ustrezen vir podatkov na tem področju. Podobno velja za sektor gospodinjstva, saj niso neposredni poročevalec, relevantna informacija pa je predmet modelskih ocenjevan v metodologiji plačilne bilance. Informacijski prispevek sektorja države je pričakovano negativen, saj so državne storitve relativno nepomembne v obravnavanem kontekstu. V splošnem pa je informacijski prispevek atributa Sektor k analizi storitvene menjave relativno pomemben že na visoki ravni abstrakcije, kar je pomembna informacija za nadaljnji proces podatkovnega rudarjenja. Storitvena menjava je izredno močno vezana na Evropo v širšem geografskem pomenu in manj na ostale kontinente. Začetna raven abstrakcije je zato prevelika in je nujno potrebno nadaljevati na nižjih ravneh hierarhije, zlasti z vidika Evrope. Slednje pa ne pomeni zanemariti dimenzijo kot celotno hierarhično ureditev (rudarjenje z metodami odločitvenih dreves in razvrščanja v skupine). Primerjalno najmočnejši informacijski prispevek prinaša atribut Valuta. Enaka je utež tolarja, ameriškega dolarja in ostalih valut, močno izstopa evro. V podatkovnem rudarjenju je, v kontekstu ciljev naloge, smiselno natančno spoznati zakonitosti storitvene menjave v tolarjih, ki bo nadomeščena z evri. Če povzamemo, lahko zapišemo, da z metodo izračuna informacijskega prispevka ugotavljamo sledeče: Informacijski prispevek pri proučevanju storitvene menjave nam že na najvišji konceptualni hierarhiji dimenzij, opredeljenih v našem podatkovnem skladišču, daje usmeritev oziroma identificira področja za poglabljanje naše analize ob uporabi metod podatkovnega rudarjenja (odločitvena drevesa, razvrščanje v skupine). Ob upoštevanju minimalnega praga izločimo atributa Čas in Smer plačila (Priliv / Odliv). Predlagamo osredotočenje na atribut Področje dejavnosti. Pri določanju vzorca poročevalcev na storitveni statistiki v novem sistemu direktnega poročanja je smiselno izhajati iz registrirane dejavnosti poslovnega subjekta. Terciarne dejavnosti prinašajo največji pričakovani delež ustreznih bodočih poročevalcev za storitveno statistiko. V sekundarnem sektorju je mogoče razmišljati o modelskem ocenjevanju storitvene statistike, vendar je potrebna nadaljnja poglobljena analiza (podatkovno rudarjenje). Pričakovani so pomembni informacijski prispevki na atributu Sektor, zlasti za nefinančne družbe. To še bolj potrdi ustreznost nadaljnje usmeritve analize na atribut Dejavnost. Storitvena menjava je močno vezana na Evropo v regionalnem smislu, vendar je začetna raven abstrakcije prevelika in je atribut nujno potrebno upoštevati v poglobljenih analizah storitvene menjave na nižjih ravneh metodološke hierarhije plačilne bilance. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 62

70 Smiselno je natančno poznavanje zakonitosti storitvene menjave v tolarjih, ki bo nadomeščena z evri. Podobne izračune smo opravili tudi za proučevana razreda: tekoči transferi (priloga 4) in dohodki (priloga 5). Ugotavljamo, da je le nekaj več kot podatkovnih zapisov v povprečju letno s šifro namena plačil, ki sodi v metodološkem pogledu med tekoče transfere. Pričakovano je koncentracija močna pri sektorju države ter osrednje slovenske regije. Zanimivo pa je tudi nezanemarljiva koncentracija takšnih šifer osnov pri subjektih iz terciarnih dejavnosti. Obstajajo pomisleki glede težav pri šifriranju plačil s strani tovrstnih ekonomskih subjektov. Poleg atributa Sektor je viden precej visok informacijski prispevek na valuti SIT. Preživnine, invalidnine npr. delavcem bivše skupne države se namreč nakazujejo v domači valuti. Število transakcij, ki so narave faktorskih dohodkov, je še nekaj manjše glede na tekoče transfere (preko transakcij v povprečju letno). Pričakovana je močna koncentracija v osrednjeslovenski regiji oziroma sektorju finančnega posredništva (banke in drugi finančni posredniki) PRIMERJAVA IN RAZVRŠČANJE RAZREDOV PODATKOVNIH ZAPISOV Izgradili smo takšno podatkovno skladišče, ki omogoča ne le primerjavo enega (proučevanega) razreda (na primer: storitvene transakcije) z nasprotnim razredom podatkovnih zapisov, ampak tudi več razredov podatkovnih zapisov na enak način hkrati. Slednje pa omogoči posploševanje atributov v smeri dimenzij podatkovnega skladišča. V našem podatkovnem skladišču, predstavljenem v razdelku 4., predstavlja metodološka klasifikacija namena plačil plačilno-bilančne statistike eno od dimenzij, drugi proučevani atributi v tabeli 8 pa ostale dimenzije, na želeni ravni abstrakcije. Pomembno diskriminatorno pravilo pri obravnavanju različnih razredov podatkovnih zapisov (X) predstavlja t. i. d_utež, ki predstavlja razmerje (koeficient d) med izbranimi podatkovnimi zapisi (npr. zapisi, ki imajo pri atributu namena plačil šifro, katera opredeljuje storitveno menjavo s tujino), ki zadovoljujejo določen pogoj (npr. podatkovni zapisi ekonomskih subjektov, ki so registrirani v primarni dejavnosti; področje dejavnosti od A-C) ter vsemi obravnavanimi podatkovnimi zapisi, ki zadovoljujejo takšen pogoj (vsemi podatkovnimi zapisi podjetij, ki so registrirana v primarnih dejavnostih). Velja torej splošna formula: X, prouč _ razred( X ) pogoj( X ) [ d : d _ utež] (4.3) V tabeli 8 na podlagi podatkov proučevanega obdobja vidimo, da v kolikor je izpolnjen pogoj, da je rezident registriran v primarni dejavnosti ekonomije, potem Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 63

71 obstaja 62 % verjetnost, da bo opravil plačilno transakcijo z nerezidentom, ki ima naravo storitvene menjave. Takšna verjetnost je pri ekonomskih subjektih iz terciarne (klasične storitvene dejavnosti) pričakovano še večja in sicer kar 69 %. Lahko zapišemo, da podjetja, ki so v osnovi registrirana za opravljanje različnih storitvenih dejavnosti, več kot 2/3 plačilnega prometa s tujino opravijo za ta namen. Prav tako lahko na visoki stopnji abstrakcije ugotovimo, da je verjetnost za storitveno transakcijo kar 77 %, če ima podjetje sedež v jugozahodnem delu Slovenije (Obalna in Obalnokraška regija) oz. le 57 % verjetnost, če podjetje prihaja iz jugovzhodnega dela Slovenije. Ugotovimo lahko, da je kar 71 % verjetnost za storitveno transakcijo, če je podjetje v institucionalni klasifikaciji razvrščeno med nefinančne družbe, in le 53 % če subjekt pripada sektorju države. Zanimivo, najdemo zelo veliko verjetnost (83 %) za pojav storitvene transakcije, če gre za menjavo z državami iz Azije in le 66 % verjetnost, če gre za trgovanje z evropskimi državami. Vsekakor je na atributu Država smiselno zmanjšati nivo abstrakcije. Večja je verjetnost za storitvene transakcije, če je originalna valuta posla med rezidentom in nerezidentom Slovenije ameriški dolar (79 %), kot pa če je originalna valuta evro (68 %). Opazimo, da atributi, ki nastopajo v pogoju in smo jih izbrali tudi glede na kriterij informacijskega prispevka na najvišji ravni abstrakcije, dajejo relativno zelo močne verjetnosti za obstoj storitvenih transakcij, kar kaže na smiselnost nadaljnje analize v zastavljeni smeri. Velika verjetnost, da izbran niz podatkovnih zapisov, ki izpolnjuje ustrezen pogoj (želeno vrednost atributa na želeni ravni abstrakcije), pripada proučevanemu razredu, navaja na dejstvo, da je koncept v osnovi izveden iz proučevanega razreda. Vendar, ker izbrani niz podatkovnih zapisov ne vsebuje vseh podatkovnih zapisov, ki sodijo v proučevani razred (manjkajo podatkovni zapisi za storitveno menjavo, ki ne izpolnjujejo pogoja), pravimo, da je diskriminatorno pravilo d_utež zadovoljiv ne pa zadosten pogoj, da naključni podatkovni zapis pripada proučevanemu razredu. Kombinacije atributov (dimenzij) preko oblikovanja ustreznega podatkovnega skladišča nam v večdimenzionalnem prostoru dajejo večje možnosti odgovarjanja na porajajoče se hipoteze, kot na primer: "Storitvena menjava z državami Azije je bolj verjetna na izvozni kot uvozni strani menjave". Diskriminatorno pravilo d_utež pa lahko pogledamo tudi bolj podrobno z vidika celotnega nabora vrednosti obravnavane dimenzije (ne-storitvene šifre osnov plačil) na želeni ravni abstrakcije oziroma posploševanja, kot prikazuje slika 18. Opazimo, da v trgovanju z evropskimi državami obstaja kar 66 % verjetnost (koeficient d tudi v tabeli 8), da je transakcija plačilnega prometa s tujino storitvene narave, 20 % verjetnost, da gre za blagovno menjavo, 5 % verjetnost, da gre za tekoče transfere in 4 % verjetnost za faktorske dohodke. Ker so vse navedene transakcije na tekočem računu plačilne bilance, sledi, da je pri tako množičnem šifriranju zelo nizka verjetnost za nastop transakcij oziroma plačil z nerezidenti, ki imajo naravo kapitalskega in finančnega računa plačilne bilance (le 5 % verjetnost). Pri tem pa imajo omembe vredno verjetnost za nastop dogodka le plačila iz naslova portfolio investicij (3 % verjetnost) ter ostalih naložb (2 % verjetnost). Če velja, da je pri majhni verjetnosti za nastop dogodka (na primer določene šifre namena plačil) večja verjetnost napake v pravilnosti šifre na eni Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 64

72 strani ter zavedajoč se velikih vrednosti plačil kapitalskega in finančnega računa na drugi strani, lahko zapišemo, da je smiselno čim prej izločiti podatkovne zapise s šiframi osnov namena plačil, ki se nanašajo na transakcije kapitalskega in finančnega računa plačilne bilance, iz sistema posrednega poročanja v celoti in preiti na neposredni vir poročanja podatkov (na primer pri portfeljskih naložbah, posojilih ipd). 66% 5% Evropa KAP. IN FIN. OSTALE NALOŽBE Evropa KAP. IN FIN. PORTFOLIO INVESTICIJE Evropa TEKOČI BLAGO Evropa TEKOČI DOHODKI 3% 2% Evropa TEKOČI STORITVE Evropa TEKOČI TRANSFERI 20% 4% Slika 18: Verjetnost za pojav plačil določenega namena (d_utež) v trgovanju z evropskimi državami Če posamezen podatkovni zapis (X) vključuje storitveno šifro osnove (proučevani razred podatkovnih zapisov) pa se lahko vprašamo: Kakšna je verjetnost, da je izpolnjen ustrezen pogoj? Takšno razvrščanje oziroma opisovanje proučevanega razreda (ali ne-razreda) podatkovnih zapisov nam omogoča t. i. mera t_utež. Zapišemo jo kot: [ t : w ]... pogoj ( X )[ t ] X prouč _ razred( X ) pogoj ( X ) : (4.4), 1 1 m w m Iz tabele 8 vidimo na primer: v kolikor v podatkovnem zapisu plačilnega prometa s tujino nastopa storitvena šifra osnove, potem je 70,9 % verjetnost (koeficient t), da gre za ekonomski subjekt, registriran v samih terciarnih dejavnostih, ali 44,2 % verjetnost, da ekonomski subjekt prihaja iz osrednje slovenske regije, ali 73,5 % verjetnost, da gre za nefinančno družbo, ali 92,9 % da gre za storitveno menjavo v Evropi, ali 79,8 % verjetnost, da gre za plačilo storitev v evrih. V tem pogledu je mogoče postaviti tudi ustrezen prag pomembnosti oziroma podpore (ang. "support threshold") pri proučevanju nekaterih atributov glede na proučevani razred storitvene menjave s tujino. Tudi ta mera je zadovoljiv, ne pa zadosten pogoj, Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 65

73 saj podatkovni zapis, ki izpolnjuje enak pogoj, lahko pripada tudi drugemu razredu (ne-storitve). Tako je na primer tudi, ko podatkovni zapis pripada razredu "nestoritve", verjetnost, da gre za nefinančno družbo, podobno zelo visoka, kot v primeru proučevanega razreda "storitve" in znaša 95 %. Primerjava in razvrščanje razredov podatkovnih zapisov po proučevanih atributih s pomočjo izračuna diskriminatornih pravil d_uteži in t_uteži nam podaja: Potrditev pomena terciarnih dejavnosti v proučevanju storitvene menjave, vendar velikost verjetnosti pojava storitvenih menjave s tujino pri rezidentih iz drugih dejavnosti ne dovoljuje drugačnega obravnavanja le teh. Presenetljivo večjo verjetnost (doslej neznano) za pojav storitvene menjave z državami Azije kot z državami Evrope. Majhno verjetnost za nastop dogodka pri transakcijah, ki imajo naravo kapitalskega in finančnega računa in s tem nujnost čimprejšnje izločitve le teh iz sistema neposrednega poročanja. Pregledno sliko verjetnosti za nastop dogodkov in s tem možnost osredotočenja v nadaljnjih analizah STATISTIČNE ANALIZE Osredotočimo se na storitveno menjavo, ki je z vidika zamenjave virov podatkov, glede na ugotovitve v razdelku 2.3., najpomembnejša postavka tekočega računa plačilne bilance Slovenije. Najprej smo izračunali enostavne statistike ne ravni proučevanega razreda (storitvene šifre menjave) v odnosu do posamezne spremenljivke (dejavnost, regija, sektor, država, valuta), še vedno na relativno visoki abstraktni ravni (primer geografske razčlenitve rezidentov po regijah in ne občinah), vendar nižji glede na analizo ustreznosti izbire izbranih atributov. Proučujemo vrednost, število transakcij izvoza in uvoza storitev na relativno visoki ravni generalizacije (npr. le transport in ne posamezne podvrste: cestni, železniški, pomorski in ostali). Posledično proučujemo tudi povprečno vrednost posamezne transakcije. V okviru posamezne dimenzije smo torej izbrali različno raven hierarhije glede na pomen posamezne členitve pri razlagi pojava. Agregirane podatke na želeni hierarhični ravni različnih uporabljenih dimenzij (Excelovih preglednic in grafik in s tem takojšnjo vizualizacijo rezultatov različnih proučevanih atributov) pridobimo s povpraševanjem v posebej pripravljenem podatkovnem skladišču (poglavje 4) tipa MOLAP neposredno preko Excelovih preglednic ter jih prenesemo za obdelavo s programskih orodjem Statistica 7.0 (StatSoft, 2004). Pri tem programsko opremo MS Excel povežemo neposredno z programsko opremo MS SQL Analysis Services, kar nam omogoča poizvedovanje tipa MOLAP preko uporabe poizvedovanj v 8-dimenzionalnem prostoru. Programsko orodje Statistica 7.0 pa ima tudi možnost neposredne povezave, bodisi na Oraclovo Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 66

74 bazo oziroma rezultate poizvedovanj z orodjem Oralce Discoverer (na primer format datoteke tipa "txt") ali tudi na posamezna namizna orodja, kot so Excel, DBase ipd VARIABILNOST VREDNOSTI IZVOZA POSAMEZNE VRSTE STORITEV Razdelek prikazuje analizo variabilnosti vrednosti izvoza posamezne vrste storitev glede na področje dejavnosti rezidenta. Osnovne mere variabilnosti prikažemo, kot v grafikonu na sliki 19, s petimi merami: minimumom, drugim in tretjim kvartilom, mediano, in maksimumom. Drugi in tretji kvartil tvorita interkvartilni rang (v nadaljevanju IQR), kjer leži, okrog srednje vrednosti mediane, 50 % proučevanih enot (v našem primeru podjetij, grupiranih po osnovnih področjih dejavnosti). Uporabljamo naslednje kratice za poimenovanje različnih temeljnih vrst storitev: FIN finančne, KOM komunikacijske, KON konstrukcijske, LIC licence, patenti in avtorske pravice, OSE osebne, kulturne in rekreativne, OPS ostale poslovne storitve, POT potovanja, RIN računalniške in informacijske, TRA transport, ZAV zavarovanje, VLA vladne. 1,6E9 1,4E9 1,2E9 1E9 8E8 6E8 4E8 2E8 0-2E8 FIN KON KOM LIC OSE POT OPS RIN TRA VLA ZAV Median 25%-75% Min-Max Slika 19: Variabilnost vrednosti izvoza posamezne vrste storitev glede na področje dejavnosti rezidenta (vrednost izvoza ) Že bežen pogled na sliko 19 nam pove, da so po vrednosti izvoza storitev, glede na proučevani vir podatkov (brez na primer modelskih ocen postavke potovanj), najpomembnejše transportne storitve, storitve potovanj, ostale poslovne storitve, računalniške in informacijske storitve, konstrukcijske itd. Pri slednjih se je potrebno Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 67

75 zavedati, da je poročanje o konstrukcijskih storitvah pretežno omejeno na poslovanje preko računov v tujini, ki ga analiziramo v nadaljevanju. Slika 19 izrazito poudarja koncentracijo vrednosti izvoza posamezne vrste storitev znotraj enega področja dejavnosti, kar pomeni dejansko specializacijo okrog registrirane storitvene dejavnosti posameznega podjetja. Večja izjema je predvsem izvoz potovanj, kjer je interkvartilni rang v vrednostno večjem razponu. Ugotovitev podkrepimo s prikazom posameznih histogramov po osnovnih vrstah izvoza storitev (sliki 20 in 21). Šifrant področij dejavnosti je naveden v razdelku Posamezno šifro (črko, ki označuje področje dejavnosti) smo, za lažje razumevanje analize, vpisali v frekvenčno distribucijo v histogramih na slikah 20 in Histogram: FINANČNE K-S d=,44328, p<,01 ; Lilliefors p<,01 Expected Normal 9 Histogram: KOMUNIKACIJSKE K-S d=,31483, p<,15 ; Lilliefors p<,01 Expected Normal No. of obs M C A O N L I K H G F E D B -5E6 0 5E6 1E7 1,5E7 2E7 2,5E7 X <= Category Boundary J No. of obs C E F H L M O J K G D -5E6 0 5E6 1E7 1,5E7 2E7 2,5E7 3E7 3,5E7 4E7 X <= Category Boundary I 10 Histogram: LICENCE, PATENTI IN AVTORSKE PRAVICE K-S d=,31710, p<,20 ; Lilliefors p<,01 Expected Normal 16 Histogram: OSEBNE, KULTURNE IN REKREATIVNE STORITVE K-S d=,44347, p<,01 ; Lilliefors p<,01 Expected Normal No. of obs O N M L J I H G F D -5E6 0 5E6 1E7 1,5E7 2E7 X <= Category Boundary K No. of obs K M D L NG J I H E F C B A -1E7 0 1E7 2E7 3E7 4E7 5E7 6E7 X <= Category Boundary O Slika 20: Histogrami vrednosti izvoza posameznih storitev (FIN, KOM, LIC, OSE) po panogah dejavnosti rezidenta Pri vrednosti izvoza finančnih storitev (prvi histogram na sliki 20) izrazito izstopajo ekonomski subjekti, registrirani v področju dejavnosti J finančno posredništvo. Izvoz v proučevanem obdobju obsega med mio evrov prometa. Vsi ostali rezidenti, registrirani v drugih področjih dejavnosti, ne presegajo 5 mio evrov izvoza finančnih storitev v letih Podobno koncentracijo izvoza posamezne vrste storitev znotraj ustreznega področja dejavnosti zasledimo tudi pri drugih vrstah izvoza storitev na slikah 20 in 21: komunikacijske (področje I promet, skladiščenje in zveze), osebne kulturne in rekreativne storitve (področje O druge javne, skupne in osebne Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 68

76 storitve), računalniške in informacijske storitve (področje K nepremičnine, najem, poslovne storitve), zavarovanje (področje J finančno posredništvo). 16 Histogram: OSTALE POSLOVNE STORITVE K-S d=,38493, p<,05 ; Lilliefors p<,01 Expected Normal 14 Histogram: POTOVANJA K-S d=,32957, p<,10 ; Lilliefors p<,01 Expected Normal No. of obs O Q N M L J I H F C E B A D G Q -1E8 0 1E8 2E8 3E8 4E8 5E8 X <= Category Boundary No. of obs N M L K J F E C D B A I H -1E8 0 1E8 2E8 3E8 4E8 5E8 X <= Category Boundary G O 11 Histogram: RAČUNALNIŠKE IN INFORMACIJSKE K-S d=,44609, p<,05 ; Lilliefors p<,01 Expected Normal 16 Histogram: TRANSPORT K-S d=,48112, p<,01 ; Lilliefors p<,01 Expected Normal No. of obs O N M L J I H G F D -5E7 0 5E7 1E8 1,5E8 2E8 X <= Category Boundary K No. of obs O N M L K H J G F E A CD -2E8 0 2E8 4E8 6E8 8E8 1E9 1,2E9 1,4E9 1,6E9 X <= Category Boundary I 10 Histogram: ZAVAROVANJE K-S d=,51165, p<,01 ; Lilliefors p<,01 Expected Normal 11 Histogram: KONSTRUKCIJSKE K-S d=,40691, p<,05 ; Lilliefors p<,01 Expected Normal No. of obs O N L K I G F E D -5E6 0 5E6 1E7 1,5E7 2E7 2,5E7 3E7 X <= Category Boundary J No. of obs O M L J I H E C B A G K D F -1E7 0 1E7 2E7 3E7 4E7 5E7 6E7 7E7 8E7 9E7 X <= Category Boundary Slika 21: Histogrami vrednosti izvoza posameznih storitev (OPS, POT, RIN, TRA, ZAV, KON) po panogah dejavnosti rezidenta Na sliki 21 je vidna izrazita vrednostna koncentracija izvoza transportnih storitev v področju dejavnosti I promet, skladiščenje in zveze. Pri podjetjih iz ostalih področij dejavnosti je izvoz transporta relativno zanemarljiv in verjetno odvisen od osnovne izvozne dejavnosti. V tem primeru transportna storitev nastopa kot neposreden odvisen strošek v kalkulaciji cene izvoza, na primer blaga pri podjetjih, registriranih v področju dejavnosti D (predelovalne dejavnosti). Pri ekonomskih subjektih, registriranih v drugih storitvenih dejavnostih (na primer G trgovina), pa je smiselno poiskati Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 69

77 korelacijo glede na izvoz transportnih storitev in jo kasneje uporabljati kot oceno v primeru bolj specializiranega sistema direktnega poročanja. Manjše so koncentracije izvoza posamezne storitve pri za to specializiranih podjetjih pri izvozu nematerialnih pravic (licence, patenti in avtorske pravice), saj jih, v relativno pomembnem obsegu, razen v podjetjih, registriranih v področju dejavnosti K (nepremičnine, najem, poslovne storitve), najdemo tudi pri podjetjih iz predelovalnih dejavnosti (D). Pri vrednostno zelo pomembnih izvoznih storitvah (potovanja, ostale poslovne storitve, konstrukcijske storitve), z izjemo transporta, pa ugotavljamo že večjo vrednostno disperzijo izvoza posameznih storitev pri podjetjih, registriranih v različnih dejavnostih. Pri ostalih poslovnih storitvah pomembno vrednost izvoza storitev v obravnavanih treh letih predstavljajo tako podjetja, registrirana za opravljanje dejavnosti v področju K (nepremičnine, najem, poslovne storitve; 434 mio evrov), kot podjetja registrirana v dejavnosti G (trgovina, popravila motornih vozil; 244 mio evrov) oziroma podjetja registrirana v dejavnosti D (predelovalne dejavnosti; 100 mio evrov). Pri izvozu storitev potovanj zasledimo nesimetričnost v levo pri histogramu v sliki 21 pri podjetjih iz področij dejavnosti O (druge javne, skupne in osebne storitve), G (trgovina, popravila motornih vozil), H (gostinstvo) in I (promet, skladiščenje, zveze). Pri izvozu konstrukcijskih storitev (upoštevan le plačilni promet s tujino preko bank) v manjšem vrednostnem razponu zasledimo večje odklone pri izvozu podjetij iz dejavnosti F (gradbeništvo), D (predelovalne dejavnosti), K (nepremičnine, najem, poslovne storitve) in G (trgovina, popravila motornih vozil) v obravnavanem obdobju. Izvoz posamezne vrste storitev na izbrani hierarhični ravni je v našem primeru praviloma koncentriran v področju dejavnosti, ki ustreza takšni vrsti menjave (npr. transport dejavnost prometa, skladiščenja in zvez), pri čemer pa to ne pomeni, da podjetja znotraj posameznega področja dejavnosti ne opravljajo relativno pomembnega izvoza številnih drugih vrst storitev (absolutne frekvence najnižjih frekvenčnih razredov so praviloma velike) VARIABILNOST PODROČIJ DEJAVNOSTI REZIDENTA Razdelek se osredotoča na analizo variabilnosti področij dejavnosti rezidenta glede na vrednost izvoza posamezne vrste storitev. Največjo storitveno izvozno usmerjeno specializacijo je v vrednostnem pogledu zaslediti v področju dejavnosti I (promet, skladiščenje in zveze) pri izvozu transportnih storitev. Vrednostno močno izstopa tudi izvoz potovanj na področju drugih javnih, skupnih in osebnih storitev (področje O), nekoliko manj, vendar še vedno značilno tudi pri podjetjih iz področja G (trgovina, popravila motornih vozil) ter pri podjetjih iz področja H (gostinstvo). V področju G zasledimo tudi drugi pomemben odklon vrednosti izvoza pri ostalih poslovnih storitvah ter transportu (slednji le v rangu od mio evrov). Pomembna so tudi odstopanja vrednosti izvoza računalniških in informacijskih storitev ter zlasti ostalih poslovnih storitev od izvoza drugih vrst storitev pri podjetjih registriranih znotraj področja K (nepremičnine, najem, poslovne storitve). Če nadalje pogledamo izračunane opisne statistike in predvsem frekvenčne distribucije vrednosti izvoza različnih vrst storitev po področjih dejavnosti, ugotovimo, da ni več vrste storitev med Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 70

78 vsemi področji dejavnosti, ki bi na povprečni letni ravni presegla 50 mio evrov vrednosti izvoza. Torej imamo le znotraj kvartarnih dejavnosti področje O, oziroma znotraj terciarne dejavnosti področja: G, H, I in K, ki presegajo izbrani kriterij (frekvenčni razredi nad 150 mio evrov izvoza posamezne vrste storitev v preučevanem obdobju). Med terciarnimi dejavnosti, ki so v osnovi storitvene dejavnosti, torej pogrešamo pomen izvoza konstrukcijskih dejavnosti znotraj področja F gradbeništvo in izvoza finančnih storitev na področju finančnega posredništva (področje J). Pri prvem (področje F gradbeništvo) moramo opozoriti, da proučujemo podatke plačilnega prometa preko domačega bančnega sistema in ne podatkov o transakcijah z nerezidenti preko računov v tujini, kjer običajno beležimo transakcije investicijskih del v tujini. Kljub temu v področju gradbeništva zasledimo v frekvenčnem razredu od 80 do 100 mio evrov vrednosti izvoza dve vrsti storitev: konstrukcijske in potovanja. V frekvenčnem razredu od 20 do 40 mio evrov izvoza v proučevanem obdobju ( ) pa ostale poslovne storitve. Zlasti ostale poslovne storitve so na izvozni strani pozitivno soodvisne od izvoza konstrukcijskih storitev (korelacijski koeficient: 0,22) in so sestavni del gradbenih investicij (npr. arhitekturne storitve med ostalimi poslovnimi storitvami). Negativni korelacijski koeficient v odnosu do postavke potovanj si lahko razložimo z dejstvom prevladujočega uvoza potovanj ob gradbenih delih v tujini. Vendar je za razlago takšnih pojavov nujno poiskati globlje po podatkovnem skladišču tipa MOLAP, ki smo ga razvili (nižje ravni hierarhije dimenzij ali celo poizvedovanje na ravni posameznih podatkovnih zapisov). Pri drugem področju (področje J) oziroma podjetjih, registriranih za opravljanje dejavnosti finančnega posredništva, pa zasledimo precejšno pestrost nesimetrične frekvenčne distribucije vrednosti izvoza različnih vrst storitev: računalniških in informacijskih (v rangu od 5 do 10 mio evrov v proučevanem obdobju), storitev izvoza potovanj (10 do 15 mio evrov), ostalih poslovnih storitev in finančnih storitev (20 do 25 mio evrov) ter zavarovalnih storitev (25 do 30 mio evrov). Finančne storitve je smiselno obravnavati tudi glede na število in povprečno vrednost opravljenih transakcij. Zavarovalniške storitve so na izvozni strani povsem soodvisne od finančnih storitev. Med terciarnimi dejavnostmi opazimo še izrazito močne pozitivne povezanosti med transportnimi in komunikacijskimi storitvami (vidno tudi v tabeli 9), med izvozom računalniških in informacijskih storitev oziroma ostalih poslovnih storitev na eni strani ter nematerialnih pravic na drugi strani. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 71

79 Correlations (storitve_izvoz za statistica_vred_dejavnost.sta) Marked correlations are significant at p <,05000 N=8 (Casewise deletion of missing data) Variable FIN KOM KON LIC OSE OPS POT RIN TRA ZAV FINANČNE KOMUNIKACIJSKE KONSTRUKCIJSKE LICENCE, PATENTI... OSEBNE, KULTURNE... OSTALE POSLOVNE ST. POTOVANJA RAČUNALNIŠKE IN INF. TRANSPORT ZAVAROVANJE 1,00-0,17-0,27-0,13-0,19-0,20-0,32-0,12-0,17 1,00-0,17 1,00-0,25-0,10-0,25-0,01 0,07-0,05 0,97-0,17-0,27-0,25 1,00 0,26-0,29 0,22-0,34 0,23-0,31-0,30-0,13-0,10 0,26 1,00-0,11 0,91-0,29 0,97-0,26-0,14-0,19-0,25-0,29-0,11 1,00-0,15 0,68-0,08-0,17-0,17-0,20-0,01 0,22 0,91-0,15 1,00-0,01 0,87-0,20-0,23-0,32 0,07-0,34-0,29 0,68-0,01 1,00-0,29 0,08-0,32-0,12-0,05 0,23 0,97-0,08 0,87-0,29 1,00-0,16-0,12-0,17 0,97-0,31-0,26-0,17-0,20 0,08-0,16 1,00-0,15 1,00-0,17-0,30-0,14-0,17-0,23-0,32-0,12-0,15 1,00 Tabela 9: Matrika korelacijskih koeficientov za vrednosti izvoza različnih vrst storitev v obdobju ) Podobno kot pri finančnem posredništvu v okviru terciarnih dejavnosti pa ugotavljamo znotraj ostalih področij kvartarnih dejavnosti relativno pomemben izvoz storitev potovanj (15 20 mio evrov pri subjektih iz področja L javna uprava, obramba, socialno zavarovanje ter pri subjektih iz področja zdravstva N, 8 10 mio evrov v okviru področja M izobraževanje), ostalih poslovnih storitev (14 16 mio evrov pri področju M, 5 10 mio evrov pri področju L) ter transportnih storitev (10 15 mio evrov pri področju L) v proučevanem obdobju. Med ekonomskimi subjekti znotraj primarnih (področja A C) in sekundarnih dejavnosti (D in E) slovenske ekonomije po pričakovanju v obravnavanem obdobju ne zasledimo izvoza posamezne vrste storitev, večjega od 150 mio evrov. Pri predelovalnih dejavnostih (D) lahko izpostavimo izvoz ostalih poslovnih storitev v frekvenčnem razredu od 100 do 120 mio evrov ter izvoz konstrukcijskih storitev v višini od 60 do 80 mio evrov. Izvoz storitev potovanj s strani podjetij, registriranih v predelovalnih dejavnostih dosega v obravnavanem obdobju vrednost od 20 do 40 mio evrov. Pri oskrbi z energenti (E) lahko izpostavimo izvoz storitev potovanj (15 20 mio evrov) ter ostalih poslovnih storitev (5 10 mio evrov). Znotraj primarnih dejavnosti izvoz nobene vrste storitev v proučevanem triletnem obdobju ne presega niti 2 mio evrov. V vseh treh področjih dejavnosti (A kmetijstvo, lov, gozdarstvo; B ribištvo, C pridobivanje energetskih surovin, rudnin in kamnin) pa zanimivo obstaja predvsem skupen nabor izvoza šestih vrst storitev: osebnih, konstrukcijskih, komunikacijskih, transportnih, ostalih poslovnih storitev in storitev potovanj. Nov sistem direktnega poročanja bi bilo na izvozni strani storitvene menjave smiselno zasnovati na vzorčenju poročevalcev, ki bi upošteval specializacijo izvoza storitev posameznega subjekta glede na njegovo področje dejavnosti ter hkratno veliko verjetnost izvoza tudi drugih vrst storitev. Slednje pomeni, da v kolikor je podjetje izbrano v vzorec poročanja na storitveni menjavi, nujno poroča o vseh vrstah storitvene menjave in ne le o prevladujoči storitveni dejavnosti. Pri odločitvi o zavezi Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 72

80 za poročanje je na izvozni strani smiselno izhajati iz delitve na začetni ravni hierarhije dejavnosti (primerne, sekundarne, terciarne, kvartarne). Podjetja iz primarnih dejavnosti ni smiselno obremenjevati s poročili (pomisleki pri konstrukcijskih storitvah). Največji vzorec poročevalcev je pričakovan v terciarnih dejavnostih. Registrsko kontrolo vzorca je potrebno izvajati na letni ravni zaključnih računov in davčnih evidenc VARIABILNOST POVPREČNE VREDNOSTI IZVOZA POSAMEZNE VRSTE STORITEV Število transakcij izvoza posamezne vrste storitev na prvi pogled sovpada z vrednostno distribucijo. Tako kot vrednostno so tudi številčno obsežne transakcije izvoza storitev transporta, potovanj in ostalih poslovnih storitev. V nasprotju z vrednostjo izvoza pa izstopajo številčno precej obsežne transakcije izvoza finančnih storitev, kjer lahko sklepamo, da gre za plačila manjših vrednosti. Vendar nam slika 22 s prikazom variabilnosti povprečne vrednosti posamezne transakcije izvoza različnih vrst storitev po različnih področjih dejavnosti nalaga bolj poglobljeno obravnavanje tega problema, zlasti z vidika oblikovanja novega sistema poročanja. Naše podatkovno skladišče nam na različni ravni abstrakcije obravnavanih dimenzij omogoča izračun povprečne vrednosti transakcije, saj smo že v fazi procesa podatkovnega rudarjenja, ki zadeva združevanje podatkovnih zapisov (razdelek 4.1.2) zagotovili poseben atribut, ki omogoča avtomatično štetje združenih podatkovnih zapisov. Enostavno, s funkcijo "Calculated Members" v programski opremi MS SQL Analysis Services iz dejstev podatkovnega skladišča: vrednost v evrih in število transakcij, izvedemo povprečno vrednost transakcije. S pomočjo programskega orodja Statistica 7 dokončamo koncept variabilnosti povprečne vrednosti transakcij, prikazan na sliki 22. Drugi in tretji kvartil na sliki 22 sta v večjem vrednostnem razponu povprečnega zneska transakcije pri izvozu konstrukcijskih, komunikacijskih, računalniških in informacijskih storitev, storitev izvoza nematerialnih pravic (licence, patenti, avtorske pravice) ter pri zavarovalnih storitvah. Gre za odraz večje verjetnosti pojava različnih povprečnih vrednosti zneska transakcije izvoza iste vrste storitev (na definirani ravni generalizacije). Hkrati so maksimalne povprečne vrednosti posamezne transakcije zelo visoke pri konstrukcijskih storitvah (blizu evrov), izvozu nematerialnih pravic (nad evrov), komunikacijskih storitev (okrog evrov) ter ostalih poslovnih storitev (nad evrov). Največji možni maksimalni povprečni znesek transakcije izvoza storitev v obravnavanem obdobju pa sicer zasledimo pri transportnih storitvah (blizu evrov), vendar je verjetnost pojava večjih povprečnih zneskov pri tovrstnih storitvah, prikazana z zelo ozkim interkvartilnim rangom ( evrov), zelo majhna. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 73

81 FIN KON OSE POT TRA ZAV KOM LIC OPS RIN VLA Median 25%-75% Min-Max Slika 22: Variabilnost povprečne vrednosti izvoza posamezne storitve ( ) glede na področja dejavnosti rezidentov Da pri novem sistemu poročanja ne bi prišlo do morebitnega neporočanja posameznih večjih zneskov plačil, ki lahko pomembno vplivajo na vrednostno spremljanje pojava (na primer izvoza transportnih storitev), je smiselno oblikovanje podatkovnega skladišča, ki omogoča bolj poglobljeno in hkratno večdimenzionalno iskanje vzrokov takšnih pojavov. Ko preko OLAP funkcij podatkovnega skladišča ugotovimo kateri ekonomski subjekti predstavljajo večje odklone (ang. outliers), je smiselno takšne subjekte tudi ekonomsko proučiti (npr. glej drugi elementi podatkovnega skladišča: zaključni računi, tuje neposredne investicije, kazalniki poslovanja ipd.) in ugotoviti morebitne specifične značilnosti kot vzroke za takšne pojave (na primer monopolne dejavnosti ipd). Dejansko nam uporaba kvartilnega razmika v statističnem pogledu omogoča odpravo slabosti variacijskega razmika, ki je odvisen od ekstremnih vrednosti statističnih znakov (atributov). Lahko pa se zgodi, da najmanjša ali pa največja vrednost zelo odskoči od ostalih vrednosti, kar povzroči velik variacijski razmik, kljub temu da se vse ostale vrednosti zelo malo razlikujejo (Jesenko, 2001). Na sliki 22 poglejmo najbolj variabilne povprečne vrednosti transakcije za isto vrsto storitev v različnih področjih dejavnosti. Največji standardni odklon od povprečja povprečnih vrednosti transakcij zasledimo pri izvozu transportnih ( evrov) in konstrukcijskih storitev ( evrov) Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 74

82 14 Histogram: TRANSPORT Expected Normal 7 Histogram: KONSTRUKCIJSKE Expected Normal N O N M K J I H G F D C A L E5 E N M L I H E B O G D K F A J C v Eur v Eur Slika 23: Variabilnost povprečne vrednosti transakcije izvoza transportnih ter konstrukcijskih storitev v obdobju po področjih dejavnosti rezidenta Pri transportu (slika 23) močno izstopa področje E (oskrba z elektriko, plinom in vodo) ter področje L (javna uprava, obramba in socialno zavarovanje). Pri konstrukcijskih storitvah velja opozoriti na področji iz primarnih dejavnosti: A kmetijstvo, lov, gozdarstvo in C pridobivanje energetskih surovin, rud, kamnin ter področje J (finančno posredništvo). Praviloma naj podjetja iz primarnih dejavnosti ne bi neposredno poročala o storitveni menjavi s tujino, zato lahko s pomočjo podatkovnega skladišča ugotovimo prave vzroke za pojave in se s tem lažje odločimo za čim bolj racionalno obliko prihodnjega pridobivanja ustreznih podatkov (nov sistem poročanja). 8 Histogram: LICENCE, PATENTI IN AVTORSKE PRAVICE Expected Normal 9 Histogram: KOMUNIKACIJSKE Expected Normal N O N M K I H G F L D J N O M L I H F E K J C D G v Eur v Eur Slika 24: Variabilnost povprečne vrednosti transakcije izvoza nematerialnih pravic ter ostalih komunikacijskih storitev v obdobju po področjih dejavnosti rezidenta Pri izvozu nematerialnih pravic precej od povprečne ( evrov) in srednje vrednosti (7.299 evrov) transakcij, značilnih za tovrstne storitve, izstopajo ekonomski subjekti iz dejavnosti finančnega posredništva (J) in klasičnih predelovalnih dejavnosti (D). Podjetja iz omenjenih področij praviloma dosegajo tudi večje vrednosti plačil za opravljene komunikacijske storitve. Poleg podjetij iz finančnega posredništva izrazito večje povprečne zneske plačil za opravljene komunikacijske storitve dosegajo še Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 75

83 podjetja iz dejavnosti trgovine in popravil motornih vozil (G). V istem frekvenčnem razredu povprečne vrednosti plačila za izvoz komunikacijskih storitev kot podjetja iz predelovalne dejavnosti nastopajo še podjetja iz dejavnosti K (nepremičnine, najem, poslovne storitve; evrov). Relativno močan standardni odklon od povprečne vrednosti posamezne transakcije izvoza zasledimo v sliki 25 še pri računalniških in informacijskih storitvah (6.220 evrov) ter ostalih poslovnih storitvah (5.837 evrov). Histogram: RAČUNALNIŠKE IN INFORMACIJSKE Expected Normal 9 Histogram: OSTALE POSLOVNE STORITVE Expected Normal N O N M L G F K H I J D N O N M L K I J H G E D A B C F Q v Eur v Eur Slika 25: Variabilnost povprečne vrednosti transakcije izvoza računalniških in informacijskih storitev ter ostalih poslovnih storitev v obdobju po področjih dejavnosti rezidenta Pri izvozu računalniških in informacijskih storitev zasledimo precej pestro frekvenčno porazdelitev povprečne vrednosti plačila za opravljeno storitev. Zneski v obravnavanem obdobju ( ) segajo od evrov pa do evrov. Navzgor (v frekvenčnem razredu od evrov) od povprečne vrednosti (približno evrov) najbolj izstopajo podjetja iz predelovalnih dejavnosti D in dejavnosti K (nepremičnine, najem, poslovne storitve). Podjetja, registrirana v dejavnosti: H (gostinstvo), L (javna uprava, obramba, soc. zavarovanje), M (izobraževanje), N (zdravstvo, soc. varstvo), O (druge javne, skupne in osebne storitve), pa opravljajo v povprečju nižje vrednosti izvoza tovrstnih storitev. Povprečne vrednosti izvoza računalniških in informacijskih storitev v obravnavanem obdobju dosegajo ekonomski subjekti iz dejavnosti G (trgovina, popravila motornih vozil), F (gradbeništvo) in I (promet, skladiščenje in zveze). Tudi pri izvozu obravnavanih storitev v odklonu navzgor zasledimo ekonomske subjekte iz finančnega posredništva (J). Pri izvozu ostalih poslovnih storitev zanimivo nastopajo podjetja iz 16 od 17 možnih osnovnih področij dejavnosti. Iz proučevanega vira podatkov plačilnega prometa v obravnavanem obdobju ne zasledimo ekonomskih subjektov, registriranih v dejavnosti P (zasebna gospodinjstva z zaposlenim osebjem). Povprečna vrednost plačila za opravljen izvoz ostalih poslovnih storitev odstopa navzgor pri ekonomskih subjektih iz dejavnosti Q (esteritorialne organizacije in združenja), F (gradbeništvo) in C Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 76

84 (pridobivanje energetskih surovin, rudnin in kamnin). S funkcionalnostjo sistematičnega poizvedovanje po podatkovnem skladišču je z vidika priprave zahtev bodočega sistema poročanja smiselno poiskati globlje vzroke zlasti za dejavnosti C in Q. Descriptive Statistics (storitve_izvoz za statistica_povp_vred_dejavnost.sta) Valid N Mean Median Minimum Maximum Percentile Percentile Std.Dev. Variable 25 % 75 % FINANČNE KOMUNIKACIJSKE KONSTRUKCIJSKE LICENCE, PATENTI OSEBNE, KULTURNE OSTALE POSLOVNE ST POTOVANJA RAČUNALNIŠKE IN INF TRANSPORT ZAVAROVANJE Tabela 10: Osnovne mere variabilnosti za poprečno vrednost transakcije izvoza posamezne vrste storitev Iz tabele 10 vidimo, da je prisotnost različnih temeljnih vrst storitev (N število opazovanih enot) po različnih področjih dejavnosti zelo visoka. Tudi storitev izvoza zavarovanj se pojavlja kar na desetih različnih področjih dejavnosti. Storitvene dejavnosti so torej razpršene tudi na izvozni strani preko celotne slovenske ekonomije A C E G I K M O Median 25%-75% Min-Max Slika 26: Variabilnost povprečne vrednosti izvoza različnih storitev znotraj področja dejavnosti rezidenta ( ) Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 77

85 S podatkovnim skladiščem in možnostmi neposrednega analitičnega procesiranja (funkcija OLAP) si pomagamo pojasniti vse večje odklone od porazdelitev, značilnih za izvoz različnih vrst storitev znotraj posameznega področja dejavnosti. Iz slike 25 je torej glede na visoke maksimalne povprečne vrednosti plačil izvoza posameznih vrst storitev potrebno v okviru obravnavanih dimenzij poizvedovati v podatkovnem skladišču kar na številnih področjih dejavnosti, najmanj povsod tam, kjer maksimalna vrednost močno odstopa od IQR. Visok oziroma razpotegnjen IQR znotraj posameznega področja dejavnosti govori o pestrosti izvoza storitev, značilni za podjetja iz tega področja dejavnosti. Odločitev o obremenjevanju oziroma izboru podjetij v vzorec za poročanje je smiselno oblikovati na kombinaciji tako zasnovanih kriterijev: položaj mediane, velikost IQR, največja oddaljenost maksimalne vrednosti od zgornjega kvartila ipd. Z naborom kriterijev bi se odločili za splošno oziroma specializirano poročanje (npr. ostale poslovne storitve nastopajo skoraj v vseh področjih dejavnosti) v smeri čim manjšega obremenjevanja poročevalcev in čim večje ohranitve kvantitete (vrednost izvoza in uvoza) in kvalitete informacije (pestrost po različnih hierarhičnih ravneh različnih proučevanih dimenzij) o storitveni menjavi Slovenije. Ob seveda nujni predhodni simulaciji rezultatov vzorčenja bi se že na osnovi slike lahko odločili za zelo smiselne kriterije, s katerimi bi dosegali ustrezne kvantitativno postavljene cilje. Tako bi na primer specializirano poročanje o storitveni menjavi lahko dopustili za podjetja iz tistih področij dejavnosti, kjer IQR oz. zgornji kvartil ne presega evrov povprečno na posamezno transakcijo izvoza, četudi je maksimalna povprečna vrednost izvoza storitev za podjetja iz obravnavanega področja dejavnosti nad tako postavljeno mejo. Takšna maksimalna vrednost pa zahteva nujno poizvedovanje tipa OLAP za dopolnitev vzorca z morebitnimi specifičnimi izvoznimi storitvenimi transakcijami oziroma poslovnimi subjekti. Za področja dejavnosti, ki ne zadostijo takšnemu kriteriju, velja obvezno splošno poročanje (IQR je razpotegnjen preko evrov) na podlagi letno definiranega vzorca oziroma velja neporočanje. Pri slednjem bi pomenilo, da oba kriterija nista izpolnjena, vendar je potrebno poglobljeno analiziranje posameznega področja dejavnosti v smislu posameznih odklonov pri nekaterih vrstah storitev (npr. področje A pri konstrukcijskih storitvah), kakor tudi v kontekstu drugih dimenzij (npr. regionalna pokritost menjave), za izpolnitev postavljenih kvalitativnih kriterijev ohranitve ustrezne oz. sprejemljive ravni kvalitete plačilno-bilančne statistike v novem sistemu poročanja. Sistematično statistično analizo s prikazano metodo smo izvedli tako na uvozni kot izvozni strani po obravnavanih dimenzijah: dejavnost, država, valuta, sektor, regija. Uporabili smo meri: vrednost izvoza oz. uvoza, število transakcij. Analiza je pripravljena tudi za izvedeno mero: povprečna vrednost transakcije. Začetni vzorec, pripravljen na osnovi posrednega poročanje, je potrebno izvesti ločeno za izvoz in uvoz storitev. Ugotoviti je potrebno velikost razlik med obema podmnožicama, z namenom uporabe le enega vzorca za enotno poročanje izvozne in uvozne aktivnosti na področju mednarodne menjave s tujino. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 78

86 Vir podatkov o transakcijah plačilnega prometa na računih v tujini je nekoliko specifičen, saj omogoča proučevanje največ le na mesečni frekvenci ter le eno mero vrednost plačil. Na enaki ravni hierarhije vrednosti proučevanih atributov smo opravili izračune za osnovne mere variacije in koncentracije, kakor tudi analizo medsebojne odvisnosti proučevanih spremenljivk. Glede na obsežno statistično analizo po ostalih dimenzijah, ki presega okvire naše naloge, lahko povzamemo nekatere splošne ugotovitve iz prikazane konkretne analize variabilnosti in koncentracije pri obravnavanju dimenzije Dejavnost in proučevanega razreda podatkovnih zapisov storitvene menjave s tujino. Izvoz storitvene menjave posameznega rezidenta je pretežno koncentriran glede na prevladujočo registrirano storitveno dejavnost, pri čemer pa to ne pomeni, da podjetja znotraj posameznega področja dejavnosti ne opravljajo relativno pomembnega izvoza številnih drugih podvrst storitev. Pri vrednostno najpomembnejših vrstah izvoza storitev Slovenije je koncentracija relativno manjša, z izjemo transportnih storitev. Izvoz transportnih storitev pri rezidentih izven področja dejavnosti I (promet, skladiščenje in zveze) je mogoče celo ocenjevati na primer z metodo korelacije (primer dejavnost G trgovina). Področja terciarnih dejavnosti: G (trgovina), H (gostinstvo), I (promet, skladiščenje in zveze) in K (nepremičnine, najem, poslovne storitve) ter področje kvartarnih dejavnosti O (druge javne, skupne in osebne storitve) presegajo prag 150 mio evrov izvoza posamezne vrste storitev v proučevanem obdobju). Ekstremne pojave je potrebno odkrivati z MOLAP funkcijo oblikovanega podatkovnega skladišča in jih upoštevati pri oblikovanju vzorca poročevalcev. Praviloma naj podjetja iz primarnih dejavnosti ne bi poročala o storitveni menjavi s tujino. Podjetje, izbrano v vzorec, poroča o vsej storitveni menjavi s tujino. Enostavni začetni vzorec na osnovi še razpoložljivih podatkov posrednega poročanja mora dati ustrezno primerjavo med podmnožicami poročevalcev na izvozni in uvozni strani storitvene menjave. Za nadaljnje vzdrževanje vzorca v letih 2007 in 2008 bo potrebno oblikovanje bolj kompleksnih kriterijev vzorčenja tudi na podlagi statičnih kazalnikov variabilnosti in koncentracije ter dodatnih administrativnih podatkovnih virov. Za pravilno sprejemanje odločitev s tem v zvezi pa je potrebno nadaljnje poglobljeno poznavanje zakonitosti menjave s tujino. Podobno metodo statistične analize smo v celoti izvedli tudi na uvozni strani storitvene menjave s tujino. Osnovna ugotovitev glede na izvoz je pričakovana. Razpršenost uvoza različnih vrst storitev po posameznem področju dejavnosti je veliko večja. Skoraj v vsakem področju dejavnosti se pojavlja uvoz vseh (z izjemo vladnih vrst storitev) desetih vrst storitev. Zaradi takšnega pojava je upravičenost uporabe metod predstavljenih v nadaljevanju naloge, na uvozni strani menjave s tujino, še toliko bolj opravičljiva. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 79

87 6. ANALIZA TIPA MOLAP V nadaljevanju se osredotočimo na področje transportnih storitev, saj v storitveni dejavnosti tako na izvozni in uvozni strani menjave s tujino predstavljajo gospodarsko eno najpomembnejših področij mednarodne menjave Slovenije. Po drugi strani pa sta, kot ugotavljamo že z statističnimi analizami v razdelku 5.2., variabilnost in disperzija, tako znotraj osnovnega področja dejavnosti kot v primerjavi z ostalimi področji dejavnosti, največji prav pri področju dejavnosti I (promet, skladiščenje in zveze). Takšni statistični kazalci pa opozarjajo na težavnost priprave bodočega vzorca. V izhodišču je potrebno navesti, da je zelo razvidna pretežna koncentracija vrednosti in števila transakcij menjave transportnih storitev s tujino pri ekonomskih subjektih oziroma rezidentih, registriranih za opravljanje dejavnosti na področju I (promet, skladiščenje, zveze), G (trgovina, popravila motornih vozil), D (predelovalne dejavnosti). Na sliki 27 pa vidimo, da povprečna vrednost posamezne transakcije v navedenih področjih dejavnosti ne presega evrov v Eur Eur 0 A B C D E F G H I J K L M N O Področje dejavnosti STORITVE - IZVOZ - TRANSPORT STORITVE - UVOZ - TRANSPORT Slika 27: Povprečna vrednost transakcije izvoza in uvoza transportnih storitev v evrih po področjih dejavnosti ter vpliv delovanja Uredbe EU (prag evrov ter evrov) Izvoz in uvoz transportnih storitev se pojavlja kar v 14 oziroma 15 področjih dejavnosti. V večini med njimi prav tako povprečna vrednost transakcij ne presega evrov. Tako bomo že v letu 2007 v povprečju izgubili večino sedanjega vira podatkov za merjenje transportnih storitev. Nastopata pa dve področji s povprečnimi Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 80

88 vrednostmi izvoza oziroma uvoza storitev transporta, večjimi od omenjenega praga poročanja. Področje E (oskrba z elektriko, plinom in vodo) pa v povprečnem znesku transakcije izvoza transportnih storitev celo presega prag poročanja evrov. Takšne transakcije pa bomo preko sedanjega vira poročanja zajeli tudi po 1. januarju 2008, ko bo predvidoma uveljavljen 2. prag poročanja. Kot sledi iz slike 27, je potrebno, z namenom podpore procesu odločanja o izboru posameznih ekonomskih subjektov po področjih dejavnostih, v vzorec poročevalcev, bodisi za splošno ali specializirano poročanje, izvesti poizvedovanje tipa MOLAP za ekstremne vrednosti (npr. maksimalne povprečne vrednosti izvoza storitev po področjih dejavnosti). Ko ugotovimo vzroke ekstremnih pojavov, je smiselna analiza v času, da bi ugotovili možnosti posplošitve odločitve o načinu bodočega pridobivanja podatkov poročanju zadevnih ekonomskih subjektov. Če ugotovimo, na primer, da se ekstremni pojav sistematično dogaja pri določenem ekonomskem subjektu v določenih časovnih intervalih, potem je smiselno po tem kriteriju zadevno podjetje vključiti v vzorec poročevalcev. Takšen pristop je bolj sistematičen in onemogoča močne vplive na postopek ugotavljanja vrednosti populacije iz vzorčne vrednosti. Uporaba funkcije "drill through" pogled v podatkovne zapise, je torej vezana v glavnem na razlago ekstremnih pojavov. Slika 28: Primer tipičnih operacij OLAP na uporabljenih dimenzijah in elementih (vir: podatkovno skladišče v programski opremi MS Analysis Services) Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 81

89 V sliki 28 vidimo, da z operacijami tipa OLAP zelo hitro odkrijemo ekstremne pojave in razloge zanje. Na sliki 28 so rdeče obkroženi povprečni zneski (elementi skladišča) izvoza transportnih storitev, ki jih najdemo v področju dejavnosti E (oskrba z elektriko, plinom in vodo). Tako imenovana tipična operacija OLAP odrez (ang. "slice") je v obravnavanem primeru narejena na dimenziji Metodološka klasifikacija namena plačil (MKNP: Transport izvoz). V kombinaciji z dimenzijo Dejavnost pridobimo del podatkovne kocke (ang. "dice"). Razčlenitev (ang. "drill-down") je na primer narejen potem v sekundarnih dejavnostih (II), kjer imamo področji D (predelovalne dejavnosti) in že omenjeno področje E. Dimenzija čas je agregirana (ang. "roll-up") na najvišjo možno hierarhično raven (leto) Avg_trans_Eur Račun Nivo 1 Nivo 2 Nivo 3 TEKOČI - STORITVE - UVOZ - TRANSPORT TEKOČI - STORITVE - IZVOZ - TRANSPORT E II Nivoosif Nivo 1 Pdr 1 Nivo 2 Pdr Nivo 3 Pans Sif1 Slika 29: Grafični prikaz vzroka ekstremnega pojava z uporabo hierarhije dimenzij v podatkovnem skladišču V prikazu na sliki 29 hitro ugotovimo, da se velike povprečne vrednosti transakcij v menjavi transportnih storitev s tujino na izvozni strani pojavljajo pri ekonomskih subjektih, ki se ukvarjajo z distribucijo električne energije, registriranih v panogi dejavnosti (promet z električno energijo), na uvozni strani pa v panogi dejavnosti (oskrba z električno energijo). V principu nas ne zanimajo ekonomski subjekti, pač pa značilnosti in zakonitosti opazovanih pojavov, zato je generalizacija oziroma hierarhična ureditev dimenzij nujen predpogoj za učinkovito analiziranje in razlago pojavov. Na sliki 21 v razdelku 5.2. smo videli, da se menjava transportnih storitev s tujino pojavlja tudi izven matičnih (I, G, D) in ekstremnih (E, L) področij dejavnosti, kjer povprečni znesek transakcij ni zanemarljiv. Za izbor ekonomskih subjektov iz neosnovnih preostalih področij dejavnosti v vzorec bodočega poročanja, ob predpostavki čim manjšega obremenjevanja ekonomskih subjektov z neposrednim poročanjem ter zasledovanju cilja ohranitve kvantitete in kvalitete statistike, je smiselno bolj poglobljeno pogledati morebitne skrite zakonitosti. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 82

90 7. UPORABA METOD PODATKOVNEGA RUDARJENJA Naše podatkovno skladišče pa poleg funkcije neposrednega analitičnega poizvedovanja omogoča tudi neposredno uporabo metod podatkovnega rudarjenja POROČEVALCI, NAMEN PLAČIL Pri proučevanju namena plačil oziroma transakcij s tujino slovenskih rezidentov preko bančnega sistema smo uporabili metodo odločitvenih dreves. Omejili smo se na izbrane atribute v razdelku ter osnovne lastnosti rezidentov. V analizi ustreznosti, izbranih atributov na začetni abstraktni ravni, izračunamo informacijske prispevke (tabela 8). Uporabili smo naše podatkovno skladišče in neposredno na izbrani hierarhični ravni uporabljenih dimenzij in lastnosti poročevalcev izvedli podatkovno rudarjenje z metodo odločitvenih dreves. Integracija odločitvenih dreves v okviru večdimenzionalnega podatkovnega skladišča, ki smo ga razvili v naši nalogi, omogoča izgradnjo oziroma pregledovanje odločitvenih dreves na številnih in različnih ravneh abstrakcije proučevanih pojavov. V nalogi torej skušamo odkriti pomembna odločitvena (pod)drevesa večdimenzionalnega podatkovnega skladišča za identificirane postavke plačilne bilance (slika 1), ki pomenijo največji izziv z vidika zagotovitve kvalitetne informacije v prihodnje, pri prehodu iz posrednega na neposredni sistem poročanja (npr. proučevani razred storitvene menjave s tujino preko proučevanih atributov, ki jih v podatkovnem skladišču standardiziramo v okviru dimenzij) IZBOR HIERAHIČNE RAVNI DIMENZIJ Optimizirati (Jesenko, 2002) moramo naslednji problem: Število bodočih poročevalcev naj bo čim manjše, vrednost posameznih vrst izvoza in uvoza storitev (nivo 3 metodološke hierarhije) mora biti čim bližje vrednosti v proučevanem obdobju. Omejitve pri tem pa so, da kvalitativni dejavniki proučevanih atributov poročevalcev: regijska delitev, menjava po državah, sektorska členitev, členitev po dejavnostih, ostanejo čim bolj ohranjeni. Valutna struktura ostaja manj pomembna dimenzija zaradi vključitve Slovenije v EMU ( ). Pri tem mora biti zastopanost posameznih podvrst storitvene dejavnosti sprejemljiva. Nižji hierarhični nivoji vrst storitvene menjave so vrednostno-kvantitativno lahko zanemarljivi, ne pa tudi z vidika kvalitete Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 83

91 informacije. Pri slednjem pa se je vsekakor potrebno odločiti za dvig praga kvalitativne sprejemljivosti informacije o storitveni menjavi. Bolj kot prehajamo na analizo na nižji hierarhični ravni dveh (v našem primeru: Metodološka klasifikacija namena plačil, Dejavnost) dimenzij, večja je variabilnost proučevanega pojava. Dobivamo nove in nove odklone od normalnih porazdelitev, ki jih je potrebno pojasnjevati z uporabo funkcij MOLAP podatkovnega skladišča. V primeru, da ostanemo na eni dimenziji na isti hierarhični ravni (na primer področje dejavnosti) se nam pričakovano zmanjšuje tudi število opazovanih enot, ob večji variabilnosti pojava. Po drugi strani pa je vedno težje v analitskem smislu ostajati na dovolj visoki abstraktni ravni posploševanja pojavov. V takem primeru je nujna uporaba metod podatkovnega rudarjenja, ki nam to omogoča. Zlasti je ustrezna njihova integracija v večdimenzionalno podatkovno skladišče. Ugotavljamo, da bi z nadaljnjim prehodom na nižjo hierarhično raven pri proučevani odvisni spremenljivki (vrsta storitev na podvrsto storitev, npr. ostali transport) in neodvisni spremenljivki (področje dejavnosti na panoge dejavnosti) variabilnost pojava (povprečna vrednost transakcije izvoza posamezne podvrste storitve med podjetji iz različnih panog dejavnosti) naraščala in bi bila analiza vzrokov za posamezne pojave otežena. Razlogi za razlago proučevanega pojava pa običajno ležijo na posameznih institucionalnih ravneh oziroma posebnostih. Zaradi slednjega je nujno na obravnavanem področju naloge razpolagati s podatkovnim skladiščem, ki omogoča odkrivanje takšnih pojavov s takojšnjim oz. neposrednim povpraševanjem v večdimenzionalnem prostoru. Zaradi razsežnosti prostora in naključnosti pojavov (zlasti na uvozni strani menjave s tujino) pa je smiselno uporabiti metode podatkovnega rudarjenja, ki lahko pokažejo bolj celovito sliko zakonitosti menjave s tujino na obravnavanih segmentih UPORABA METODE GRADNJE ODLOČITVENIH DREVES Ko smo izbrali ustrezno hierarhično raven uporabljenih dimenzij, smo na tej ravni abstrakcije našega podatkovnega skladišča definirali zahteve za izvedbo metode odločitvenih dreves. Z uporabljeno metodo smo želeli odkriti glavne značilnosti pomembnih poročevalcev, glede na metodološko klasifikacijo namena transakcij z nerezidenti. Če se metaforično izrazimo, potem lahko zapišemo, da smo z večdimenzionalnim podatkovnim skladiščem in hkratno uporabo metod podatkovnega rudarjenja dobili gozd dreves, na katere lahko poljubno "plezamo" do višine naše "varnosti" (razumevanja). Če celotni plačilni promet s tujino vpliva oziroma je vir podatkov (uporabljen ali neuporabljen v spreminjajoči se metodologiji), potem lahko ob večdimenzionalnosti prostora in hierarhičnosti dimenzij proučujemo lastnosti posameznih ekonomskih subjektov (rezidentov) glede na njihovo aktivnost v menjavi s tujino. Preprosteje zapisano, na katerem koli nivoju dimenzije oziroma izbrane hiperravnine v večdimenzionalnem prostoru lahko ugotavljamo, kakšne so zakonitosti Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 84

92 (lastnosti) rezidentov, ki to menjavo opravljajo. Takšno proučevanje starega sistema pa je ključno za odločitveni proces izbora poročevalcev v vzorec novega neposrednega sistema poročanja. Seveda lahko "posadimo številne gozdove" (sisteme odločitvenih dreves), če zamenjamo proučevani pojav (ang. "case") iz na primer dimenzije "rezidenta" na dimenzijo "metodološka klasifikacija namena plačil" na ravni na primer posamezne šifre plačilnega prometa. V nadaljevanju si v "gozdu dreves" na osnovi proučevanja rezidentov (naš "case") poglejmo nekatera zanimiva drevesa. Pri tem izhajamo iz naših dosedanjih zanimanj v praksi, ne glede na potencialna odkritja zelo zanimivih lastnosti drugih dreves (na primer zlasti postavke kapitalskega in finančnega računa plačilne bilance). Kot vhodno in hkrati napovedno dimenzijo izberemo metodologijo na različnih ravneh njene hierarhije, saj proučujemo, kateri ekonomski subjekti so bili sedanji poročevalci (posredno preko bank) za na primer posamezne vrste storitev in transferjev (identificirana problematika v poglavju 2.3.). Izgrajeni sistem (poglavje 4) nam omogoča relativno hitro in sprotno pregledovanje vsakokratno zanimivih odločitvenih dreves (področij menjave s tujino) na osnovi različnih virov podatkov. Na ta način prikažemo način razumevanja in smiselnost "plezanja" oz. "nepovzpetja" na sam vrh dreves (6. raven metodološke hierarhije). Že od nekdaj se na primer sprašujemo: kdo izvaža transportne storitve?, od česa je odvisen uvoz posameznih vrst storitev?, kakšna so podjetja, ki se ukvarjajo z menjavo konstrukcijskih storitev? itd. Omeniti je potrebno, da so zelo pomembni vhodni podatki o lastnostih posameznih subjektov. V analizi so predstavljeni nekateri osnovni podatki ekonomskih subjektov: lokacija (regija), velikost, število zaposlenih, sektor in panoga dejavnosti. Poleg odnosa do drugih dimenzij je v metodi odločitvenih dreves hkrati omogočena odvisnostna analiza tudi znotraj dimenzije (npr. dimenzija metodološka klasifikacija namena plačil). Osredotočimo se na osnovne podatke o ekonomskih subjektih, ki so opravljali storitveno menjavo s tujino (plačila preko slovenskih bank) v letih od 2003 do 2005 ter jih proučujmo tudi z vidika metodološke hierarhije plačilne bilance na tretjem hierarhičnem nivoju. Izvoz in uvoz storitev na tem nivoju omogoča njihovo delitev na osnovne namene storitvene menjave IZVOZ TRANSPORTNIH STORITEV V "gozdu dreves", oziroma večdimenzionalnem podatkovnem skladišču po izvedeni proceduri podatkovnega rudarjenja z uporabo metode odločitvenih dreves, si izberimo drevo "izvoz transporta". Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 85

93 Raven drevesa I. II. III. IV. V. Slika: Odločitveno drevo več dimenzionalnega podatkovnega 5 skladišča za proučevanje lastnosti rezidentov Slovenije, 272 ki znesek izvažajo > 92,89transportne storitve 554 <= 38,75 > 38,75 and <= 214,75 Št. transakcij 151 > 214,75 in <= 710,25 72 > 710,25 58 <= 92, ne Izvoz blaga? da 3306 <= 1,75 ne 30 Dejavnost:DE,DJ,F,G,H, I,,K,M,N,O 622 > 1,75 in <= 15,25 da 592 > 15,25 in <= 63,25 ne 1534 Št. transakcij 8 Dejavnost:DE,DJ,F,G,H, I,,K,M,N,O 353 da 345 da > 63,25 ne Dejavnost:DE,DJ,F,G,H, I,,K,M,N,O Sekt Sif = S.141 da ne 1772 <= 1,75 <= Št. zaposlenih > 1,75 in <= 143,75 > Št. transakcij > 143,75 <= Št. zaposlenih 824 > > 143,75 in <= 478, Št. transakcij > 478, Legenda: Verjetnost vrednosti atributa (vrednost plačil) Visoka Nizka Število proučevanih enot Kriterijska funkcija Slika 30: Odločitveno drevo na tretjem nivoju metodološke hierarhije večdimenzionalnega podatkovnega skladišča za proučevanje lastnosti rezidentov Slovenije, ki izvažajo transportne storitve Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 86

94 Proučevana enota v odločitvenem drevesu na sliki 30 so torej rezidenti, ki so izvažali storitve transporta v letih od 2003 do Skupaj je bilo takšnih ekonomskih subjektov 3860, kar predstavlja 13 % celotne populacije ekonomskih subjektov, za katere smo pridobili podatke o njihovi raznovrstni menjavi s tujino ( različnih ekonomskih subjektov) v proučevanem obdobju. Barve vozlišč drevesa v skali verjetnosti vrednosti atributa praviloma odražajo absolutno oziroma relativno frekvenco število oz. odstotek vseh enot, ki izpolnjujejo določen kriterij, če se pomikamo po drevesu preko vej do listov. V drevesu na sliki 30 odražajo te barve odnose do proučevanih enot, ki so izvažale le transportne storitve, saj nas zanimajo le njihove lastnosti oziroma od česa je pojav izvoza takšnih storitev odvisen. Kljub vsemu pa smo pri proučevanju uporabili tudi obe meri iz tabele dejstev v našem podatkovnem skladišču: število transakcij in vrednost transakcij. Odtenek barve vozlišč (pravokotniki v sliki 30) je odvisen od vrednosti izvoza transporta, proučevanih glede na predhodne kriterije. Glede na uporabljene atribute na sliki 30, ugotavljamo, da je največja verjetnost, da bo neko podjetje, registrirano lahko v različnih panogah dejavnosti, kot smo ugotavljali z opisnimi statistikami, izvažalo transportne storitve, če hkrati tudi izvaža blago. Takšnih enot je v proučevanem obdobju kar Le 554 pa je takšnih podjetij, ki so za nerezidente opravila transportne storitve, niso pa tudi izvažala blaga. Iz odločitvenega drevesa je razvidno, da se takšna podjetja na 3. ravni drevesa razlikujejo predvsem po številu opravljenih transakcij v proučevanih letih. Največ (272) je takšnih, ki so v povprečju prejela manj kot 38,75 plačil za izvoz transportnih storitev. Med njimi je po vrednosti izvoza 5 podjetij zanemarljivih, kar izvemo na 3. ravni drevesa. Najmanj (58) pa je takšnih podjetij, ki opravljajo transportne storitve, ne da bi izvažale tudi blago, ki so v proučevanem obdobju opravile nad 710 transakcij izvoza transportnih storitev. Vendar, kot je iz odtenka lista v tem primeru videti, je verjetnost atributa precej velika. V tem primeru lahko sodimo, da so ta podjetja pomembna tudi po vrednosti izvoza transportnih storitev. Sklepamo lahko, da je le približno 10 % podjetij, ki so specializirana v ponudbi izvoza transportnih storitev in ne izvažajo blaga rezidentov, po vrednosti menjave s tujino na tem področju posebej pomembnih z vidika obveznosti prihodnjega načina (neposrednega) poročanja. Vrnimo se v 2. koleno, k večini podjetij, ki izvažajo transportne storitve in hkrati tudi svoje ali blago drugega rezidenta. Po lastnostih takšnih podjetij je zaznati močno delitev po kriteriju sektorske pripadnosti. "Manjša polovica" (1534) pripada sektorju S.141 (Gospodinjstva delodajalci) oziroma so v pravno-organizacijskem pogledu organizirani kot samostojni podjetniki (s.p.). "Večja polovica" (1772) pa pripada drugih sektorjem ekonomije. Po pričakovanju največ S.11 nefinančnim družbam. Samostojni podjetniki se po številu opravljenih transakcij izvoza transportnih storitev v proučevanem obdobju delijo zlasti na tri frekvenčne razrede: 622 je takšnih, ki so Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 87

95 opravili ne več kot 16 transakcij, 353 jih je opravilo od 16 do 63 transakcij, 559 pa več kot 63 transakcij. Za vse frekvenčne razrede samostojnih podjetnikov, ki izvažajo transportne storitve in blago (rezidentov) v nadaljevanju izvemo, da so praviloma (od 1534 kar 1488) registrirani v področjih oziroma podpodročjih dejavnostih: DE (proizvodnja vlaknin, papirja, založništvo), DJ (proizvodnja kovin in kovinskih izdelkov), F (gradbeništvo), G (trgovina, popravila motornih vozil), H (gostinstvo), I (promet, skladiščenje, zveze), K (nepremičnine, najem, poslovne storitve), M (izobraževanje), N (zdravstvo, socialno varstvo), O (druge javne, skupne in osebne storitve). Vprašanje je, ali v tem pogledu algoritem odločitvenih dreves bolj ali manj ne izraža le pravno formalno možnost delovanja samostojnih podjetij v okviru določenih področij dejavnosti ekonomije? Če je tako, potem še toliko bolj potrjuje vsebinsko pravilnost izbrane metode. Vsekakor je zaznati, da samostojni podjetniki delujejo z izvozom transportnih storitev tako v sekundarnih, pretežno v storitvenih, kot tudi v terciarnih dejavnostih ekonomije. Največjo skupino podjetij (1772) na nivoju 3. kolena obravnavanega odločitvenega drevesa predstavljajo podjetja, ki hkrati izvažajo tudi blago (svoje ali drugega rezidenta) in niso organizirani v obliki samostojnega podjetnika. Po številu opravljenih tovrstnih transakcij v proučevanem obdobju se delijo na tiste, ki so opravili do 143 transakcij in tiste nad 143 transakcij. Nekoliko več je prvih (948), za katere izvemo, da so to pretežno podjetja z manj kot 4 zaposlenimi (659). Drugi (824) imajo praviloma več kot 9 zaposlenih (502) in opravijo preko 478 transakcij v triletnem obdobju. Za celotni obravnavani del dreves, in tudi sicer povsod, kjer velja močna verjetnost pojava, je smiselno racionaliziranje obremenjevanja poročanja le s postavitvijo ustreznega praga (vrednosti prometa), upoštevajoč odkrite implicitne zakonitosti preko proučevanih atributov. Na četrtem nivoju metodološke hierarhije plačilne bilance ugotovimo, da odločitveno drevo za celotni izvoz transportnih storitev najbolj definira odločitveno drevo na področju izvoza storitev cestnega transporta, saj je kar 3242 od 3860 vseh podjetij v proučevanem obdobju opravljalo izvoz (tudi) transportnih storitev. Pri tem je bilo v obravnavanih treh letih le 121 podjetij, ki pri opravljanju izvoza transportnih storitev niso hkrati tudi izvažala blaga (lastnega ali od drugega rezidenta) oz. so nudila le storitev transporta nerezidentu. V odločitvenem drevesu na tretji ravni metodološke klasifikacije namena plačil pa pri preostanku podjetij (3121) najdemo pomembno členitev tudi na tista podjetja, ki opravljajo transportne storitve v primeru dodelavnih poslov blaga in tista, ki nudenje transportnih storitev ne zagotavljajo v primeru dodelavnih poslov. Med prvimi je 224 podjetij. Praviloma takšna podjetja niso organizirana kot samostojni podjetniki, obstaja pa velika verjetnost, da ima takšno podjetje več kot 382 opravljenih poslov v proučevanem obdobju. Večina izvoznikov cestnih transportnih storitev, ki uvažajo blago in ne opravljajo dodelavnih poslov, se nadalje deli, kot že ugotovljeno, glede na dejstvo, ali gre za samostojne podjetnike (1508) ali ne (1389). Prve najdemo potem v zgoraj navedenih področjih dejavnosti. Pri drugih je zanimiva lastninska struktura, saj je kar 1274 podjetij takšnih, ki so v lasti Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 88

96 bodisi (1), bodisi (2) ali (3) in imajo praviloma manj kot 147 pridobljenih plačil na osnovi opravljenih izvoznih poslov cestnega transporta v obdobju 3 let. Drugačne strukturne vzorce najdemo pri drugih temeljnih vrstah izvoza transportnih storitev na 4. ravni metodološke hierarhije plačilne bilance Št. transakcij 78 ne 48 Država = Belgija da Št. transakcij ne 75 Država = Irska da Slika 31: Odločitveno drevo za izvoz storitev zračnega transporta (4. raven metodološke klasifikacije namena plačil) Storitve zračnega transporta (slika 31) je izvozilo 384 različnih podjetij: 44 je takih, ki so pomembne v kvantitativnem obsegu (številčno in vrednostno), saj so opravila preko 2687 transakcij v proučevanem obdobju. Največ pa je takšnih, ki so opravila manj kot toliko oz. več kot 218 transakcij. Boljša polovica njih je tovrstne storitve ustvarila za podjetja, registrirana na Irskem (83). Trideset podjetij pa je opravilo od 15 do 85 tovrstnih transakcij v obdobju 3 let z rezidenti Belgije. Variabilnost pojava zmanjšujemo s prehodom na nižjo hierarhično raven posameznih vrst storitev. Manjša kot je populacija poročevalcev (izvoznikov) manjša je pričakovana razvejanost drevesa glede na obravnavane atribute. V tem primeru nam tudi sama programska oprema omogoča izpise vrednosti odločitvenih kriterijev (npr. frekvenčni razredi števila transakcij v korenih vej oziroma listih). Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 89

97 122 ne da 62 Uvoz transportnih storitev Št. transakcij 92 ne 37 Država = Ciper da 55 9 Slika 32: Odločitveno drevo za izvoz storitev pomorskega transporta (4. raven metodološke klasifikacije namena plačil) V treh letih je 262 rezidentih podjetij opravljalo transport po vodnih poteh (slika 32). Devet je v vrednostnem in količinskem obsegu izredno pomembnih podjetij, saj so opravili po več kot 8548 takšnih plačilnih transakcij z nerezidenti. Drugo pomembno skupino predstavljajo podjetja, ki so imela več kot 427 prilivov iz naslova opravljanja te dejavnosti. Večina med njimi z nerezidenti iz Cipra (55). Manj pomembno (vrednostno in količinsko) predstavljajo podjetja, ki so ob izvozu pomorskega transporta hkrati tudi uvažala katerokoli vrsto transportnih storitev. Podobno situacijo zasledimo tudi pri proučevanju izvoza železniških storitev. Glede na koncesijsko storitev je seveda le malo podjetij, ki se ukvarjajo s tovrstno dejavnostjo. Pri večini je izvoz železniških storitev močno odvisen od uvoza drugih vrst transportnih storitev ter povezan z nerezidenti iz Cipra. Le redka so podjetja, za katera to ne velja. Ta pa izrazito železniško izvozno storitev vežejo na nerezidente iz Ukrajine. Zanimiv pojav pri proučevanju izvoza transportnih storitev na 4. ravni hierarhije je jakost dimenzije Država. Sklepati je, da trgovanje v globalnem smislu na področju transporta po zraku in vodi (morju) prinaša koncentracijo plačilnega prometa na neko geografsko lokacijo. V tem pogledu nam sistem posrednega poročanja na izvozni strani praviloma ne daje natančne geografske distribucije glede na državo rezidenta. Pričakovati je, da bo sistem direktnega poročanja na tem področju bistveno zanesljivejši. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 90

98 Opažamo, da je (slike 30 32) pri proučevanju posamezne vrste transportnih storitev, takoj opaziti list skupino najpomembnejših podjetij že na drugi ravni odločitvenega drevesa, katerih bistvena lastnost je veliko število opravljenih tovrstnih transakcij. Druga skupina v relativno pomembnem številu podjetij, registriranih v dejavnosti transporta, se močno loči, praviloma glede na povezanost opravljanja transportnih storitev z izvozom blaga oziroma uvozom drugih vrst transportnih storitev. V nadaljevanju omenimo še ostale transportne storitve, ki so po številu prisotnih podjetij (645) najštevilčnejše izvozne transportne storitve na 4. nivoju hierarhije, takoj za cestnim transportom. Tudi pri izvozu storitev ostalega transporta opažamo največjo skupino podjetij, ki jo opredeljuje veliko število opravljenih tovrstnih transakcij z nerezidenti (222 podjetij, preko 1639 transakcij). Nekoliko večjo absolutno frekvenco (244 podjetij, ki so opravila storitev izvoza ostalega transporta) zasledimo v razredu nad 176 do 1639 opravljenih transakcij v proučevanem obdobju. Pri takšnih podjetjih obstaja velika verjetnost, da hkrati tudi uvažajo različne transportne storitve ter izvažajo blaga. Praviloma pa imajo več kot 38 zaposlenih. Podobno lahko sedaj poglobimo rudarjenje na nižjo 5. hierarhično raven, kjer se storitve izvoza ostalega transporta ločijo na: špediterske storitve, najem vozil s posadko in ostalo. Med njimi imajo največjo utež špediterske storitve. ne ne Izvoz cestnega transporta da 72 ne Država = Madžarska da da 14 Sektor = S Uvoz storitev Ostalega transporta da ne Prilagoditev zaobjema CIF / FOB da 183 ne 22 Izvoz Ostalih poslovnih storitev da da Sektor = S.141 ne ne 172 Država = Švica da 137 Slika 33: Odločitveno drevo za izvoz storitev ostalega transporta špediterske storitve (5. raven metodološke klasifikacije namena plačil) Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 91

99 Med storitvami izvoza ostalega transporta, če po sliki 33 opišemo le glavno linijo značilnosti tovrstnih podjetij (zelena puščica), prevladuje opravljanje špediterskih storitev za nerezidente. Takšna domača podjetja se ukvarjajo tudi z uvozom ostalih transportnih storitev oziroma praviloma delujejo kot posredniki. V plačilno-bilančni metodologiji zato zelo izstopajo po nujnosti prilagoditve zaobjema oziroma merjenja vrednosti izvoza in uvoza z enakim imenovalcem (f.o.b. pariteta). Praviloma gre za večja podjetja, ki niso organizirana kot samostojni podjetniki ter opravljajo posle z nerezidenti Švice (plačilni promet preko računov bank v Švici). Že pri primerjavi izvozu cestnega transporta smo ugotovili, da so pri najpomembnejši obliki izvoza transportnih storitev na 4. ravni hierarhije podobne zakonitosti podjetij, ki izvajajo tovrstne storitev, kot na izhodiščni 3. ravni osnovne členitve različnih vrst storitvene menjave. Odločitveno drevo na nižji hierarhiji nam podaja posamezne dodatne atribute oziroma jih bolj natančno opredeli. Raven 3. 4 Proučevane enote izvoz transporta izvoz cestnega transport Koleno Kriterijska funkcija I. izvoz blaga = da uvoz blaga = da II. sektor? S.141 dodelavni posli = da III. 2 < = št. transakcij < 144 sektor = S IV. št. zaposlenih <= 4 št. transakcij > V. SKD = DE, DJ, F, G, H, I, K, M, N, O 1468 Tabela 11: Kriterijski funkciji glavnih vej odločitvenih dreves, glede na število proučevanih enot Pri primerjavi odločitvenih dreves izvoza celotnega transporta in izvoza cestnega transporta na 3. oziroma 4. hierarhični ravni ugotavljamo, da kljub dejstvu, da se kar 84 % proučevanih enot ukvarja z izvozom cestnega transporta, glavni veji odločitvenega drevesa na obeh ravneh izkazujeta različno kriterijsko funkcijo. V takšnih primerih je smiselno nadaljevati podatkovno rudarjenje na nižji hierarhični ravni glede na izhodiščno (3. raven). Sicer ugotovimo, da je druga najpomembnejša veja odločitvenega drevesa na 4. hierarhični ravni enaka po kriterijski funkciji glavni veji izhodiščnega odločitvenega drevesa (izvoz celotnega transporta). Zanimivi pa so novi kriteriji, ki opredeljujejo lastnosti pomembnih poročevalcev, katere je nujno vključiti v sistem neposrednega poročanja na tem segmentu plačilno-bilančne statistike: dodelavni posli, lastninska oblika podjetja, področje dejavnosti. Takšne so lahko spremenljivke za oblikovanje logičnih operatorjev oziroma pogojev, pod katerimi podjetja izberemo iz registra v vzorec obveznikov poročanja oziroma poročevalcev. Pri oblikovanju registra za izbor enot v sistem neposrednega poročanje je nujna navezava na vire podatkov, ki omogočajo proučevanje lastnosti takšnih enot glede na obravnavane in druge ekonomske atribute oziroma značilnosti. V obdobju postopne menjave sistema je smiselno z metodami podatkovnega rudarjenja ter neposrednim Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 92

100 analitičnim procesiranjem preko ustrezno oblikovanih podatkovnih skladišč nadzirati primerljivost dobljenih rezultatov in odpravljati neskladnosti glede na izkušnje preteklosti. Podobno ugotavljamo na primer pri prehodu iz 4. na 5. raven metodološke hierarhije pri proučevanju izvoza ostalih transportnih storitev oziroma izvoza špediterskih storitev. Ugotavljamo, da na nižji hierarhični ravni odkrivamo posamezne podrobnejše značilnosti določenega pojava oziroma se pojavijo novi pogoji kriterijske funkcije. V primeru izvoza transportnih storitev opažamo, da se s prehajanjem na nižjo hierarhično raven, ko že obravnavamo malo število enot (npr. pomorski, zračni transport) glede na tretjo izhodiščno raven proučevanja pojava pojavi tudi kriterij delitve glede na državo nerezidenta. Ker je v sistemu posrednega poročanja kriterij države na izvozni strani manj pomemben (praviloma se menja z državo banke računa nerezidenta), je to lahko znak, da nadaljnja analiza na nižji hierarhični ravni ni smiselna oziroma je tudi na proučevani ravni hierarhije smotrno upoštevati le nove atribute kriterijske funkcije glede na utež v celotni 3. ravni po posamezni veji drevesa in/ali do ravni, kjer se pojavi kriterij država. Novi sistem poročanja bo z vidika obravnavane dimenzije država nerezidenta lahko prikazal bistveno drugačno in po pričakovanju glede na opravljeno analizo praviloma bolj pravilno podobo geografske členitve menjave na opazovanih postavkah plačilnobilančne metodologije. Ker smo v razdelku 4. izgradili tudi podatkovno skladišče kocko za vire podatkov o transakcijah z nerezidenti preko računov v tujini, preverimo še potencialne neodkrite značilnosti takšnih podjetij. Ker gre za specifično poslovanje, ki pa je zlasti posledica preteklih zakonskih omejitev, in z njihovo odpravo po letu 1999, je v prihodnosti zaznati, predvsem tudi zaradi uvedbe evra in elektronskega poslovanja v plačilnem prometu, relativno manjšo potrebo po tovrstnem poslovanju rezidentskih firm na področju transporta. Že na tretji ravni metodološke hierarhije nam odločitveno drevo pove, da je v obravnavanem obdobju preko računov v tujini prejelo plačila za izvoz transportnih storitev 151 podjetij. Kar 86 je takšnih, kjer je vrednostni obseg plačil v obdobju dosegel skoraj pol milijona evrov ( evrov). Med njimi so najpomembnejša podjetja (45) registrirana v področju dejavnosti I (promet, skladiščenje in zveze) in panogi dejavnosti (cestni tovorni promet). Del podjetij, ki ni registriran v tej dejavnosti pa se loči glede na poslovanje z nerezidenti iz držav članic Efte. Zlasti je pomemben obseg izvoza transportnih (ne-cestnih) storitev na Norveško. Ker gre pri računih v tujini že za obliko neposrednega poročanja, je kriterij dimenzije država na izvozni strani v tem primeru bolj relevanten glede na podatke posrednega poročanja. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 93

101 Drugo skupino predstavljajo podjetja, ki opravijo srednji vrednostni obseg menjave v razponu od evrov do približno pol milijona evrov v obravnavanem obdobju in jih na tej ravni hierarhije ni mogoče drugače opredeliti, glede na uporabljene atribute. Tretjo skupino predstavljajo podjetja z relativno majhnim obsegom izvoza (pod evrov v obdobju) transportnih storitev, za katere prejemajo plačila preko računov v tujini. Zanimivo pa je, da se večina med njimi ukvarja z drugimi oblikami poslovanja in menjave z nerezidenti preko računov v tujini (uvoz storitev, kapitalski dohodki, tekoči transferi, gotovina in vloge). Verjetnost, da bi bilo takšno podjetje pomembno z vidika izvoza transportnih storitev, je nižja od 0,1. Če povzamemo ugotovitve podatkovnega rudarjenja na izvozu transportnih storitev s pomočjo metode odločitvenih dreves v smeri opredelitev pomembnih značilnosti za izbor vzorca bodočih poročevalcev: Izvoz transporta je močno povezan z izvozom blaga in uvozom blaga, podjetja, ki pa so specializirana v dejavnosti transporta, je potrebno selekcionirati s kvantitativnimi kriteriji (število transakcij, vrednost v obdobju). Zelo pomembno vejo v odločitvenem drevesu izvoza transportnih storitev in med njimi zlasti cestnega transporta predstavljajo samostojni podjetniki posamezniki, ki jih je smiselno vzorčiti glede na dejavnost in obseg menjave. Drugo pomembno skupino predstavljajo podjetja, ki po večini sodijo med klasične nefinančne družbe z določenimi oblikami lastninske organizacije ter največkrat z manjšim številom zaposlenih. Za obe sektorski skupini podjetij pa je značilno, da praviloma ne izvajata dodelavnih poslov. Sklepamo, da so torej pomembna transportna podjetja, kjer je prevladujoča dejavnost transport in ne predelovalna dejavnost. Na nižjo metodološko hierarhično raven je z metodo podatkovnega rudarjenja smiselno preiti, v kolikor pridobimo nova spoznanja in so tudi kvantitativni kazalniki relativno pomembni. Prvo predvsem pomeni, da na primer odkrijemo posamezne ekstremne vrednosti, ki se redno pojavljajo pri posamezne podjetju ali skupini podjetij z določenimi značilnostmi. Drugo pa nam predstavlja relativno pomembno vrednost posamezne postavke z vidika trenutnega obsega ekonomskega delovanja ali porajanje novega pojava. Dimenzija država nerezidenta je na izvozni strani, zaradi značilnosti sistema posrednega poročanja, relativno slab odločitveni kriterij. Druge izvozne transportne storitve: železniški, pomorski in zračni transport imajo značilnosti pomembnih skupin poročevalcev glede na kvantitativne dejavnike. Plačilne transakcije pa so običajno geografsko koncentrirane. Tudi na 5. hierarhični ravni je še mogoče odkriti posamezne implicitne zakonitosti; praviloma velja močna soodvisnost od uvoza ostalih oblik transporta. Tako je izvoz špediterskih storitev odvisen tudi od uvoza ostalih oblik transporta. Podjetja, ki plačila za izvoz transportnih storitev prejemajo preko računov pri bankah v tujini, so relativno manj številčna in se v osnovi ločijo glede na vrednostni obseg tovrstne menjave. Najpomembnejša so podjetja, ki jih izrecno Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 94

102 najdemo v panogi cestnega transporta na eni strani ali pa v drugih oblikah cestnega transporta glede na poslovanje z državami EFTA na drugi strani. Dimenzija država je zaradi oblike poročanja bolj zanesljiv kriterij na izvozni strani kot pri statistiki plačilnega prometa s tujino. Vrednostno manj pomembna podjetja pri prejemanju plačil za izvoz transporta na račun pri tuji banki vodijo številne druge posle preko teh računov in je malo verjetna njihova vključitev v vzorec poročanja za transportne storitve. Kot vidimo na številnih mestih naše analize, metode podatkovnega rudarjenja postavljajo hipoteze. Vsekakor jih je moč preveriti s pomočjo MOLAP ali OLAM orodij našega podatkovnega skladišča ali s pomočjo statističnih metod. Z omenjenimi orodji v pripravljenem podatkovnem skladišču hitro ugotovimo, da samostojni podjetniki iz navedenih področij dejavnosti opravijo vrednostno in številčno pomembnejši obseg menjave transportnih storitev, kot pa tisti, ki niso iz omenjenih dejavnosti (46). S povpraševanjem tipa OLAP potrdimo dejstvo, ki ga izraža temna senca barvne skale stičišč vej oziroma listov v tem delu proučevanega drevesa (slika 30), da so samostojni podjetniki opravili kar preko 248 mio evrov izvoza transportnih storitev, imeli pri tem preko tovrstnih plačilnih transakcij preko slovenskega bančnega sistema s povprečno vrednostjo približno evrov na transakcijo UVOZ TRANSPORTNIH STORITEV Enake metode analize oziroma podatkovnega rudarjenja smo uporabili tudi na uvozni strani transportne menjave Slovenije s tujino. Narava uvoza je bistveno manj predvidljiva, saj smo v okviru celovite sistematične analize, z metodo statistične analize, predstavljene v poglavju 5.2., ugotovili veliko večjo razpršenost vrednosti uvoza različnih vrst storitev znotraj posameznih področjih dejavnosti podjetij v primerjavi z izvozno stranjo. S tega zornega kota je uporaba metod podatkovnega rudarjenja, ki omogoča odkrivati strukturne vzorce in predvideti bodoče potencialne obveznike poročanja, še toliko bolj dobrodošla. Če posplošimo naše ugotovitve, pridobljene z odločitvenimi drevesi, pripravljenimi tudi za uvozno stran transportne menjave, potem lahko navedemo sledeče: Število podjetij, ki uvažajo transportne storitve (5573 v proučevanem obdobju), je praviloma večje od števila podjetij, ki izvažajo transportne storitve, oziroma je verjetnost uvoza transportnih storitev pri naključno izbranem podjetju v vzorec večja od verjetnosti izvoza transportnih storitev. Na izhodiščni ravni metodološke hierarhije plačilne bilance (3. raven) z odločitvenimi drevesi in proučevanimi atributi dobimo zato bolj osnovne informacije o lastnostih proučevane populacije, kot je to primer pri analizi izvoza transportnih storitev. Na uvozni strani je zato bolj priporočljivo podatkovno rudarjenje na nižjih hierarhičnih ravneh metodologije plačilne bilance. Glavno vejo odločitvenega drevesa za uvoz storitev transporta predstavljajo zasebna podjetja, ki so hkrati tudi uvozniki in izvozniki blaga in opravijo preko 50 takšnih transakcij v letu. Dobro tretjino celotne populacije uvoznikov transportnih storitev predstavljajo Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 95

103 podjetja, ki nimajo blagovnega uvoza in so v menjavi transportnih storitev vezana geografsko zlasti na Nemčijo in Italijo. Na 4. ravni metodološke hierarhije nam, podobno kot pri izvozu transportnih storitev, tudi pri uvozu največjo utež in s tem definiranje odločitvenega drevesa na višji hierarhični ravni, predstavlja uvoz storitev cestnega transporta (3534 podjetij je imelo uvoz cestnega transporta od vseh 5573 podjetij, ki so uvažala transportne storitve v proučevanem obdobju). Med temi podjetji obstaja 38 % verjetnost, da so hkrati tudi izvozniki transportnih storitev. Pri podjetjih, ki uvažajo transportne storitve in so hkrati uvozniki blaga (takšnih je bilo v obravnavanem obdobju 3309), je pomemben tudi pojav dodelavnih poslov. Zelo zanimivo je odločitveno drevo za uvoz storitev pomorskega transporta. Podjetja je smiselno vzorčiti glede na kvantitativne kriterije, ugotovimo pa, da obstajajo tri pomembnejše skupine. Najpomembnejšo skupino podjetij, ki uvaža storitve pomorskega transporta, predstavljajo podjetja, ki izvažajo blago v Indijo. Drugi dve skupini pa predstavljajo podjetja, ki uvažajo blago bodisi iz Hong Konga bodisi iz ostale Kitajske. Odločitveno drevo nam pokaže, da je pomemben del uvoza zračnega transporta povezan z večjimi izvozno uvoznimi posli (kriterij postavka gotovina in vloge), zlasti z državami na severu Afrike ter ZDA. Pomembno geografsko ločnico predstavlja tudi uvoz storitev zračnega transporta iz Turčije. Omeniti je potrebno še večjo navezanost uvoza zračnega transporta z izvozom ostalih poslovnih storitev. Poročevalce na uvozu storitev železniškega transporta je moč vzorčiti le na osnovi kvantitativnih kazalnikov (vrednost, število transakcij). Uvoz ostalega transporta je na 5. hierarhični ravni metodologije razčlenjen nekoliko bolj kot izvoz ostalega transporta. Tako ločimo (IMF, 1993) v okviru uvoza ostalega transporta: najem vozil s posadko, transport nafte in plina po cevovodu, ostale storitve povezane s transportom, špediterske storitve. Najem vozil s posadko je vezan na uvoz pomorskega transporta po eni strani, po drugi pa predvsem na menjavo s Hrvaško. Uvoz transporta nafte in plina po cevovodu je po eni strani povezan z uvozom storitev pomorskega transporta, po drugi pa z izdatki na postavki tekočih transferov v tujino z namenom zavarovanj oziroma pozavarovanj. Precejšnjo utež pri definiranju odločitvenega drevesa za uvoz ostalih transportnih storitev predstavljajo tako imenovane storitve, povezane s transportom (1287 podjetij). Spoznamo, da je večina takšnih podjetij hkrati tudi ali izvozni oziroma uvoznik cestnega transporta ali uvoznik storitev pomorskega transporta. Precej močne uvozne države na področju tovrstnih storitev so Luksemburg, Nemčija in Italija. Postavka je močno korelirana tudi s stroški službenih potovanj. Tudi na uvozni strani predstavljajo med ostalim transportom špediterske storitve najpomembnejši delež. Podjetja, ki plačujejo tovrstne storitve, praviloma plačujejo tudi storitve cestnega transporta in se precej ukvarjajo z dodelavnimi posli. Tovrstne storitve so močno vezane na nerezidente iz Italije, Avstrije in Nemčije. Preko računov v tujini obstaja velika verjetnost (65 %), da podjetje plačuje transportne storitve nerezidentom iz Hrvaške. Plačila ostalim nerezidentom z Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 96

104 rezidentskih računov v tujini pa so praviloma namenjena plačilu uvoza "necestnih" transportnih storitev. Na uvozni strani je država bolj zanesljiva in pomembna kriterijska dimenzija, zaradi načina zbiranja podatkov sedanjega posrednega poročanja DRUGE VRSTE STORITVENE MENJAVE S TUJINO V nadaljevanju smo pregledali menjavo s tujino na ostalih vrstah storitev, prav tako pa tudi na postavkah plačilne bilance: dohodki, tekoči in kapitalski transferi, ki smo jih na sliki 1 označili kot temeljni predmet analize oziroma obravnavane problematike v naši nalogi. Izsledke na navedenih segmentih podajamo tudi v okviru predlogov v zaključku naloge (razdelek 8). Finančne storitve: tako na izvozu kot uvozu gre za veliko število majhnih transakcij plačil, ki so prisotna pri preko poročevalcih na izvozni strani in preko rezidentov na uvozni strani. Vzorčenje poročevalcev kot obveznost poročanja, v okviru univerzalnega poročanja večine storitvene menjave, je smiselno na kriteriju števila in skupne vrednosti plačil. Po vrednosti so praviloma pomembno večji poslovni subjekti (ni pa pričakovane sektorske členitve). Izvoz finančnih storitev ni zanemarljiv tudi pri nefinančnih družbah in redkih samostojnih podjetnikih zlasti v številčnem smislu transakcij. Vrednostni izvoz finančnih storitev je pomemben tudi pri poslovanju z nerezidenti ostalih kontinentov (zlasti Amerike in Azije). Na uvozni strani kot pomemben kriterij izstopa poslovanje z državami bivše Jugoslavije in Nemčije. Komunikacijske storitve: z izvozom komunikacijskih storitev se je v proučevanem obdobju ukvarjalo 281 ekonomskih subjektov iz Slovenije. Odločitvena drevesa izkazujejo, da mora biti zaveza k poročanju izvoza in uvoza komunikacijskih storitev oblikovana primarno na osnovi vrednosti poslovanja v preteklem obdobju. Na izvozni strani praviloma to niso samostojni podjetniki. Na uvozni strani pa obstaja velika verjetnost, da gre za poslovanje z nerezidenti iz Velike Britanije. Posebno izstopajo tudi tako imenovane davčne oaze. Transakcije uvoza komunikacijskih storitev pa so povezane s tekočimi transferi ostalih sektorjev v tujino. Konstrukcijske storitve: poleg vrednostnega kriterija menjave pa je pri izvozu konstrukcijskih storitev pomembno, da največje posle opravljajo domače nefinančne družbe v zasebni lasti, z večjim številom zaposlenih in manjšim številom transakcij večjih vrednosti, kar je v skladu z naravo takšnih storitev. Praviloma izvoz konstrukcijskih storitev zahteva tudi uvoz številnih vrst drugih storitev. Pričakovano število firm (populacija poročevalcev) je, zanimivo, pri menjavi konstrukcijskih storitev podobno tako na izvozni kot uvozni strani (nekaj preko 800 podjetij). Na uvozni strani je prisotna tudi relativno močna relacija do nerezidentskih firm na Hrvaškem. Licence, patenti in avtorske pravice: Izvoz nematerialnih pravic poteka praviloma preko postopkov standardizacije in registracije preko ZDA, Velike Britanije in Irske. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 97

105 Izvoz v Evropo predstavlja drugo pomembno vejo odločitvenega drevesa. Število podjetij, ki uvažajo nematerialne pravice (1300), je v obravnavanem obdobju močno presegalo število podjetij, ki izvažajo (281) pravice do uporabe zavarovane intelektualne lastnine. Tudi uvoz je geografsko močno lociran na Veliko Britanijo in prisoten zlasti pri razredu velikih podjetij z večjim številom zaposlenih. Osebne, kulturne in rekreacijske storitve: Osnovni kriterij ločevanja populacije pri menjavi tovrstnih storitev je velikost podjetja. Zaradi pestrosti različnih podvrst storitev je smiselno celo stratificirano vzorčenje na osnovi ločitve zelo majhnih podjetij (npr. samostojni podjetniki) in vseh ostalih. Večja podjetja so močno usmerjena na poslovanje z nerezidenti Italije ter prihajajo iz določenih sekundarnih in predvsem terciarnih dejavnosti poslovanja. Skoraj ekonomskih subjektov iz Slovenije je bilo v proučevanem obdobju uvoznik obravnavanih storitev. Kriterijska funkcija je tako nedoločena, da je smiselna univerzalna zaveza k poročanju uvoza tovrstnih storitev, vseh subjektov, ki so takšno poslovanje imeli in so izbrani v vzorec poročanja v okviru izvoza ali ostalih vrst storitvene menjave. Ostale poslovne storitve: Odločitveni drevesi izvoza in uvoza ostalih poslovni storitev sta zelo razvejani in shematično precej podobni. Že na izvozni strani gre za veliko populacijo rezidentov, ki so se ukvarjali z menjavo tovrstnih storitev v proučevanem obdobju (izvoz 7850, uvoz 9591). Razvejanost pa izvira tudi iz pestrosti podvrst menjave ostalih poslovnih storitev (IMF, 1993). Na izvozni strani obstajajo štirje vrednostni frekvenčni razredi znotraj katerih je močna verjetnost za nastop odločitvenih kriterijev (vrednosti posameznih proučevanih atributov). Za najpomembnejšega (3432 proučevanih enot) je značilna navezava na geografsko lokacijo menjave, izvoz blaga in velikost podjetja. Za naslednji zelo pomemben frekvenčni razred (1593 proučevanih enot) je značilna odvisnost od uvoza faktorskih dohodkov (izdatki za kapital in delo). Tretji frekvenčni razred podjetij (2489 proučevanih enot), ki izvažajo ostale poslovne storitve, je zanimivo definiran z izločitvenimi kriteriji v naslednji jakostni razvrstitvi: uvoz drugih vrst storitev, uvoz faktorskih dohodkov, izvoz in uvoz blaga, oblika lastnine, tekoči transferi v tujino, portfolio investicije, neposredne naložbe v tujino. Podobne izločitvene kriterije definirajo četrti, sicer vrednostno manj pomemben frekvenčni razred. Vsebina izločitvenih kriterijev, ki obdela vse postavke tekočega računa, nam posredno nakaže, da gre za specializirana podjetja v okviru izvoza ostalih poslovnih storitev (npr. odvetniška, svetovanja, marketing ipd). List tretje veje odločitvenega drevesa na izvozni strani ostalih poslovnih storitev nam pove, da je na podlagi analiziranega obdobja pričakovati, da bo takšnih podjetij v tretjem frekvenčnem razredu dobrih tisoč (1.117). Četrti frekvenčni razred doda še 225 podjetij. Smiselno je postaviti kvantitativni kriterij za definiranje obveznosti poročanja na izvozni strani ostalih poslovnih storitev. Uvoz ostalih poslovnih storitev po številu podjetij bistveno ne presega izvozne zastopanosti. V tem pogledu je menjava s tujino relativno uravnotežena na obravnavanem segmentu plačilne bilance Slovenije. Na uvozni strani obstaja po številu, ne pa tudi vrednostno najpomembnejši frekvenčni razred, ki je definiran s podobnimi izločitvenimi kriteriji, predstavljenimi na izvozni strani. Torej Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 98

106 tudi na uvozu obstaja populacija specializiranih podjetij. Pomembni kriteriji, ki definirajo ostale tri frekvenčne razrede na uvozni strani, so še: število zaposlenih, velikost in organizacijska oblika podjetja. Skladnost shem odločitvenih dreves nakazuje na smiselnost enotnega vzorca za izvozno in uvozno stran menjave ostalih poslovnih storitev. Glede na nakazano specializacijo pa je upravičeno pričakovati ustreznost uporabe stratificiranega vzorčenja. Potovanja: Na izvozni strani kot uvozni strani postavke potovanj je z vidika še obstoječega sistema potrebno navesti, da je uporabljeni vir podatkov plačilnega prometa s tujino le del celotnega modela potovanj. Odločitveno drevo za izvoz postavke potovanj deli rezidente, ki opravljajo takšne storitve za nerezidente, na 4 frekvenčne razrede, glede na število opravljenih transakcij v proučevanem obdobju. Prvi trije razredi zajemajo manjše število firm od celotnega nabora ekonomskih subjektov (približno 3.000). Praviloma ima izvoz storitev v plačilno-bilančnem evidentiranju svojo protipostavko (vknjižbo) na nekem finančnem instrumentu kapitalskega in finančnega računa plačilne bilance. To pa je glavni kriterij nadaljnjega vejanja rezidentov v omenjenih treh frekvenčnih razredih. Četrti frekvenčni razred, katerega frekvenca je največja, pa tudi pri izvozu potovanj izloči, preko izločitvenih kriterijev, omenjenih predhodno pri analizi menjave ostalih poslovnih storitev, specializirana podjetja, ki nudijo storitve potovanj. Najpomembnejša postavka v okviru potovanj je seveda izvoz turizma. Glede na dejansko poslovanje in ne po poslovnem registru ugotovimo, da je približno 700 specializiranih podjetij za opravljanje tovrstnih storitev. V četrtem razredu pa se izloči tudi precejšnje število podjetij, katerih izvoz storitev potovanj je močno povezan z uvozom ostalih vrst storitev. Verjetnost za uvoz storitev, če je podjetje izvozilo storitev potovanj, na osnovi proučevanega vira, je 0,18. V osnovi odločitveno drevo uvoza storitev potovanj loči med rezidenti, katerih tovrstne transakcije (plačila) se evidentirajo na klasičnih protipostavkah finančnega računa plačilne bilance in na tiste, pri katerih to ni odločilni kriterij. Pri prvih nadalje prevladujejo večja podjetja nefinančnega sektorja, pri drugih pa močna prisotnost členitve na državo ponudnika storitev potovanj. Računalniške in informacijske storitve: Izvoz računalniških in informacijskih storitev (805 podjetij) v osnovi loči med podjetij, ki trgujejo preko Irske in Velike Britanije (ena četrtina) ter med tistimi, ki trgujejo z drugimi. Med drugimi državami izstopajo ZDA. Zanimivo je, da v tem primeru ni povezave na uvoz faktorskih dohodkov. Slednje lahko kaže na pojav dovolj izobražene delovne sile v Sloveniji na tem področju, hkrati pa tudi, da ni pomembnih investicij iz ZDA na tem področju. Izvoz računalniških in informacijskih storitev močno spominja na razlago izvoza nematerialnih pravic. Smiselno je povezati vzorčenje in poročanje na omenjenih segmentih storitvene menjave pri nekaterih podjetjih zlasti na uvozu. Korelacijska koeficienta časovnih serij dekadnih podatkov vrednosti (slika 32) izvoza in uvoza med računalniškimi in informacijskimi storitvami ter nematerialnimi pravicami (licence, patenti in avtorske pravice) sta: 0,16 in 0,66. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 99

107 Ppd Zn Eur Račun Nivo 1 Nivo 2 Nivo 3 TEKOČI - STORITVE - UVOZ - RAČUNALNIŠKE IN INFORMACIJSKE TEKOČI - STORITVE - UVOZ - LICENCE, PATENTI IN AVTORSKE PRAVICE TEKOČI - STORITVE - IZVOZ - RAČUNALNIŠKE IN INFORMACIJSKE TEKOČI - STORITVE - IZVOZ - LICENCE, PATENTI IN AVTORSKE PRAVICE 0 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 D3 D1 D2 januar februar marec aprilmaj junij julij avgust september oktober november december januar februar marec aprilmaj junij julij avgust september oktober november december januar februar marec aprilmaj junij julij avgust september oktober november december Quarter 1 Quarter 2 Quarter 3 Quarter 4 Quarter 1 Quarter 2 Quarter 3 Quarter 4 Quarter Quarter Leto Četrtletje Mesec Dekada Quarter Quarter 3 4 Slika 34: Vizualizacija z neposrednim povpraševanjem iz podatkovnega skladišča Na uvozni strani računalniških in informacijskih storitev seveda nastopa bistveno več ekonomskih subjektov (preko 2.000). Približno polovični pomen imajo klasična velika nefinačna podjetja, ki uvažajo računalniške in informacijske storitve. V drugi polovici pa nastopajo podjetja, ki so seveda povezana s to dejavnostjo in poslovanjem preko omenjenih geografskih razčlenitev. Ugotovimo, da obstaja izrazito močna pozitivna odvisnost med uvozom računalniških in informacijskih storitev ter nematerialnih pravic (zlasti licenc za programsko opremo). Zavarovanja: Izvoz zavarovanj je lahko splošen v okviru izvoznouvoznih poslov ali specializiran (zavarovalnice). Protipostavke v okviru plačilne bilance Slovenije so na tekočih transferih ter kapitalskih in finančnih transferih (BS, 2005). Različnih ekonomskih subjektov, ki so izvozili storitve zavarovanj, je relativno malo (131). Ekonomske subjekte oziroma transakcije uvoza storitev zavarovanj prav tako opredeljuje protipostavka na tekočih transferih plačilne bilance. V osnovi pa se ločijo glede na pripadnost sektorju nefinačnih družb pod tujim nadzorom (S.11003). Takšnih je približno tretjina. Nadaljnja členitev je odvisna od velikosti obsega menjave s tujino. Tekoči in kapitalski transferi: Tekoči transferi v Sloveniji pri uradnem sektorju so odvisni od velikosti posamezne enote uradnega sektorja, ki je prejemnica transferjev. Za vzorčno poročanje so pomembni kvantitativni kriteriji in število zaposlenih. Pri ostalih sektorjih prihaja do tekočih transferov v povezavi s kapitalskimi in finančnimi transferi. Če te ni, obstaja delitev na tiste, ki imajo večje število transakcij in tiste z manjšim. Med prvimi izstopa tudi sektor prebivalstva. Velikost transferov v tujino s strani uradnega sektorja je močno odvisna od števila zaposlenih pri posamezni enoti. Na tekočih transferih ostalih sektorjev v tujino obstajajo pomembni indikatorji odločitvenih dreves, ki kažejo na smiselnost pridobivanja neposrednih virov podatkov Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 100

108 od pristojnih institucij (na primer: SPIZ pokojnine v države bivše Jugoslavije ipd). Podobne ugotovitve veljajo tudi na kapitalskih transferih. Pri uradnem sektorju so v obravnavanem obdobju še redki s strani EU. Pri ostalih sektorjih pa so povezani s tekočimi transferi in običajno na podjetja v okviru javnega sektorja (lastnina je državna). Kapitalski transferi ostalih sektorjev v tujino, zaznani preko plačilnega prometa s tujino, so redki in večinoma povezani s portfolio investicijami ter z kapitalskimi trgi v vzponu (Indija). Kapitalski transferi uradnega sektorja so usmerjeni v države v razvoju BODOČI ŠIFRANT NAMENA PLAČIL IN REGISTER POROČEVALCEV Analizo omejimo na vprašanje: Kakšen naj bo bodoči šifrant namena plačil ob dvigu praga poročanja na evrov za posamezno transakcije z nerezidenti? Želja je tudi (poleg vzdrževanja registra), da bi za glavne vrednostne tokove ohranili posredni sistem poročanja z namenom identificiranja bodočih poročevalcev (obveznikov poročanja) po posameznih sklopih sistema neposrednega poročanja. To bi bil eden od pomembnih virov podatkov za vzdrževanje registra poročevalcev neposrednega poročanja. Vprašanje pa je, kakšen naj bo bodoči register, da bi čim bolj učinkovito pripomogel k vzorčenju in izračunavanju vrednosti proučevanih spremenljivk na celotno populacijo. Seveda bo nov šifrant namena plačil potrebno bistveno skrčiti glede na pomen tega vira podatkov v smislu neposrednega vključevanja v plačilnobilančno metodologijo. Cilj je imeti čim manj šifer namena plačil (npr. 30 namesto dosedanjih 205 šifer), ki zagotavljajo večjo kvaliteto šifriranja plačil nad evrov za potrebe vodenja registra in hitrih informacij o glavnih vrednostnih plačilnobilančnih tokovih. Dilema, ki jo je potrebno razrešiti, obstaja v smislu dveh opcij, ob ciljni omejitvi števila šifer namena plačil: a) simetričen šifrant na določeni hierarhični ravni metodologije plačilne bilance, b) nesimetrični šifrant s poudarkom na večjem številu šifer namena plačil na nižji hierarhični ravni pri postavkah plačilne bilance, ki jih uvedba praga poročanja bolj prizadene (storitve, transferi). Proučiti moramo predvsem možnosti uvedbe druge opcije KOEFICIENTI POVPREČNE IZGUBE PODATKOV NA OSNOVI PODATKOVNEGA SKLADIŠČA Podobno, vendar bolj sistematično kot v tabelah 1 in 2, lahko sedaj s podatkovnim skladiščem, na realnih podatkih za plačilnega prometa s tujino za obdobje , analiziramo oziroma simuliramo natančne izpade podatkov zaradi uvedb praga poročanja: evrov z in evrov z Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 101

109 Vrednost plačil Število plačil Račun Nivo 1 Nivo 2 1. prag 2. prag 1. prag 2. prag KAP. IN FIN. NEPOSREDNE NALOŽBE V Slovenijo 0,004 0,02 0,71 0,83 V tujino 0,004 0,03 0,43 0,68 NEPROIZ. NEFINANČNA IMETJA Nakup 0,08 0,12 0,95 0,98 Prodaja 0,06 0,33 0,51 0,94 OSTALE NALOŽBE Obveznosti 0,09 0,34 0,82 0,96 Terjatve 0,39 0,72 0,93 0,99 PORTFOLIO INVESTICIJE V Slovenijo 0,00 0,01 0,39 0,61 V tujino 0,00 0,01 0,40 0,66 TRANSFERI V Slovenijo 0,07 0,26 0,75 0,93 V tujino 0,10 0,32 0,88 0,99 Vsota KAP. IN FIN. 0,01 0,02 0,73 0,87 TEKOČI BLAGO IZVOZ 0,41 0,68 0,96 0,99 UVOZ 0,07 0,55 0,97 1,00 DOHODKI Izdatki 0,08 0,17 0,90 0,96 Prejemki 0,06 0,16 0,79 0,90 STORITVE IZVOZ 0,30 0,53 0,95 0,99 UVOZ 0,28 0,53 0,95 0,99 TRANSFERI V Slovenijo 0,13 0,28 0,89 0,97 V tujino 0,12 0,25 0,95 0,98 Vsota TEKOČI 0,24 0,45 0,95 0,99 Skupna vsota 0,07 0,13 0,94 0,98 Tabela 12: Koeficienti povprečne izgube podatkov po vrednosti in številu plačil s tujino v postavkah na prvi in drugi hierarhični ravni plačilne bilanc, ob simulaciji na podatkih , glede na uvedbo praga poročanja evrov oziroma evrov Koeficient povprečne izgube podatkov ob delovanju Uredbe prikazuje v razponu od 0 do 1 velikost izgube podatkov na posameznih agregatnih postavkah plačilne bilance (1 raven hierarhije Metodološke klasifikacije namena plačil) ob uveljavljenem prvem pragu ( evrov, ) oziroma 2. pragu ( evrov, predvidoma s ) na podatkih plačilnega prometa s tujino preko bank. Podatkovno skladišče nam natančno odgovori, kolikšen delež podatkov po kvantiteti (vrednost, število) in kvaliteti (na primer posamezne podvrste storitvene menjave) izgubimo preko uvajanja pragov poročanja zaradi delovanja Uredbe na različnih ravneh metodološke hierarhije plačilne bilance. Koeficiente izgube podatkov je moč zlasti v prvih letih menjave sistema oziroma prehoda na nov metodološki koncept koristno uporabiti v okviru postopka zaokroževanja vzorčnih vrednosti spremenljivk na celotno populacijo. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 102

110 Vrednost plačil Število plačil Nivo 1 Nivo 2 Nivo 3 Nivo 4 Nivo 5 1. prag 2. prag 1. prag 2. prag STORITVE IZVOZ TRANSPORT Železniški Ostalo 0,68 1,00 0,97 1,00 Prevoz blaga 0,09 0,30 0,61 0,87 Prevoz potnikov 0,28 0,47 0,88 0,95 Vsota Železniški 0,09 0,31 0,64 0,88 Cestni Ostalo 0,45 0,68 0,96 0,99 Prevoz blaga 0,57 0,79 0,96 1,00 Prevoz potnikov 0,68 0,93 0,97 1,00 Vsota Cestni 0,57 0,79 0,96 1,00 Ostali Nafta in plina po cevovodu 0,00 0,19 0,06 0,63 Najem vozil s posadko 0,09 0,23 0,67 0,84 Ostalo 0,17 0,37 0,86 0,97 Špediterske storitve 0,37 0,68 0,94 0,99 Vsota Ostali 0,30 0,57 0,93 0,99 Pomorski Ostalo 0,21 0,53 0,81 0,96 Prevoz blaga 0,35 0,72 0,88 0,98 Prevoz potnikov 0,87 1,00 0,98 1,00 Vsota Pomorski 0,26 0,60 0,85 0,97 Zračni Ostalo 0,45 0,64 0,95 0,99 Prevoz blaga 0,35 0,74 0,92 0,98 Prevoz potnikov 0,50 0,91 0,93 0,99 Vsota Zračni 0,42 0,79 0,93 0,99 Vsota TRANSPORT 0,41 0,66 0,94 0,99 Vsota IZVOZ 0,41 0,66 0,94 0,99 UVOZ TRANSPORT Cestni Ostalo 0,48 0,89 0,94 0,99 Prevoz blaga 0,60 0,91 0,96 1,00 Prevoz potnikov 0,66 1,00 0,96 1,00 Vsota Cestni 0,58 0,91 0,95 1,00 Ostali Najem vozil s posadko 0,17 0,79 0,61 0,97 Ostale storitve, povezane s transportom 0,46 0,83 0,93 0,99 Špediterske storitve 0,70 0,92 0,99 1,00 Transport nafte in plina po cevovodu 0,00 0,01 0,14 0,16 Vsota Ostali 0,35 0,58 0,95 0,99 Pomorski Ostalo 0,31 0,70 0,86 0,98 Prevoz blaga 0,09 0,31 0,69 0,88 Prevoz potnikov 0,65 0,99 0,92 1,00 Vsota Pomorski 0,13 0,38 0,76 0,92 Zračni Ostalo 0,37 0,66 0,93 0,98 Prevoz blaga 0,28 0,53 0,92 0,98 Prevoz potnikov 0,09 0,24 0,81 0,93 Vsota Zračni 0,14 0,32 0,88 0,96 Železniški Ostalo 0,52 0,79 0,95 0,99 Prevoz blaga - 0,22 0,25 0,70 0,92 Prevoz potnikov 0,84 1,00 0,99 1,00 Vsota Železniški - 0,21 0,26 0,72 0,92 Vsota TRANSPORT 0,28 0,54 0,92 0,98 Vsota UVOZ 0,28 0,54 0,92 0,98 0,37 0,62 0,93 0,99 Tabela 13: Koeficienti povprečne izgube podatkov po vrednosti in številu plačil s tujino v menjavi transportnih storitev na vseh hierahičnih ravneh plačilne bilanc, ob simulaciji na podatkih , glede na uvedbo praga poročanja evrov oziroma evrov V tabeli 13 vidimo, da je pričakovani izpad podatkov na storitveni menjavi s tujino v vrednostnem pogledu ob uvedbi 1. praga poročanja 30 % na izvozni in 28 % na uvozni strani. Ob uvedbi drugega praga poročanja se izpad dvigne tako pri izvozu kot uvozu storitvene menjave na 53 % vrednosti. Po številu transakcij vidimo, da ob prvem pragu uspemo preko starega vira podatkov zajeti 5 %, ob drugem pa le še 1 % števila vseh storitvenih transakcij. Vendar nam poizvedovanje po nižjih hierarhičnih nivojih poda v tabeli 13 informacijo, da je izpad različen glede na različne vrste storitvene menjave. V povprečju na primer po vrednosti pričakujemo večji izpad na menjavi transportnih storitev, zlasti na njeni izvozni strani: 41 % oziroma 66 % glede na posamezen prag poročanja. Tudi na uvozni strani izrazito visok koeficient izgube opazimo pri storitvah cestnega transporta: 58 % oziroma 91 %. Verjetnost, da nekaterih kvalitativnih informacij o podvrstah transportne menjave sploh ne bo več zaznati preko starega Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 103

111 sistema poročanja (koeficient 1 pri drugem pragu poročanja), je maksimalna na postavkah: ostalega izvoza železniškega transporta, izvoza in uvoza cestnih storitev prevoz blaga in potnikov, uvoza ostalih storitev špediterske storitve, izvoza pomorskega transporta prevoz potnikov, uvoza storitev prevoza potnikov po morju in železnici. Na nižjih hierarhičnih ravneh (nivo 3, nivo 4) metodologije plačilne bilance opazimo, da sicer lahko pričakujemo relativno pestrost zastopanosti šifer različnega namena plačil za posle storitvene menjave med rezidenti Slovenije in nerezidenti tudi ob uvedbi drugega praga poročanja. Zato menimo, da je na postavkah in podpostavkah plačilne bilance, kjer je izguba informacije relativno majhna in kjer že imamo zagotovljene kvalitetne neposredne vire (npr. neposredne naložbe, naložbe v vrednostno papirje, komercialni krediti itd.), smiselno zagotoviti samo eno šifro namena plačil že na 2 ravni metodološke hierarhije (osnovna delitev), ki loči tudi izvozno in uvozno stran za potrebe registra. Na postavkah oziroma podpostavkah plačilne bilance, kjer pa ni tako (npr. storitve), je ob osnovni delitvi potrebno preiti s šifrantom še na 3 hierarhično raven. Na ta način bi v registru ločili med podjetji tudi po temeljni vrsti storitvene menjave s tujino, kar bi bilo v prihodnje zelo pomembno za nadaljnje poglobljeno poznavanje zakonitosti njihove menjave s tujino. V kontekstu prehoda na nove vire podatkov, ki bodo nadomestili takšen izpad, je skrb za ohranitev kvantitete in kvalitete informacije povsem na mestu. Ker bo začetni register ( ), temelječ še na celovitih podatkih posrednega poročanja, relativno natančen za definiranje vzorca poročevalcev, bo kasneje zaradi uvedbe praga poročanja, za vzdrževanje ažurnosti registra prihajalo malo informacij iz starega vira podatkov. Menimo, da je v bodoče za potrebe vzdrževanja registra potrebno izkoristiti skrita znanja v preteklih podatkih. Pri tem opozarjamo zlasti na medsebojno povezanost posameznih oblik menjave s tujino, ki jih odkrivamo z metodami podatkovnega rudarjenja. Nujna pa je tudi kontinuiteta vzdrževanja večdimenzionalnega podatkovnega skladišča UPORABA METODE RAZVRŠČANJA V SKUPINE Z vidika šifriranja namena plačil (dimenzija Metodološka klasifikacija namena plačil) nas zanima, kako lahko združujemo podjetja v skupine s podobnimi nameni plačil v menjavi s tujino ter kakšna so ta podjetja. Rezultati nam pomagajo pri odločitvi o bodočem poenostavljenem šifrantu namena plačil, ki bo služil za oblikovanja registra podjetij. Na osnovi informacij iz registra pa bo izveden izbor podjetij v vzorec neposrednega poročanja. Uporabili smo metodo razvrščanja v skupine. Razvrščanje v skupine lahko opravimo tako neposredno v relacijski bazi podatkov kot v podatkovnem skladišču. V okviru slednjega pa tako na podatkovni kocki za račune v tujini kot na podatkovni kocki plačilnega prometa s tujino. Posamezne bolj zanimive dele podatkovnih skladišč lahko ločimo in izvajamo podatkovno rudarjenje le na tem Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 104

112 delu. Za ta namen lahko uporabimo navidezne podatkovne kocke ali izvedemo členitve podatkovnega skladišča. Lahko pa že s samim povpraševanjem v relacijski bazi naredimo selekcijo na vrednosti posameznih atributov. Na tretji način smo pripravili posebna podatkovna skladišča, ki zajamejo le transakcije nad evri oziroma nad evri, glede na problematiko, ki jo obravnavamo v nalogi. Na tabeli dejstev smo, v okviru posameznega podatkovnega zapisa, že v relacijski bazi podatkov postavili ustrezen kriterij, ki zahteva povprečno vrednost plačila večjo od evrov oz evrov. Na tej osnovi smo pripravili dodatne podatkovne kocke z enakim osnovnim modelom, predstavljenim v razdelku Tako kot pri odločitvenih drevesih v zgrajenem večdimenzionalnem podatkovnem skladišču tudi v tem primeru dobimo cel nabor razvrščanj v skupine, glede na izbor proučevanih spremenljivk ter glede na nivo metodološke hierarhije plačilne bilance, na katerem želimo pripraviti analizo razvrščanja v skupine. Če vemo, kakšen bo bodoči šifrant namena plačil, ki naj bi kar v največji meri služil za pridobivanje koristnih informacij za vzorčenje podjetij v sistemu neposrednega poročanja, na način, da bo omogočena zaveza za kombinacijo poročanja različnih postavk plačilne bilance, pa nam podatki preteklosti lahko služijo za analizo tistega dela populacije, katerih vrednosti transakcij s tujino so nižje od predvidenega praga poročanja. Zanima nas na primer, po katerih namenih plačil so si ta podjetja najbolj podobna? S tem bi lažje iskali alternativni administrativni vir za dopolnitev registra bodočih poročevalcev. Pri tem je seveda pomemben kriterij vrednostni obseg posameznega namena poslovanja s tujino, ki združuje takšna podjetja, katerih nobena posamična transakcija ne presega evrov. Izločiti moramo torej podjetja, ki imajo hkrati transakcije po posameznih namenih plačil na različni ravni metodološke hierarhije plačilne bilance tudi večje od evrov. Takšno dinamično analizo nam omogoča pripravljeno podatkovno skladišče. Za namene takšne analize bomo uporabili metodo združevanja v skupine kot metodo podatkovnega rudarjenja, predstavljeno v razdelku Naredili smo primerjalno analizo združevanja v skupine z enakimi parametri oziroma nastavitvami pri podatkovnem skladišču za transakcije pod pragom evrov in nad tem pragom. Ugotovljene razlike, oziroma bistveno bolj podrobne značilnosti poročevalcev pri starem viru podatkov, nam dajejo informacije za iskanje dodatnih administrativnih virov za dopolnjevanje registra bodočih obveznikov poročanja. Na sliki 35 je v levem delu predstavljen meni za urejevanje oziroma nastavitev spremenljivk za izvajanje metode razvrščanja v skupine. Spremenljivke lahko izberemo kot vhodne ali napovedne ali kot kombinacijo obojega (vidno levo spodaj v okviru lastnosti "Properties"). Zaradi preglednosti rezultatov je praviloma smiselno izbrati manjše število spremenljivk (atributov, urejenih v dimenzije). V našem primeru smo kot enoto proučevanja izbrali posamezen poslovni subjekt (Rezidenti) z vsemi proučevanimi lastnostmi (lokacija, sektor, dejavnost, velikost, lastnina). Vhodno spremenljivko predstavlja tudi obseg vrednosti menjave, merjen v evrih. Ker nas zanima, po katerih namenih menjave se podjetja združujejo v skupine, smo kot napovedno spremenljivko izbrali namen plačil (MKNP metodološka klasifikacija Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 105

113 namena plačil), dodatno pa tudi dejavnost poslovnega subjekta, saj bi radi vedeli, na katerem področju dejavnosti ekonomije, posamezne skupine podjetij, združene po namenu plačil, najpogosteje delujejo. Na ta način bi radi dobili pomembno informacijo za iskanje dodatnih administrativnih virov podatkov za dopolnjevanje registra bodočih obveznikov poročanja. Na sredini slike 35 "Content Detail" so grafično predstavljene dobljene skupine. Gostota oziroma verjetnost enot v posamezni skupini je premosorazmerna z jakostjo barvnega odtenka. V našem primeru nanj vpliva tudi celotna vrednost menjave s tujino. Na katerikoli pravokotnik (skupino) se postavimo, lahko v desnem delu slike 35 odčitamo lastnosti in nekatere podatke skupine. Slika 35: Programska oprema MS Analysis services priprava parametrov za algoritem razvrščanja v skupine; primer na 3. ravni metodološke hierarhije plačilne bilance izvoz transportnih storitev; podatkovna kocka za vse transakcije pod evrov (podatki ) Zelo pomembno programsko lastnost omogoča t. i. "Node attribut Set", ki zagotavlja različna izhodišča za pripravo rezultatov podatkovnega rudarjenja. Ta izhodišča so odvisna od izbrane hierarhične ravni v okviru predhodno izbranih dimenzij (spremenljivk). V primeru na sliki 35 smo definirali največ 3. raven metodologije plačilne bilance, prikazano je združevanje v skupine po namenu plačil za vsa podjetja, ki so v letih imela izvoz transportnih storitev. Značilnosti združevanja v skupine za takšna podjetja po namenu plačil so zelo zanimive z vidika obravnavane problematike. Mogoče je spremeniti nastavitev na nižjo hierarhično raven namena plačil, celo na samo šifro namena plačil. Analizo izvajamo v primerjavi enot, ki Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 106

114 izpolnjujejo ustrezne kriterije praga poročanja in tistih, ki ne izpolnjujejo teh kriterijev, vendar imajo enak namen plačil oziroma menjavo s tujino. Preidimo na 4. hierarhično raven in obravnavajmo izvoz cestnega transporta, saj smo v tabeli 13 ugotavljali probleme zagotavljanja ustreznih informacij za bodoči register poročevalcev neposrednega poročanja na tej pomembni postavki menjave s tujino. Kot vemo na preteklih podatkih, z uvedbo praga poročanja evrov v celoti izpadejo iz podatkov plačilnega prometa s tujino transakcije izvoza cestnega transporta pri prevozu blaga in potnikov. Kljub temu nam rudarjenje z metodo združevanja v skupine (MS Analysis Services), ki temelji na verjetnosti dohodka, na osnovi manjkajočih enot, omogoča pripravo 8 skupin. Štiri od njih so prikazane na sliki 36 v beli barvi, kar pomeni, da so tudi z vidika manjkajočih enot nepomembne. Štiri od njih pa nam podajajo značilnosti namenov plačil in poročevalcev, v kolikor bi le ti imeli posamezne transakcije izvoza cestnega transporta v vrednosti, višji od evrov, česar pa, na podlagi preteklih podatkov, skoraj ni pričakovati. Če ohranimo bolj podrobno šifriranje storitev na 3 hierarhični ravni, potem lahko z večjo verjetnostjo pričakujemo, da se bodo šifre izvoza cestnega transporta (v glavnem ostali transport) pojavile pri 4 skupinah podjetij: Za prvo skupino (Cluster 1) je značilno, da gre za nefinačna podjetja v zasebni ali tuji lasti z do 30 zaposlenimi, praviloma iz dejavnosti G. Takšne transakcije se pojavljajo v povezavi z izvozom ostalih poslovnih (tehnične storitve, posredovanje) in konstrukcijskih (gradbena dela v tujini) storitev. Če gre za podjetja iz dejavnosti F, pa v povezavi z uvozom blaga oziroma pri podjetjih iz dejavnosti L v povezavi s finančnimi transakcijami (tekočimi transferi in portfolio investicijami v Slovenijo). Redke so večje transakcije (Cluster 2) izvoza transporta (praviloma ostalega) pri drugih finančnih posrednikih v povezavi s kapitalskimi transferi ali pri večjih podjetjih iz dejavnosti D (DA, DC, DF, DI, DL, DJ) in C (CA). Največja verjetnost obstaja (Cluster 5), da se velika plačila za izvoz transportnih (praviloma ostalih) storitev zgodijo enotam lokalne ravni države oziroma enotam registriranim v dejavnosti I v povezavi z temeljnimi vrstami transporta (zračni, železniški itd.). Mogoč je izvoz (Cluster 6) ostalih transportnih storitev v veliki vrednosti v povezavi zavarovalnimi storitvami. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 107

115 > ; do 938, last. =2, do 30 zapos., vel.>1, dej. G, S.11002/03, izvoz OPS, KON, uvoz Blaga, - dej. F, dej. L- portfoliointektrans.vslo. 5; S kapitalski transferi, S velika podjetja, dejavnost D, 96 60; S.13 enote ravni države dej L in O, dejavnost L izvoz osnovnih dejavnosti transporta 2; S.125, zavarovalne storitve Slika 36: Združevanje v skupine po namenu plačil za podjetja, ki izvažajo storitve cestnega transporta (transakcije > evrov) Ugotavljamo, da so posamična plačila izvoza transportnih storitev v vrednosti, večji od evrov, izredno redka in še ta so povezana s primarno drugo dejavnostjo nekega rezidentnega ekonomskega subjekta. Sledi, da je skoraj enako število subjektov kot pri celoviti (vsa plačila) analizi izvoza cestnega transporta z odločitvenimi drevesi (3242) zaslediti pri tudi pri analizi izvoza cestnega transporta za plačila pod pragom evrov (3238). Če pogledamo na sliki 37 le najpomembnejše skupine, ugotavljamo, da bo potrebno za ustrezno vzorčenje dopolniti register z drugimi administrativnimi zbirkami podatkov, ki dopolnjujejo poslovni register: povezava na podatke o komercialnih kreditih (dodatki k zaključnim računom Ajpes Agencije za javnopravne evidence in storitve), ki jo narekuje skupina 7 (Cluster 7), povezava na regionalne statistike (Cluster 7), povezava na statistiko storitev SURS (Cluster 5), povezava na statistiko naložb v vrednostne papirje, neposrednih naložb (Cluster 10); medsebojna povezanost sistemov neposrednega poročanja. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 108

116 <= ; Izvoz in uvoz blaga - popravila, uvoz Transporta, finančnih st., S.11102, dejavnost G 2018; Izvoz in uvoz blaga, uvoz transporta, S.141, vse regije, S-V; Savinjska 336; Tekoči transferi v tujino, portfolio investicije, S.12508, S.12, Slika 37 Združevanje v skupine po namenu plačil za podjetja, ki izvažajo storitve cestnega transporta (transakcije <= evrov) Ustreznost registra bodočih poročevalcev je nedvoumno pogojena z njegovo navezavo na druge administrativne vire podatkov, ki jih določajo zakonitosti v pretekli menjavi s tujino. Janez Fabijan: Odkrivanje zakonitosti menjave s tujino z metodami podatkovnega rudarjenja stran 109

BANKA SLOVENIJE BANK OF SLOVENIA EVROSISTEM / EUROSYSTEM FINANÈNI RAÈUNI SLOVENIJE FINANCIAL ACCOUNTS OF SLOVENIA

BANKA SLOVENIJE BANK OF SLOVENIA EVROSISTEM / EUROSYSTEM FINANÈNI RAÈUNI SLOVENIJE FINANCIAL ACCOUNTS OF SLOVENIA BANKA SLOVENIJE EVROSISTEM / FINANÈNI RAÈUNI SLOVENIJE 2001-2006 FINANCIAL ACCOUNTS OF SLOVENIA 2001-2006 NOVEMBER/NOVEMBER 2007 2 Finančni računi Slovenije/Financial Accounts of Slovenia 2001-2006, november/november

More information

Makroekonomija 1: 4. vaje. Igor Feketija

Makroekonomija 1: 4. vaje. Igor Feketija Makroekonomija 1: 4. vaje Igor Feketija Teorija agregatnega povpraševanja AD = C + I + G + nx padajoča krivulja AD (v modelu AS-AD) učinek ponudbe denarja premiki vzdolž krivulje in premiki krivulje mikro

More information

Attempt to prepare seasonal weather outlook for Slovenia

Attempt to prepare seasonal weather outlook for Slovenia Attempt to prepare seasonal weather outlook for Slovenia Main available sources (ECMWF, EUROSIP, IRI, CPC.NCEP.NOAA,..) Two parameters (T and RR anomally) Textual information ( Met Office like ) Issued

More information

OPTIMIRANJE IZDELOVALNIH PROCESOV

OPTIMIRANJE IZDELOVALNIH PROCESOV OPTIMIRANJE IZDELOVALNIH PROCESOV asist. Damir GRGURAŠ, mag. inž. str izr. prof. dr. Davorin KRAMAR damir.grguras@fs.uni-lj.si Namen vaje: Ugotoviti/določiti optimalne parametre pri struženju za dosego

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Statistika Statistics Študijski program in stopnja Study programme and level Univerzitetni študijski program Matematika First cycle academic

More information

Ministrstvo za infrastrukturo in prostor Geodetska uprava Republike Slovenije TOPO & INSPIRE WORKSHOP

Ministrstvo za infrastrukturo in prostor Geodetska uprava Republike Slovenije TOPO & INSPIRE WORKSHOP Ministrstvo za infrastrukturo in prostor Geodetska uprava Republike Slovenije TOPO & INSPIRE WORKSHOP Ljubljana, 5. februar 2014 VSEBINA DELAVNICE DAY 1 Wednesday FEBRUARY 5 th 2014 9.00 10.30 PLENARY

More information

PRIPRAVA PODATKOV V PROCESU PODATKOVNEGA RUDARJENJA

PRIPRAVA PODATKOV V PROCESU PODATKOVNEGA RUDARJENJA UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO PRIPRAVA PODATKOV V PROCESU PODATKOVNEGA RUDARJENJA Ljubljana, september 2013 ŽIGA VAUPOT IZJAVA O AVTORSTVU Spodaj podpisani Žiga Vaupot, študent

More information

METODOLOŠKO POJASNILO INPUT-OUTPUT TABELE, TABELE PONUDBE IN PORABE

METODOLOŠKO POJASNILO INPUT-OUTPUT TABELE, TABELE PONUDBE IN PORABE METODOLOŠKO POJASNILO INPUT-OUTPUT TABELE, TABELE PONUDBE IN PORABE To metodološko pojasnilo se nanaša na objavljanje podatkov: - Tabele ponudbe in porabe, input-output tabele, Slovenija, letno (Prva objava)

More information

ENAČBA STANJA VODE IN VODNE PARE

ENAČBA STANJA VODE IN VODNE PARE ENAČBA STANJA VODE IN VODNE PARE SEMINARSKA NALOGA PRI PREDMETU JEDRSKA TEHNIKA IN ENERGETIKA TAMARA STOJANOV MENTOR: IZRED. PROF. DR. IZTOK TISELJ NOVEMBER 2011 Enačba stanja idealni plin: pv = RT p tlak,

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. O neeksaknotsti eksaktnega binomskega intervala zaupanja

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. O neeksaknotsti eksaktnega binomskega intervala zaupanja UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga (Final project paper) O neeksaknotsti eksaktnega binomskega intervala zaupanja (On the inexactness

More information

matematika + biologija = sistemska biologija? Prof. Dr. Kristina Gruden Prof. Dr. Aleš Belič Doc. DDr. Jure Ačimovič

matematika + biologija = sistemska biologija? Prof. Dr. Kristina Gruden Prof. Dr. Aleš Belič Doc. DDr. Jure Ačimovič matematika + biologija = sistemska biologija? Prof. Dr. Kristina Gruden Prof. Dr. Aleš Belič Doc. DDr. Jure Ačimovič Kaj je sistemska biologija? > Razumevanje delovanja organizmov sistemska biologija =

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Analiza 1 Course title: Analysis 1. Študijska smer Study field. Samost. delo Individ.

UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Analiza 1 Course title: Analysis 1. Študijska smer Study field. Samost. delo Individ. UČNI NAČRT PREDMETA / COURSE SYLLABUS Predmet: Analiza 1 Course title: Analysis 1 Študijski program in stopnja Study programme and level Univerzitetni študijski program Finančna matematika First cycle

More information

UPORABA METODE KALKULIRANJA STROŠKOV NA PODLAGI SESTAVIN DEJAVNOSTI V IZBRANIH DRŽAVAH

UPORABA METODE KALKULIRANJA STROŠKOV NA PODLAGI SESTAVIN DEJAVNOSTI V IZBRANIH DRŽAVAH UNIVERZA V MARIBORU EKONOMSKO-POSLOVNA FAKULTETA MARIBOR DIPLOMSKO DELO UPORABA METODE KALKULIRANJA STROŠKOV NA PODLAGI SESTAVIN DEJAVNOSTI V IZBRANIH DRŽAVAH Študentka: Urška Drevenšek Naslov: Pohorska

More information

EKONOMETRIČNA ANALIZA ZADOLŽENOSTI SLOVENSKIH IN PORTUGALSKIH PODJETIJ

EKONOMETRIČNA ANALIZA ZADOLŽENOSTI SLOVENSKIH IN PORTUGALSKIH PODJETIJ ZAKLJUČNA NALOGA UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE ZAKLJUČNA NALOGA EKONOMETRIČNA ANALIZA ZADOLŽENOSTI SLOVENSKIH IN PORTUGALSKIH PODJETIJ NEŽA MARKOČIČ

More information

UMESTITEV EKOLOŠKIH RAZISKAV MED OSTALE VRSTE RAZISKAV

UMESTITEV EKOLOŠKIH RAZISKAV MED OSTALE VRSTE RAZISKAV EKOLOŠKE RAZISKAVE UMESTITEV EKOLOŠKIH RAZISKAV MED OSTALE VRSTE RAZISKAV EPIDEMIOLOŠKE OPAZOVALNE RAZISKAVE NA AGREGIRANIH PODATKIH EKOLOŠKE RAZISKAVE populacija POPULACIJSKE EKSPERIMENTALNE RAZISKAVE

More information

ENERGY AND MASS SPECTROSCOPY OF IONS AND NEUTRALS IN COLD PLASMA

ENERGY AND MASS SPECTROSCOPY OF IONS AND NEUTRALS IN COLD PLASMA UDK621.3:(53+54+621 +66), ISSN0352-9045 Informaclje MIDEM 3~(~UU8)4, Ljubljana ENERGY AND MASS SPECTROSCOPY OF IONS AND NEUTRALS IN COLD PLASMA Marijan Macek 1,2* Miha Cekada 2 1 University of Ljubljana,

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS Numerical linear algebra. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

UČNI NAČRT PREDMETA / COURSE SYLLABUS Numerical linear algebra. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Numerična linearna algebra Numerical linear algebra Študijski program in stopnja Study programme and level Univerzitetni študijski program Matematika

More information

TOPLJENEC ASOCIIRA LE V VODNI FAZI

TOPLJENEC ASOCIIRA LE V VODNI FAZI TOPLJENEC ASOCIIRA LE V VODNI FAZI V primeru asociacij molekul topljenca v vodni ali organski fazi eksperimentalno določeni navidezni porazdelitveni koeficient (P n ) v odvisnosti od koncentracije ni konstanten.

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS

UČNI NAČRT PREDMETA / COURSE SYLLABUS UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Izbrana poglavja iz diskretne matematike 1 Course title: Topics in discrete mathematics 1 Študijski program in stopnja Study programme

More information

ACTA BIOLOGICA SLOVENICA LJUBLJANA 2012 Vol. 55, [t. 1: 29 34

ACTA BIOLOGICA SLOVENICA LJUBLJANA 2012 Vol. 55, [t. 1: 29 34 ACTA BIOLOGICA SLOVENICA LJUBLJANA 2012 Vol. 55, [t. 1: 29 34 Survey of the Lynx lynx distribution in the French Alps: 2005 2009 update Spremljanje razširjenosti risa v francoskih Alpah: 2005 2009 Eric

More information

THE TOWNS AND THE TRAFFIC OF THEIR OUTSKIRTS IN SLOVENIA

THE TOWNS AND THE TRAFFIC OF THEIR OUTSKIRTS IN SLOVENIA UDC 911. 37:38(497. 12-201)=20 Marjan Zagar * THE TOWNS AND THE TRAFFIC OF THEIR OUTSKIRTS IN SLOVENIA In the urban policy of the long-term development of SR Slovenia the decision has been made that in

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work

UČNI NAČRT PREDMETA / COURSE SYLLABUS. Študijska smer Study field. Samost. delo Individ. work Klinične vaje work Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS Teorija grafov Graph theory Študijski program in stopnja Study programme and level Magistrski študijski program Matematika Master's study

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Študijska smer Study field ECTS

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Študijska smer Study field ECTS Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Numerične metode Numerical methods Študijski program in stopnja Study programme and level Interdisciplinarni univerzitetni

More information

Odgovor rastlin na povečane koncentracije CO 2. Ekofiziologija in mineralna prehrana rastlin

Odgovor rastlin na povečane koncentracije CO 2. Ekofiziologija in mineralna prehrana rastlin Odgovor rastlin na povečane koncentracije CO 2 Ekofiziologija in mineralna prehrana rastlin Spremembe koncentracije CO 2 v atmosferi merilna postaja Mauna Loa, Hawaii. koncentracija CO 2 [μmol mol -1 ]

More information

OA07 ANNEX 4: SCOPE OF ACCREDITATION IN CALIBRATION

OA07 ANNEX 4: SCOPE OF ACCREDITATION IN CALIBRATION OA07 ANNEX 4: SCOPE OF ACCREDITATION IN CALIBRATION Table of contents 1 TECHNICAL FIELDS... 2 2 PRESENTING THE SCOPE OF A CALIBRATION LABOORATORY... 2 3 CONSIDERING CHANGES TO SCOPES... 6 4 CHANGES WITH

More information

MICROWAVE PLASMAS AT ATMOSPHERIC PRESSURE: NEW THEORETICAL DEVELOPMENTS AND APPLICATIONS IN SURFACE SCIENCE

MICROWAVE PLASMAS AT ATMOSPHERIC PRESSURE: NEW THEORETICAL DEVELOPMENTS AND APPLICATIONS IN SURFACE SCIENCE UDK621.3:(53+54+621 +66), ISSN0352-9045 Informacije MIDEM 38(2008)4, Ljubljana MICROWAVE PLASMAS AT ATMOSPHERIC PRESSURE: NEW THEORETICAL DEVELOPMENTS AND APPLICATIONS IN SURFACE SCIENCE T. 8elmonte*,

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Magistrsko delo Izdelava in evalvacija različnih modelov za napovedovanje zvrsti turizma iz besedil (Development

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga Uporaba logistične regresije za napovedovanje razreda, ko je število enot v preučevanih razredih

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Parcialne diferencialne enačbe Partial differential equations. Študijska smer Study field

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Parcialne diferencialne enačbe Partial differential equations. Študijska smer Study field Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Parcialne diferencialne enačbe Partial differential equations Študijski program in stopnja Study programme and level Magistrski

More information

USING THE DIRECTION OF THE SHOULDER S ROTATION ANGLE AS AN ABSCISSA AXIS IN COMPARATIVE SHOT PUT ANALYSIS. Matej Supej* Milan Čoh

USING THE DIRECTION OF THE SHOULDER S ROTATION ANGLE AS AN ABSCISSA AXIS IN COMPARATIVE SHOT PUT ANALYSIS. Matej Supej* Milan Čoh Kinesiologia Slovenica, 14, 3, 5 14 (28) Faculty of Sport, University of Ljubljana, ISSN 1318-2269 5 Matej Supej* Milan Čoh USING THE DIRECTION OF THE SHOULDER S ROTATION ANGLE AS AN ABSCISSA AXIS IN COMPARATIVE

More information

Reševanje problemov in algoritmi

Reševanje problemov in algoritmi Reševanje problemov in algoritmi Vhod Algoritem Izhod Kaj bomo spoznali Zgodovina algoritmov. Primeri algoritmov. Algoritmi in programi. Kaj je algoritem? Algoritem je postopek, kako korak za korakom rešimo

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Statistika 2 Course title: Statistics 2. Študijska smer Study field

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Statistika 2 Course title: Statistics 2. Študijska smer Study field UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Statistika 2 Course title: Statistics 2 Študijski program in stopnja Study programme and level Magistrski študijski program Matematika

More information

Spletni sistem za vaje iz jezika SQL

Spletni sistem za vaje iz jezika SQL UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO Matematika praktična matematika (VSŠ) Ines Frelih Spletni sistem za vaje iz jezika SQL Diplomska naloga Ljubljana, 2011 Zahvala Zahvalila bi se rada

More information

IMPACT OF THE NEW ROAD TRAFFIC SAFETY LAW ON THE NUMBER OF ROAD ACCIDENTS IN SLOVENIA

IMPACT OF THE NEW ROAD TRAFFIC SAFETY LAW ON THE NUMBER OF ROAD ACCIDENTS IN SLOVENIA P. To mine: Impact of the New Road Traffic Safety Law on the Number of Road Accidents in Slovenia POLONA TOMINC, D. Sc. Ekonomsko-poslovna fakulteta Razlagova 14, 2000 Maribor, Republika Slovenija e-mail:

More information

Kako vzpostaviti sistem upravljanja in vrednotenja intelektualne lastnine v podjetjih?

Kako vzpostaviti sistem upravljanja in vrednotenja intelektualne lastnine v podjetjih? Kako vzpostaviti sistem upravljanja in vrednotenja intelektualne lastnine v podjetjih? Dan inovativnosti, Brdo pri Kranju dr. Marko Uplaznik 17. 9. 2013 B O S C H A N D S I E M E N S H O M E A P P L I

More information

modeli regresijske analize nominalnih spremenljivk

modeli regresijske analize nominalnih spremenljivk modeli regresijske analize nominalnih spremenljivk Cveto Trampuž An Illustrative Comparison Logit Analysis with Dummy Variable Regression Analysis. Two different regression models in which the dependent

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Analiza 3 Course title: Analysis 3. Študijska smer Study field ECTS

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Analiza 3 Course title: Analysis 3. Študijska smer Study field ECTS UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Analiza 3 Course title: Analysis 3 Študijski program in stopnja Study programme and level Univerzitetni študijski program Matematika

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga Primerjava modernih pristopov za identifikacijo pomembno izraženih genov za dve skupini (Comparison

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Optimizacija 1 Course title: Optimization 1. Študijska smer Study field

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Optimizacija 1 Course title: Optimization 1. Študijska smer Study field UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Predmet: Optimizacija 1 Course title: Optimization 1 Študijski program in stopnja Study programme and level Univerzitetni študijski program Matematika

More information

Underground natural stone excavation technics in Slovenia. Tehnike podzemnega pridobivanja naravnega kamna v Sloveniji

Underground natural stone excavation technics in Slovenia. Tehnike podzemnega pridobivanja naravnega kamna v Sloveniji RMZ Materials and Geoenvironment, Vol. 56, No. 2, pp. 202 211, 2009 202 Underground natural stone excavation technics in Slovenia Tehnike podzemnega pridobivanja naravnega kamna v Sloveniji Jo ž e Ko rt

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga (Final project paper) Grafi struktur proteinov: Uporaba teorije grafov za analizo makromolekulskih

More information

ASSESSMENT OF THE IMPACT-ECHO METHOD FOR MONITORING THE LONG-STANDING FROST RESISTANCE OF CERAMIC TILES

ASSESSMENT OF THE IMPACT-ECHO METHOD FOR MONITORING THE LONG-STANDING FROST RESISTANCE OF CERAMIC TILES UDK 666.3/.7:620.179.1 ISSN 1580-2949 Professional article/strokovni ~lanek MTAEC9, 49(4)639(2015) M. MATYSIK et al.: ASSESSMENT OF THE IMPACT-ECHO METHOD FOR MONITORING... ASSESSMENT OF THE IMPACT-ECHO

More information

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Diferencialne enačbe. Študijska smer Study field ECTS

UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Diferencialne enačbe. Študijska smer Study field ECTS Predmet: Course title: UČNI NAČRT PREDMETA / COURSE SYLLABUS (leto / year 2017/18) Diferencialne enačbe Differential equations Študijski program in stopnja Study programme and level Visokošolski strokovni

More information

DELOVNA SKUPINA ZA VARSTVO PODATKOV IZ ČLENA 29

DELOVNA SKUPINA ZA VARSTVO PODATKOV IZ ČLENA 29 DELOVNA SKUPINA ZA VARSTVO PODATKOV IZ ČLENA 29 17/SL DS 248 rev.01 Smernice glede ocene učinka v zvezi z varstvom podatkov in opredelitve, ali je verjetno, da bi [obdelava] povzročila veliko tveganje,

More information

O finančni matematiki

O finančni matematiki O finančni matematiki Tomaž Košir Oddelek za matematiko FMF Moderni izzivi v poučevanju matematike 21. september 2007 Vsebina Uvod 1 Uvod 2 Začetki Moderna doba 3 Definicije Primeri 4 Idealni finančni

More information

Multipla korelacija in regresija. Multipla regresija, multipla korelacija, statistično zaključevanje o multiplem R

Multipla korelacija in regresija. Multipla regresija, multipla korelacija, statistično zaključevanje o multiplem R Multipla koelacia in egesia Multipla egesia, multipla koelacia, statistično zaklučevane o multiplem Multipla egesia osnovni model in ačunane paametov Z multiplo egesio napoveduemo vednost kiteia (odvisne

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Ocenjevanje izvozne funkcije za Slovenijo

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Ocenjevanje izvozne funkcije za Slovenijo UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga Ocenjevanje izvozne funkcije za Slovenijo (Estimating export function for Slovenia) Ime in priimek:

More information

Analogna elektronska vezja. Uvodna vaja

Analogna elektronska vezja. Uvodna vaja Analogna elektronska vezja Uvodna vaja Povzetek Namen uvodne vaje je, da študenti spoznajo orodja, ki jih bojo uporabljali pri laboratorijskih vajah predmeta Analogna elektronska vezja in sicer: podatkovne

More information

Domen Perc. Implementacija in eksperimentalna analiza tehnike razvrščanja podatkov s konsenzom

Domen Perc. Implementacija in eksperimentalna analiza tehnike razvrščanja podatkov s konsenzom UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Domen Perc Implementacija in eksperimentalna analiza tehnike razvrščanja podatkov s konsenzom DIPLOMSKO DELO NA UNIVERZITETNEM ŠTUDIJU Mentor:

More information

UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO. Gregor Slokan AVTOMATIZACIJO REZERVACIJE VIROV V TELEKOMUNIKACIJSKEM OMREŽJU

UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO. Gregor Slokan AVTOMATIZACIJO REZERVACIJE VIROV V TELEKOMUNIKACIJSKEM OMREŽJU UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Gregor Slokan RAZVOJ SISTEMA AUTOMATOR ZA AVTOMATIZACIJO REZERVACIJE VIROV V TELEKOMUNIKACIJSKEM OMREŽJU DIPLOMSKO DELO NA VISOKOŠOLSKEM STROKOVNEM

More information

USING SIMULATED SPECTRA TO TEST THE EFFICIENCY OF SPECTRAL PROCESSING SOFTWARE IN REDUCING THE NOISE IN AUGER ELECTRON SPECTRA

USING SIMULATED SPECTRA TO TEST THE EFFICIENCY OF SPECTRAL PROCESSING SOFTWARE IN REDUCING THE NOISE IN AUGER ELECTRON SPECTRA UDK 543.428.2:544.171.7 ISSN 1580-2949 Original scientific article/izvirni znanstveni ~lanek MTAEC9, 49(3)435(2015) B. PONIKU et al.: USING SIMULATED SPECTRA TO TEST THE EFFICIENCY... USING SIMULATED SPECTRA

More information

Analiza variance in linearna regresija

Analiza variance in linearna regresija Analiza variance in linearna regresija Aleš Žiberna 28. november 2011 Kazalo 1 Uporabljeni podatki 2 2 Analiza variance (ANOVA) 2 2.1 Enofaktorska analiza variance za neodvisne vzorce....... 3 2.2 Večfaktorska

More information

Verifikacija napovedi padavin

Verifikacija napovedi padavin Oddelek za Meteorologijo Seminar: 4. letnik - univerzitetni program Verifikacija napovedi padavin Avtor: Matic Šavli Mentor: doc. dr. Nedjeljka Žagar 26. februar 2012 Povzetek Pojem verifikacije je v meteorologiji

More information

Statistika 2 z računalniško analizo podatkov

Statistika 2 z računalniško analizo podatkov Statistika 2 z računalniško analizo podatkov Bivariatne analize 1 V Statistične analize v SPSS-ju V.4 Bivariatne analize Analyze - Descriptive statistics - Crosstabs Analyze Correlate Bivariate Analyze

More information

DEJAVNIKI, KI VPLIVAJO NA PLANIRANJE KADROV

DEJAVNIKI, KI VPLIVAJO NA PLANIRANJE KADROV UNIVERZA V MARIBORU FAKULTETA ZA ORGANIZACIJSKE VEDE Smer: organizacija in management delovnih procesov DEJAVNIKI, KI VPLIVAJO NA PLANIRANJE KADROV Mentor: red. prof. dr. Jože Florjančič Kandidat: Simon

More information

Increasing process safety using analytical redundancy

Increasing process safety using analytical redundancy Elektrotehniški vestnik 69(3-4): 240 246, 2002 Electrotechnical Review, Ljubljana, Slovenija Increasing process safety using analytical redundancy Stojan Peršin, Boris Tovornik, Nenad Muškinja, Drago Valh

More information

MODEL ZA OCENJEVANJE KAKOVOSTI SPLETNIH STRANI

MODEL ZA OCENJEVANJE KAKOVOSTI SPLETNIH STRANI UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO MODEL ZA OCENJEVANJE KAKOVOSTI SPLETNIH STRANI Ljubljana, avgust 2003 JAKA LINDIČ IZJAVA Študent Jaka Lindič izjavljam, da sem avtor tega magistrskega

More information

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA POLONA ŠENKINC REŠEVANJE LINEARNIH DIFERENCIALNIH ENAČB DRUGEGA REDA S POMOČJO POTENČNIH VRST DIPLOMSKO DELO

UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA POLONA ŠENKINC REŠEVANJE LINEARNIH DIFERENCIALNIH ENAČB DRUGEGA REDA S POMOČJO POTENČNIH VRST DIPLOMSKO DELO UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA POLONA ŠENKINC REŠEVANJE LINEARNIH DIFERENCIALNIH ENAČB DRUGEGA REDA S POMOČJO POTENČNIH VRST DIPLOMSKO DELO LJUBLJANA, 2016 UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA

More information

(Received )

(Received ) 79 Acta Chim. Slov. 1997, 45(1), pp. 79-84 (Received 28.1.1999) THE INFLUENCE OF THE PROTEINASE INHIBITOR EP475 ON SOME MORPHOLOGICAL CHARACTERISTICS OF POTATO PLANTS (Solanum tuberosum L. cv. Desirée)

More information

Biološka ekvivalenca Statistične metode. Iztok Grabnar

Biološka ekvivalenca Statistične metode. Iztok Grabnar Biološka ekvivalenca Statistične metode Iztok Grabnar Definicije EMEA: Note for guidance on the investigation of bioavailability and bioequivalence Biološka uporabnost Biovailability means the rate and

More information

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Ekstremne porazdelitve za odvisne spremenljivke

UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE. Ekstremne porazdelitve za odvisne spremenljivke UNIVERZA NA PRIMORSKEM FAKULTETA ZA MATEMATIKO, NARAVOSLOVJE IN INFORMACIJSKE TEHNOLOGIJE Zaključna naloga Ekstremne porazdelitve za odvisne spremenljivke (Extremal Distributions for Dependent Variables)

More information

Parametrični in neparametrični pristopi za odkrivanje trenda v časovnih vrstah

Parametrični in neparametrični pristopi za odkrivanje trenda v časovnih vrstah COBISS koda 1.02 Agrovoc descriptors: trends, statistical methods, methods Agris category code: U10 Parametrični in neparametrični pristopi za odkrivanje trenda v časovnih vrstah Tadeja KRANER ŠUMENJAK

More information

PROSTORSKI PODATKI PRI RAZVOJU NACIONALNE PROSTORSKE PODATKOVNE INFRASTRUKTURE V REPUBLIKI SRBIJI

PROSTORSKI PODATKI PRI RAZVOJU NACIONALNE PROSTORSKE PODATKOVNE INFRASTRUKTURE V REPUBLIKI SRBIJI 58/4 G 2014 V PROSTORSKI PODATKI PRI RAZVOJU NACIONALNE PROSTORSKE PODATKOVNE INFRASTRUKTURE V REPUBLIKI SRBIJI GEODETSKI VESTNIK letn. / Vol. 58 št. / No. 4 GEODATA MANAGEMENT BY DEVELOPING OF NATIONAL

More information

Designing Global Behavior in Multi-Agent Systems Using Evolutionary Computation

Designing Global Behavior in Multi-Agent Systems Using Evolutionary Computation ELEKTROTEHNIŠKI VESTNIK 8(5): 234-239, 23 ORIGINL SCIENTIFIC PPER Designing Global Behavior in Multi-gent Systems Using Evolutionary Computation Marko Privošnik University of Ljubljana, Faculty of Computer

More information

Miha Troha. Robotsko učenje in planiranje potiskanja predmetov

Miha Troha. Robotsko učenje in planiranje potiskanja predmetov UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Miha Troha Robotsko učenje in planiranje potiskanja predmetov DIPLOMSKO DELO NA UNIVERZITETNEM ŠTUDIJU Mentor: prof. dr. Ivan Bratko Ljubljana,

More information

Calculation of stress-strain dependence from tensile tests at high temperatures using final shapes of specimen s contours

Calculation of stress-strain dependence from tensile tests at high temperatures using final shapes of specimen s contours RMZ Materials and Geoenvironment, Vol. 59, No. 4, pp. 331 346, 2012 331 Calculation of stress-strain dependence from tensile tests at high temperatures using final shapes of specimen s contours Določitev

More information

GIS approach to publishing common facilities plans of land consolidation in the Czech Republic

GIS approach to publishing common facilities plans of land consolidation in the Czech Republic G 2018 V Pristop GIS za izdelavo in predstavitev načrta ureditve infrastrukture komasacijskega območja na Češkem GEODETSKI VESTNIK letn. / Vol. 62 št. / No. 4 GIS approach to publishing common facilities

More information

UNIVERZA V LJUBLJANI

UNIVERZA V LJUBLJANI UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO VREDNOTENJE KAKOVOSTI SPLETNIH PREDSTAVITEV IZBRANIH SLOVENSKIH FAKULTET Ljubljana, september 2003 MATEJA DOLNIČAR IZJAVA Študentka Mateja Dolničar

More information

ANALIZA OBISKA V SPLETNI TRGOVINI S POMOČJO PODATKOVNEGA SKLADIŠČA

ANALIZA OBISKA V SPLETNI TRGOVINI S POMOČJO PODATKOVNEGA SKLADIŠČA Univerza v Ljubljani Fakulteta za računalništvo in informatiko Andrej Remškar ANALIZA OBISKA V SPLETNI TRGOVINI S POMOČJO PODATKOVNEGA SKLADIŠČA Diplomsko delo Mentor: prof. dr. Viljan Mahnič Ljubljana,

More information

MODELIRANJE IN SIMULACIJA TER NJUNA UPORABA V MEDICINI IN FARMACIJI

MODELIRANJE IN SIMULACIJA TER NJUNA UPORABA V MEDICINI IN FARMACIJI Zdrav Vestn 28; 77: 57 71 57 Pregledni prispevek/review article MODELIRANJE IN SIMULACIJA TER NJUNA UPORABA V MEDICINI IN FARMACIJI USAGE OF MODELLING AND SIMULATION IN MEDICINE AND PHARMACY Maja Atanasijević-Kunc

More information

PRIMERJALNA ANALIZA SPLETNIH STRANI BANK NA PODROČJU POSLOVANJA S PREBIVALSTVOM COMPARATIVE ANALYSIS OF WEB PAGES ON FIELD OF BUSINESS WITH POPULATION

PRIMERJALNA ANALIZA SPLETNIH STRANI BANK NA PODROČJU POSLOVANJA S PREBIVALSTVOM COMPARATIVE ANALYSIS OF WEB PAGES ON FIELD OF BUSINESS WITH POPULATION UNIVERZA V MARIBORU EKONOMSKO - POSLOVNA FAKULTETA MARIBOR DIPLOMSKO DELO PRIMERJALNA ANALIZA SPLETNIH STRANI BANK NA PODROČJU POSLOVANJA S PREBIVALSTVOM COMPARATIVE ANALYSIS OF WEB PAGES ON FIELD OF BUSINESS

More information

KLAUDIJA ŠTERMAN IVANČIČ (UR.) izhodišča merjenja finančne pismenosti v raziskavi pisa 2012 s primeri nalog

KLAUDIJA ŠTERMAN IVANČIČ (UR.) izhodišča merjenja finančne pismenosti v raziskavi pisa 2012 s primeri nalog KLAUDIJA ŠTERMAN IVANČIČ (UR.) izhodišča merjenja finančne pismenosti v raziskavi pisa 2012 s primeri nalog DIGITALNA KNJIŽNICA DOCUMENTA 8 PEDAGOŠKI INŠTITUT 2013 izhodišča merjenja KLAUDIJA ŠTERMAN

More information

T: F: E:

T: F: E: Župančičeva 3, 1000 Ljubljana T: 01 369 53 42 F: 01 369 57 83 E: gp.mp@gov.si Številka: 007-318/2017 Ljubljana, dne 13. 3. 2018 EVA 2017-2030-0039 GENERALNI SEKRETARIAT VLADE REPUBLIKE SLOVENIJE Gp.gs@gov.si

More information

QUALITY EVALUATION OF THE NATIONAL TOPO- GRAPHIC MAP 1 : 50,000 OCENA KAKOVOSTI DRŽAVNE TOPOGRAFSKE KARTE V MERILU 1 :

QUALITY EVALUATION OF THE NATIONAL TOPO- GRAPHIC MAP 1 : 50,000 OCENA KAKOVOSTI DRŽAVNE TOPOGRAFSKE KARTE V MERILU 1 : QUALITY EVALUATION OF THE NATIONAL TOPO- GRAPHIC MAP 1 : 50,000 OCENA KAKOVOSTI DRŽAVNE TOPOGRAFSKE KARTE V MERILU 1 : 50 000 Dušan Petrovič UDK: 528.93 Klasifikacija prispevka po COBISS-u: 1.01 ABSTRACT

More information

METODOLOGIJA PRIMERJAVE IZPOSTAVLJENOSTI SN OMREŽJA UDAROM STREL METHODOLOGY FOR COMPARING EXPOSURE OF ELECTRIC DISTRIBUTION GRID TO LIGHTNING

METODOLOGIJA PRIMERJAVE IZPOSTAVLJENOSTI SN OMREŽJA UDAROM STREL METHODOLOGY FOR COMPARING EXPOSURE OF ELECTRIC DISTRIBUTION GRID TO LIGHTNING METODOLOGIJA IMERJAVE IZPOSTAVENOSTI SN OMREŽJA UDAROM STREL GAŠPER LAKOTA 1, RAN MILEV 1, TOMAŽ MOHAR 1, DAVID BATIČ 2 Elektroinštitut Milan Vidmar 1, Agencija za energijo 2 gasper.lakota@eimv.si Povzetek

More information

UPORABA STROJNEGA UČENJA PRI ANALIZI VREDNOSTNIH PAPIRJEV

UPORABA STROJNEGA UČENJA PRI ANALIZI VREDNOSTNIH PAPIRJEV UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA MAGISTRSKO DELO UPORABA STROJNEGA UČENJA PRI ANALIZI VREDNOSTNIH PAPIRJEV V Ljubljani, september 2006 Dragan Šmigič I IZJAVA Študent Dragan Šmigič izjavljam, da

More information

Verodostojnost in kvaliteta spletno dostopnih informacij

Verodostojnost in kvaliteta spletno dostopnih informacij Univerza v Ljubljani Filozofska fakulteta Oddelek za bibliotekarstvo, informacijsko znanost in knjigarstvo Verodostojnost in kvaliteta spletno dostopnih informacij Mentor: dr. Jure Dimec Lea Očko Katja

More information

FREEWAT prosto dostopno programsko orodje za upravljanje z vodami

FREEWAT prosto dostopno programsko orodje za upravljanje z vodami 6. delavnica raziskovalcev IEI FREEWAT prosto dostopno programsko orodje za upravljanje z vodami mag. Irena Kopač, univ.dipl.inž.grad. FREEWAT je projekt OBZORJA 2020 (HORIZON 2020), financiran s strani

More information

Uvod v odkrivanje znanj iz podatkov (zapiski predavatelja, samo za interno uporabo)

Uvod v odkrivanje znanj iz podatkov (zapiski predavatelja, samo za interno uporabo) Uvod v odkrivanje znanj iz podatkov (zapiski predavatelja, samo za interno uporabo) Blaž Zupan 29. julij 2017 Kazalo 1 Odkrivanje skupin 7 1.1 Primer podatkov.................................. 7 1.2 Nekaj

More information

NEWTON, RUNGE-KUTTA AND SCIENTIFIC SIMULATIONS. Newton, Runge-Kutta in simulacije v znanosti

NEWTON, RUNGE-KUTTA AND SCIENTIFIC SIMULATIONS. Newton, Runge-Kutta in simulacije v znanosti UDK621.3:(53+54+621+66), ISSN0352-9045 Informacije MIDEM 38(2008)3, Ljubljana NEWTON, RUNGE-KUTTA AND SCIENTIFIC SIMULATIONS Zvonko Fazarinc Palo Alto, California, USA Key words: Scientific simulations,

More information

Cveto Trampuž PRIMERJAVA ANALIZE VEČRAZSEŽNIH TABEL Z RAZLIČNIMI MODELI REGRESIJSKE ANALIZE DIHOTOMNIH SPREMENLJIVK

Cveto Trampuž PRIMERJAVA ANALIZE VEČRAZSEŽNIH TABEL Z RAZLIČNIMI MODELI REGRESIJSKE ANALIZE DIHOTOMNIH SPREMENLJIVK Cveto Trampuž PRIMERJAVA ANALIZE VEČRAZSEŽNIH TABEL Z RAZLIČNIMI MODELI REGRESIJSKE ANALIZE DIHOTOMNIH SPREMENLJIVK POVZETEK. Namen tega dela je prikazati osnove razlik, ki lahko nastanejo pri interpretaciji

More information

THE SELECTION AND DEVELOPMENT OF TRIBOLOGICAL COATINGS

THE SELECTION AND DEVELOPMENT OF TRIBOLOGICAL COATINGS UDK 620.179.11:621.794:621.8 ISSN 1580-2949 Professional article/strokovni ~lanek MTAEC9, 44(5)283(2010) Y. KHARLAMOV et al.: THE SELECTION AND DEVELOPMENT OF TRIBOLOGICAL COATINGS THE SELECTION AND DEVELOPMENT

More information

Simulation of multilayer coating growth in an industrial magnetron sputtering system

Simulation of multilayer coating growth in an industrial magnetron sputtering system RMZ Materials and Geoenvironment, Vol. 57, No. 3, pp. 317 330, 2010 317 Simulation of multilayer coating growth in an industrial magnetron sputtering system Simulacija rasti večplastnih prevlek v industrijski

More information

UPORABA NEVRONSKIH MREŽ PRI NAPOVEDOVANJU DEVIZNEGA TEČAJA EVRO-DOLAR

UPORABA NEVRONSKIH MREŽ PRI NAPOVEDOVANJU DEVIZNEGA TEČAJA EVRO-DOLAR UNIVERZA V LJUBLJANI EKONOMSKA FAKULTETA DIPLOMSKO DELO UPORABA NEVRONSKIH MREŽ PRI NAPOVEDOVANJU DEVIZNEGA TEČAJA EVRO-DOLAR Ljubljana, april 2008 MATEJ BEVC IZJAVA Študent Matej Bevc izjavljam, da sem

More information

Statistika 2 z računalniško analizo podatkov. Neizpolnjevanje predpostavk regresijskega modela

Statistika 2 z računalniško analizo podatkov. Neizpolnjevanje predpostavk regresijskega modela Statistika 2 z računalniško analizo podatkov Neizpolnjevanje predpostavk regresijskega modela 1 Predpostavke regresijskega modela (ponovitev) V regresijskem modelu navadno privzamemo naslednje pogoje:

More information

Modeliranje časovnih vrst z metodami teorije informacij

Modeliranje časovnih vrst z metodami teorije informacij Elektrotehniški vestnik 76(4): 240 245, 2009 Electrotechnical Review, Ljubljana, Slovenija Modeliranje časovnih vrst z metodami teorije informacij Marko Bratina 1, Andrej Dobnikar 2, Uroš Lotrič 2 1 Savatech,

More information

ZASNOVA AVTOMATSKEGA METEOROLOŠKEGA MERILNEGA SISTEMA GLEDE NA ZAHTEVE UPORABNIKOV METEOROLOŠKIH PODATKOV Z UPORABO METODE RAZVOJA FUNKCIJ KAKOVOSTI

ZASNOVA AVTOMATSKEGA METEOROLOŠKEGA MERILNEGA SISTEMA GLEDE NA ZAHTEVE UPORABNIKOV METEOROLOŠKIH PODATKOV Z UPORABO METODE RAZVOJA FUNKCIJ KAKOVOSTI UNIVERZA V LJUBLJANI FAKULTETA ZA MATEMATIKO IN FIZIKO ODDELEK ZA FIZIKO UNIVERZITETNI PODIPLOMSKI ŠTUDIJ VARSTVO OKOLJA Joško KNEZ ZASNOVA AVTOMATSKEGA METEOROLOŠKEGA MERILNEGA SISTEMA GLEDE NA ZAHTEVE

More information

Preverjanje optimiziranosti spletnih strani

Preverjanje optimiziranosti spletnih strani UNIVERZA V LJUBLJANI FAKULTETA ZA RAČUNALNIŠTVO IN INFORMATIKO Boštjan Hozjan Preverjanje optimiziranosti spletnih strani DIPLOMSKO DELO NA UNIVERZITETNEM ŠTUDIJU Ljubljana, 2016 UNIVERZA V LJUBLJANI

More information

Kompetenčni model primer oblikovanja modela kompetenc v enoti strežba v podjetju X

Kompetenčni model primer oblikovanja modela kompetenc v enoti strežba v podjetju X UNIVERZA V LJUBLJANI FAKULTETA ZA DRUŽBENE VEDE Tjaša Habjan Kompetenčni model primer oblikovanja modela kompetenc v enoti strežba v podjetju X Diplomsko delo Ljubljana, 2015 UNIVERZA V LJUBLJANI FAKULTETA

More information

Simulacija dinamičnih sistemov s pomočjo osnovnih funkcij orodij MATLAB in Simulink

Simulacija dinamičnih sistemov s pomočjo osnovnih funkcij orodij MATLAB in Simulink Laboratorijske vaje Računalniška simulacija 2012/13 1. laboratorijska vaja Simulacija dinamičnih sistemov s pomočjo osnovnih funkcij orodij MATLAB in Simulink Pri tej laboratorijski vaji boste spoznali

More information

Sistem za sledenje in analizo uporabe računalniških aplikacij

Sistem za sledenje in analizo uporabe računalniških aplikacij Univerza v Ljubljani Fakulteta za računalništvo in informatiko Dejan Mesar Sistem za sledenje in analizo uporabe računalniških aplikacij DIPLOMSKO DELO NA UNIVERZITETNEM ŠTUDIJU Mentor: izr. prof. dr.

More information

Plan 2018 Plan 2019 Plan 2020 Plan 2021 Plan po PV Proračunski viri

Plan 2018 Plan 2019 Plan 2020 Plan 2021 Plan po PV Proračunski viri Uradni list Republike Slovenije Št. 71 / 13. 12. 2017 / Stran 10117 Projekti / Viri SPREMEMBE PRORAČUNA REPUBLIKE SLOVENIJE ZA LETO 2018 III. NAČRT RAZVOJNIH PROGRAMOV 2018-2021 01 POLITIČNI SISTEM 64.665.971

More information

Extracting and Maintaining Geo-Referenced Data during the Application Processing Joze SENEGACNIK

Extracting and Maintaining Geo-Referenced Data during the Application Processing Joze SENEGACNIK Extracting and Maintaining Geo-Referenced Data during the Application Processing (Permanent associate of S&T Hermes-Plus d.d., Slovenia, e-mail: joze.senegacnik@snt.si) 1 ABSTRACT A lot of governmental

More information

NIKJER-NIČELNI PRETOKI

NIKJER-NIČELNI PRETOKI UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA ALJA ŠUBIC NIKJER-NIČELNI PRETOKI DIPLOMSKO DELO LJUBLJANA, 2016 UNIVERZA V LJUBLJANI PEDAGOŠKA FAKULTETA Dvopredmetni učitelj: matematika - računalništvo ALJA

More information

Electric Power-System Inertia Estimation applying WAMS

Electric Power-System Inertia Estimation applying WAMS Univerza v Ljubljani Fakulteta za elektrotehniko Teodora Dimitrovska Electric Power-System Inertia Estimation applying WAMS Master's thesis Mentor: doc. dr. Urban Rudež Co-mentor: prof. dr. Rafael Mihalič

More information

VAJE 2: Opisna statistika

VAJE 2: Opisna statistika VAJE : Opisna statistika Na računalniških vajah se za urejanje in prikazovanje statističnih podatkov uporabi statistični programski paket SPSS in podatkovna datoteka podatki.sav. NALOGE: 1. Analiza vzorčnih

More information

SPECIALTY OPTICAL FIBRES FOR A SENSING APPLICATION. Uporaba posebnih optičnih vlaken za zaznavanje

SPECIALTY OPTICAL FIBRES FOR A SENSING APPLICATION. Uporaba posebnih optičnih vlaken za zaznavanje UDK621.3:(53+54+621+66), ISSN0352-9045 Informacije MIDEM 40(2010)4, Ljubljana SPECIALTY OPTICAL FIBRES FOR A SENSING APPLICATION Yuri Chamorovskiy Institute of Radioengineering and Electronics Russian

More information

Vpliv likvidnostnega tveganja na izračun tvegane vrednosti

Vpliv likvidnostnega tveganja na izračun tvegane vrednosti Vpliv likvidnostnega tveganja na izračun tvegane vrednosti bor bricelj Univerza v Mariboru, Slovenija sebastjan strašek Univerza v Mariboru, Slovenija timotej jagrič Univerza v Mariboru, Slovenija V članku

More information

IZGRADNJA INFORMACIJSKEGA SISTEMA IBIS ZA PODPORO IZVAJANJA BILANČNEGA OBRAČUNA NA TRGU Z ELEKTRIČNO ENERGIJO

IZGRADNJA INFORMACIJSKEGA SISTEMA IBIS ZA PODPORO IZVAJANJA BILANČNEGA OBRAČUNA NA TRGU Z ELEKTRIČNO ENERGIJO IZGRADNJA INFORMACIJSKEGA SISTEMA IBIS ZA PODPORO IZVAJANJA BILANČNEGA OBRAČUNA NA TRGU Z ELEKTRIČNO ENERGIJO Ivan Lorencin 2, Andraž Šavli 1, Damjan Stanek 1, Boštjan Strmčnik 2 1 Borzen, Organizator

More information

Smernice. za opredelitev MSP KORAK 1 KORAK 2 KORAK 3 KORAK 3. Notranji trg, industrija, podjetništvo ter mala in srednje velika podjetja

Smernice. za opredelitev MSP KORAK 1 KORAK 2 KORAK 3 KORAK 3. Notranji trg, industrija, podjetništvo ter mala in srednje velika podjetja Smernice za opredelitev MSP KORAK 1 KORAK 2 KORAK 3 KORAK 3 Notranji trg, industrija, podjetništvo ter mala in srednje velika podjetja IZJAVA O OMEJITVI ODGOVORNOSTI Te smernice za opredelitev MSP vsebujejo

More information