Plan vežbi za predmet Informatički praktikum 4

Similar documents
Uvod u relacione baze podataka

TEORIJA SKUPOVA Zadaci

Rešenja zadataka za vežbu na relacionoj algebri i relacionom računu

Fajl koji je korišćen može se naći na

Red veze za benzen. Slika 1.

KLASIFIKACIJA NAIVNI BAJES. NIKOLA MILIKIĆ URL:

Projektovanje paralelnih algoritama II

Mathcad sa algoritmima

NIPP. Implementing rules for metadata. Ivica Skender NSDI Working group for technical standards.

Zadatci sa ciklusima. Zadatak1: Sastaviti progra koji određuje z ir prvih prirod ih rojeva.

Slika 1. Slika 2. Da ne bismo stalno izbacivali elemente iz skupa, mi ćemo napraviti još jedan niz markirano, gde će

Syntactic Patterns of Spatial Relations in Text

A multidimensional generalization of the Steinhaus theorem

Osobine metode rezolucije: zaustavlja se, pouzdanost i kompletnost. Iskazna logika 4

Algoritam za množenje ulančanih matrica. Alen Kosanović Prirodoslovno-matematički fakultet Matematički odsjek

ZANIMLJIV NAČIN IZRAČUNAVANJA NEKIH GRANIČNIH VRIJEDNOSTI FUNKCIJA. Šefket Arslanagić, Sarajevo, BiH

ANALYSIS OF INFLUENCE OF PARAMETERS ON TRANSFER FUNCTIONS OF APERIODIC MECHANISMS UDC Života Živković, Miloš Milošević, Ivan Ivanov

Programiranje u realnom vremenu Bojan Furlan

arxiv: v1 [math.ra] 27 Jul 2013

ANALYTICAL AND NUMERICAL PREDICTION OF SPRINGBACK IN SHEET METAL BENDING

Modified Zagreb M 2 Index Comparison with the Randi} Connectivity Index for Benzenoid Systems

NAPREDNI FIZIČKI PRAKTIKUM 1 studij Matematika i fizika; smjer nastavnički MJERENJE MALIH OTPORA

Oracle Spatial Koordinatni sustavi, projekcije i transformacije. Dalibor Kušić, mag. ing. listopad 2010.

ANALYSIS OF THE RELIABILITY OF THE "ALTERNATOR- ALTERNATOR BELT" SYSTEM

Iskazna logika 1. Matematička logika u računarstvu. oktobar 2012

PRIPADNOST RJEŠENJA KVADRATNE JEDNAČINE DANOM INTERVALU

The Polynomial Numerical Index of L p (µ)

THE SPECTRAL DIAMETER IN BANACH ALGEBRAS

SHARP BOUNDS FOR THE GENERAL RANDIĆ INDEX R 1 OF A GRAPH

povezuju tačke na četiri različita načina (pravom linijom, splajnom,

THE SOLUTION OF 3y2 ± 2" = x3

Konstekstno slobodne gramatike

AGENTI ZA RUDARENJE WEBA

Some results on the reverse order law in rings with involution

REVERSALS ON SFT S. 1. Introduction and preliminaries

Uvod u analizu (M3-02) 05., 07. i 12. XI dr Nenad Teofanov. principle) ili Dirihleov princip (engl. Dirichlet box principle).

FACTORING A QUADRATIC OPERATOR AS A PRODUCT OF TWO POSITIVE CONTRACTIONS

Machine Learning on temporal data

MULTIPLICATIVE ALGORITHM FOR CORRENTROPY-BASED NONNEGATIVE MATRIX FACTORIZATION

IMPROVEMENT OF HIPPARCOS PROPER MOTIONS IN DECLINATION

THE USE OF SCRIPT IN THE SOFTWARE GEMCOM ***

Publications: Charles Fulton. Papers On Sturm-Liouville Theory

Supervisor: Prof. Stefano Spaccapietra Dr. Fabio Porto Student: Yuanjian Wang Zufferey. EPFL - Computer Science - LBD 1

NAPREDNI FIZIČKI PRAKTIKUM II studij Geofizika POLARIZACIJA SVJETLOSTI

BOSNA I HERCEGOVINA TRŽIŠTE OSIGURANJA 2009

RELACIONI MODEL PODATAKA

u Novom Sadu na Tehnološkom fakultetu od Septembra održava Workshop pod nazivom:

Text and multimedia languages and properties

SUPPORT VECTOR MACHINE

Algoritmi i programiranje

MAGNETIC FIELD OF ELECTRICAL RADIANT HEATING SYSTEM

CLASSIFICATION OF CONIC SECTIONS IN P E 2 (R) Jelena Beban-Brkić and Marija Šimić Horvath

The Residual Spectrum and the Continuous Spectrum of Upper Triangular Operator Matrices

Aspect Term Extraction with History Attention and Selective Transformation 1

DISTRIBUIRANI ALGORITMI I SISTEMI

Probabilistic Latent Semantic Analysis

Dihedral groups of automorphisms of compact Riemann surfaces of genus two

CLINICAL. Neodoljiva ponuda iz Ivoclar Vivadenta PROLJEĆE LJETO. Ponuda traje od: ili do isteka zaliha

A set theoretic view of the ISA hierarchy

Trace Representation of Legendre Sequences

Spectral isometries into commutative Banach algebras

Automatically Evaluating Text Coherence using Anaphora and Coreference Resolution

AN INTRODUCTION TO TOPIC MODELS

AIR CURTAINS VAZDU[NE ZAVESE V H

LINEARNI MODELI STATISTIČKI PRAKTIKUM 2 2. VJEŽBE

BAZE PODATAKA Predavanje 03

Universidad Autónoma de San Luis Potosí College of Engineering Mechanical and Electrical Department Analytical Program

On Einstein Nearly Kenmotsu Manifolds

1a select indeks from dosije where mesto_rodjenja='beograd' union select indeks from ispit where ocena=10 order by indeks desc;

UPUTE ZA OBLIKOVANJE DIPLOMSKOG RADA

Hierachical Name Entity Recognition

Applying Phonetic Matching Algorithm to Tongue Twister Retrieval in Japanese

Multi-theme Sentiment Analysis using Quantified Contextual

Singular Value Inequalities for Real and Imaginary Parts of Matrices

UPUTE ZA IZRADU DIPLOMSKOG RADA NA ODJELU ZA PSIHOLOGIJU SVEUČILIŠTA U ZADRU. 1. Izgled diplomskog rada

Generalized left and right Weyl spectra of upper triangular operator matrices

Generalized Cayley Digraphs

Mere sličnosti XML podataka i primene u otkrivanju duplikata

Use precise language and domain-specific vocabulary to inform about or explain the topic. CCSS.ELA-LITERACY.WHST D

One-sided clean rings.

Information Extraction from Text

Surveying, Mapping and Remote Sensing (LIESMARS), Wuhan University, China

Fast Logistic Regression for Text Categorization with Variable-Length N-grams

FUNDAMENTAL THEOREMS OF ANALYSIS IN FORMALLY REAL FIELDS

Lecture Notes on Combinatory Modal Logic

A Present Position-Dependent Conditional Fourier-Feynman Transform and Convolution Product over Continuous Paths

R, 1 i 1,i 2,...,i m n.

On the Cross-Correlation of a p-ary m-sequence of Period p 2m 1 and Its Decimated

Zbirka ispitnih zadataka iz Baza Podataka 1 Ispiti i kolokvijumi u periodu

ON THE TWO BODY PROBLEM UDC (045)=20. Veljko A. Vujičić

COMMUTATIVE SEMIFIELDS OF ORDER 243 AND 3125

Curriculum Vitae. Education: Degrees and Diplomas: Employments:

Locally linearly dependent operators and reflexivity of operator spaces

A Generalization of VNL-Rings and P P -Rings

STRESS OF ANGLE SECTION SUBJECTED TO TRANSVERSAL LOADING ACTING OUT OF THE SHEAR CENTER

ZANIMLJIVI ALGEBARSKI ZADACI SA BROJEM 2013 (Interesting algebraic problems with number 2013)

Monomial orderings, rewriting systems, and Gröbner bases for the commutator ideal of a free algebra

Moore-Penrose-invertible normal and Hermitian elements in rings

THE PRECISION OF TIME REGISTRATION WITH DANJON ASTROLABE

Transcription:

Plan vežbi za predmet Informatički praktikum 4 Branislava Šandrih školska 2016/2017. godina 1

Sadržaj 1 Uvod u XML 3 2 Osnovni pojmovi DTD-a 6 3 DTD - nastavak 8 4 DTD - nastavak 9 5 Razni zadaci 13 6 Regularni izrazi 17 7 BibTEX 22 8 XML Schema 24 2

1 Uvod u XML 1. Zbog čega je važno obeležavanje teksta? 2. Navedite bar tri formata za obeležavanje teksta. 3. Šta se dešava u situaciji da strane koje razmenjuju podatke, ne predstavljaju podatke u istom formatu? 4. Šta je SGML? Šta su SGML aplikacije? 5. Navedite dve SGML aplikacije. 6. Šta je HTML? 7. Koja je razlika izmedu interneta i veba? 8. Šta je XML? Navedite bar tri slučaja gde bi se XML mogao upotrebi. 9. Koja su osnovna svojstva XML-a? Da li je XML programski jezik? 10. Koja je razlika izmedu XML-a i HTML-a? 11. 12. 13. Šta je osnovna namena XML-a? Šta su XML elementi? Navesti primer. Šta su atributi XML elemenata? Navesti primer. 14. Kakvi su prazni XML elementi? Navesti primer. 15. Šta je koreni XML element? Navesti primer. 16. Kakva je konvencija o imenovanju elemenata u XML-u? Navesti primer. 17. 18. 19. 20. Šta znači da je sadržaj XML elementa jednostavan? Navesti primer. Šta znači da je sadržaj XML elementa mešovit? Navesti primer. Šta su i zbog čega se koriste reference entiteta? Navesti pet predefinisanih. Šta su i čemu služe odeljci karakterskih podataka? 21. Kako se navode komentari u XML-u? Čemu služe komentari? 22. Objasniti konstrukciju instrukcija za obradu. Navesti dve takve instrukcije. 23. Koji su atributi XML deklaracije i šta predstavljaju? Da li je XML deklaracija obavezna? 24. 25. Šta znači da je dokument dobro formiran? Navesti primer takvog dokumenta. Šta je XML parser i čemu služi? 26. Formirati XML dokument za tabelu koja sadrži podatke o studentima: 3

Ime Prezime Broj indeksa Osvojenih ESPB Miroslav Stanković 130458 152 Jadranka Jovanović 121258 160 Milena Aleksić 141278 203 Vladimir Pantić 138578 125 (a) tako da se svi podaci nalaze u okviru nekog elementa (b) tako da se elementi, koji imaju jednostavan sadržaj (samo tekst), nadu kao atributi roditelj-elementa. 27. Formirati XML dokument za sledeće podatke o filmovima: Naziv Režiser Ocena Godina Žanr Bekstvo iz Šošenka Frank Darabont 9.3 1994 crime, drama Šindlerova lista Steven Spielberg 8.9 1993 biography, drama, history Kad jaganjci utihnu Jonathan Demme 8.6 1991 crime, drama, thriller The Pianist Roman Polanski 8.5 2002 biography, drama, war (a) tako da se svi podaci nalaze u okviru nekog elementa (b) tako da se elementi, koji imaju jednostavan sadržaj (samo tekst), nadu kao atributi roditelj-elementa. Isprobati API za IMDB, npr. http: // www. omdbapi. com/?t= Shawshank+ Redemption& r= xml 28. Formirati XML dokument za fiskalni račun sa slike. Obeležiti naziv trgovinskog objekta, adresu, vreme i datum izdavanja, PIB, IBFM, artikle (naziv, količina, cena), iznos računa, koliko je uplaćeno i koliki je povraćaj: 4

(a) tako da se svi podaci nalaze u okviru nekog elementa (b) tako da se elementi, koji imaju jednostavan sadržaj (samo tekst), nadu kao atributi roditelj-elementa. 29. Formirati XML dokument za vest iz novine sa slike (vest preuzeta sa http://www.blic.rs/ kultura/vesti/objavljen-naslov-osmog-nastavka-o-ratovima-zvezda/gp897vl). U okviru vesti dati referencu na originalni članak, obeležiti naslov, izvor vesti, datum, vreme, tekst i sliku. Dati referencu za sliku. U samom tekstu, obeležiti i sva lična imena. 5

2 Osnovni pojmovi DTD-a 1. Šta je DTD? 2. Koja je namena DTD-a? 3. Šta znači da je XML dokument validan? Koji program to treba da ustanovi? 4. Da li je nevalidnost XML dokumenta nužno fatalna? Objasniti. 5. Objasniti razliku izmedu dobro formiranog i validnog XML dokumenta. 6. Koje stavke se ne preciziraju DTD-em? 7. Kako se zove deo dokumenta u kom se nalazi DTD, odnosno referenca na DTD? Gde se on nalazi? 8. Na koji način se referiše na odgovarajući spoljašnji DTD? 9. Šta znači da je DTD unutrašnji i kako se koristi? 10. Da li se istovremeno mogu koristiti i spoljašnji i unutrašnji DTD? Objasniti. 11. Kako izgleda deklaracija XML elementa u DTD-u? 12. 13. Šta je model sadržaja? Šta znači da sadržaj XML elementa tipa PCDATA? 14. Kako se DTD-em navodi da je sadržaj XML elementa drugi element, odnosno niz drugih elemenata? Kako se takvi elementi zovu? Navesti primer DTD deklaracije i odgovarajućeg elementa. 15. Kako se DTD-em navodi da XML element može imati različitu decu? Navesti primer DTD deklaracije i odgovarajućeg elementa. 16. Kako se specifikuje broj dece? Navesti primer DTD deklaracije i odgovarajućeg elementa. 17. Šta znači da element nema sadržaj? Navesti primer DTD deklaracije i odgovarajućeg elementa. 18. Napisati (a) unutrašnji (b) spoljašnji DTD za XML dokument iz zadatka 1.26, pod a.) (podaci o studentima). 19. Napisati spoljašnji DTD za XML dokument iz zadatka 1.27, pod a.) (podaci o filmovima). 20. Napisati spoljašnji DTD za XML dokument iz zadatka 1.28, pod a.) (fiskalni račun). 21. Napisati spoljašnji DTD za naredni XML dokument. XML dokument predstavlja rečnik kao niz odrednica, od kojih svaka obavezno sadrži kanonski oblik (lemu), vrstu reči (imenica, glagol, pridev itd), i bar jedno značenje. Svako značenje obavezno sadrži opis i neobavezne primere (kojih može biti i više). U okviru svakog primera se obavezno navodi citat primera i referenca na odgovarajući izvor. 6

<?xml version= 1. 0 encoding= UTF 8?> <recnik> <odrednica> <lema>plav</lema> <vrsta>p r i d e v</ vrsta> <opis>k o j i ima jednu od osnovnih boja s p e k t r a ; k o j i j e b o j e vedrog neba i l i mora</ opis> <primer> <c i t a t>imao j e plav kaput, žute pumperice do i s p o d kolena, b e l e čarape i crvenu, š i l j a s t u kapu</ c i t a t> <referenca>miroslav Popović. Sudbine, Beograd: Dereta. 1 9 9 4. UDK: 886.1 31</ referenca> </primer> <opis>s v e t l o ž u t ( o k o s i )</ opis> <primer> <c i t a t>tramvaj v o z i mlad, plav t r a m v a j d ž i j a</ c i t a t> <referenca>mostovi ( b r o j 100) : č a s o p i s za prevodnu k n j i ž e v n o s t Udruženja k n j i ž e v n i h p r e v o d i l a c a S r b i j e</ referenca> </primer> </ odrednica> <odrednica> <lema>p i s a t i</lema> <vrsta>g l a g o l</ vrsta> <opis> b e l e ž i t i na papiru, h a r t i j i</ opis> <opis> s l a t i pismo</ opis> </ odrednica> <odrednica> <lema> s t o l i c a</lema> <vrsta>imenica</ vrsta> <opis>komad nameštaja</ opis> <primer> <c i t a t>prvo š t o j e popravio b i l a je, naravno, s t o l i c a koja po p r a v i l u t r p i n a j v i š e f i z i č k i h o š t e ć e n j a</ c i t a t> <referenca>p o l i t i k i n magazin (2001). UDK: 79+659(497.11 Beograd ) ( 0 5 ), 79 </ referenca> </primer> <opis>s e d i š t e poglavara države i l i neke p o k r a j i n e, g l a v n i grad, p r e s t o n i c a </ opis> <primer> <c i t a t>za Kruševac zna da j e s t o l i c a kneza Lazara </ c i tat> <referenca>danica : s r p s k i narodni i l u s t r o v a n i kalendar za godinu 1 9 9 5 ; Beograd : Vukova zadužbina, 1 9 9 5. UDK: 059, 0 5 0. 8 /. 9</ referenca> </primer> <opis>i z b a c i v a n j e izmeta i z organizma kroz d e b e l o crevo</ opis> </ odrednica> </ recnik> 7

3 DTD - nastavak 1. Šta znači da je sadržaj XML elementa mešovit? Navesti primer DTD deklaracije i odgovarajućeg elementa. 2. 3. Šta znači da je sadržaj XML elementa proizvoljan? Navesti primer DTD deklaracije. Šta su atributi XML elemenata? Navesti primer. 4. Da li atributi moraju biti deklarisani unutar DTD-a? 5. Navesti primer deklaracije jednog atributa za element. 6. Navesti primer istovremene deklaracije više atributa za jedan element. 7. Navesti deset tipova atributa i ukratko ih objasniti. 8. Koje su četiri podrazumevane vrednosti atributa? Ukratko objasniti svaku. 9. Napisati spoljašnji DTD za XML dokument iz zadatka 1.26, pod b.) (podaci o studentima). 10. Napisati spoljašnji DTD za XML dokument iz zadatka 1.27, pod b.) (podaci o filmovima). 11. Prilagoditi XML strukturu iz zadatka 1.28 tako da element prodavnica sadrži mešoviti sadržaj (na primer, poruka zahvalnosti ne mora biti obeležena). Da li je dokument i dalje validan u odnosu na svoj DTD? Ako nije, prilagoditi DTD novoj strukturi elementa. 12. Prilagoditi DTD za zadatak 1.28, pod a.) tako da: element datum bude prazan, ali da sadrži atribute dan (obavezan), mesec (obavezan), godinu (obavezan) element vreme bude prazan, ali da sadrži atribute sat (obavezan), minut (obavezan), sekund (opcionalan) napraviti novi, prazan element pdv, kao dete elementa stavka, koji može ali ne mora da se navede. Ovaj element može sa sadrži atribut procenat (vrednost 8 ili 18), pri čemu, ako se atribut ne navede, podrazumevana vrednost je 8. 13. Napisati spoljašnji DTD za XML dokument iz zadatka 1.28, pod b.) (fiskalni račun). 14. Napisati spoljašnji DTD za XML dokument iz zadatka 1.29 (novinski isečak). 8

4 DTD - nastavak 1. Čemu služe karakterski entiteti? Kako se oni koriste? 2. Objasniti predstavljanje karaktera u računaru. 3. Opisati ASCII kodni raspored. 4. Objasniti razliku izmedu ISO-8859-1 i ISO-8859-2 kodnog rasporeda? 5. Kojim kodnim rasporedom se predstavlja srpska ćirilica? 6. Kako se imenuju karakterski entiteti i zbog čega? Kako se koriste? Navesti primer. 7. Šta su parametarski entiteti? Gde se oni deklarišu? Mogu li se redefinisati? 8. Koja je osnovna namena parametarskih entiteta? Navesti primer deklaracije. 9. Za naredni DTD pripremiti XML dokument: <!ENTITY % adresa ime, prezime, u l i c a, broj, posta, grad > <!ELEMENT pismo ( datum, p o s i l j a l a c, primalac +, s a d r z a j )> <!ELEMENT datum ( dan, mesec, godina )> <!ELEMENT dan (#PCDATA)> <!ELEMENT mesec (#PCDATA)> <!ELEMENT godina (#PCDATA)> <!ELEMENT p o s i l j a l a c (%adresa ; )> <!ELEMENT primalac (% adresa ; )> <!ELEMENT ime (#PCDATA)> <!ELEMENT prezime (#PCDATA)> <!ELEMENT u l i c a (#PCDATA)> <!ELEMENT b r o j (#PCDATA)> <!ELEMENT posta (#PCDATA)> <!ELEMENT grad (#PCDATA)> <!ELEMENT s a d r z a j (#PCDATA datum pesma ) > <!ELEMENT pesma ( s t i h +)> <!ELEMENT s t i h (#PCDATA)> Sadržaj pisma je: 1 2. 0 2. 2 0 0 9. Š a l j e : D a v i t e l j Beogradski U l i c a K a r a n f i l a 21 11001 Beograd Prima: Ognjen S t r a h i n j i c 2 9. novembra 107 11000 Beograd Dragi i n s p e k t o r e, Sledeću davim u p o n e d e l j a k 1 5. 0 2. 2 0 0 9. Bejbi, b e j b i, z a t v o r i o č i sada, Bejbi, b e j b i, z a t v o r i s v o j e oči, Bejbi, b e j b i, z a t v o r i o č i sada, S l e d i p o l j u b a c! P o z d r a v l j a Vas Vaš D a v i t e l j Nakon kreiranja XML dokumenta, ubaciti u prolog referencu na taj spoljašnji DTD i da proveriti da li je u odnosu na taj DTD kreiran validan XML dokument. 9

10. Za prethodni zadatak, umetnuti DTD kao unutrašnji. Prokomentarisati šta se desilo. Da li se parametarski entiteti mogu definisati u okviru unutrašnjeg DTD-a? 11. Koja je razlika izmedu opštih i parametarskih entiteta prema (a) mestu upotrebe (b) nameni? 12. Kako se deklarišu opšti unutrašnji entiteti i čemu služe? Navesti primer DTD deklaracije i upotrebe. 13. Da li se parsira sadržaj unutrašnjih entiteta? 14. Poruku zahvalnosti sa fiskalnog računa iz zadatka 2.20 deklarisati kao unutrašnji entitet i kao takvu je upotrebiti unutar XML dokumenta. 15. Primetiti da je cela struktura informacija o prodavnici (naziv, adresa, poruka zahvalnosti) nepromenljiva. Izdvojiti taj konstantni XML i koristiti ga kao unutrašnji entitet u XML dokumentu iz zadatka 2.20. 16. Kako se deklarišu opšti spoljašnji entiteti i čemu služe? Navesti primer DTD deklaracije i upotrebe. 17. Da li se parsira sadržaj spoljašnjih entiteta? 18. Prilagoditi zadatak 4.15, tako da se nepromenljivi deo računa čuva u spoljašnjem dokumentu, a koristi kao spoljašnji entitet. 19. Šta su javni DTD-evi? Kako se koriste? 20. Kako bi se u XML dokumentu koristile predefinisane kolekcije karakterskih entiteta iz prve polovine karakterskog skupa Latin 1? 21. Kako se uslovno uključuju, odnosno isključuju delovi XML dokumenta? 22. Za naredni DTD pripremiti XML dokument: <!ELEMENT ambulanta ( u c e k a o n i c i, na redu )> <!ELEMENT u c e k a o n i c i ( pas zec macka ) > <!ELEMENT na redu ( pas zec macka ) > <!ENTITY % podaci ime, rasa, s t a r o s t, k i l a z a > <!ENTITY % b r o j k a r t o n a b r o j k a r t o n a ID #REQUIRED > <!ELEMENT pas (% podaci ; )> <!ATTLIST pas %b r o j k a r t o n a ;> <!ELEMENT zec (% podaci ; )> <!ATTLIST zec %b r o j k a r t o n a ;> <!ELEMENT macka (% podaci ; )> <!ATTLIST macka %b r o j k a r t o n a ;> <!ELEMENT ime (#PCDATA)> <!ELEMENT r a s a (#PCDATA)> <!ELEMENT s t a r o s t (#PCDATA)> <!ELEMENT k i l a z a (#PCDATA)> 10

Životinje koje čekaju na red u ambulanti: Broj kartona Ime Rasa Starost u mesecima Kilaža Status p 45893 Srba pitbul 18 32.3 čeka p 12454 Maza mešanac 26 26.3 čeka z 45978 Duško kunić 8 2.2 čeka p 78975 Aron rotvajler 38 42 na redu m 12369 Feri zelena domaća 47 4.3 na redu Nakon kreiranja XML dokumenta, ubaciti u prolog referencu na taj spoljašnji DTD i da proveriti da li je u odnosu na taj DTD kreiran validan XML dokument. 23. Za naredni XML dokument pripremiti DTD: <?xml version= 1. 0 encoding= us a s c i i?> <b i b l i o t e k a> <! podaci o b i b l i o t e c i > &p o d a c i o b i b l i o t e c i ; <! a u t o r i > <a u t o r i> <autor i d= a 01025 > <ime>ivo</ ime> <prezime>andrić</ prezime> </ autor> </ a u t o r i> <! k n j i g e > <k n j i g e> <k n j i g a i d= k 788999 i d a u t o r a= a 01025 > <n a s l o v>ex Ponto</ n a s l o v> <g o d i n a i z d a v a n j a>1918</ g o d i n a i z d a v a n j a> </ k n j i g a> <k n j i g a i d= k 578449 i d a u t o r a= a 01025 > <n a s l o v>p r o k l e t a a v l i j a</ n a s l o v> <g o d i n a i z d a v a n j a>1954</ g o d i n a i z d a v a n j a> </ k n j i g a> </ k n j i g e> <! k o r i s n i c i > <k o r i s n i c i> <! p r v i k o r i s n i k > <k o r i s n i k i d= u 489899 > <ime>petar</ ime> <prezime>p e t r o v i ć</ prezime> <p o z a j m l j e n e k n j i g e> <pozajmica i d k n j i g e= k 788999 uzeto= 20/02/2017 v r a c a n j e= 27/02/2017 /> <pozajmica i d k n j i g e= k 578449 uzeto= 13/03/2017 v r a c a n j e= /> </ p o z a j m l j e n e k n j i g e> </ k o r i s n i k> <! d r u g i k o r i s n i k > <k o r i s n i k i d= u 123535 > <ime>jovana</ ime> <prezime>jovanovi ć</ prezime> <p o z a j m l j e n e k n j i g e /> </ k o r i s n i k> </ k o r i s n i c i> </ b i b l i o t e k a> 11

Sadržaj opšteg entiteta podaci o biblioteci čuva se u spoljašnjoj datoteci: <p o d a c i o b i b l i o t e c i i d= b 123 > <adresa> <u l i c a>miročka</ u l i c a> <b r o j>23</ b r o j> <grad>š abac</ grad> </ adresa> </ p o d a c i o b i b l i o t e c i> Atribut id elemenata bibloteka, autor, knjiga i korisnik koristiti kao parametarski entitet. 24. Ispitati koja reč se krije iza sledeće sekvence heksadekadnih kodova, a zatim imenovati svaki od karaktera u unutrašnjem DTD-u i prikazati dokument sa tako imenovanim entitetima: x41f x440 x430 x43a x442 x438 x43a x443 x43c 4 x2661 12

5 Razni zadaci 1. Dati su sledeći podaci o filmovima: Naziv Režiser Ocena Godina Žanr Bekstvo iz Šošenka Frank Darabont 9.3 1994 crime, drama Šindlerova lista Steven Spielberg 8.9 1993 biography, drama, history Kad jaganjci utihnu Jonathan Demme 8.6 1991 crime, drama, thriller The Pianist Roman Polanski 8.5 2002 biography, drama, war (a) Formirati XML dokument tako da se svi podaci nalaze u okviru nekog elementa (elementi ne sadrže atribute). (b) Napisati spoljašnji DTD za takav XML dokument i proveriti validnost u odnosu na taj DTD. (c) Formirati XML dokument tako da se elementi, koji imaju jednostavan sadržaj (samo tekst), nadu kao atributi roditelj-elementa. (d) Napisati spoljašnji DTD za takav XML dokument i proveriti validnost u odnosu na taj DTD. 2. Napisati spoljašnji DTD za naredni XML dokument. XML dokument predstavlja rečnik kao niz odrednica, od kojih svaka obavezno sadrži kanonski oblik (lemu), vrstu reči (imenica, glagol, pridev itd), i bar jedno značenje. Svako značenje obavezno sadrži opis i neobavezne primere (kojih može biti i više). U okviru svakog primera se obavezno navodi citat primera i referenca na odgovarajući izvor. 13

<?xml version= 1. 0 encoding= UTF 8?> <recnik> <odrednica> <lema>plav</lema> <vrsta>p r i d e v</ vrsta> <opis>k o j i ima jednu od osnovnih boja s p e k t r a ; k o j i j e b o j e vedrog neba i l i mora</ opis> <primer> <c i t a t>imao j e plav kaput, žute pumperice do i s p o d kolena, b e l e čarape i crvenu, š i l j a s t u kapu</ c i t a t> <referenca>miroslav Popović. Sudbine, Beograd: Dereta. 1 9 9 4. UDK: 886.1 31</ referenca> </primer> <opis>s v e t l o ž u t ( o k o s i )</ opis> <primer> <c i t a t>tramvaj v o z i mlad, plav t r a m v a j d ž i j a</ c i t a t> <referenca>mostovi ( b r o j 100) : č a s o p i s za prevodnu k n j i ž e v n o s t Udruženja k n j i ž e v n i h p r e v o d i l a c a S r b i j e</ referenca> </primer> </ odrednica> <odrednica> <lema>p i s a t i</lema> <vrsta>g l a g o l</ vrsta> <opis> b e l e ž i t i na papiru, h a r t i j i</ opis> <opis> s l a t i pismo</ opis> </ odrednica> <odrednica> <lema> s t o l i c a</lema> <vrsta>imenica</ vrsta> <opis>komad nameštaja</ opis> <primer> <c i t a t>prvo š t o j e popravio b i l a je, naravno, s t o l i c a koja po p r a v i l u t r p i n a j v i š e f i z i č k i h o š t e ć e n j a</ c i t a t> <referenca>p o l i t i k i n magazin (2001). UDK: 79+659(497.11 Beograd ) ( 0 5 ), 79 </ referenca> </primer> <opis>s e d i š t e poglavara države i l i neke p o k r a j i n e, g l a v n i grad, p r e s t o n i c a </ opis> <primer> <c i t a t>za Kruševac zna da j e s t o l i c a kneza Lazara </ c i tat> <referenca>danica : s r p s k i narodni i l u s t r o v a n i kalendar za godinu 1 9 9 5 ; Beograd : Vukova zadužbina, 1 9 9 5. UDK: 059, 0 5 0. 8 /. 9</ referenca> </primer> <opis>i z b a c i v a n j e izmeta i z organizma kroz d e b e l o crevo</ opis> </ odrednica> </ recnik> 14

3. Za naredni DTD pripremiti XML dokument: <!ELEMENT ambulanta ( u c e k a o n i c i, na redu )> <!ELEMENT u c e k a o n i c i ( pas zec macka ) > <!ELEMENT na redu ( pas zec macka ) > <!ENTITY % podaci ime, rasa, s t a r o s t, k i l a z a > <!ENTITY % b r o j k a r t o n a b r o j k a r t o n a ID #REQUIRED > <!ELEMENT pas (% podaci ; )> <!ATTLIST pas %b r o j k a r t o n a ;> <!ELEMENT zec (% podaci ; )> <!ATTLIST zec %b r o j k a r t o n a ;> <!ELEMENT macka (% podaci ; )> <!ATTLIST macka %b r o j k a r t o n a ;> <!ELEMENT ime (#PCDATA)> <!ELEMENT r a s a (#PCDATA)> <!ELEMENT s t a r o s t (#PCDATA)> <!ELEMENT k i l a z a (#PCDATA)> Životinje koje čekaju na red u ambulanti: Broj kartona Ime Rasa Starost u mesecima Kilaža Status p 45893 Srba pitbul 18 32.3 čeka p 12454 Maza mešanac 26 26.3 čeka z 45978 Duško kunić 8 2.2 čeka p 78975 Aron rotvajler 38 42 na redu m 12369 Feri zelena domaća 47 4.3 na redu Nakon kreiranja XML dokumenta, ubaciti u prolog referencu na taj spoljašnji DTD i da proveriti da li je u odnosu na taj DTD kreiran validan XML dokument. 4. Za naredni XML dokument pripremiti DTD: <?xml version= 1. 0 encoding= us a s c i i?> <b i b l i o t e k a> <! podaci o b i b l i o t e c i > &p o d a c i o b i b l i o t e c i ; <! a u t o r i > <a u t o r i> <autor i d= a 01025 > <ime>ivo</ ime> <prezime>andrić</ prezime> </ autor> </ a u t o r i> <! k n j i g e > <k n j i g e> <k n j i g a i d= k 788999 i d a u t o r a= a 01025 > <n a s l o v>ex Ponto</ n a s l o v> <g o d i n a i z d a v a n j a>1918</ g o d i n a i z d a v a n j a> </ k n j i g a> <k n j i g a i d= k 578449 i d a u t o r a= a 01025 > <n a s l o v>p r o k l e t a a v l i j a</ n a s l o v> <g o d i n a i z d a v a n j a>1954</ g o d i n a i z d a v a n j a> 15

</ k n j i g a> </ k n j i g e> <! k o r i s n i c i > <k o r i s n i c i> <! p r v i k o r i s n i k > <k o r i s n i k i d= u 489899 > <ime>petar</ ime> <prezime>p e t r o v i ć</ prezime> <p o z a j m l j e n e k n j i g e> <pozajmica i d k n j i g e= k 788999 uzeto= 20/02/2017 v r a c a n j e= 27/02/2017 /> <pozajmica i d k n j i g e= k 578449 uzeto= 13/03/2017 v r a c a n j e= /> </ p o z a j m l j e n e k n j i g e> </ k o r i s n i k> <! d r u g i k o r i s n i k > <k o r i s n i k i d= u 123535 > <ime>jovana</ ime> <prezime>jovanovi ć</ prezime> <p o z a j m l j e n e k n j i g e /> </ k o r i s n i k> </ k o r i s n i c i> </ b i b l i o t e k a> Sadržaj opšteg entiteta podaci o biblioteci čuva se u spoljašnjoj datoteci: <p o d a c i o b i b l i o t e c i i d= b 123 > <adresa> <u l i c a>miročka</ u l i c a> <b r o j>23</ b r o j> <grad>š abac</ grad> </ adresa> </ p o d a c i o b i b l i o t e c i> Atribut id elemenata bibloteka, autor, knjiga i korisnik koristiti kao parametarski entitet. 5. Ispitati koja reč se krije iza sledeće sekvence heksadekadnih kodova, a zatim imenovati svaki od karaktera u unutrašnjem DTD-u i prikazati dokument sa tako imenovanim entitetima: x41f x440 x430 x43a x442 x438 x43a x443 x43c 4 x2661 16

6 Regularni izrazi 1. Napraviti regularni izraz koji prepoznaje niske: ac abc abbbc abbbbc Rešenje: ab*c 2. Napraviti regularni izraz koji prepoznaje niske: ac bc aabbbc abbbbc Rešenje: a*b*c 3. Napraviti regularni izraz koji prepoznaje niske: abccc bccc accc ccc Rešenje: a?b?c{3} 4. Napraviti regularni izraz koji prepoznaje JMBG: 1204999632145 1312986123599 1503981188789 Rešenje: \d{13} 5. Napraviti regularni izraz koji prepoznaje validne brojeve telefona: +381641234567 +38369997893 +3829949897238 Rešenje: \+38\d\d{2}\d{6,8} 6. Napraviti regularni izraz koji medu sledećim rečima prepoznaje samo one koje sadrže samo suglasnike: 17

praktikum prst tacna krst Banana vrh TASTATURA srp Rešenje: \b[^aeiouaeio ]+\b 7. Napraviti regularni izraz koji medu sledećim rečima prepoznaje samo one koje sadrže bar jedan samoglasnik: praktikum prst tacna krst Banana vrh TASTATURA srp Rešenje: \b[a-za-z]*[aeiouaeiou][a-za-z]*\b 8. Napraviti regularni izraz koji prepoznaje aritmetičke izraze: 1+3=4 1-6=-5 13*2=26 16/2=8 Rešenje: -?\d+[-\+\*\/]\d+=-?\d+ 9. Napraviti regularni izraz koji prepoznaje niske: a ac acab acabab acababab acabababab Rešenje: ac?(ab)* 10. Napraviti regularni izraz koji prepoznaje validne e-mail adrese: mile.aleksic@gmail.com petar.petrovic@yahoo.com milica96@web.server.rs Rešenje : [a-z_\.-]+@[a-z]+\.[a-z.]+ 11. Napraviti regularni izraz koji prepoznaje niske: a aaaa ab aba abaabaaaab ali ne prepoznaje niske 18

b abb bba Rešenje: (a+b?)+ 12. Napraviti regularni izraz koji prepoznaje srpske automobilske tablice: VF-003 PA ZZ-123 BG HI-078 NS Rešenje: [A-Z]{2}-\d{3} [A-Z]{2} 13. Napraviti regularni izraz koji prepoznaje srpske automobilske tablice za prikolice: PA 003-VF BG 123-ZZ NS 078-HI Rešenje: [A-Z]{2} \d{3}-[a-z]{2} 14. Napraviti regularni izraz koji prepoznaje nemačke automobilske tablice: KA PA 777 BE AR 123 DT AK 556 Rešenje: [A-Z]{2} [A-Z]{2} \d{3} 15. Napraviti regularni izraz koji prepoznaje engleske automobilske tablice: 08-TN-231053 Rešenje: \d{2}-[a-z]{2}-\d{6} 16. Napraviti regularni izraz koji prepoznaje irske automobilske tablice: LA5I ABC Rešenje: [A-Z]{2}\d[A-Z] [A-Z]{3} 17. Napraviti regularni izraz koji prepoznaje datume: 12.03.1991. 14.05.2016. 04.04.2017. 31.12.1990. 19

ali ne prepoznaje: 12.13.1991. 34.05.2016. 04.04.17 32.31.2296. Rešenje: (0[1-9] 1[0-9] 3[01])\.(0[0-9] 1[0-2])\.\d{4}\. 18. Napraviti regularni izraz koji prepoznaje datume: 12.3.1991. 14.5.2016. 4.4.2017. 31.12.1990. Rešenje: ([1-9] 1[0-9] 3[01])\.([0-9] 1[0-2])\.\d{4}\. 19. Napraviti regularni izraz koji prepoznaje dozvoljene nazive promenljivih u programskom jeziku Java: my_variable myvariable myvariable1 _myvariable _myvariable2 Rešenje: [a-za-z_]\w* 20. Napraviti regularni izraz koji prepoznaje otvorenu XML etiketu bez atributa: <element> <korisnik-usluge> <osoba.ime> <licno_ime> <tabela3> <_element> Rešenje: <[a-za-z_][\w\._\-]*> 21. Napraviti regularni izraz koji prepoznaje praznu XML etiketu bez atributa: <element /> <korisnik-usluge /> <osoba.ime /> <licno_ime /> <tabela3 /> <_element /> Rešenje: <[a-za-z_][\w\._\-]* \/> 20

22. Napraviti regularni izraz koji prepoznaje zatvorenu XML etiketu: </ element> </ korisnik-usluge> </ osoba.ime> </ licno_ime> </ tabela3> </ _element> Rešenje: <\/ [a-za-z_][\w\._\-]*> 23. Napraviti regularni izraz koji prepoznaje otvorenu XML etiketu sa jednim atributom: <element atribut="18"> <korisnik-usluge tip= sbb > <osoba.ime prvo="jovan"> <licno_ime vrednost= Milica > <tabela3 border="1"> <_element atrib="566"> Rešenje: <[a-za-z_][\w\._-]* [a-za-z_][\w\._-]+=[" ].*[" ]> Bolje rešenje: <[a-za-z_][\w\._-]* [a-za-z_][\w\._-]+=([" ]).*\1> 24. Napraviti regularni izraz koji prepoznaje praznu XML etiketu sa jednim atributom: </ element atribut="18"> </ korisnik-usluge tip= sbb > </ osoba.ime prvo="jovan"> </ licno_ime vrednost= Milica > </ tabela3 border="1"> </ _element atrib="566"> Rešenje: <\/ [_a-za-z][\w-\.]* [_a-za-z][\w-\.]*=([ "]).+\1> 25. *Napraviti regularni izraz koji prepoznaje otvorenu XML etiketu sa više atributa: <element atribut="18" drugi="16"> <korisnik-usluge tip= sbb provajder= orion > <osoba.ime prvo="jovan" drugo="vladan"> <licno_ime vrednost= Milica ocevo= Petar > <tabela3 border="1" type= dotted > <_element atrib="566" val="1a"> Rešenje: <[a-za-z_][\w\._-]* ([a-za-z_][\w\._-]+=([ "])\w+\2?)+> 21

7 BibTEX 1. Napisati BibTEXza narednu bibliografiju: Literatura [1] Leslie Lamport. L A TEX: A Document Preparation System. Addison-Wesley, 1986. [2] A. Simonič. Grupe operatorjev s pozitivnim spektrom. Master s thesis, Univerza v Ljubljani, FNT, Oddelek za Matematiko, 1990. [3] A. Simonič. Notes on Subharmonic Functions. Lecture Notes, Dalhousie University, Department of Mathematics, Statistics, & Computing Science, 1991. [4] A. Simonič. Matrix Groups with Positive Spectra. Linear Algebra Appl., 173:57 76, 1992. [5] A. Simonič. An Extension of Lomonosov s Techniques to Non-Compact Operators. PhD thesis, Dalhousie University, Department of Mathematics, Statistics, & Computing Science, 1994. [6] A. Simonič. A Construction of Lomonosov Functions and Applications to the Invariant Subspace Problem. Pacific J. Math., 175:257 270, 1996. [7] A. Simonič. An extension of Lomonosov s Techniques to non-compact Operators. Trans. Amer. Math. Soc., 348:975 995, 1996. [8] Donald E. Knuth. The TEXbook. Addison-Wesley, 1984. [9] Charles Louis Xavier Joseph de la Vallée Poussin. A strong form of the prime number theorem, 19th century. [10] H. Radjavi and P. Rosenthal. Invariant Subspaces. Springer-Verlag, New York, 1973. [11] B. Aupetit. A Primer on Spectral Theory. Springer-Verlag, New York, 1991. Potom napraviti TEXdatoteku u kojoj postoje citati tih referenci. Isprobati sledeće stilove: plain alpha unsrt Uporediti ih i prokomentarisati sličnosti i razlike. Citirati neke od bibliografskih unosa. Da li se prikazuje cela bibliografija i zbog čega? 2. Napisati BibTEXza narednu bibliografiju: Literatura [1] Eneko Agirre, Lluís Màrquez, and Richard Wicentowski, editors. SemEval 07: Proceedings of the 4th International Workshop on Semantic Evaluations, Stroudsburg, PA, USA, 2007. Association for Computational Linguistics. [2] Ricardo Baeza-Yates, Berthier Ribeiro-Neto, et al. Modern information retrieval, volume 463. ACM Press New York, 1999. 22

[3] Daniel G. Bobrow. A Question-Answering System for High School Algebra Word Problems. In Proceedings of AFIPS Conference, 26. FJCC, Part I, pages 591 614, New York, 1964. ACM. [4] Eduardo Cunha Campos and Marcelo de Almeida Maia. Automatic categorization of questions from q&a sites. In Proceedings of the 29th Annual ACM Symposium on Applied Computing, pages 641 643. ACM, 2014. [5] Martin Fowler and Kent Beck. Refactoring: improving the design of existing code. Addison-Wesley Professional, 1999. [6] Roberto I. González-Ibáñez, Smaranda Muresan, and Nina Wacholder. Identifying Sarcasm in Twitter: A Closer Look. In The 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies, Proceedings of the Conference, 19-24 June, 2011, Portland, Oregon, USA - Short Papers, pages 581 586, 2001. [7] Andrew Hardie, Veronika Koller, Paul Rayson, and Elena Semino. Exploiting a Semantic Annotation Tool for Metaphor Analysis. In Matthew Davies, Paul Rayson, Susan Hunston, and Pernilla Danielsson, editors, Proceedings of the Corpus Linguistics 2007 Conference, Birmingham, 2007. University of Birmingham. [8] Kwanho Kim, Beom suk Chung, Yerim Choi, Seungjun Lee, Jae-Yoon Jung, and Jonghun Park. Language independent semantic kernels for short-text classification. Expert Systems with Applications, 41(2):735 743, 2014. [9] Pang-Ning Tan et al. Introduction to data mining. Pearson Education India, 2006. [10] Miloš Utvić. Izgradnja referentnog korpusa savremenog srpskog jezika. Doktorska disertacija, Univerzitet u Beogradu, Filološki fakultet, Beograd, 2014. [11] Xindong Wu, Vipin Kumar, Ross J Quinlan, Joydeep Ghosh, Qiang Yang, Hiroshi Motoda, Geoffrey J McLachlan, Angus Ng, Bing Liu, S Philip Yu, et al. Top 10 algorithms in data mining. Knowledge and information systems, 14(1):1 37, 2008. [12] Chunyong Yin, Jun Xiang, Hui Zhang, Jin Wang, Zhichao Yin, and Jeong-Uk Kim. A new svm method for short text classification based on semi-supervised learning. In Advanced Information Technology and Sensor Application (AITS), 2015 4th International Conference on, pages 100 103. IEEE, 2015. [13] Heng Zhang and Guoqiang Zhong. Improving short text classification by learning vector representations of both words and hidden topics. Knowledge-Based Systems, 102, 2016. 23

8 XML Schema 1. Napisati XML Schemu za XML dokument iz zadatka 1.26, pod a.) (podaci o studentima). 2. Napisati XML Schemu za XML dokument iz zadatka 1.26, pod b.) (podaci o studentima). 3. Napisati XML Schemu za XML dokument iz zadatka 1.27, pod a.) (podaci o filmovima). 4. Napisati XML Schemu za XML dokument iz zadatka 1.27, pod b.) (podaci o filmovima). 5. Napisati XML Schemu za XML dokument iz zadatka 1.28, pod a.) (fiskalni račun). 6. Napisati XML Schemu za XML dokument iz zadatka 1.28, pod b.) (fiskalni račun). 7. Napisati XML Schemu za XML dokument iz zadatka 1.29 (novinski isečak). 8. Napisati XML Schemu za XML dokument iz zadatka 2.21 (rečnik). 9. Napisati XML Schemu za XML dokument iz zadatka 4.9 (pismo). 10. Napisati XML Schemu za XML dokument iz zadatka 4.22 (ambulanta). 24