SEMANTIČKO OZNAČAVANJE TRAJEKTORIJA MOBILNIH OBJEKATA SEMANTIC ANNOTATION OF MOBILE OBJECT TRAJECTORIES

Similar documents
SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan.

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd,

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings

Podešavanje za eduroam ios

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević

Uvod u relacione baze podataka

Klasterizacija. NIKOLA MILIKIĆ URL:

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri.

STABLA ODLUČIVANJA. Jelena Jovanovic. Web:

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI

Port Community System

Otpremanje video snimka na YouTube

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB.

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE

Priprema podataka. NIKOLA MILIKIĆ URL:

Upute za korištenje makronaredbi gml2dwg i gml2dgn

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ

BENCHMARKING HOSTELA

Advertising on the Web

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine

STRUČNA PRAKSA B-PRO TEMA 13

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020.

Nejednakosti s faktorijelima

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT

NIS PETROL. Uputstvo za deaktiviranje/aktiviranje stranice Veleprodajnog cenovnika na sajtu NIS Petrol-a

2. poglavlje - IDENTIFIKACIJA POTROŠAČA - od 62 do 80 strane (19 strana)

Bušilice nove generacije. ImpactDrill

3D GRAFIKA I ANIMACIJA

Struktura indeksa: B-stablo. ls/swd/btree/btree.html

SAS On Demand. Video: Upute za registraciju:

INSTALIRANJE SOFTVERSKOG SISTEMA SURVEY

Dr Smiljan Vukanović, dis

PROJEKTNI PRORAČUN 1

DEFINISANJE TURISTIČKE TRAŽNJE

Skalabilni klaster algoritmi Seminarski rad iz Istraživanja podataka

Tutorijal za Štefice za upload slika na forum.

Određivanje pozicije mobilnih GSM korisnika korišćenjem Support Vector Regression metode

Mogudnosti za prilagođavanje

- Vežba 1 (dodatan materijal) - Kreiranje Web šablona (template) pomoću softvera Adobe Photoshop CS

FILOGENETSKA ANALIZA

Direktan link ka kursu:

DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta. Hotel ODISEJ, POMENA, otok Mljet, listopad 2010.

RAZVOJ NGA MREŽA U CRNOJ GORI

Posmatrani i objekti posmatraci

Uputstvo za konfigurisanje uređaja Roadstar

POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU

Windows Easy Transfer

GLEDANOST TELEVIZIJSKIH PROGRAMA PROSINAC Konzumacija TV-a u prosincu godine

NAUČ NI Č LANCI POREĐENJE SNAGE ZA JEDNU I DVE KONTRAROTIRAJUĆE HIDRO TURBINE U VENTURIJEVOJ CEVI DRUGI DEO

WWF. Jahorina

Struktura i organizacija baza podataka

RANI BOOKING TURSKA LJETO 2017

ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP

GSM TRACING SVEUČILIŠTE U ZAGREBU. FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA Zavod za elektroničke sustave i obradu informacija

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze

Ciljevi. Poslije kompletiranja ove lekcije trebalo bi se moći:

TEHNOLOGIJA, INFORMATIKA I OBRAZOVANJE ZA DRUŠTVO UČENJA I ZNANJA 6. Međunarodni Simpozijum, Tehnički fakultet Čačak, 3 5. jun 2011.

Dr Dejan Bogićević, dipl. inž. saob., VTŠSS Niš Dušan Radosavljević, dipl. inž. saob., VTŠSS Niš; Nebojša Čergić, dipl. inž. saob.

1. Instalacija programske podrške

IZRADA TEHNIČKE DOKUMENTACIJE

Automatske Maske za zavarivanje. Stella, black carbon. chain and skull. clown. blue carbon

Integracija CAD i GIS tehnologije za potrebe izrade informacionih sistema objekata korišćenjem ARCGIS-a

TEHNIĈKO VELEUĈILIŠTE U ZAGREBU ELEKTROTEHNIĈKI ODJEL Prof.dr.sc.KREŠIMIR MEŠTROVIĆ POUZDANOST VISOKONAPONSKIH PREKIDAĈA

JEDINSTVENI PORTAL POREZNE UPRAVE. Priručnik za instalaciju Google Chrome dodatka. (Opera preglednik)

CRNA GORA

Mindomo online aplikacija za izradu umnih mapa

FAKULTET ZA POSLOVNU INFORMATIKU

PROFOMETER 5+ lokator armature

Univerzitet u Novom Sadu. Fakultet tehničkih nauka. Odsek za računarsku tehniku i računarske komunikacije. Uvod u GIT

1. MODEL (Ulaz / Zadržavanje / Stanje)

FAKULTET TEHNIČKIH NAUKA

Kooperativna meteorološka stanica za cestovni promet

UVOD U REGISTRACIJU SLIKA

IZDAVAČ / Publisher Sveučilište u Zadru / University of Zadar Mihovila Pavlinovića 1, Zadar, Hrvatska

STRUKTURNO KABLIRANJE

DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO DOO PODGORICA


OBJEKTNO ORIJENTISANO PROGRAMIRANJE

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU

ANALIZA PRIKUPLJENIH PODATAKA O KVALITETU ZRAKA NA PODRUČJU OPĆINE LUKAVAC ( ZA PERIOD OD DO GOD.)

CRNA GORA / MONTENEGRO ZAVOD ZA STATISTIKU / STATISTICAL OFFICE S A O P Š T E NJ E / STATEMENT Broj / No 76 Podgorica, god.

PROSTORNO FIKSIRANJE SAOBRAĆAJNIH NEZGODA

za STB GO4TV in alliance with GSS media

MRS MRSLab09 Metodologija Razvoja Softvera Vežba 09

Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu

MRS. MRSLab03 Metodologija Razvoja Softvera Vežba 03 LAB Dijagram aktivnosti

СТРУКТУРА СТАНДАРДА СИСТЕМАМЕНАЏМЕНТАКВАЛИТЕТОМ

Pronalaženje mikrotubula u trodimenzionalnim mikroskopskim slikama

Mašinsko učenje Uvod. Bojan Furlan УНИВЕРЗИТЕТ У БЕОГРАДУ ЕЛЕКТРОТЕХНИЧКИ ФАКУЛТЕТ

24th International FIG Congress

1.7 Predstavljanje negativnih brojeva u binarnom sistemu

STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA:

Bear management in Croatia

OSNOVNE PREMISE ANALIZE GRUPISANJA THE BASIC PREMISES OF GROUPING ANALYSIS

EKSPLORATIVNA ANALIZA PODATAKA IZ SUSTAVA ZA ISPORUKU OGLASA

Transcription:

SEMANTIČKO OZNAČAVANJE TRAJEKTORIJA MOBILNIH OBJEKATA SEMANTIC ANNOTATION OF MOBILE OBJECT TRAJECTORIES Aleksandra Spasojević, Dragan Stojanović, Bratislav Predić Elektronski fakultet u Nišu Sadržaj U ovom radu su razmotrene metode klasterovanja trajektorija i metode za obogaćivanje trajektorija semantičkim podacima. Proces semantičkog označavanja trajektorije je opisan i implementiran korišćenjem postojećih alata za kreiranje semantičke trajektorije. Implementirana je SEMT metoda za semantičko označavanje trajektorije i praktično prikazan postupak kako se od sirovih podataka stvaraju informacije, razumljive za čoveka i za mašinu. Na kraju je izvršeno i poređenje rezultata koje daju odabrane metode. Abstract This paper discusses methods of clustering and enrichment of trajectories with semantic data. The procedure of the semantic annotation of trajectories is described and practically implemented using existing tools for creating semantic trajectories. SEMT method for semantic annotation of trajectories is implemented and the process of producing meaningful information, comprehensible to man and machine, from raw data is shown. Finally the comparison of results produced by the chosen methods is given. autobus) > (samoposluga, 17:30-18:30, kupovina) > (put, 18:30-19:00, pešice) > (stan, 19:00-, -). U svakoj od ovih trojki su prostorne koordinate predstavljene na semantičkom nivou u vidu opisa posao, stan ili put. Druga komponenta je vremenska, predstavlja period u kome prva i treća komponenta ostaju nepromenjene. Poslednja u nizu predstavlja dodatne semantičke informacije, beleške u vezi sa aktivnošću koja se obavlja, na primer prevozno sredstvo kojim se kretao posmatrani objekat. Iza ovakvog rezultata leži čitav niz koraka koje treba izvršiti. Oni su prikazani na slici 1 i opisani dalje u tekstu. 1. UVOD Sa napretkom mobilnih uređaja opremljenih GPS prijemnicima (Smartphones, PDA, iphone) pokazalo se veoma jednostavnim i korisnim prikupljanje lokacija mobilnih objekata, uključujući ljude, životinje ali i nebiološke objekte. Od kada su velike količine podataka sa mobilnih uređaja postale dostupne, stalno raste potreba da se na osnovu njih dođe do novih saznanja. Analiza ponašanja mobilnih objekata je osnova mnogih primena u navigaciji, upravljanju flotom vozila, upravljanju vanrednim situacijama, turističkim vodičima, urbanom planiranju, itd. Fizička lokacija objekta daje informaciju o kretanju i može se zabeležiti korišćenjem GPS (Global Positioning System) tehnologije. Da bi bila upotrebljiva za naprednije namene poput urbanističkih planiranja, upravljanja saobraćajem i mobilnih komunikacija, mora se predstaviti u obliku koji nosi više informacija od same pozicije mobilnog objekta zadate prostornim koordinatama. Ovo je objedinjeno upravo semantičkim trajektorijama. Prema konceptu semantičke trajektorije, geografske informacije u pozadini treba integrisati sa fizičkim lokacijama, tačkama trajektorije. Umesto da se posmatra skup GPS tačaka, jednostavnije je da se trajektorija predstavi na semantičkom nivou, na primer u vidu niza trojki: (stan, -08:00, -) > (put, 08:00-09:00, autobus) > (kancelarija, 09:00-17:00, posao) > (put, 17:00-17:30, Slika 1. Proces semantičkog označavanja trajektorije Počev od preprocesiranja trajektorije, svaki skup GPS podaka može sadržati redundantne podatke ili podatke koji narušavaju principe uređene trajektorije ukoliko nije ispoštovan vremenski redosled ili ne postoji dovoljan broj tačaka koji čine trajektoriju. Nakon uređenja i filtriranja trajektorije i uklanjanja šuma, vrši se segmentacija trajektorije po prostornom ili vremenskom osnovu tako da se formiraju tačno određeni segmenti trajektorije jasno definisani svojim početkom i krajem podtrajektorije. Zatim se pristupa izdvajanju delova trajektorije u kojima se objekat zadržavao, bilo da je zastao ili boravio duže vreme, odnosno određivanju delova u kojima se kretao. Ovo je poznato kao problem prepoznavanja epizoda zaustavljanja i kretanja objekta duž trajektorije i u ovu svrhu se primenjuju razni algoritmi bazirani na vremenu, brzini, gustini tačaka ili prostornoj udaljenosti. Na posletku treba ovako struktuiranu trajektoriju obogatiti semantičkim podacima. Integracijom geometrija oblasti 141

zaustavljanja i geografskih informacija o putnoj mreži i objektima od interesa svakoj tački trajektorije pridružuju se semantički podaci i na taj način se formira semantička trajektorija. Odavde dobijamo saznanja o ponašanju posmatranog mobilnog objekta u toku zadatog vremenskog perioda koje možemo iskoristiti da uočimo njegove navike ili prepoznajemo šablone u njegovim aktivnostima. U ovom radu predstavljena je metoda za kreiranje semantičke trajektorije koja se oslanja na semantički model podataka predložen u [1]. Kroz eksperimentalne rezultate nad skupom podataka simuliranih trajektorija upoređeni su različiti pristupi u semantičkom označavanju. Ostatak rada je organizovan na sledeći način u 2. poglavlju predstavljene su postojeće tehnike dobijanja semantičkih trajektorija. U 3. poglavlju predstavljena je SEMT metoda za semantičko označavanje, a u 4. poglavlju predstavljen je Web GIS alat za vizuelizaciju i evaluaciju rezultata obrađenih metoda. Poglavlje 5 predstavlja zaključak i daje pravce budućih istraživanja. 2. SEMANTIČKO OZNAČAVANJE TRAJEKTORIJAE PREGLED ISTRAŽIVANJA Raniji radovi na generisanju semantičkih lokacija koriste manje pouzdane izvore semantičkih podataka. Na primer u [2] se koristi reverzno geokodiranje lokacija (na osnovu koordinata pozicije objekta pribavlja se adresa lokacije). Zatim se pretražuju Žute strane, profil korisnika na internetu i ostale dostupne informacije da bi se formirala semantička informacija o lokaciji. Loša strana ovog pristupa je što se oslanja u velikom delu na rezultate pretrage po internetu i unose korisnika da bi se pribavili semantički podataci o lokacijama. U [3] je predstavljen prvi algoritam klasterovanja koji se bazira na minimalnom vremenu koje posetilac provede na nekom mestu, a koji ne zahteva da unapred bude poznat broj klastera. Svako nađeno mesto se smatra bitnim, ali takođe se uzima u obzir i broj poseta tom mestu, jer se na nekim mestima kao što su automati, ljudi zadržavaju kratko vreme, ali imaju veliki broj poseta dnevno. U poslednjih nekoliko godina prema široko prihvaćenom modelu trajektorije predstavljenom u [1], trajektorija se posmatra kao niz zaustavljanja i kretanja (stops and moves). Zaustavljanja su interesantna mesta u okviru trajektorije, mesta na kojima se objekat zadržao neko minimalno vreme. Polazeći od ovog modela u [4] predstavljen je algoritam SMoT (Stops and Moves of Trajectories) kao metoda za izdvajanje epizoda iz trajektorije. SMoT algoritam se sastoji u sledećem za svaku tačku trajektorije proverava se da li postoji presek sa geometrijom potencijalnog zaustavljanja. Ako se seku, proverava se da li je vremensko trajanje preseka manje ili jednako zadatom pragu. Ako su prethodni uslovi ispunjeni, potencijalno zaustavljanje se usvaja i pamti. U suprotnom, ako tačka ne pripada podtrajektoriji koja preseca potencijalno zaustavljanje za zadato vreme, smatra se delom kretanja. Kasnije je ista grupa autora [5] u nešto manjem sastavu predložila pristup baziran na klasterovanju (grupisanju) tačaka u cilju izdvajanja epizoda. CB-SMOT (Clustering Based SMoT) algoritam se za razliku od prethodne metode koju nazivaju i IB-SMoT (Intersection-Based SMoT) bavi analizom brzine kretanja objekta duž trajektorije. Delovi trajektorije u kojima je brzina manja nego u ostalim delovima predstavljaju takozvana zanimljiva mesta. Algoritam se izvršava u dva koraka u prvom se identifikuju sporiji delovi trajektorije koristeći prostorno-vremensku metodu klasterovanja. U drugom koraku algoritam određuje geografske lokacije ovih klastera razmatrajući potencijalna zaustavljanja. U slučaju da klaster ne preseca nijedan od zadatih geografskih objekata, on i dalje može biti zanimljivo mesto. Kako bi i ovakva mesta prikazao korisniku, ona se čuvaju kao nepoznata zaustavljanja. Nepoznata zaustavljanja su važna jer iako nemaju preseka sa karakterističnim tipovima prostornih objekata koje je naveo korisnik, mogu se prepoznati šabloni koji uključuju ova nepoznata zaustavljanja, ako se na njima javljaju zardžavanja u nekoliko trajektorija za procenjeno minimalno vreme. Za određivanje klastera koristi se prostorno-vremenski algoritam klasterovanja koji je zapravo modifikovani DBSCAN (Density-Based Spatial Clustering of Applications with Noise) algoritam. Prednost ovog pristupa je u tome što pronalazi zaustavljanja koja korisnici inače ne navode, kao što su semafori ili kontroleri brzina. Ovo je od velikog značaja za primene u upravljanju saobraćajem ili turizmu. SMoT pristup je u poređenju sa CB-SMoT ograničen u smislu da može pronaći zaustavljanja samo prema mestima od interesa koja je zadao korisnik. Međutim za primene u kojima nije bitna brzina kretanja daje dobre rezultate iako nije zasnovan na klasterovanju tačaka. Za evaluaciju metode kasnije u radu iskorišćena je njihova implementacija u open-source alatu WEKA predstavljenom u [6] i [7] koji je namenjen preprocesiranju, klasterovanju i semantičkom označavanju trajektorija. Ovaj alat pruža veliki broj mogućnosti za direktno izvršavanje upita nad trajektorijom, vizuelni prikaz trajektorija i rezultata upita nad više slojeva prostornih i prostorno-vremenskih informacija. Jedna od glavnih funkcionalnosti je podrška za algoritme za otkrivanje znanja koji se mogu primeniti na semantičku trajektoriju. WEKA-STPM (Semantic Trajectory Preprocessing Module) predstavlja modul kojim se nad podacima može primeniti potpuni postupak semantičkog označavanja trajektorije od pripreme i obrade sirovih podataka o lokaciji do formiranja semantičke trajektorije. Međutim, najveći uticaj na ovaj rad ima SeMiTri okruženje [8] koje implementira semantičko označavanje na različitim nivoima u zavisnosti od primene nivoima regiona, linija i tačaka. Regioni ROI (Regions Of Interest) mogu biti industrijska, komercjalna, građevinska 142

područja i slično, zatim šume, jezera itd., dok se u ulozi linijskih objekata LOI (Lines Of Interest) mogu razmatrati autoputevi, biciklističke staze i ostalo. Konačno, tačkaste objekte POI (Points Of Interest) predstavljaju restorani, hoteli, bolnice, poslovne zgrade i sl. Brojni su kvaliteti ovog okruženja, među njima su primena algoritama za izdvajanje epizoda, kompleksnih map-matching algoritama za pridruživanje elemenata GPS pozicijama, statističke analize trajektorije itd. Međutim, moguće je opredeliti se za označavanje u odnosu na samo jedan tip geografskih objekata u odnosu na ROI, LOI ili POI u zavisnosti od oblasti primene. Ova karakteristika je poslužila kao inspiracija da se u ovom radu objedine LOI i POI i formira kompletna semantička trajektorija sa semantički opisanim zaustavljanjima i kretanjima. 3.SEMT METODA SEMANTIČKOG OZNAČAVANJA U procesu semantičkog označavanja trajektorija razlikuju se dva problema. Jedan je problem klasterovanja tačaka trajektorije sa ciljem da se izdvoje epizode zaustavljanja i kretanja, a drugi je pridruživanje semantičkih podataka prepoznatim epizodama. U ovom poglavlju predstavlja se način na koji su ovi problemi rešeni u SEMT i kako se dolazi do rezultata ove metode. Rezultat su struktuirane i semantički obogaćene trajektorije koje se pamte u PostGIS bazi podataka ili običnim datotekama u zavisnosti od oblika u kojem su dostupni polazni podaci. Za pristup ovim rezultatima i njihov prikaz zadužen je web GIS alat, predstavljen u sledećem poglavlju. Metoda SEMT (Semantic Enrichment of Mobile Trajectories) za sematičko označavanje koristi pristup za ekstrakciju epizoda kretanja i zaustavljanja klasterovanjem tačaka po unapređenom DBSCAN algoritmu, pritom uzimajući u obzir i dodatne uslove radi dobijanja optimalnog rezultata. Prednosti ove metode su što se može primeniti na heterogene trajektorije dobijene iz kretanja različitih tipova mobilnih objekata i u tome što daje kompletnu sliku semantičke trajektorije sa označenim zaustavljanjima i kretanjima. Kako je izlaz koji daje WEKA-STPM u vidu PostGIS tabela zaustavljanja i kretanja pri čemu semantiku zaustavljanja i kretanja čine imena tabela u kojima se nalaze objekti od interesa to nije dovoljna količina podataka koju je kao rezultat trebalo postići ovim radom, tako da su zaustavljanja i kretanja dobijena iz WEKA-SMTP alata naknadno obogaćena dostupnim informacijama u web GIS alatu. U svrhu klasterovanja kod SEMT metode iskorišćen je OPTICS algoritam predstavljen u [9]. Ovaj algoritam zasnovan je na DBSCAN što znači da se klasterovanje vrši razmatrajući gustinu tačaka trajektorije. Svrha ovog algoritma nije da eksplicitno izvrši klasterovanje skupa podataka i dostavi izdvojene skupove tačaka, već da odredi njihovo uređenje po principu klasterovanja po gustini. Nastao je sa idejom da se DBSCAN algoritam proširi tako da se istovremeno mogu odrediti klasteri za više parametara udaljenosti ε. Da bi se izdvojili klasteri tačaka mora se poštovati određeni red u kome će se podaci obrađivati. Uvek se za sledeći objekat u procesu bira onaj koji je dostižan u oblasti gustine u odnosu na minimalnu vrednost gustine zadate parametrom ε jer se tako obezbeđuje da se klasteri sa većom gustinom (manjim ε) prvi obrade. Dakle, zadavanjem parametra ε tačke trajektorije se uređuju u redosled kojim ih treba obrađivati. Na rezultate OPTICS algoritma primenjuje se postupak za izdvajanje klastera detaljnije opisan u [9]. Na slici 2 je duž x-ose predstavljeno uređenje tačaka trajektorije, a po y-osi udaljenost dometa (reachability distance) tačke do najbližeg suseda. Može se uočiti da tačke koje pripadaju istim klasterima imaju male udaljenosti dometa do najbližeg suseda. Prema slici 2, klasterima odgovaraju oblasti koje izgledaju kao udubljenja. Što je veće udubljenje to je klaster gušći. Crvena horizontalna linija predstavlja vrednost udaljenosti po kojoj se vrši klasterovanje. Svako udubljenje koje se formira ispod linije predstavlja jedan klaster. Što se linija više spusti po y-osi, više klastera će biti formirano. Ovaj postupak je praktično implementiran u okviru alata za prikaz rezultata metoda, a iskorišćena je implementacija OPTICS u okviru softverskog alata ELKI 1. Slika 2. Izdvajanje klastera iz OPTICS 2 Nakon što su određeni klasteri pristupa se određivanju epizoda trajektorije. Svaki klaster se obrađuje na sledeći način tačke trajektorije koje ga čine se sortiraju vremenski, a za vremenski marker početka zaustavljanja usvaja se vreme prve tačke iz sortiranog niza. Zatim se formira geometrijska oblast u vidu poligona od tačaka koje čine klaster. Analizira se klaster da bi se otkrile tačke sa velikom vremenskom razlikom kako bi se klaster tu podelio na dva nova klastera (na primer, ako je prošlo više od 4h između dve tačke). Kada se konačno sve tačke trajektorije obrade, postavlja se konačno i vremenski marker za kraj klastera, uzimajući vreme poslednje tačke u nizu. Na kraju ove faze identifikovana su zaustavljanja. Sledeći korak je određivanje kretanja u trajektoriji učitavaju se sve tačke trajektorije i izdvajaju se one koje ne pripadaju klasterima čineći tako skup tačaka kretanja. Konačno treba dodati i semantičke podatke izdvojenim 1 ELKI (http://elki.dbs.ifi.lmu.de/) 2 Wikipedia OPTICS (http://en.wikipedia.org/wiki/optics) 143

epizodama. Od koristi za analizu mobilnih trajektorija su svi raspoloživi podaci o lokacijama na kojima se mobilni objekat zaustavljao počev od tipa ili namene objekta koji se tu nalazi, adrese lokacije, do podataka o stanju, na primer zagušenosti saobraćaja na deonicama puteva. Metoda SEMT je namenjena evaluaciji stranim (third party) resursima podataka koji sadrže putnu mrežu i mesta od interesa. Po ugledu na [8] za različite tipove geografskih objekata se primenjuje drugačiji pristup integracije ovih podataka sa koordinatama pozicije. Za označavanje zaustavljanja traži se presek geometrije klastera i geometrija objekata od interesa. Kada je taj presek pronađen izvršava se integracija opisnih, geografskih i geometrijskih podataka. Tako, za svako semantički označeno zaustavljanje poznato je: ulica i broj, tip objekta, geometrija zgrade, geometriju zaustavljanja, vremenski marker početka i kraja zaustavljanja i identifikator trajektorije. Na slici 3 se može videti primer rezultata uspešno određene semantičke lokacije na osnovu prepoznatog zaustavljanja. Siafu 3 alata za deo grada Niša koji se nalazi unutar oblasti definisane geografskim koordinatama pravougaone oblasti (21.89385, 43.32273 -- 21.90675, 43.31182). Ovaj alat je odabran zbog toga što je to kontekstni simulator i pored kretanja objekata, simulira i njihovo ponašanje u koje vreme su na poslu, koliko vole da rade, da li i koliko često idu na zabave, da li poseduju prevozno sredstvo, kada spavaju itd. Obezbeđena je i odgovarajuća putna mreža i objekti od interesa za odabrani deo grada. Geografski objekti koji su uzeti u obzir kao mesta od interesa su državne ustanove i škole kao mesta rada (offices), parkovi i restorani kao mesta na kojima se provodi slobodno vreme (entertainment) i neki stambeni objekti (homes). Nakon preprocesiranja, trajektorija je svedena na oko 200 slogova u tabeli. Metoda za semantičko označavanje SEMT implementirana je u okviru web GIS aplikacije. Troslojna arhitektura aplikacije je prikazana na slici 4. Slika 3. Semantička lokacija Za označavanje kretanja se za svaku tačku koja ne pripada izdvojenim klasterima ispituje od koje ulice je udaljena zadati broj metara. Kada se takva ulica nađe, pridružuju se naziv ulice, geometrija ulice, geometrija kretanja, vremenski marker početka i kraja kretanja, identifikator trajektorije. Na kraju ovog postupka poznate su informacije o kretanju objekta gde je provodio vreme u toku dana, kuda se kretao u međuvremenu. Na osnovu namene i tipa objekta ili lokacije možemo da zaključimo zašto je tu boravio, na osnovu puteva koje je koristio mogu da se uoče šabloni u njegovom ponašanju i da se čak predvidi kojim putevima će se objekat kretati u zavisnosti od doba dana. Ako su dostupni podaci o zagušenosti saobraćaja mogu se predlagati alternativni putevi i sl. 4. EVALUACIJA METODA I VIZUELIZACIJA REZULTATA Za vizuelizaciju rezultata metoda kreiran je web GIS alat specijalne namene i generisani GPS podaci korišćenjem Slika 4. Arhitektura web GIS aplikacije Osnovni elementi arhitekture su sloj podataka i upravljački sloj koji čine serversku stranu i prezentacioni sloj koji predstavlja klijentsku stranu aplikacije. Prezentacioni sloj web aplikacije koristi GeoExt/OpenLayers okruženje za rad sa geoprostornim objektima, kontrolu i prikaz mapa, markera i upravljanje vektorskim slojevima geografskih objekata. Kao osnovni sloj mape koristi se GoogleMaps. DBMS koji se koristi je PostgreSQL, odnosno njegovo proširenje PostGIS, za rad sa geo-prostornim podacima. Prezentacioni sloj web aplikacije služi za demonstraciju rada gore navedenih metoda. Obuhvata funkcionalnosti za prikaz klastera, prikaz semantičke trajektorije nakon primene odgovarajućih algoritama. Evaluaciji i testiranju su podvrgnuti rezultati metoda SMoT i CB-SMoT dobijeni pomoću WEKA-STPM alata, kao i postupak predstavljen metodom SEMT. U zavisnosti od kombinacije parametara ove metode daju različite rezultate. Razlike se ogledaju u veličini klastera što se odražava na preciznost, odnosno broj nađenih objekata koji odgovaraju jednom zaustavljanju nekada se može izdvojiti i više susednih zgrada, iako je posmatrani mobilni objekat boravio samo na jednom mestu. Naravno, kvalitet rezultata zavisi i od ulaznih podataka jer i realni GPS prijemnici uvode određenu grešku pri lociranju objekata, a po uzoru na to i simulirani podaci nisu previše precizni. Na raspolaganju su tri trajektorije, a optimalni rezultati su postignuti uz dole navedene vrednosti parametara. Za 3 Siafu (http://siafusimulator.sourceforge.net/) 144

evaluaciju SMoT metode određeni su sledeći optimalni parametri za određivanje zaustavljanja: objekti od interesa i ulice označene su zelenom bojom na slici 7. ε = 0.0001 RF Min Time=300 sec Veličina bafera oko tačke se postavlja na 10-tak m (ε se zadaje prema formatu kartografske projekcije) po širini/dužini, a minimalno vreme zadržavanja na 5min. Kao rezultat određena su 22 klastera. Izdvojeni klasteri su prikazani žutom bojom na slici 5a). a) b) c) Slika 5. Rezultat klasterovanja po a) SMoT, b) CB-SMoT i c) SEMT metodi Odgovarajući objekti od interesa na kojima se mobilni objekat zadržao kao i ulice kojima se kretao u međuvremenu, prikazani su ljubičastom bojom na slici 6. Slika 7. CB-SMoT zaustavljanja i kretanja Kod SEMT metode izdvajanje klastera izvršeno je u odnosu na parametre: ε' = 0.00005 r = 0.00002 Gde je ε' oblast koja se koristi u OPTICS algoritmu za određivanje da li tačka pripada oblasti gustine druge tačke, r poluprečnik bafera oko tačaka koje formiraju poligon klastera u formatu korišćenog koordinatnog sistema, što odgovara redu veličine 1-2m. Izdvojeni klasteri prikazani su narandžastom bojom na slici 5c) dok su odgovarajući objekti od interesa i ulice date na slici 8. Primećujemo da je oblast malo preciznije definisana nego u prethodna dva slučaja i da je zadata manja vrednost ε' za ovu metodu da bi se odredili što preciznije objekti od interesa. Za veće vrednosti ε' više susednih objekata bude obuhvaćeno jednim klasterom pa se ne dobijaju jedinstveni rezultati. Slika 6. SMoT zaustavljanja i kretanja Što je manje transparentna zgrada, više klastera je identifikovano na tom mestu. Ovom metodom je prostim traženjem preseka bafera oko tačaka trajektorije i objekata od interesa određeno 5 zaustavljanja za sve tri trajektorije. Parametri sa kojima je otpočeta CB-SMoT analiza su: MaxAvgSpeed = 0.9 MinTime = 60ms MaxSpeed = 1.1 Brojne vrednosti za zadavanje brzine odnose se na razlomljene vrednosti od 0 do 1 što odgovara 0-100% od maksimalne brzine na putanji. Pronađena su 4 klastera prikazana crvenom bojom na slici 5b). Kod ove metode minimalno vreme zadržavanja i veličina bafera oko tačke nema većeg uticaja na određivanje klastera, za razliku od podešavanja maksimalne prosečne brzine. Odgovarajući Slika 8. SEMT zaustavljanja i kretanja Konačan rezultat predstavlja semantička trajektorija i prikazana je na slici 9. 145

lokacija objekta na osnovu trenutne lokacije i njegovog ranijeg kretanja. Tako bi se zaključno sa otkrivanjem novih informacija zaokružio ovaj proces. Analizom semantičke trajektorije moguće je otkriti kontekstne i druge informacije od interesa kao što su semantičke sličnosti, šabloni ponašanja, analize i statistike kretanja itd. Informacije o trajektorijama mobilnih objekata već danas imaju sve veću primenu u upravljanju saobraćajem, urbanističkim planiranjima, mobilnim komunikacijama, geomarketingu i turizmu, a bez ovakvog postupka bilo bi nemoguće razumeti neko mobilno ponašanje. ZAHVALNICA Istraživanja prezentovana u ovom radu delimično su finansirana od strane Ministarstva prosvete i nauke Republike Srbije u okviru projekta "Istraživanje klimatskih promena i njihovog uticaja na životnu sredinu praćenje uticaja, adaptacija i ubalažavanje", ev. broj III- 43007. Slika 9. Semantička trajektorija po SEMT Web GIS alat formira ovakvu trajektoriju na osnovu prethodnih rezultata svake od metoda, a reprezentativno je na slici 9 prikazan rezultat SEMT metode za jednu trajektoriju. Svako zaustavljanje se obeležava slikom koja upućuje na tip objekta, na primer, prikazane kućice su zaustavljanja u stambenim objektima, slika zgrade predstavlja poslovne objekte, ovde konkretno zgradu osnovnog suda, itd. Zaustavljanje karakteriše i vremenski period koji je objekat tu proveo kao i adresu objekta. Kretanja su označena opet vremenom koje je posmatrani objekat proveo u putu i ulice kojima se kretao. Prikazana semantička trajektorija se može protumačiti na sledeći način dana 2. januara 2009. osoba je boravila u stambenom objektu na adresi Oblačića Rada br. 6, u 06:00h. Zatim je putovala ulicama Obrenovićevom, Dušanovom,, Sinđelićev Trg u periodu od 06:00-08:27h kada je stigla u zgradu Osnovnog suda i tu ostala do 16:24h. Nakon toga je putovala nazad do stana gde je boravila od 18:43-21:10h. 5. ZAKLJUČAK U ovom radu obrađene su tehnike semantičkog označavanja lokacija i formiranja semantičke trajektorije, kao i metode za ekstrakciju epizoda trajektorije na kojima se mobilni objekat zaustavljao i kretao. Primenjeni su alati koji automatizuju ovaj proces i implementirana nova metoda za dodavanje semantičkih informacija trajektoriji mobilnog objekta. Mogući nastavak rada bio bi usmeren ka implementaciji metoda za sematičko označavanje mobilnih trajektorija za Android platformu sa ciljem mobilnosti i primenljivosti na terenu, a kasnije i u smeru primene nekih od algoritama za data mining na dobijene semantičke trajektorije. Kao posledica ovoga bi se mogla predvideti sledeća LITERATURA [1] Spaccapietra, S., Parent, C., Damiani, M.L., de Macedo, J.A., Porto, F., Vangenot, C., A conceptual view on trajectories, Data Knowl. Eng, 2008. [2] Liu, J., Wolfson, O., Yin, H., Extracting Semantic Location from Outdoor Positioning Systems, MDM, 2006. [3] Kang, J.H., Welbourne, W., Stewart, B., Borriello, G., Extracting places from traces of locations, WMASH, 2004. [4] Alvares, L.O., Bogorny, V., Kuijpers B., de Macêdo, J.A.F., Moelans, B., Vaisman, A.A., A Model for Enriching Trajectories with Semantic Geographical Information, GIS, 2007. [5] Palma, A.T., Tietbohl, A., A Clustering-based Approach for Discovering Interesting Places in Trajectories, SAC, 2008. [6] Alvares, L.O., Palma A.L., Oliveira, G., Bogorny, V., Weka-STPM: from trajectory samples to semantic trajectories, Proc of the XI Workshop de Sofware Livre, Porto Alegre, 21-24, p.164-169, 2010. [7] Bogorny, V., Avancini, H., de Paula, B.C., Alvares L.O., Kuplich, C.R., Weka-STPM: a Software Architecture and Prototype for Semantic Trajectory Data Mining and Visualization, Transactions in GIS, Volume 15, Number 2, p. 227-248, 2011. [8] Yan, Z., Chakaborty, D., Parent, C., Spaccapietra, S., Aberer, K., SeMiTri: A Framework for Semantic Annotation of Heterogeneous Trajectories, EDBT, 2011. [9] Ankerst, M., Breunig, M.M., Kriegel, H.P., Sander, J., OPTICS: Ordering Points To Identify the Clustering Structure, ACM SIGMOD Record Volume 28 Issue 2, 1999. 146