Mašinsko učenje Uvod. Bojan Furlan УНИВЕРЗИТЕТ У БЕОГРАДУ ЕЛЕКТРОТЕХНИЧКИ ФАКУЛТЕТ

Similar documents
MAŠINSKO UČENJE. JELENA JOVANOVIĆ Web:

Klasterizacija. NIKOLA MILIKIĆ URL:

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije

Priprema podataka. NIKOLA MILIKIĆ URL:

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd,

STABLA ODLUČIVANJA. Jelena Jovanovic. Web:

Podešavanje za eduroam ios

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB.

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri.

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan.

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine

Port Community System

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ

BENCHMARKING HOSTELA

STRUČNA PRAKSA B-PRO TEMA 13

PROJEKTNI PRORAČUN 1

Poboljšanje tačnosti klasifikacije algoritama za induktivno učenje pravila primenom metoda prethodnog učenja

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA

Nejednakosti s faktorijelima

Struktura indeksa: B-stablo. ls/swd/btree/btree.html

INFORMACIONI SISTEMI ZA PODRŠKU MENADŽMENTU

MODEL OBJEKTI - VEZE KONCEPTI MODELA METODOLOGIJA MODELIRANJA

Uvod u relacione baze podataka

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA:

СТРУКТУРА СТАНДАРДА СИСТЕМАМЕНАЏМЕНТАКВАЛИТЕТОМ

5. Asocijacijska pravila

KOMPARATIVNA ANALIZA PREDIKTIVNIH TEHNIKA RUDARENJA PODATAKA

Uvod. Uvod u strojno učenje. Motivacija. Automatizirano prikupljanje znanja. Automatizirano prikupljanje znanja

CILJ UEFA PRO EDUKACIJE

Mogudnosti za prilagođavanje

Otpremanje video snimka na YouTube

Ciljevi. Poslije kompletiranja ove lekcije trebalo bi se moći:

Bušilice nove generacije. ImpactDrill

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE

fontool alat za klasifikaciju i generisanje računarskih fontova

SAS On Demand. Video: Upute za registraciju:

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION

Sveučilište Jurja Dobrile u Puli Fakultet ekonomije i turizma «Dr. Mijo Mirković» SARA NIKOLAŠEVIĆ METODE I PROGRAMI ZA RUDARENJE PODATAKA

WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET!

Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi

Struktura i organizacija baza podataka

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze

EKSPLORATIVNA ANALIZA PODATAKA IZ SUSTAVA ZA ISPORUKU OGLASA

Practical training. Flight manoeuvres and procedures

Rešavanje problema pomoću računara

RANI BOOKING TURSKA LJETO 2017

CRNA GORA

Primena algoritma stabla odlučivanja u prepoznavanju ponašanja i zdravstvenih rizika kod starijih osoba

Univerzitet u Beogradu Matematički fakultet. Mašina pravila ekspertski sistem dokazivanja zasnovan na pravilima. master rad

WWF. Jahorina

Pregled metodologija:

Primena istraživanja podataka za otkrivanje obrazaca u oblasti kulinarskih recepata

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU

FILOGENETSKA ANALIZA

MODEL ZA SELEKCIJU POSLOVNIH PROCESA I METODOLOGIJA NJIHOVOG POBOLJŠANJA

Dr.Miroljub Banković, prof. Kragujevac, 2008.

Windows Easy Transfer

PERSONAL INFORMATION. Name: Fields of interest: Teaching courses:

TEHNO SISTEM d.o.o. PRODUCT CATALOGUE KATALOG PROIZVODA TOPLOSKUPLJAJUĆI KABLOVSKI PRIBOR HEAT-SHRINKABLE CABLE ACCESSORIES

1. Instalacija programske podrške

Testiranje koda - JUnit. Bojan Tomić

En-route procedures VFR

TEHNIĈKO VELEUĈILIŠTE U ZAGREBU ELEKTROTEHNIĈKI ODJEL Prof.dr.sc.KREŠIMIR MEŠTROVIĆ POUZDANOST VISOKONAPONSKIH PREKIDAĈA

MRS MRSLab09 Metodologija Razvoja Softvera Vežba 09

MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE

UNAPREƉENJE MODELA POSLOVNOG ODLUČIVANJA SISTEMOM ASOCIJATIVNIH PRAVILA

FAKULTET ZA POSLOVNU INFORMATIKU

Tutorijal za Štefice za upload slika na forum.

Primena tehnika veštačke inteligencije u prepoznavanju oblika na slikama

24th International FIG Congress

Tema 11 Analiza algoritama, pretraživanje i sortiranjeu jeziku Python

3D GRAFIKA I ANIMACIJA

KABUPLAST, AGROPLAST, AGROSIL 2500

ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA

Materijali za pripremu usmenog ispita Predmet: Procesi razvoja softvera

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020.

Modeli podataka. Model podataka - osnovne komponente

INFORMACIONI SISTEMI ZA PODRŠKU MENADŽMENTU

OBJEKTNO ORIJENTISANO PROGRAMIRANJE

Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE)

Croatian Automobile Club: Contribution to road safety in the Republic of Croatia

Big Data: kako smo došli do Velikih podataka i kamo nas oni vode

DEFINISANJE TURISTIČKE TRAŽNJE

MRS MRSLab08 Metodologija Razvoja Softvera Vežba 08

Univerzitet u Beogradu Fakultet organizacionih nauka Miloš Milić

- Vežba 1 (dodatan materijal) - Kreiranje Web šablona (template) pomoću softvera Adobe Photoshop CS

SVEUČILIŠTE U ZAGREBU FAKULTET STROJARSTVA I BRODOGRADNJE DIPLOMSKI RAD VIKTORIJA IVANDIĆ. Zagreb, godina 2016.

PLAN RADA. 1. Počnimo sa primerom! 2. Kako i zašto? 3. Pejzaž višestruke upotrebe softvera 4. Frameworks 5. Proizvodne linije softvera 6.

MRS. MRSLab03 Metodologija Razvoja Softvera Vežba 03 LAB Dijagram aktivnosti

Algoritamski aspekti razvoja i implementacije Web pretraživača

Donosnost zavarovanj v omejeni izdaji

prese presses proizvedene u kija-inoxu made by kija-inox

TEHNIKA I INFORMATIKA U OBRAZOVANJU

UPUTSTVO. za ruter TP-LINK TD-854W/ TD-W8951NB

Sveučilište Jurja Dobrile u Puli Fakultet ekonomije i turizma «Dr. Mijo Mirković» SARA IBRULJ CRM SUSTAV PODUZEĆA RUDAN D.O.O.

Transcription:

Mašinsko učenje Uvod Bojan Furlan УНИВЕРЗИТЕТ У БЕОГРАДУ ЕЛЕКТРОТЕХНИЧКИ ФАКУЛТЕТ

Šta je to mašinsko učenje? Disciplina koja omogućava računarima da uče bez eksplicitnog programiranja (Arthur Samuel 1959). 1. Generalizacija znanja na osnovu prethodnog iskustva (podataka o pojavama/entitetima koji su predmet učenja) 2. Dobijeno znanje koristi se kako bi se dali odgovori na pitanja za entitete/pojave koji nisu ranije viđeni

Primer

Definicija (Tom Mitchell 1998) Za kompjuterski program se kaže da uči iz iskustva E (experience), vezanog za zadatak T (task), i meru performansi P (performance), ukoliko se njegove performanse na zadatku T, merene metrikama P, unapređuju sa iskustvom E

Primer Program koji označava kreditne zahteve kao dobre (Good) i loše (Bad) Zadatak (T): klasifikacija zahteva na Good/Bad Iskustvo (E): zahtevi prethodno označeni kao dobri i loši kreditni rizici (stvarni ishodi) Performanse (P): procenat korektno klasifikovanih zahteva kao Good/Bad

Prednosti ML-a? 1. Vrlo je teško precizno (algoritamski) opisati neke vrste zadataka koje ljudi lako rešavaju. Primeri: prepoznavanje lica (face detection), prepoznavanje govora (speech recognition) 2. Za neke vrste zadataka mogu se definisati algoritmi za rešavanje, ali su ti algoritmi vrlo složeni i/ili zahtevaju velike baze znanja Primer: automatsko prevođenje (MT)

Prednosti ML-a? 3. U mnogim oblastima se kontinuirano prikupljaju podaci sa ciljem da se iz njih nešto sazna ; npr: u medicini: podaci o pacijentima i terapijama u marketingu: o korisnicima/kupcima i tome šta su kupili, za šta su se interesovali, kako su proizvode ocenili, Analiza podataka ovog tipa zahteva pristupe koji će omogućiti da se otkriju pravilnosti, zakonitosti u podacima koje nisu ni poznate, ni očigledne, a mogu biti korisne (Data mining)

IR vs. ML vs. DM Pretraživanje informacija (Information retrieval IR) je pronalaženje postojećih informacija što je brže moguće. Primer: veb pretraživač pronaći stranicu u okviru (velikog) skupa postojećih Mašinsko učenje (Machine learning ML ) je skup tehnika koje generalizuju postojeće znanje nad novim podacima, što je moguće preciznije. Primer: prepoznavanje govora Data mining DM se prvenstveno odnosi na otkrivanje nečega skrivenog unutar podataka, nekih novih zakonitosti koje nisu ranije bile poznate. Primer: CRM analiza kupaca

IR vs. ML vs. DM Sve tri oblasti se ukrštaju i dele mnoge tehnike: DM i IR koriste indeksne strukture kako bi ubrzale proces. DM koristi mnoge ML tehnike Npr. zavisnost prepoznata u skupu podataka, koja predstavlja generalizaciju znanja, može biti i neko novo znanje

Oblasti primene Klasifikacija Predikcija Grupisanje Asocijacija

Klasifikacija U klasifikaciji postoji ciljana kategorička promenljiva (atribut), čiju vrednost treba odrediti. Klasifikacija se odnosi na dodelu pojave/entitete u određenu kategoriju na osnovu vrednosti ostalih atributa.

Klasifikacija - primer Ostali primeri: Kategorizacija teksta prema temi (npr. sport, politika,...), iskazanim osećanjima, itd.

Predikcija Sličan postupak klasifikaciji, s tim što ciljani atribut predstavlja numeričku vrednost. Predicting the price of a stock three months in the future

Grupisanje Grupisanje (Clustering) se odnosi na grupisanje pojava/entiteta u grupe (klastere) sličnih objekata. Klaster je kolekcija pojava/entiteta koji su međusobno slični, a značajno se razlikuju od onih pojava/entiteta u drugim klasterima. Grupisanje se razlikuje od klasifikacije: ne postoji ciljni atribut za grupisanje. Algoritam nastoji da segmentira ceo skup podataka u homogene podgrupe ili klastere: gde sličnost podataka u okviru klastera je maksimalna, a sličnost sa podacima izvan klastera je sveden na minimum.

Grupisanje - primeri Grupisanje klijenata na osnovu demografskih podataka. Grupisanje reči iz dokumenata koje opisuju teme (topic modeling).

Asocijacija Zadatak asocijacije je da pronađe koje pojave/entiteti idu zajedno. Asocijacija otkriva pravila za kvantifikovanje odnosa između dva ili više atributa. Dobijena pravila su u obliku IF uslov THEN konsekvenca Sa merom zastupljenosti i pouzdanosti za pravilo

Asocijacija - pirmer U supermarketu od 1000 kupaca, 200 su kupili pelene, i od tih 200 koji su kupili pelene, 50 je kupilo pivo. Pravilo asocijacije će biti IF pelene THEN pivo Uz zastupljenost 200/1000 = 20% i pouzdanost 50/200 = 25%.

Proces mašinskog učenja Prikupljanje/ razumevanje Priprema Upotreba Izbor atr/alg Modelovanje Evaluacija

Podaci Potrebni su za trening, validaciju i testiranje modela Tipična podela na 60% za trening, 20% za validaciju i 20% za testiranje Izbor uzoraka treba uraditi na slučajan način (random selection)

Atributi (features) Model treba da verno opisuje pojave/entitete Zato prepoznajemo osobine i odnose u datom domenu i predstavljamo ih atributima Izazov je odabrati prave atribute

Atributi - primeri Za kreditne zahteve: vrednost imovine podnosioca, primanja, zaposlenje, bračno stanje, itd. Za identifikaciju nepoželjne elektronske pošte (spam): naslov, prisustvo tipičnih reči (buy, visit, ), dužina email-a, broj primalaca, itd.

Testiranje Procena uspešnosti modela Koriste se podaci kojima model nije imao pristup u fazi učenja (20-30% ukupnih podataka) Uspešnost se utvrđuje različitim metrikama: tačnost, preciznost, odziv,

TRAIN/VALIDATE/TEST Pored treniranja i testiranja modela, najčešće se radi i validacija modela kako bi se: a) izabrao najbolji model između više kandidata b) odredila optimalna konfiguracija parametara modela c) izbegli problemi over/under-fitting-a ukupan skup podataka se deli u odnosu 60/20/20 na podatake za trening, validaciju i testiranje Podaci za validaciju koriste se za poređenje performansi različitih modela (a); izabranog modela sa različitim vrednostima parametara (b)

Analiza greške ručno pregledanje primera na kojima je model pogrešio Pomaže da se stekne osećaj zbog čega model greši i šta bi se moglo uraditi da se greške otklone; npr: identifikovati suvišne atribute identifikovati atribute koji nedostaju drugačije podesiti parametre modela

Reference Mašinsko učenje, Jelena Jovanović, Fakultet Organizacionih Nauka, http://jelenajovanovic.net/ Coursera: https://www.coursera.org/course/ml Discovering Knowledge in Data: An Introduction to Data Mining (Wiley, 2005) Larose D.