MASTER RAD. Tema: Komparacija CATI i CAWI metoda za prikupljanje podataka i njihov uticaj na preţivljavanje preduzeća u longitudinalnom uzorku

Size: px
Start display at page:

Download "MASTER RAD. Tema: Komparacija CATI i CAWI metoda za prikupljanje podataka i njihov uticaj na preţivljavanje preduzeća u longitudinalnom uzorku"

Transcription

1 UNIVERZITET U NOVOM SADU CENTAR ZA PRIMENJENU STATISTIKU MASTER RAD Tema: Komparacija CATI i CAWI metoda za prikupljanje podataka i njihov uticaj na preţivljavanje preduzeća u longitudinalnom uzorku Mentor: Student: Dr Andreja Tepavčević Jelena Jojkić 6/2012 Novi Sad, jun 2017.

2 Univerzitet u Novom Sadu Univerzitetski centar za primenjenu statistiku - UCPS Ključna dokumentacijska informacija Redni broj: RBR Identifikacioni broj: IBR Tip dokumentacije: TD Tip zapisa: TZ Vrsta rada (dipl., mag., dokt.): VR Ime i prezime autora: AU Mentor (titula, ime, prezime, zvanje): MN Naslov rada: NR Jezik publikacije: JP Jezik izvoda: JI Zemlja publikovanja: ZP Uţe geografsko područje: UGP Godina: GO Izdavač: IZ Mesto i adresa: MA Fizički opis rada: FO Naučna oblast: NO Monografska dokumentacija Tekstualni štampani materijal Master rad Jelena Jojkić Dr Andreja Tepavčević, profesor Komparacija CATI i CAWI metoda za prikupljanje podataka i njihov uticaj na preţivljavanje preduzeća u longitudinalnom uzorku Srpski (latinica) srp. / eng. Srbija Novi Sad, Vojvodina autorski reprint Trg Dositeja Obradovića 5 (7 poglavlja / 104 stranica / 0 slika / 5 grafikona/ 98 tabela / 40 referenci / 9 priloga) Statistika 2

3 Naučna disciplina: ND Predmetna odrednica, ključne reči: PO UDK Čuva se: ČU Vaţna napomena: VN Izvod: IZ Statistika u društvenim naukama Koks PH model, ordinalna regresija, logistička regresija, hi kvadrat test, Kruskal-Wallis, Mann- Whitney U test, korelacija, privredni subjekti, preţivljavanje Biblioteka U radu se vrši komparacija CATI i CAWI metode sakupljanja podataka u odnosu na vreme preţivljavanja tokom longitudinalnog istraţivačkog projekta. Uzorak su činila preduzeća koja učestvuju u projektu Narodne banke Srbije, u trajanju 23 meseca. Pored metoda sakupljanja podataka kao glavnog prediktora, testirani su i uticaji drugih varijabli (prekid u kontinuitetu sakupljanju podataka, veličina preduzeća, broj zaposlenih, region, delatnost). Rezultati dobijeni Koks PH modelom ukazuje na statistički značajan uticaj veličine preduzeća na vreme preţivljavanja preduzeća; ordinalnom regresijom (čiji je rezultat nesiguran), veličine preduzeća i broja zaposlenih u njima; logističkom regresijom uticaj regiona na prekid u kontinuitetu sakupljanja podataka, Mann-Whitney U testom, dobijen je značajan prediktor prekid u kontinuitetu sakupljanja podataka u odnosu na vreme preţivljavanja. Ostali prediktori, dobijeni navedenim analizama, kao ni hi-kvadrat testom, Kruskal-Wallis testom ili korelacijom nisu bili značajni. Zaključuje se da metoda sakupljanja podataka CAWI ili CATI na uzorku preduzeća ne utiče na duţinu preţivljavanja u longitudinalnom uzorku. Datum prihvatanja teme od strane NN veća: DP Datum odbrane: DO 3

4 Članovi komisije: (ime i prezime / titula / zvanje / naziv organizacije / status) KO predsednik: dr Andreja Tepavčević, redovni profesor, Prirodno-matematički fakultet Novi Sad, član: dr Zorana Luţanin, redovni profesor, Prirodno-matematički fakultet Novi Sad član: dr Mirko Savić, redovni profesor, Ekonomski fakultet u Subotici 4

5 University of Novi Sad University Center for Applied Statistics Key word documentation Accession number: ANO Identification number: INO Document type: DT Type of record: TR Contents code: CC Author: AU Mentor: MN Title: TI Language of text: LT Language of abstract: LA Country of publication: CP Locality of publication: LP Publication year: PY Publisher: PU Publication place: PP PHysical description: PD Scientific field SF Monograph documentation Textual printed material Master s thesis Jelena Jojkić Dr Andreja Tepavčević, Professor Comparison of CATI and CAWI data collecting method and their impact on companies survival in the longitudinal sample Serbian (Latin) eng. / srp. Serbia Novi Sad, Vojvodina Author s publication Trg Dositeja Obradovića 5 (7 chapters / 104 pages / 0 picture /98 tabels/ 5 graphs / 40 bibliographic citations / 9 appendices) Applied statistics 5

6 Scientific discipline SD Subject, Key words SKW Statistics in social sciences Cox PH model, Ordinal regression, Logistic regression, Chi square test, Kruskal-Wallis, Mann-Whitney U test, correlation, corporate sector, survival UC Holding data: HD Note: N Abstract: AB Accepted on Scientific Board on: AS Library During the operation, CATI and CAWI data collection methods are being compared relative to survival time during the longitudinal research project. The sample involved companies taking part in a 23-month project run by the National Bank of Serbia. In addition to gathering of data as the main predictor, influences of other variables (suspension in data collection continuity, the size of the company, number of employees, region, activity) have been tested. The results gained through Cox PH model indicate statistically important influence of the size of a company on a company s survival time; the results of ordinal regression (which produces uncertain results) indicate the influence of the size of a company and the number of its employees; logistic regression indicates the influence of a region on a suspension in continuity of data collection. Mann-Whitney U test produced a major predictor a suspension in continuity of data collection on a company s survival time in a sample. Other predictors, gained through the mentioned analyses, the Chi-squared test, Kruskal-Wallis test, or correlation were not significant. The conclusion is that the data collection method CAWI or CATI on a company sample do not affect the survival time in the longitudinal sample. 6

7 Defended: DE Thesis Defend Board: DB president: dr Andreja Tepavčević, full professor, Faculty of Sciences Novi Sad member: dr Zorana Luţanin, full professor, Faculty of Sciences Novi Sad, member: dr Mirko Savić, full professor, Faculty of economics Subotica. 7

8 REZIME U radu se vrši komparacija CATI i CAWI metode sakupljanja podataka u odnosu na vreme preţivljavanja tokom longitudinalnog istraţivačkog projekta. Uzorak su činila preduzeća koja učestvuju u projektu Narodne banke Srbije, u trajanju 23 meseca. Pored metoda sakupljanja podataka kao glavnog prediktora, testirani su i uticaji drugih varijabli (prekid u kontinuitetu sakupljanju podataka, veličina preduzeća, broj zaposlenih, region, delatnost). Rezultati dobijeni Koks PH modelom ukazuju na statistički značajan uticaj veličine preduzeća; ordinalnom regresijom (čiji je rezultat nesiguran), veličine preduzeća i broja zaposlenih u njima; logističkom regresijom uticaj regiona na prekid u kontinuitetu sakupljanja podataka. Mann-Whitney U testom, dobijen je značajan prediktor prekid u kontinuitetu sakupljanja podataka na vreme preţivljavanja preduzeća u uzorku. Ostali prediktori, dobijeni navedenim analizama, kao ni hi-kvadrat testom, Kruskal-Wallis testom ili korelacijom nisu bili značajni. Zaključuje se da metoda sakupljanja podataka CAWI ili CATI na uzorku preduzeća ne utiče na duţinu preţivljavanja u longitudinalnom uzorku. Ključne reči: CATI, CAWI, Koks PH model, ordinalna regresija, logistička regresija, hi-kvadrat test, Kruskal-Wallis, Mann-Whitney U test, korelacija, privredni subjekti, vreme preţivljavanja 8

9 ABSTRACT During the operation, CATI and CAWI data collection methods are being compared relative to survival time during the longitudinal research project. The sample involved companies taking part in a 23-month project run by the National Bank of Serbia. In addition to gathering of data as the main predictor, influences of other variables (suspension in data collection continuity, the size of the company, number of employees, region, activity) have been tested. The results gained through Cox PH model indicate statistically important influence of the size of a company on a company s survival time; the results of ordinal regression (which produces uncertain results) indicate the influence of the size of a company and the number of its employees; logistic regression indicates the influence of a region on a suspension in continuity of data collection. Mann-Whitney U test produced a major predictor a suspension in continuity of data collection on a company s survival time in a sample. Other predictors, gained through the mentioned analyses, the Chi-squared test, Kruskal-Wallis test, or correlation were not significant. The conclusion is that the data collection method CAWI or CATI on a company sample do not affect the survival time in the longitudinal sample. Key words: CATI, CAWI, Cox PH model, Ordinal regression, Logistic regression, Chisquare test, Kruskal-Wallis, Mann-Whitney U test, correlation, corporate sector, survival time 9

10 SADRŢAJ 1.UVOD OPŠTI TEORIJSKI DEO Opšti problem istraţivanja Ciljevi istraţivanja Hipoteze istraţivanja Pojmovi ANALIZA PREŢIVLJAVANJA I KOKS MODEL PROPORCIONALNOG RIZIKA Analiza preţivljavanja Notacija u okviru analize preţivljavanja Funkcija preţivljavanja Funkcija rizika Koks PH model Ocena parametara Koks PH modela Količnik rizika PrilagoĎene krive preţivljavanja PH modela PH pretpostavka Upotreba modela Dijagnostikovanje modela ORDINALNA REGRESIJA Linearni modeli Regresija Ordinalna regresija Uslovi i pretpostavka ordinalne regresije: Osnovni koncepti ordinalne regresije: Kumulativni model proporcionalnih verovatnoća Neprekidni Racio model Model susednih kategorija LOGISTIČKA REGRESIJA Uvod u logističku regresiju Pretpostavke logističke regresije i izraz Fitovanje modela Procenjivanje modela: Log-likelihood Procenjivanje modela: R i R Testiranje značajnosti koeficijenata modela

11 1.4.7.Procenjivanje modela: Wald statistika EXP(B) Višestruki logistički model Interpretacija modela logističke regresije χ 2 test Mann -Whitney U i Kruskal-Wallis testovi Mann-Whitney U test Kruskal-Wallis test Koeficijent korelacije Spirmanov koeficijent korelacije Kendalov tau koeficijent korelacije Kendalov koeficijent konkordance W METODOLOŠKI DEO Metoda sakupljanja podataka CATI Metoda sakupljanja podataka CAWI Metoda sakupljanja podataka PAPI Metoda sakupljanja podataka CAPI Opis metodologije sakupljanja podataka Narodne banke Srbije Uzorkovanje preduzeća Ispitanici Merni instrument Varijable i ostali podaci o projektu REZULTATI DESKRIPTIVNA STATISTIKA KOKS PH MODEL ORDINALNA REGRESIJA LOGISTIČKA REGRESIJA χ2 TEST Kruskal-Wallis i Mann-Whitney U testovi KORELACIJE VARIJABLI DISKUSIJA Uvodni deo Sumirani rezultati ZAKLJUČAK LITERATURA PRILOZI

12 Prilog 1. Output statistike opisa uzorka Prilog 2- Analiza preţivljavanja output iz SPSS Prilog 3.- Ordinalna regresija, Ispis iz SPSS Prilog 4.- Logistička regresija Ispisi iz SPSS Prilog 5. Output Ukrštanje broja trajanja u uzorku u odnosu na prediktorske varijable, bez računanja statističke značajnosti (ANOVE) Prilog 6 Χ² test output, ukrštanje sa rekodiranom zavisnom varijablom Prilog 7 - Korelacije varijabli Prilog 8. - Mann Whiteny Prilog 9.- Kruskal Wallis

13 1. UVOD Tema rada je smeštena u okviru naučne grane statistike. Sama reč statistika ima poreklo od latinske reči status (stanje) i italijanske reči stato (drţava). Potreba za upotrebnom statistike postojala je od najranijih dana. Istorijski gledano, u periodu 4000 do 3000 godina pre Nove ere, različite civilizacije (kao što su Egipat, Grčka, Rim, Kina) su koristile prebrojavanje (frekvencije) u cilju planiranja rata i razvoja tadašnjih ekonomija. U periodu postojanja rimske drţave, vršen je popis stanovništva svakih 5 godina. Ovaj vid upotrebe statistike je kasnije proširen sa popisa stanovništva, na popis stoke i vlasništva. Tokom vremena, razvoj statistike je bio ubrzan. U odnosu na najranije dane se izmenila i postala kompleksnija a značajan napredak u njenom razvoju je bilo povezivanje teorije teorije verovatnoće sa statistikom, koje je napravio belgijski astronom i statističar Adolf Kvetlet. On bi se mogao nazvati ocem statistike. Statistička analiza u današnje vreme podrazumeva teorijsko znanje i softversko apliciranje. Pred statističarem modernog vremena su postavljeni visoki zahtevi. Ukoliko se posmatra jednostavna definicija da je statistika skup metoda sakupljanja, sumiranja, analiziranja i izvlačenja zaključaka iz podataka (Petrie, Sabin, 2000), statističar treba da je upoznat sa svim vrstama metoda za sakupljanje podataka (CAPI, PAPI, CATI, CAWI, I-CAWI ), da poznaje moderne softvere koji se sve više primenjuju u prikupljanju podataka, da zna da uzorkuje, oblikuje merni instrument, obraďuje podatke, donosi zaključke, piše izveštaje i prezentuje rezultate. Razvojem informacionih tehnologija, statistika je znatno napredovala, kako po pitanju razvijenih softvera za obradu podataka (SPSS, SAS, S-PLUS, STATA, SPIDA, R, Statistica i mnogi drugi), tako i softvera za sakupljanje podataka. Trenutno na trţištu postoje brojni softveri za statističke namene. Sve navedeno je neophodno, uz primesu znanja iz IT-a, metodologije, istraţivačkog iskustva, poznavanja teorije i primene statističkih znanja, do dizajniranja izveštaja i osmišljavanja istih kako se na što jednostavniji i efikasniji način prezentuju radi lakše manipulacije podacima. Današnjica nosi interdisciplinarni pristup, uvezivanje znanja iz teorije i prakse brojnih disciplina, a primeri u radu bi trebali da to predstave. Osnova svake statističke analize je nivo merenja podataka, tip varijabli, veličina uzorka, (ne)zavisnost podataka, broj grupa koji se poredi. Ponekad postoji situacija da se odgovor na istraţivački problem moţe dobiti na osnovu više analiza. U radu će biti obraďeno više statističkih analiza na teorijskom nivou, a zatim će biti prikazana njihova upotreba na istim podacima. 13

14 1.1. OPŠTI TEORIJSKI DEO Opšti problem istraţivanja Opšti problem istraţivanja je komparacija CATI i CAWI metoda sakupljanja podataka i njihov uticaj na preţivljavanje preduzeća u longitudinalnom uzorku. Potreba za istraţivanjem ovakve vrste nastala je iz ţelje da se postojeći longitudinalni projekat iz prakse unapredi, kako bi ispitanici ostali što duţe u uzorku Ciljevi istraţivanja Osnovni cilj istraţivanja se moţe podeliti na dve komponente koje su vezani za primenjene zaključke koji treba da proizaďu iz rezultata istraţivanja i ostvare svoju vrednost u praksi: UtvrĎivanje uspešnosti CATI i CAWI metode sakupljanja podataka u odnosu na vreme preţivljavanja preduzeća u panel istraţivanju (longitudinalnom uzorku) UtvrĎivanje koje od varijabli koje opisuju preduzeća imaju najveći uticaj na vreme preţivljavanja preduzeća u uzorku: veličina preduzeća, region iz kog potiče preduzeće, broj zaposlenih, delatnost kojom se preduzeće bavi, postojanje ili ne prekida u kontinuitetu sakupljanja podataka Hipoteze istraţivanja Hipoteze istraţivanja koje su postavljene u daljem radu će biti formulisane kao nulte hipoteze u kojima se tvrdi da nema statistički značajne razlike/uticaja meďu obeleţjima. 1. Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu broj meseci preţivljavanja u uzorku. Navedena hipoteza pretpostavlja da su svi regresioni koeficijenti u modelu jednaki 0 i da nema efekta nijedne prediktorske varijable ubačene u model (Koks PH model i ordinalna regresija testiraju istu hipotezu). 2. Ne postoji statistički značajan prediktor koji doprinosi objašnjenju zavisne varijable prekidu u kontinuitetu sakupljanja podataka. 3. Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu prekid u kontinuitetu sakupljanja podataka. 4. Ne postoji statistički značajna veza izmeďu metode preteţnog sakupljanja podataka i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku (delatnosti preduzeća, regiona,veličine preduzeća, broja zaposlenih, prekida u kontinuitetu) 5. Ne postoji statistički značajna razlika u distribuciji varijable broj meseci preţivljavanja u uzorku u odnosu na region (veličinu preduzeća, broj zaposlenih, metod, prekid u kontinutetu, delatnost) 6. Ne postoji statistički značajna povezanost prediktorskih varijabli sa kategorisanim brojem meseci preţivljavanja preduzeća u uzorku Pojmovi Analiza preţivljavanja uopšteno govoreći, analiza preţivljavanja je skup procedura u kojoj je varijabla vreme dok se dogaďaj ne pojavi (Kleinbaum i Klein, 2006) 14

15 Koks PH model matematički model koji se koristi za analizu podataka preţivljavanja (Kleinbaum i Klein, 2006) Regresija je analiza koja objašnjava vezu izmeďu zavisne varijable i jedne ili više nezavisnih, prediktorskih varijabli (Hosmer i Lemeshow, 2000) Ordinalna regresija vrsta regresije u kojoj je zavisna varijabla ordinalnog tipa Logistička regresija - vrsta regresije u kojoj je zavisna varijabla binomna (0/1) CATI Computer Assisted Telephone Interviewing, kompjuterski podrţano telefonsko anketiranje, jedna od često primenljivanih tehnika prilikom sakupljanja podataka CAWI Computer Assisted Web Interviewing, kompjuterski podrţano web anketiranje PAPI - Paper and Pencil Interviewing, istraţivanje putem papira i olovke, što podrazumeva istraţivanje licem u lice sa ispitanikom, a odgovori se unose na unapred pripremljen odštampan merni instrument. CAPI Computer Assisted Personal Interview metoda sakupljanja podataka u kojoj se intervjui odvijaju putem direktnog intervjua sa ispitanikom, a odgovori se unose u ureďaj (tablet, lap top, mobilni telefon) koji je povezan sa serverom na kom je baza podataka. Panel istraţivanje longitudinalno istraţivanje u kojem se ispitivanje vrši na istom skupu privrednih subjekata, u ovom slučaju preduzeća ANALIZA PREŢIVLJAVANJA I KOKS MODEL PROPORCIONALNOG RIZIKA Analiza preţivljavanja Istorijat analize preţivljavanja kreće od ispitivanja trajanja vojne opreme, oko Drugog Svetskog rata (Smith, 2013). Nakon toga, razvija se od statističkih podataka o umrlima, ka onome što danas predstavlja analizi koja moţe da ima široku primenu u različitim sferama, sa akcentom na biomedicinske nauke. Prema Foksu (Fox, 2002), suština analize preţivljavanja je ispitivanje i modeliranje vremena potrebnog da se dogaďaj desi. Pored toga, oslanja se na set statističkih metoda koje su razvijene posebno za modelovanje dogaďaja koji se dešavaju u vremenu (Abdelaal i Zakria, 2015). Ipak, iako se posmatra u biomedicinskim sferama, primena analize preţivljavanja je u stvari mnogo šira (primer analize dogaďaja u istoriji u sociologiji Fox, 2002). U okviru ovog rada, analiza preţivljavanja će biti korišćena u novoj sferi ispitivanja privrednih subjekata u okviru longitudinalnog uzorka. U sferi analize preţivljavanja najpoznatiji metod je Koks PH metod. On je regresioni semiparametrijski model, koji se pokazao robustnost, kako u praksi, tako i u okviru ovog rada. Koks PH model poseduje odreďene karakteristike i od parametrijskog i neparametrijskog modela. Ima više pretpostavki od neparametrijskog, ali manje od parametrijskog modela, pa se moţe reći da koristi najbolje od oba modela (Abdelaal i Zakria, 2015). 15

16 Osnovni cilj analize preţivljavanja je ispitivanje faktora rizika (prediktora) i toga kako oni utiču na vreme preţivljavanja. Navedeno je cilj ovog rada primenjen na uzorak preduzeća. Kako je rečeno da model ima i parametrijski i neparametrijski deo, potrebno je napomenuti da u okviru neparametrijskog dela modela nije neophodno da se ispuni ispuniti pretpostavku o izgledu h(t) i oblik distribucije. U okviru prakse, vaţnije je ispitivati efekte prediktora u odnosu na funkciju rizika nego sam oblik distribucije, pa je Koks PH model adekvatan za tu namenu. Dejvid Koks je autor modela. Engleski statističar, koji je u svoje vreme imao preko 300 radova/knjiga, imao je citiranja samo u okviru analize preţivljavanja. Jedna od specifičnosti kod analize preţivljavaja je termin cenzurisanog vremena neuspeha koji je Koks (1972) posebno razmatrao. Razmatrao je funkciju rizika tokom nepoznate funkcije vremena, kao nepoznatu funkciju mnoţenja prediktorskih varijabli i koeficijenata regresije. Kako bi se bolje razumeo koncept Koks PH modela u daljem radu, potrebno je dati širi referentni okvir u kojem je on smešten analiza preţivljavanja. Ona je po definiciji skup statističkih procedura za analizu podataka za koje je rezultujuća promenljiva od interesa vreme dok se događaj ne desi (Kleinbaum, 1998). U okviru date definicije, potrebno je objasniti pojam dogaďaja. U okviru analize preţivljavanja, koja se kao što je napomenuto najčešće koristi u biomedicinskim naukama, dogaďaj je smrt, bolest ili pojava koja dovodi do prekida daljeg preţivljavanja subjekta. Ovaj rad će raditi primenu analize preţivljavanja na novu sferu, sa ciljnom grupom preduzeća, pa će se pod dogaďajem smatrati njihov prestanak učešća u istraţivanju, odnosno njihovo trajno nepojavljivanje u narednim mesecima istraţivanja. Još jedan od termina koji je vaţan za analizu preţivljavanja je vreme preživljavanja, koje bi u ovom slučaju bilo definisano kao ukupan broj meseci koje je preduzeće preţivelo u projektu istraţivanja koje traje 36 meseci, u trenutku kada je napravljen presek stanja - 23/36 meseci. Pod vremenom će se smatrati ukupan broj meseci (ceo broj) od početka učešća u projektu do njihovog trajnog odustajanja od projekta. Cenzurisani podaci su nov termin koji se javlja kod analize preţivljavanja, a odnosi se na vreme preţivljavanja svakog preduzeća unutar istraţivačkog projekta, prilikom čega ne znamo tačno njegovo vreme preţivljavanja jer je napravljen presek stanja na 23/36 meseci. U radu će se pod cenzurisanim podacima koristiti informacija koliko dugo je preduzeće preţivelo u uzorku. Cenzurisani podaci se mogu klasifikovati na dva tipa (Rodriguez, 2010): Tip I cenzurisanih podataka je vrsta u okviru koje se uzorak n prati neko unapred odreďeno vreme t. Kod tipa I, tačno se zna koliko dugo projekat traje i naziva se fiksiranim cenzurisanjem. Broj ispitanika kojima se desi dogaďaj slučajan, a verovatnoća da će da preţive do kraja unapred definisanog vremena je S(t i ). Potrebno je naglasiti da se u slučaju ovog rada, koristi fiksirano cenzurisanje, jer se unapred zna koliko će istraţivanje da traje 36 meseci na koliko je potpisan ugovor o projektu istraţivanja. Tip II cenzurisanih podataka je malo drugačije koncipiran i predstavlja uzorak ispitanika (jedinica) koje se prate na neodreďeno, nefiksirano vreme onoliko koliko je to potrebno. U okviru ovakvog koncepta, ne zna se unapred koliko će dugo da traje projekat. Naziva se slučajnim cenzurisanjem. U okviru njega, svaki ispitanik ima potencijalno vreme cenzurisanja 16

17 Ci i vreme preţivljavanja Ti. Navedeno vaţi samo ako su u pitanju nezavisne slučajne varijable. Posmatranjem oba tipa cenzurisanja, moţe se reći da u suštini dovode do iste funkcije maksimalne verodostojnosti, a osnovna pretpostavka glasi da je opservacija cenzurisana u trajanju t i da vreme preţivljavanja prevazilazi t. Ipak, navedeni teorijski prikaz daje mogućnost klasifikacije cenzurisanih podataka dizajna istraţivanja koje će se obraďivati u radu Notacija u okviru analize preţivljavanja T predstavlja vreme preţivljavanja preduzeća u okviru istraţivanja (moguće vrednosti su 1-23 maksimalno, koliko traje projekat do vremena obrade podataka), predstavlja nenegativnu slučajnu varijablu. T ima kumulativnu funkciju distribucije P(t) = Pr(T t) i funkciju verovatnoće p(t) = dp(t)/dt. T je varijabla koja reprezentuje vreme dok se dogaďaj ne desi. t - predstavlja odreďenu vrednost za T (na primer, ako postoji interesovanje da li je preduzeće preţivelo više od 12 meseci u uzorku, t=12) δ dihotomna/binarna varijabla, koja ima samo dve moguće vrednosti (0 ili 1), je slučajna varijabla koja ukazuje ili na cenzurisanje ili neuspeh (dogaďaj). U radu je korišćena onako kako se najčešće kodira, tako da 0 predstavlja vreme preţivljavanja koje je cenzurisano, a 1 da se dogaďaj desio i da preduzeće više nije prisutno u uzorku. Ukoliko ne doďe do izostanka preduzeća iz projekta, do kraja studije, cenzurisanje je jedino moguće kao opcija koja ostaje kao vreme preţivljavanja. Tada uzima kod 0 - preduzeće preţivljava do kraja studije. Vreme preţivljavanja preduzeća će biti nenegativno i imati distribucije koje su skjunisane, sa dugačkim repovima. Kako projekat istraţivanja traje 36 meseci a posmatra se fiksirani period od 23 meseca, neka preduzeća će preţiveti u uzorku i nakon posmatranog perioda i ne znamo im tačno vreme preţivljavanja takva preduzeća će biti cenzurisana Funkcija preţivljavanja Naredna notacija se odnosi na funkciju preţivljavanja S(t) i funkciju rizika h(t). Prva, funkcija preţivljavanja S(t) je verovatnoća da će slučajna varijabla T preći specifično vreme t, predstavlja samu osnovu analize preţivljavanja (Kleinbaum, 1998). ( ) ( ) Slede teorijski prikaz krive, kao i prikaz krive u praksi na grafikonu 1. 17

18 Teorijski prikaz krive: Prikaz krive u praksi: Grafikon 1 Teorijski i praktični prikaz krive Razlika u krivama u teoriji i praksi nastaje zbog više stvari. U okviru rada će biti dat grafik funkcije preţivljavanja u kojoj se jasno vidi stepenasti prikaz krive na obraďenim podacima Funkcija rizika h(t) još jedna funkcija koja čini osnovu analize preţivljavanja je funkcija rizika. Predstavlja trenutni potencijal po jedinici vremena da se dogaďaj pojavi, ako se zna da se nije pojavio do momenta t (Kleinbaum, 1998). U konkretnom slučaju bi značilo da je preduzeće preţivelo do momenta t. Funkcija rizika ima suprotnu ulogu u odnosu na funkciju preţivljavanja, ali je vaţno napomenuti to da se odnosi na pojavljivanje dogaďaja (preduzeće odustalo da učestvuje u istraţivačkom projektu) i odnosi se na stopu preţivljavanja, ne verovatnoću. Vaţno je napomenuti da rasponi mogućih vrednosti nisu 0-1 (kao kod verovatnoće), nego se kreću od 0 do jer je stopa. Matematički izraz za funkciju rizika je: h(t)= ( ) Funkcije preţivljavanja i rizika je moguće matematički povezati na sledeći način: S(t) = ( ) h(t)= -* ( ) ( ) + U okviru rada će se moći videti funkcije preţivljavanja i rizika, kako se ponašaju na istim podacima i koliko su meďusobno povezane u okviru dela rezultata istraţivanja. Generalno, ciljevi analize preţivljavanja se mogu klasifikovati na tri najvaţnija (Kleinbaum, 1998): 1. Obraditi funkcije preţivljavanja i rizika (pronaći, izračunati i interpetirati) 2. Komparacija funkcija preţivljavanja i rizika 3. Pronaći postojanje veza izmeďu prediktora i vremena preţivljavanja 18

19 Prva dva cilja u radu će biti ostvarena u obradi podataka, dok je osnovni cilj rada treći procena uticaja prediktorskih varijabli na vreme preţivljavanja Koks PH model Dejvid Koks je razvio svoj PH model godine. U okviru naziva modela, PH znači da model polazi od proporcionalnog rizika. Model se zasniva na pretpostavci da je rizik proporcionalan i da je pri tome moguće oceniti efekte parametara bez obzira na samu formu rizika. Suština modela je posmatranje osnovne funkcije rizika i promenu iste tokom vremena, kao i promenu u odnosu na prediktore u modelu. Koks PH model je model koji ispituje postojanje veza izmeďu prediktorskih varijabli i zavisne varijable. Njegov matematički izraz je: ( ) ( ) ( ) Formulom se opisuje model u kom je rizik u vremenu t za odreďeno preduzuće, sa više prediktorskih varijabli označenih boldovanim X (veličina preduzeća, region, prekid u kontinuitetu, broj zaposlenih, delatnost preduzeća, preteţni metod sakupljanja podataka). Prediktorske varijable X se računaju tako u modelu da mogu da predvide pojedinačne rizike tokom odreďenog vremena t. Formula se moţe razloţiti na dva dela, čime se uviďa da predstavlja proizvod dve veličine. Prva veličina je h 0 (t) - osnovni rizik (uključuje samo vreme, bez prediktora X), dok je druga veličina eksponencijalni deo jednačine, koji sadrţi prediktore, ali ne i vreme t, često se zove vremenski nezavisni X-ovi (predstavlja vaţan deo logike Koks PH modela). Druga formula sadrţi i linearne sume βi Xi. Prema modelu, vremenski nezavisni X-ovi predstavljaju prediktore koji se ne menjaju kroz vreme, koji su relativno stabilni (na primer, posedovanje fakultetske diplome je vremenski nepromenljiva varijabla, kao i delatnost preduzeća, region u kom se nalazi..). Sa druge strane, vremenski zavisni prediktori zahtevaju prošireni deo Koks PH modela, o kojem u ovom radu neće biti reči jer se neće obraďivati podaci tog tipa. U konkretnom slučaju kada su u pitanju preduzeća, relativno su nepromenljive karakteristike koje su date kao prediktorske varijable: region gde se preduzeće nalazi, veličina preduzeća, broj zaposlenih, delatnost, preteţni metod koji odabira za sakupljanje podataka, kontinuitet u sakupljanju podataka, tako da je izbor Koks PH modela sa vremenski nezavisnim prediktorima bio adekvatan izbor za obradu podataka iz rada. Pored navedenih, postoji još jedna karakteristika Koks PH modela. U situaciji kada su prediktori X=0, formula se svodi na osnovu funkciju rizika i tada je eksponencijalni deo formule jednak 0 ( ). U tom slučaju, model nema prediktora. ( ) ( ) ( ) ( ). Još jedna vaţna karakteristika modela je neodreďenost ( ) funkcije, koji potiče od neparametrijskog dela modela, dajući mu fleksibilnost. Funkcionalna forma nije odreďena, ali se ipak odreďuju vrednosti nepoznatih parametara. Celokupan proces se moţe svesti na tri koraka: 19

20 1. Procena svih β i njihovih statističkih karakteristika 2. Testiranje hipoteze H0 : β = 0 3. Dijagnostikovanje modela Napominje se da se navedeno odnosi na svaki parametar β koji se nalazi u modelu Ocena parametara Koks PH modela Parametri u Koks PH modelu su razumevanja: koeficijenti. Formula će biti ponovljena radi lakšeg ( ) ( ) Metodom maksimalne verodostojnosti se vrši ocean parametara, dok se dobijeni rezultat označava sa. Najjednostavnije rečeno, metoda maskimalne verodostojnosti maksimizira funkciju verodostojnosti pomoću L(β) (u tom slučaju β predstavlja skup nepoznatih parametara). Ceo proces iteracija kojima se računa funkcija maksimalne verodostojnosti i ocena parametara je kompleksan i biće prikazan samo suštinski deo. Metoda maksimalne verodostojnosti sadrţi verovatnoće za one ispitanike kojima se desio dogaďaj, a isključuje ispitanike koji su u tom procesu cenzurisani. Tako se dobija parcijalna funkcija verodostojnosti. Matematički, prikazuje se kao proizvod više funkcija verodostojnosti, prilikom čega svaka od njih se računa pojedinačno, za svaki od k neuspeha (jer uključuje samo ispitanike kojima se desio dogaďaj): Gde: Indeksi 1 do k predstavljaju interval u kojima se desio dogaďaj. predstavlja proporciju L za svaki j-to vreme dogaďaja, tako da se moţe videti tačno vreme preţivljavanja preduzeća do tog vremena. Preduzeća pod rizikom kojima moţe da se desi dogaďaj u nekom vremenu čine grupu rizika ( ( ) ). Na taj način se dobija da se grupa rizika smanjuje protokom vremena. Kao što je napomenuto, funkcija neće razmatrati cenzurisane ispitanike ali u toj situaciji - ako se desi cenzurisanje, biće deo grupe rizika koja se koristi za računanje. Nakon što se formira funkcija verodostojnosti, sledeći korak je da se maksimalizuje. Maksimalizacija se radi tako što se izjednačavaju parcijalni izvodi funcije L za svaki parameter koji postoji u modelu sa 0. Time se dobije sistem jednačina oblika: Potrebna su sledeća tri koraka za ocenu parametara: Formiranje funkcije ( ) Maksimiziranje ( ) ili maksimiziranje ( ) 20

21 Rešavanje sistema putem iteracija u kojima se prvobitno pretpostavljaju vrednosti rešenja i menjanjem istih, dok se ne doďe do pravog rešenja na kraju iteracija Količnik rizika Količnik rizika u okviru Koks PH modela je količnik rizika dva preduzeća u našem slučaju, koje se porede po vrednostima prediktora u vremenu. Količnik rizika se definiše kao: A u tom slučaju: ( ) ( ) ( ) ( ), X-ovi predstavljaju prediktore preduzeća, a t vreme. Zvezdica se dodaje i kodira se tako da ono preduzeće koje ima veći rizik se označi sa a preduzeće sa manjim rizikom, sa X. Daljim izvoďenjem prethodnog izraza dobija se: odnosno: ( ) ( ) ( ) ( ) ( ) ( ) PrilagoĎene krive preţivljavanja PH modela Krive preţivljavanja modela predstavljaju drugi vaţan kvantitet koji se moţe dobiti iz Koks PH modela. Model jeste prilagoďen podacima analize preţivljavanja, ali se moţe desiti situacija kada podaci ne fituju dobro, a tada se koriste Kaplan-Majerove krive (stepenaste funkcije). Dobile su ime zbog prilagoďavanja vrednostima X i mogu se računati za bilo koje vreme t. Već je ukazano na matematičku vezu izmeďu količnika rizika i funkcije preţivljavanja, koja predstavlja osnovu za računanje prilagoďenih kriva preţivljavanja. Matematički izraz za funkciju preţivljavanja je: ( ) ( ) Procenjena funkcija preţivljavanja je veoma slična, računa se softverski. Potebno je da onaj ko obraďuje podatke unese podatke X varijabli, a ostalo se dobije u ispisu obrade podataka, za ( ) i. Matematički izraz glasi: ( ) ( ) 21

22 Izraz daje mogućnost računanja ocenjene verovatnoće preţivljavanja, a da se prilikom toga prilagoďava srednjoj vrednosti (birana vrednost za varijablu). PrilagoĎene krive preţivljavanja se meďusobno mogu i porediti jer se svaka računa posebno (npr. za različite tretmane se mogu porediti različite krive): ( ) ( ) ( ) ( ) X 1 u prvom slučaju predstavlja recimo grupu koja je izloţena odreďenom tretmanu, a X 0, u drugom izrazu, grupu koja nije imala tretman. Moguće je i objediniti sve varijable u jednom modelu i izračunati prilagoďenu krivu preţivljavanja putem sledećeg izraza: ( ) ( ) PH pretpostavka PH (proporcionalna pretpostavka rizika) pretpostavka je osnova Koksovog modela. Potrebno je da je rizik jednog preduzeća proporcionalan riziku drugog preduzeća, a da je navedena proporcija nezavisna kako vreme protiče gleda se konstantnost količnika rizika u vremenu. Kako bi se bolje razumela PH pretpostavka, ponavlja se formula za količnik rizika: ( ) ( ) ( ) ( ) ( ) Kako je konačna vrednost količnika rizika konstantna, označimo je sa i onda se dobije izraz: ( ) ( ) ( ) Izraz moţe da se objasni time da je funkcija za jedno preduzeće proporcionalna funkciji za drugo, a je konstanta proporcionalnosti koja ne zavisi od vremena. Konstanta proporcionalnosti se dobija poreďenjem dva rizika (odnos u kome se vidi koliko puta je jedan veći/manji od drugog). Koks PH modela postaje neadekvatan kada doďe do kršenja PH pretpostavke, u situacijama kada količnici rizika nisu konstantni tokom vremena. Grafički je moguće proveriti navedeno, na grafiku funkcije rizika. Ukoliko se krive na grafiku seku tokom vremena, onda rizik nije konstantan i Koks PH model nije validan za takve podatke. Alternative u slučaju neadekvatnosti modela su korišćenje proširenog Koks PH modela, sa vremenski zavisnim prediktorima ili stratifikovano korišćenje Kaplan-Majerovih krivih. 22

23 Upotreba modela Koks PH model je veoma popularan, posebno u biomedicinskoj statistici, a njegove primene se šire i na druge sfere. Postoji više razloga zbog čega je njegova popularnost opravdana (Kleinbaum, 1998): 1. Dobre procene regresionih koeficijenata 2. Dobre procene rizika sa mogućnošću široke primene 3. Računanje prilagoďenih kriva preţivljavanja koje se takoďe mogu široko primenjivati 4. Fleksibilan i prilagodljiv model 5. Dobijeni rezultati su kvalitetni na nivou parametrijskog modela 6. PrilagoĎen je podacima analize preţivljavanja 7. Daje mogućnost korišćenja većeg broja prediktora 8. Lako fituje kao model 9. Rasprostranjen je u okviru standardnih statističkih paketa 10. Koks je siguran izbor ukoliko postoji sumnja da podaci dobro fituju parametrijskom modelu 11. Daje uvek nenagativne ocene koje nastaju zbog eksponencijalnog dela formule (ne postoji mogućnost dobijanja negativnih ocena rizika koje su moguće u računanju) Kao što je napomenuto, funkcija osnovnog rizika je neodreďena, ali pored toga, moguće je dobiti vrednosti parametara preko eksponencijalnog dela formule, kao i meru efekta količnika rizika. Funkcija rizika i odgovarajuća kriva preţivljavanja ( ) se takoďe mogu oceniti u ovoj situaciji, a tako se dobijaju informacije analize preţivljavanja uz minimum pretpostavki. Robustan je i kao takav je siguran izbor u mnogim situacijama, daje kvalitetne podatke, čvrst je model i kao takav, veoma upotrebljiv u različitim situacijama Dijagnostikovanje modela Postoje situacije, kao što je već napomenuto, kada Koks PH model nije adekvatan za upotrebu. Na tri načina se moţe dijagnostikovati upotrebljivost Koks PH modela (Fox, 2002): 1. Kršenje PH pretpostavke kao što je već navedeno kršenje PH pretpostavke dovodi do neadekvatnosti modela, u situacijama kada se koriste vremenski zavisni prediktori, koji dovode do toga da proporcija rizika nije konstantna tokom vremena, što je njena osnova na kojoj počiva. Način na koji se ovo moţe proveriti je računanje Schoenfeldovih reziduala, koji se računaju za svaki kovarijat, zajedno sa opštim testom celokupnog modela. Kao što je već napomenuto, na grafiku količnika rizika, ukoliko se krive presecaju, to ukazuje na nekonstantnost rizika tokom vremena i takoďe na kršenje PH pretpostavke. U situaciji ovog rada, X-ovi su vremenski nezavisni jer sadrţe karakteristike koje su konstantne tokom vremena, pa je i pretpostavka na kojoj je raďen Koks PH model da su ulazni podaci bili adekvatni, iako će se ovo još dodatno proveriti u radu na grafikonu funkcije rizika tokom obrade podataka. 2. Drugi način provere adekvatnosti Koks PH modela je utvrďivanjem postojanja uticajnih opservacija. Brisanje uticajnih tačaka dovodi do promene u regresivnim 23

24 koeficijentima, tako da treba obratiti paţnju i na ovo, što je slično kao kod regresije i testiranja adekvatnosti linearnog modela. 3. Treće na šta je vaţno obratiti paţnju je nelinearnost, koja se javlja kao problem i u linearnim modelima, koja treba da je odsutna na samom početku analize (veza izmeďu količnika rizika i kovarijata). Pored navedenih, Koks PH model je izučavan i sa aspekta preporučljive veličine uzorka koja se obraďuje modelom. Peduzzi (Peduzzi et al, 1995) je napravio odreďeni vodič vezan za minimalni broj ispitanika koji bi trebali da budu uključeni u model. Formula prema kojoj se računa potreban n glasi N=10 k / p, gde je N ţeljena veličina uzorka koja je minimalno potrebna da bi model bio adekvatan, k broj prediktora u modelu, a p proporcija pozitivnih slučajeva (proporcija onih preduzeća koja su preţivela u uzorku). Za primer preduzeća u ovom radu to bi značilo, k=6 prediktora, proporcija pozitivnih dogaďaja je 0,73, (što je 73,5% = 100 od 136 ukupno preduzeća u praćenju), onda je N= 10 X 6/0,73 = 82,2, pa se moţe zaključiti da je uzorak u bazi koja je ušla u model i koja ima 136 slučajeva, odgovarajuća za veličinu uzorka modela. 1.3.ORDINALNA REGRESIJA Linearni modeli Kako bi se bolje razumela ordinalna regresija, kao i regresija uopšte, vaţno je ukratko objasniti linearne modele. Kako su problemi u praksi raznovrsni, zadaci koji se postavljaju pred statističara u nekim od tih situacija traţe da se uočavaju veze izmeďu dve ili više varijabli. Kada veza izmeďu varijabli ima linearnu formu, nazivamo je linearnim modelom (Janke, Tinsley, 2005). U situacijama kada postoji linearna veza izmeďu varijabli Xi i Yi, moguće je koristiti jednostavni linearni model koji je izraţen sledećom formulom (Janke itinsley, 2005): Yi = a + bxi + εi, za svako 1 i n Jednostavni linearni model je podrţan kada postoji po jedna jednačina za svako i, jedna prediktorska varijabla. U takvoj formi varijabla Yi zavisi od jedne varijable Xi. Pored jednostavnog, postoji višestruki regresivni model, u kojem je uključeno više prediktorskih varijabli i o kom će biti ukratko reči u daljem delu rada. U okviru date jednačine linearnog modela, a i b su nepoznate konstante, εi predstavljaju slučajne varijable, Xi su algebarske varijable, a Yi, pošto predstavlja zbir algebarskih i slučajnih varijabli, je takoďe slučajna varijabla. Regresija predstavlja vid linearne veze i linearnog modela Regresija Termin regresija potiče od reči regressio, što bi značilo vraćanje na niţi stepen razvoja, opadanje. Termin se javlja godine, kada je Fransis Galton koristio u knjizi Regression towards mediocrity in hereditary stature. Ideja je potekla iz dobijenih rezultata istraţivanja 24

25 koji su ukazivali da visina sinova teţi ka proseku iako su roditelji veoma visoki (Janke i Tinsley, 2005). Regresija predstavlja statističku analizu, koja se bavi proučavanjem veze izmeďu zavisne varijable i jedne/više nezavisnih prediktorskih varijabli. Zavisna varijabla u regresiji najčešće bude diskretna, sa mogućom jednom ili više vrednosti. Razvoj regresije je veoma napredovao u poslednjih desetak godina i danas se široko koristi u raznim sferama. Kada se govori o klasičnoj linearnoj regresiji, potrebno je da ispuni nekoliko uslova, meďu kojima su da su ulazni podaci zavisne varijable kontinuiranog tipa. U radu će biti predstavljene ordinalna i logistička regresija, u kojima su zavisne varijable ordinalnog nivoa merenja, odnosno binarnog ili dihotomnog tipa. Ipak, logistička regresija prati iste principe na kojima se zasniva i linearna (Hosmer i Lerneshow, 2000). Cilj i upotrebna vrednost regresije je da pronaďe najbolje veze izmeďu zavisne varijable i jedne ili više prediktorskih varijabli Ordinalna regresija Prilikom istraţivanja u sferi biostatistike, zavisna varijabla je često ordinalnog tipa. Podaci ordinalnog tipa se često transformišu tokom obrade i koriste kao nominalni, nekad i kao intervalni (najjednostavniji primer je prosek učeničkih ocena). Ipak, linearna regresija ne daje mogućnost korišćenja zavisne varijable ordinalnog nivoa merenja i iz tog razloga je nastala potreba da se razvije ordinalna regresija koja će prevazići taj nedostatak. Ordinalna regresija se moţe opisati kao statistička tehnika koja se bavi proučavanjem veze izmeďu jedne zavisne varijable ordinalnog nivoa merenja i jedne ili više nezavisnih, koje mogu biti ili kategorijalne ili kontinuirane. Armstrong (Armstrong i Sloan, 1989) je ukazao na potrebu za ordinalnom regresijom. Istraţivao je efikasnost primene logističke regresije na dihotomnim podacima u odnosu na efikasnost ordinalnog modela. U epidemiološkim studijama, varijabla zdravstvenog statusa ima često ordinalni nivo merenja. Ipak, u postupku obrade podataka, on se transformiše u dihotomnu varijablu. Način na koji je rekodirao podatke sa ordinalnog na nominalni nivo merenja jeste adekvatan, ali se postavlja pitanje neiskorišćenosti kvalitetnijih podataka, tj. podataka sa višeg nivoa merenja na niţi. Nakon rekodiranja, kalkulisao je asimptotsku relativnu efikasnost i dobio rezultate simulacije, koji su ukazali da jednostavna logistička regresija, koja se primeni na dihotomne podatke može u realnim situacijama imati preko 75% efikasnosti ordinalnog regresivnog modela, što potvrďuje da je takav model sa podacima niţeg nivoa merenja manje moćan u odnosu na ordinalnu regresiju i ulazne podatke ordinalnog nivoa. Na taj način, osim postojanja potrebe zbog zavisne varijable ordinalnog nivoa merenja, je dokazao vrednost ordinalne regresije i potrebu da se ona dalje razvija (Armstrong i Sloan, 1989). Ordinalni nivo merenja je specifičan po tome što ostavlja prostor za manipulaciju transformaciju varijabli na tri načina. U prvom slučaju, ordinalnu varijablu je moguće posmatrati kao da je kontinuirana, usled čega se koristi linearna regresija a podaci sa ordinalnog nivoa merenja se posmatraju kao da su intervalni. MeĎutim, u praksi se često dešava da u tom slučaju, pretpostavka linearnosti nije ispunjena. Kako kategorije odgovora ordinalnog nivoa merenja sadrţe vrednosti za koje 25

26 se ne moţe pretpostavljati da su meďusobno jednake, to povlači za sobom još neke probleme koji se dešavaju u praksi kada se tretiraju na nivou intervalnih. Postojale su brojne diskusije u naučnim krugovima u vezi sa upotrebom ordinalne i intervalne skale. Jedan od autora, Knapp, je sumirao postojeće nalaze u nadi da će razrešiti diskusiju. Nalazi ukazuju da oblik distribucije podataka ima uticaj na nivo merenja (Gaito, 1980, prema Knapp, 1990) jer podaci koji su normalno distribuirani moraju imati intervalni nivo merenja. U slučaju normalne raspodele, postavlja se pitanje aritmetičke sredine i standardne devijacije, koje nisu adekvatne mere ordinalnog nivoa merenja. Ukoliko se doďe u situaciju da istraţivač razmišlja da li da ordinalni nivo merenja posmatra kao intervalni ili ne, vaţno je uzeti u obzir da se i deskriptivna i inferencijalna statistika zasnivaju na nivoima merenja i da ih je potrebno koristiti na načine koji su adekvatni. U suprotnom dolazi do pogrešnih zaključaka. Iz tog razloga, parametrijski testovi imaju svoje neparametrijske zamene, koje imaju manju moć testa, ali napravljeni su tako da koriste i podrţe niţe nivoe merenja kao što su ordinalni i nominalni. Drugi problem koji moţe nastati usled korišćenja ordinalnog nivoa merenja kao intervalnog, u slučaju linearne regresije, moţe dovesti do oteţane interpretacije. Ipak, kroz praksu se pokazuje da neki istraţivači imaju stav da robustnost ovih analiza moţe da prevaziďe problem oteţane interpretacije (O'Connel, 2006). U drugom slučaju, zavisna varijabla ordinalnog nivoa merenja se sniţava na nominalni nivo, rekodiranjem u binarnu varijablu. Tada se koristi set logističkih jednačina, a merenje se gleda kao kumulativni ishod više elemenata. Ipak, kao što je Armstrong već napomenuo, tada se ne iskoriste dovoljno podaci ordinalnog nivoa merenja i manja je moć modela. U trećem slučaju, zavisna varijabla je ordinalnog nivoa merenja, razmatra se kumulativna verovatnoća a koristi se pretpostavka proporcionalnih verovatnoća da bi se ispitalo da li su efekti nezavisnih varijabli isti tokom različitih nivoa. Ovde se koristi model ordinalne regresije koji odgovara nivou merenja zavisne varijable. Pojedini autori (Ananth i Kleinbaum, 1997) smatraju da su ordinalni regresivni modeli potcenjeni u okviru socijalnih nauka, jer u praksi istraţivači redukuju podatke sa ordinalnog nivoa na nominalni nivo, na serije binarnih logističkih regresija. Ordinalna regresija je analiza koja daje rezultate svih podataka u jednom modelu, a model je moćniji samim tim što su podaci višeg nivoa merenja nego u pojedinačnim logističkim regresijama. Ipak, ne koristi se toliko često Uslovi i pretpostavka ordinalne regresije: Ulazni podaci (jedine) zavisne varijable, kao što je već napomenuto, treba da budu ordinalnog nivoa merenja. Procena modela ordinalne regresije se radi pomoću χ2 testa. Pretpostavka koju je usled toga potrebno ispuniti jeste da 80% ćelija mora da ima veću frekvenciju od 5. Ukoliko se ova pretpostavka ne ispuni, vaţno je obratiti paţnju na pouzdanost rezultata χ2 testa u modelu. Još jedna vaţna pretpostavka na kojoj se zasniva ordinalna regresija i kojom se testira njena validnost, jeste pretpostavka paralelnih linija (negde se naziva i prepostavkom proporcionalne verovatnoće). Pretpostavka paralelnih linija podrazumeva postojanje regresijske jednačine za svaku kategoriju u modelu (osim za poslednju). Verovatnoća poslednje kategorije se prediktuje kao 1-druga od nazad verovatnoća kategorije. Osnovni koncept na kom počiva je 26

27 da efekti prediktorskih varijabli, bilo koje od njih, su proporcionalne tokom različitih pragova. Tada prediktorske prediktorske varijable imaju iste efekte na verovatnoće, uprkos pragovima. Ordinalna regresija razdvaja odsečke sa svakim početkom praga, a odnosi verovatnoća za svaki od njih postoje za svaki pojedinačni efekat prediktorskih varijabli. Pored navednih pretpostavki, ordinalna regresija pretpostavlja da su greške homoskedastične. Jednostavan ordinalni model, koji sadrţi jedan prediktor ima oblik ln (ϴ j ) = α j βx, a raspon kategorije j moţe da uzima vrednosti u zavisnosti od broja kategorija 1. Uočava se da postoji negativan znak, što nije slučaj u odnosu na klasične linearne regresione jednačine. Kod pozitivnih koeficijenata su verovatniji viši skorovi i obrnuto. Kod varijabli koje imaju kontinuirane vrednosti, slična je situacija pozitivni koeficijenti ukazuju da se vrednosti varijable povećavaju. TakoĎe se uočava da svaki prediktor ima svoj α j ali zajednički β, ali to je zbog pretpostavke da su efekti prediktorskih varijabli konstantni za različite logit funkcije. SPSS omogućava testiranje pretpostavke paralelnih linija (proporcionalne verovatnoće). Testira se nulta hipoteza da je koeficijent nagiba regresivnog modela identičan za sve kategorije odgovora, iz čega proizilazi da su linije od istog nagiba paralelne. Kada dolazi do odbijanja nulte hipoteze, ordinalni koeficijenti nisu jednaki na svim nivoima i u toj situaciji treba primeniti neki drugi model. U okviru rada će biti dat prikaz testiranja i interpretacije pretpostavke paralelnih linija. Modeli ordinalne regresije koji se najčešće koriste u praksi su ordinalni logit i probit modeli. U praksi dolazi često do kršenja pretpostavki ordinalne regresije, što dovodi do neadekvatnih rezultata. Najčešće problem nastaje sa heteroskedastičnim greškama, kao i kršenjem pretpostavke paralelnih linija. Bilo koji od navedenih problema dovodi do neadekvatnih rezultata, nepreciznih parametara procene, loših standardnih grešaka. Ipak, sve navedeno treba uzeti u obzir tokom interpretacije dobijenih rezultata Osnovni koncepti ordinalne regresije: U okviru definisanja zavisne varijable, najčešće se prva kategorija kodira kao kategorija najniţe vrednosti, a poslednja najviše, a notacija ide 0 do n. Faktor predstavlja kategorijalnu nezavisnu varijablu koja se numerički kodira. Kovarijati su kontinuirane nezavisne varijable koje se koriste za predikciju zavisnih kategorijalnih varijabli. Link funkcija predstavlja pojam u okviru ordinalne regresije - transformacija kumulativnih verovatnoća zavisne ordinalne varijable koja omogućava procenu samog modela. Posmatraju se kao parametri skaliranja, a koristi se i za fitovanje heteroskedastičnih probit i logit modela. U okviru statističkog paketa SPSS, moguće je raditi 5 link funcija. Notacija: γ verovatnoća da će se dogaďaj dogoditi. Napominje se da se kod ordinalne regresije verovatnoća dogaďaja odnosi na kumulativnu verovatnoću. 1. Logit funcija - Kao funkcija ordinalne regresije najčešće se koristi u okviru SPSS. Uslov za korišćenje je kada zavisna ordinalna varijabla ima meďusobno jednake kategorije. Matematički izraz logit funkcije je ( ) 27

28 2. Probit funcija najčešće se koristi u situacijama kada je zavisna varijabla normalno distribuirana i kada su njene kategorije relativno podjednake. Inverzna je normalnoj kumulativnoj distribuciji. Matematički izraz je: (γ) 3. Negativna log-log funkcija funkcija koja se najčešće koristi kada su niţe kategorije modaliteta zavisne varijable verovatnije da se dese. Matematički izraz je: ln(-ln(γ)) 4. Komplementarna log-log funkcija - funkcija koja se najčešće koristi kada su više kategorije modaliteta zavisne varijable verovatnije da se dese. Matematički izraz je: ln(-ln(1- γ)) 5. Cauchit funkcija funkcija čiji je izvorni naziv ostavljen na engleskom jeziku, zbog nemogućnosti adekvatnog prevoda, je funkcija koja se najčešće koristi kada postoji više ekstremnih vrednosti meďu podacima. Matematički izraz je: tan (π (γ 0.5)) Ordinalna regresija ima više različitih modela na osnovu kojih se mogu obraďivati podaci. Postoji više podela i više modela, a u okviru ovog rada će se obraditi tri modela: kumulativni model verovatnoća, kontinuirani racio model i model susednih kategorija (Adjacent categories). McCullagh (1980) je takoďe istraţivao regresivne modele za ordinalne podatke i došao do zaključaka da su posebno dva modela, model proporcionalnih verovatnoća i proporcionalnih rizika najbolji za korišćenje u praksi, najviše zbog jednostavnosti njihove interpretacije. Oni predstavljaju proširenje generalizovanih linearnih modela. Neki autori (Ananth i Kleinbaum, 1997, prema Brant, 1990) smatraju da je testiranje pretpostavke paralelnih linija previše konzervativno, posebno kada ima puno prediktora. Model proporcionalnih verovatnoća pojednostavljuje pretpostavku da ordinalna regresija povezana sa svakom nezavisnom varijablom je uvek ista tokom kumulativnog razdvajanja u ishodu. Kako bi se primenila na adekvatan način, mora biti testirana. Sledi presek poreďenja kategorija koje se mogu raditi sa modelima (O'Connell, 2006): 1. Model kumulativnih verovatnoća rastući redosled P (Y j), gde se kreće od toga da se nulta kategorija poredi sa svim kategorijama iznad sebe. Primer prvobitno se poredi nulta kategorija sa svim iznad nje, nakon čega se porede kategorije obeleţene sa 0 i 1 sa svim iznad sebe i tako redom dok se ne istroše sve kategorije zavisne varijable. 2. Model kumulativnih verovatnoća opadajući redosled P (Y j), gde se kreće od toga da se poslednja kategorija, koja nosi najvišu vrednost, poredi sa svim kategorijama ispod sebe. Primer prvobitno se poredi poslednja kategorija sa svim ispod sebe, nakon čega se niţu poslednja i pretposlednja kategorija koje se porede sa svim ispod njih i tako redom. Modeli opadajućeg i rastućeg redosleda predstavljaju dve verzije istog modela 3. Neprekidni racio model P(Y > j Y j) model u okviru kojega se kreće od druge najniţe kategorije, najčešće označene sa kodom 1 (ako posmatramo da je 0 poslednja najniţa kategorija), nakon čega se ona preko poslednje najviše kategorije poredi sa najniţom kategorijom (1 preko 5 vs. 0). Naredna sledeća komparacija bi išla poreďenje treće kategorije od dole preko poslednje najviše preko druge kategorije i tako redom. 4. Model susednih kategorija treći model regresija koja se koristi kod ordinalnih varijabli, u okviru koje vaţi P(Y= j + Y 1 = j ili Y=j+1). Model kreće po koracima 28

29 tako što se pretposlednja najniţa kategorija poredi sa poslednjom, zatim jedna iznad pretposlednje sa pretposlednjom i tako redom. Svaki od modela će biti opisan samo u svom baznom obliku, jer svaki sadrţi još po 2-3 podvrste modela u odnosu na različite situacije Kumulativni model proporcionalnih verovatnoća Kumulativni model proporcionalnih verovatnoća je jedan od često korišćenih modela ordinalne regresije u praksi. Koristi se u situacijama kada je potrebno prediktovati verovatnoću da će se rezultati nalaziti u ravni ili ispod odreďene kategorije modeliteta zavisne varijable, koristeći sve podatke tako da proceni efekte prediktorskih varijabli. Tu spada i model kumulativnih verovatnoća sa rastućim i opadajućim redosledom. U okviru ovog rada, korišćen je upravo ovaj model i to model sa rastućim ishodom, u kojem su se sve kategorije poredile sa najniţom kategorijom zavisne varijable, najmanjom kategorijom broja meseci koliko su preduzeća preţivela u istraţivanju. Teorijski, postoji k mogućih ishoda (kod preduzeća, ordinalna zavisna varijabla ima 3 modaliteta), a model će da napravi k-1 predikcija (2 predikcije u obradi podataka za preduzeća). Ako se definiše π (Y j x 1, x 2,...x p ) = πj (x) tako da Y predstavlja verovatnoću da se odgovor naďe u okviru kategorije koja je ista ili niţa od j-te kategorije, u situaciji kada je j=1,2,3 k-1. Tako se pravi grupa kumulativnih verovatnoća svakog slučaja, a poslednja kategorija će uvek imati 1 (kao i kod deskriptivne statistike). Kako je ovaj model razraďen na osnovu opšteg logističkog modela, ono što se dobije kao rezultat su predikcije koje se nazivaju logitima za kumulativne verovatnoće (O'Connell, 2006): ( ) ( ( ) ( ) ) α j + (β 1 X 1 + β 2 X 2 +. β p X p ) Cilj u okviru obrade podataka ordinalne zavisne varijable je povezivanje kumulativne verovatnoće sa prediktorima u modelu. U okviru modela, β je isti kod svih k-1 jednačina u okviru kojih se pretpostavlja da je efekat nezavisnih varijabli isti za svaku kategoriju skale. Model je rasprostranjen i moţe se naći u standardnim statističkim paketima. U situaciji kada postoji dva modaliteta zavisne varijable, ovaj model je identičan logističkom binarnom modelu Neprekidni Racio model Drugi model koji se moţe koristiti u situacijama kada prethodno opisani nije dovoljno adekvatan je neprekidni racio model. Njega je dobro koristiti kada radimo komparaciju grupe koja je doţivela neuspeh, niske skorove sa ostalima koji su postigli bolje/više rezultate, a da pritom ţelimo da prediktujemo efekte prediktorskih varijabli na zavisnu. Na taj način se istraţuje razlika onih koji su imali loše rezultate u odnosu na one koji su imali mnogo bolje, odnosno šta je to po čemu se oni razlikuju, šta od nezavisnih varijabli utiče ona njih u datom modelu. 29

30 Model se zasniva na uslovnoj verovatnoći i konceptualno je sličan Koks PH modelu za situacije kada je vreme diskretna varijabla. On pretpostavlja da su odsečci homogeni u kategorijama (Armstrong i Sloan, 1989). U okviru ovog modela, posmatraju se verovatnoće da se vrednost nalazi van neke od kategorija. Gleda se da li je ispitanik dostigao najmanje vrednost koja se nalazi u odreďenoj kategoriji δ j (x) = P(Y > kategorija j Y kategorija j). To predstavlja uslovnu verovatnoću u većoj meri nego kumulativnu (O'Connell, 2006). Neprekidni racio model je model koji koristi uslovnu verovatnoću. U zavisnosti od ciljeva istraţivanja koje istraţivač postavlja, moţe se izvesti na više načina. Suština je u tome da se bazira na formi δ j= P(odgovor van kategorije j Y odgovor najmanje u kategoriji j) ili komplamenta u ovom slučaju 1-P(Y i > kategorija j Y i kategorija j)= P(Y i kategorija j Y i kategorija j ( Kako se j povećava, dolazi do toga da vrednosti koje ne spadaju u tu kategoriju izlaze iz modela u okviru svake logit komparacije Model susednih kategorija Treći ali ne i najmanje vaţan je model susednih kategorija (Adjacent Categories Model, ACR). Koristi se kada je potrebno izračunati efekte prediktorskih varijabli istovremeno u paru susednih kategorija. Kod njih je specifično to što zahtevaju da efekti prediktorskih varijabli budu homogeni za susedne kategorije. Cilj je dobiti istovremeno verovatnoće odgovora naredne kategorije za svaki par susednih kategorija koje postoje u okviru zavisne ordinalne varijable. Logaritam dve susedne verovatnoće će da kreira logit: Y' j = ln (π 1,j+1 / π 1,j ) = α j + βx 1 Gde j predstavlja broj nivoa odgovora zavisne ordinalne varijable, verovatnoće koje se računaju pripadaju dvema susednim kategorijama koje se u tom momentu porede Pretpostavlja se da su efekti prediktorskih varijabli konstantne u poreďenjima, kao i efekat nagiba β. Kada je u pitanju odabir modela unutar ordinalne regresije, najbolje je voditi se problemom koji se istraţuje i u skladu sa tim birati najadekvatniji model za obradu ordinalnih podataka (O'Connell, 2006). Ananth i Kleinbaum (1997) su istraţivali nekoliko regresivnih ordinalnih modela u cilju ispitivanja fitovanja podacima iz baza podataka perinatalnog programa. Ispitivali su 6 različitih regresivnih modela: kumulativni logit model, kontinuirani-racio model, model parcijalnih proporcionalnih verovatnoća, politomni logistički model, logistički model susednih kategorija i stereotipni logistički model. Rezultati do kojih su došli ukazuju na to da se u okviru epidemioloških studija/biomedicinskih primena, najviše koriste kumulativni logit model, kao i kontinuirani racio model. U ovom tekstu neće biti dat detaljan opis svih 6 modela, ali svi ordinalni regresioni modeli počivaju na pretpostavci proporcionalnih verovatnoća. Preporuka autora je da se nakon svakog modeliranja putem ordinalne regresije radi Goodness-of-fit test, kao i analiza reziduala pojedinačnog modela, ali i da se grafički predstavljaju pretpostavke modela radi lakšeg uočavanja informacija na njima. 30

31 Kako sledi deo u kom će se obraďivati podaci, moţda je potrebno još napomenuti da procedura u SPSS koja se naziva PLUM (Polytomous Universal Model) predstavlja proširenje sa opšteg linearnog modela na ordinalne kategorijalne podatke. Nekoliko parametara koji će biti uvršeni u obradu podataka će biti pominjani u okviru teorijskog dela logističke regresije, pa neće biti obraďivana i na ovom mestu (Wald statistika, pseudo R 2 ). Ono što nije dodatno objašnjeno je 95% interval poverenja, CI, koji se računa u okviru SPSS za svaki pojedinačni regresivni koeficijent, za svaki prediktor u modelu. Računa se kao (z α/2 )*(Std.Err.) gde je z α/2 odreďena kritična vrednost standardizovane normalne distribucije. U rezultatima se mogu videti rasponi intervala poverenja za pojedinačne regresivne koeficijente. 1.4 LOGISTIČKA REGRESIJA Uvod u logističku regresiju Logistička regresija se koristi za analizu kategorijalnih podataka, prilikom čega je sam koncept zasnovan na fitovanju verovatnoće odgovora proporcije u odnosu na realizovane odgovore (Bergerud, 1996). Posmatrajući linearnu regresiju i logističku regresiju, njihova osnovna razlika leţi u tome što je zavisna varijabla dihotomna, iako se obe zasnivaju na istim principima (Hosmer i Lerneshow, 2000). Kod logističke regresije, zavisna varijabla je kategorijalna, dok prediktorske mogu biti ili kategorijalne ili kontinuirane (Field, 2009). Logistička regresija se primenjuje u situacijama kad linearna nije moguća, kad je zavisna varijabla kategorijalna. Korišćenje linearne regresije sa zavisnom kategorijalnom varijablom ne bi bilo adekvatno jer ne bi ispunjavalo pretpostavku linearne regresije po pitanju linearnosti. Osnovni koncept logističke regresije je predikcija kojoj kategoriji ispitanik realnije pripada u odnosu na informacije koje postoje. Kada se radi predikcija kategorijalne varijable koja sadrţi dihotoman modalitet, radi se binarna logistička regresija, dok se kod obrade zavisne varijable sa više modaliteta koristi multinominalna ili polihotomna logistička regresija (Field, 2009). Njeno korišćenje je pojedinostavljeno jer ne pretpostavlja normalnu distribuciju podataka, varijanse koje treba da budu jednake, kontrolu ekstremnih vrednosti, a nije potrebno ni razmišljati o statističkoj moći jer je koncept zasnovan na fitovanju veza zavisne varijable i prediktora. Celokupan matematički koncept koji leţi u osnovi logističke regresije je logit, prirodni algoritam verovatnoće količnika (Peng, Lee, Ingersoll, 2002). Logistička regresija ima više namena, meďu kojima su najvaţnije predviďanje zavisne varijable na osnovu prediktora, procena efekta interakcije i rangiranje nezavisnih prediktora po vaţnosti Pretpostavke logističke regresije i izraz Kao i kod linearne regresije, logistička regresija ima odreďene pretpostavke koje je potrebno ispuniti da bi se mogla realizovati. Bergerud (1996) je definisao nekoliko njih: 31

32 1. Zavisna varijabla moţe da ima samo dihotomne vrednosti (najčešće kodirane kao 0 dogaďaj se nije desio/nije prisutna karakteristika i 1- dogaďaj se desio/prisutna karakteristika) 2. Podaci su meďusobno nezavisni (ukoliko nije uspunjeno, dolazi do prevelikog raspršenja podataka) 3. Veličina uzorka je poznata pre obrade podataka (ukoliko nije, dolazi do moguće slučajne varijacije) 4. Uzorkovanje podataka treba da isprati binominalnu distribuciju (nije neophodno da podaci baš moraju da fituju sa navedenom distribucijom) 5. Uzorkovanje treba da bude slučajno iz unapred definisane populacije, kako bi se rezultati mogli generalizovati Pored navedenog, logistička regresija pretpostavlja da treba da postoji linearnost kod kontinuiranog prediktora i logita zavisne varijable (Field, 2009, prema Hosmer i Lemeshow, 1989). Još jedna od pretpostavki je da prediktori ne bi smeli meďusobno visoko da koreliraju potrebno je proveriti da li postoji multikolinearnost. VIF (variance inflation factor) je indikator kolinearnosti, odgovoran za povećanje varijanse (Janke,Tinsley, 2005). Računa se pomoću formule: VIF = 1/(1-R² j ), gde je R² j koeficijent determinacije, tj. kvadrat korelacije prediktora čija se multikolinearnost ispituje. Problem koji moţe da se javi tokom računanja logističke regresije u SPSS je taj što moţe da predugo radi iteracije i da na kraju izbaci netačna rešenja, sa velikim standardnim greškama. Uzrok tome mogu biti nepotpuni podataci i separacija podataka (Field, 2009). Kod linearne regresije, vrednosti Y se prediktuju iz prediktorske varijable X 1 u slučaju da postoji samo jedan prediktor ili iz više prediktorskih varijabli (X s ). Kod logističke regresije ovaj koncept se razlikuje, jer uzima jednačinu verovatnoće Y koju prediktuje na osnovu izraza (Field, 2009): ( ) ( ) P(Y) verovatnoća da će se Y pojaviti e baza prirodnog logaritma b 0 konstanta b 1 koeficijent koji se vezuje za prediktor X 1 - prediktorska varijabla Izraz logit je log verovatnoće, a u tom slučaju b 0 predstavlja vrednost logita kada je prediktor 0. Tada je b 1 povećanje/smanjenje logita u situaciji povećanja jedinice prediktora ako je prediktor kontinuirana varijabla (ili razlike jedne kategorije u drugu ukoliko je prediktor kategorijalna varijabla). Naravno, kao i kod linearne regresije, moguće je proširenje modela tako da sadrţi više prediktora i onda uzima sledeći oblik: ( ) ( ) 32

33 Kako izraz računa verovatnoću, vrednosti koje se mogu dobiti na osnovu njega mogu da se nalaze u rasponima 0 do 1. Dobijena vrednost 0 ukazuje na to da se Y najverovatnije nije, a vrednost 1, da se najverovatnije desio. U zavisnosti od broja prediktora u jednačini, postoji i toliko koeficijenata, a svaki od njih se pojedinačno ocenjuje Fitovanje modela Fitovanje modela je moguće proceniti korišćenjem posmatranih i prediktovanih vrednosti pomoću mere koja se naziva logom verovatnoća (Hosmer i Lerneshow, 2000). Fitovanje modela kreće od pretpostavke da imamo uzorak od n ispitanika, koji su meďusobno nezavisni i čine par (x i ; y i ) u kojem imaju vrednost i=1,2,3 n. Tada y i predstavlja vrednost dihotomne zavisne varijable, a x i vrednost prediktivne varijable (za svakog i-tog ispitanika). Unapred se definišu vrednosti y i, najčešće tako da vrednost 0 dobija značenje da nema karakteristike, a 1 da je definisana karakteristika prisutna. Da bi model mogao da fituje jednačini, potrebno je proceniti vrednosti nepoznatih parametara β 0 i β 1 (u literaturi se označava negde i sa a i b) (Hosmer i Lerneshow, 2000). π(x)= Naknadna transformacija π(x) se naziva transformacijom logita g(x): ( ) * ( ) ( ) + = β 0+β 1 x Transformacija logita g(x) ima poţeljne karakteristike, meďu kojima su te da je linearna parametrima, ali i da rasponi koji su mogući zavise od x. Radi lakšeg razumevanja fitovanja modela logističke regresije, porediće se sa linearnom.u linearnoj regresiji se nepoznati parametric najčešće procenjuju metodom najmanjih kvadrata. Vrednosti parametara β 0 i β 1 se minimalizuju pomoću sume kvadrata odstupanja Y. Iako je metod najmanjih kvadrata uspešan način procene nepoznatih parametara, u situacijama primene na model u kojem je zavisna varijabla dihotomna, on nije toliko upotrebljiv i potrebno mu je naći zamenu metod maksimalne verodostojnosti. On je već objašnjen kod analize preţivljavanja i funkcioniše po istom principu. Ukratko, zasniva se na ideji da se za vrednost parametara odabere ona vrednost θ za koju postoji najveća verovatnoća realizacije dobijenog uzorka, što je u konkretnom slučaju utvrďivanje verovatnoća podataka iz uzorka za kombinacije vrednosti regresionih koeficijenata. Sam proces odreďivanja metode maksimalne verodostojnosti sadrţi više iteracija tokom računanja. Počinje pravljenjem funkcije maksimalne verodostojnosti u kojoj se računaju verovatnoće podataka u modelu da se nalaze u funkciji nepoznatih parametara sa jedne strane, dok sa druge da su procenjivači parametara vrednosti koje će da maksimalizuju funkciju procenjivači koji će u datom slučaju da najbolje fituju sa podacima modela. 33

34 1.4.4.Procenjivanje modela: Log-likelihood U logističkoj regresiji, koristi se log-likelihoood koji radi procenu izmeďu posmatranih i prediktovanih vrednosti radi utvrďivanja fitovanja modela. Log-likelihood [ ( ( )) ( ) ( ( ))] Njegova funkcija je da sumira verovatnoće koje se povezuju sa prediktovanim i posmatranim ishodima (Tabachnick i Fidell, 2007, prema Field, 2009). U poreďenju sa višestrukom regresijom, sličan je rezidualnoj sumi kvadrata i predstavlja statistiku koja objašnjava koliko ima objašnjene/neobjašnjene varijanse nakon fitovanja modela. Sa tim u vezi, što je veći koeficijent, više je neobjašnjene varijanse u modelu Procenjivanje modela: R i R 2 Korisne mere koje omogućavaju procenu modela su R i R 2. R statistika je parcijalna korelacija izmeďu zavisne varijable i svakog pojedinačnog prediktora. Kao kod korelacije, mogući rasponi koeficijenata koji se dobijaju su -1 do 1. Vrednosti R koje su male ukazuju na to da te varijable malo doprinose modelu i obrnuto (Field, 2009). Interpretacija R 2 je slična interpretaciji u linearnoj regresiji (opisuje koliko dobro model fituje podatke, predstavlja Pirsonov koeficijent korelacije izmeďu zavisne varijable i prediktovanih vrednosti regresivnog modela). Razlika izmeďu R 2 linearne regresije i logističke regresije je u tome što se kod logističke regresije gledaju kao pseudopokazatelji vrednosti R², a ne apsolutni realni iznosi kao kod linearne regresije (pokazuju da odreďen skup indikatora objašnjava odreďeni procenat varijanse zavisne varijabe): R L 2 = ( ) ( ) Gde LL predstavlja -2log-likelihood za originalne podatke za model ili originalne podatke. Opisali su ga Hosmer i Lemeshow godine. Koristi u okviru računanja u SPSS-u. R² L predstavlja meru koliko ubacivanje prediktora poboljšava model u odnosu na osnovni model kada ih nema. Posmatra se u terminima χ2 testa koji se zasniva na log-likelihood-u. Ukoliko je razlika veća u izrazu, ukazuje na manji prediktivni kapacitet u modelu, ali i veće vrednosti χ2 testa. Predstavlja indikator kvaliteta predikcije modela i interpretira se kao dobar ukoliko nije statistički značajan. Mana mu je ta što je osetljiv na veličinu uzorka. Navode se dva R², dve mere na osnovu kojih se moţe raditi procena modela. One su slične u svojoj osnovi iako se drugačije računaju. To su u okviru SPSS outputa su još Cox i Snell R², koji su takoďe bazirani na log-likelihood modela i originalnih podataka, a matematički izraz izgleda: R² CS = * ( ( ) ( ( ))+ n predstavlja veličinu uzorka u datoj formuli. Po teoriji, R² CS moţe imati maksimalno vrednost 1, ali se to dešava retko u praksi. Slično njemu, postoji i Nagelkerke, koji se računa po formuli: R² N = * ( ( )) + 34

35 1.4.6.Testiranje značajnosti koeficijenata modela Naredni korak je testiranje značajnosti koeficijenata modela ispitivanje koliko su varijable u modelu statistički značajne. To podrazumeva prethodno formulisanje hipoteze da li su prediktorske varijable modela statistički značajno povezane sa zavisnom varijablom. Kod logističke regresije se postavlja pitanje da li je model koji uključuje odreďen prediktor bolje opisuje zavisnu varijablu u odnosu na drugi u kojem se isti prediktor isključuje. Prvobitno se izračuna model sa odreďenim prediktorom, a zatim model bez i onda se radi poreďenje dobijenih podataka. Moguća su dva ishoda, da prediktor ne poboljšava model (nema statističke značajnosti razlike izmeďu dva modela) i da prediktor doprinosi tome da model bolje opisuje zavisnu varijablu i da doprinosi njenom boljem objašnjavanju, čineći ovu razliku statistički značajnom. Posmatrajući opisani koncept, ne razlikuje se od linearne regresije koja radi po istom principu. Komparacija se odvija pomoću sledećeg izraza: G = - 2ln ( ) Kada je hipoteza tako definisana da je β 1 = 0, statistika G ima χ2 raspodelu (df=1). Pored navedenog pristupa testiranju značajnosti koeficijenata, moguće je imati drugi pristup pomoću Wald testa, ali istraţivanja (Hauck i Donner, 1977; Jennings, 1986a; prema Hosmer i Lemeshow, 2000) ukazuju na to da Wald test jeste dobra statistika, ali moţe češće da odbija nultu hipotezu u slučajevima kada realno koeficijenti nisu značajni i da je bolje koristiti test količnika verodostojnosti. Kada je regresioni koeficijent visok, njegova standardna greška ima tendenciju da bude velika, što dovodi do rezultata da Wald statistika ne bude dovoljno precizna mera. Ono što sledi jeste da povećanje standardne greške dovodi do povećanja verovatnoće da je prediktor značajan, iako nije u stvarnosti zaista značajan model Procenjivanje modela: Wald statistika U logističkoj regresiji, kako bi procenili fitovanje modela u odnosu na podatke, koristi se Wald statistika, zasnovana na χ2 distribuciji. On testira nultu hipotezu da je koeficijent 0. Pored fitovanja on procenjuje pojedinačne prediktore i njihove koeficijente, testirajući ih da li statistički značajno doprinose modelu i zavisnoj varijabli. Matematički izraz je: Wald = Gde je b regresioni koeficijent, a SE b njegova standardna greška EXP(B) U okviru logističke regresije, poslednji indikator koji je veoma vaţan da bude spomenut u radu je EXP(B). Ima ulogu kod interpretacije podataka, a predstavlja količnik verovatnoće koji ukazuje na to kako promena u prediktorima utiče na promenu zavisne varijable verovatnoće dogaďaja P(Y). Najjednostavnije prikazano, on predstavlja: 35

36 Verovatnoća = ( ) ( ) P(dogaĎaja Y) = ( ) P(dogaĎaj se nije desio) = 1 - P (dogaďaj se desio) Gde je: b 0 - koeficijent konstante b 1 - koeficijent prediktora X prediktor, sa mogućim vrednostima 0 (dogaďaj se nije desio) i 1 (dogaďaj se desio) Interpretacija koeficijenata i količnika verovatnoće da se dogaďaj desio ili ne je jednostavna. Kod logističke regresije, sve interpretacije se vrše tako da su ostale varijable konstante u modelu. Povećanje za jednu jedinicu prediktora dovodi do povećanja ili smanjenja logita zavisne varijable. Ukoliko je dobijena vrednost veća od 1, podaci ukazuju na to da što se više prediktor povećava, šanse da se desi zavisna varijabla se takoďe povećavaju i obrnuto Višestruki logistički model O višestrukom logističkom modelu će biti reči kratko, toliko da se stekne utisak koja je razlika u odnosu na jednostavni logistički model, jer počivaju na istim regresionim principima. Višestruki logistički model sadrţi više od jednog prediktora i ako se pretpostavi da su oni intervalnog nivoa merenja, moţe se izračunati verovatnoća zavisne varijable na sledeći način: P(Y = 1 x ) = π (x) Dalje, logit višestruke logističke regresije se moţe iskazati sledećim izrazom: g (x) = a na osnovu navedenog, logistički model dobija sledeći oblik: ( ) ( ) ( ) Interpretacija modela logističke regresije Poslednji korak u obradi podataka u putem logističke regresije je interpretacija. Preporuke za interpretaciju su da se odvija u dva koraka (Hosmer i Lerneshow, 200). Prvi korak bi podrazumevao odreďivanje veze izmeďu zavisne varijable i prediktora, a drugi, definisanje jedinice promene prediktora, kako bi se dobili rezultati koji su cilj same obrade. Opšte preporuke kada je u pitanju interpretacija rezultata su da je potrebno imati u vidu ukupnu evaluaciju modela, statističke testove pojedinačnih prediktora, Goodness-of-fit statistike, kao i procenu prediktorskih verovatnoća (Peng, Lee, Ingersoll, 2002). 36

37 Postoji detaljno uputstvo za interpretaciju logističke regresije u zavisnosti koje je vrste i nivo merenja prediktor (dihotoman, polihotoman ili neprekidan), ali neće biti detaljnije obrazlagana svaka vrsta intepretacije u ovom delu. Ono što je vaţno kod interpretacije jeste poznavanje prethodno navedenih indikatora i pravila da li kad je nešto statistički značajno je dobro ili loše za podatke. Radi se interpretacija (u SPSS) za Omnibus test of model coefficients, Hosmer i Lemeshow test, Cox i Snell R² i Nagelkerke R², kao i interpretacija koeficijenata B, EXP (B), Wald statistike i statističke značajnosti svakog pojedinačnog prediktora. Sve navedeno će bit interpretirano na primeru u radu koji sledi, u odeljku sa rezultatima logističke regresije. Pored navedenog, vaţno je naglasiti da logistička regresija ne sme interpretirati podatke u svetlu kauzalnosti podataka. 1.5 χ 2 test Test koji je Pirson godine razvio, χ2 test, spada u grupu neparametrijskih testova. Pomoću njega se testira nulta hipoteza da obeleţje X ima odreďenu teorijsku raspodelu protiv alternativne koja tvrdi da te raspodele nema. Omogućava računanje i testiranje povezanosti kategorijalnih varijabli, odnosno njihovih opaţenih i očekivanih frekvencija koje predstavljaju osnovu ovog testa. Dobijene frekvencije su one koje predstavljaju ulazne podatke nekog istraţivanja, dok su očekivane frekvencije teorijske. Tokom korišćenja testa, vaţno je napomenuti da je potrebno da zbir razlike opaţenih i očekivanih frekvencija mora uvek biti jednak 0. H 0 : Oi = Ei H 1 : Oi Ei ( ) O i su opaţene, a E i teorijske očekivane frekvencije. Test zahteva da postoji manje od 20% ćelija koje imaju frekvenciju manju od 5. Ukoliko se kod nekog ispitanika kod opaţenih frekvencija naďe da je teorijska frekvencija E i < 5, trebalo bi sabrati susedne kategorije. U situaciji potvrďene nulte hipoteze, postoje male razlike izmeďu opaţenih i očekivanih frekvencija. Tada statistika χ2 nosi malu vrednost i nije značajna. Vaţno je napomenuti i to da vrednost statistike nikad nije negativna jer je suma kvadrata. Broj stepena slobode, df se računa na osnovu broja kategorija koje se koriste u računanju statistike. Stepen slobode se izračunava po obrascu: S.S. = (R-1) x (K-1), gde je K - broj kolona, a R broj redova tabele u kojoj se ukrštaju podaci 2 varijable. Izračunate vrednosti statistike i df se gledaju u χ2 tablicama, na osnovu kojih se uočava statistička značajnost rezultata. Kod statističkih softvera je jednostavnije jer imaju ugraďene tablice, pa automatski izbacuju značajnost u okviru analize. Neke od pretpostavki koje je potrebno da postoje kako bi test bio validan su sledeće (Gingrich, 1992): 1. χ2 kvadrat test se izračunava iz apsolutnih frekvencija (ili podataka koji mogu da se svedu na apsolutne frekvencije) ulazni podaci dobijeni istraţivanjem 37

38 2. Kao što je napomenuto, u slučaju postojanja više od dve kategorije (r > 2), ne sme biti više od 20% očekivanih učestalosti manjih od 5 (vrši se saţimanje susednih kategorija ili rekodiranje varijabli na manji broj kategorija kako bi se smanjio %). Ukoliko se test koristi sa većim procentom dozvoljenih očekivanih frekvencija, njegovi nalazi se ne mogu smatrati tačnim i moraju se ili izuzeti ili oprezno tumačiti. 3. Specifična je situacija u kojoj postoje tabele kontingencije 2x2. Tada se primenjuje korekcija za kontinuitet engleskog statističara Franka Yates-a: svaka dobijena frekvencija, ako je veća od očekivane umanjuje se za 0,5, a svaka dobijena frekvencija ako je manja od očekivane uvećava se za 0,5. Njome se smanjuje vrednost testa i povećava njegova p-vrednost. Suština korekcije je u tome da se smanji precenjena značajnost kod malih uzoraka, jer se najčešće koristi kada najmanje jedna ćelija ma očekivanu vrednost manju od 5. Tumačenje dobijene vrednosti bazira se na teorijskoj χ2 raspodeli (Gingrich,1992): a) Raspodela je definisana u rasponu od 0 do +, b) Kriva χ2 raspodele nije simetrična. Kada se povećava broj modaliteta varijabli koje su uključene u analizu, ona se lagano pribliţava normalnoj raspodeli, jer dolazi do povećanja broja stepena slobode. c) Statistička značajnost (kao što je napomenuto), se računa na osnovu tablica prema koeficijentu testa i broja stepena slobode. 1.6 Mann -Whitney U i Kruskal-Wallis testovi U situaciji kada postoje numerički podaci, koji ne zadovoljavaju pretpostavke potrebne za t- test i ANOVA-u, koriste se njihove neparametrijske zamene, Mann-Whitney U test za t-test i Kruskal Wallis za ANOVA-u Mann-Whitney U test Mann i Whitney su godine razvili svoj test, a uporedo sa njima je i Wilcoxon, godine. On predstavlja neparametrijsku zamenu za t-test u situacijama kada pretpostavke za t-test nisu odrţive nema normalne raspodele, kada postoje numerički nezavisni podaci i 2 grupe koje se porede. Kao neparametrijski test, nema pretpostavku o distribuciji podataka a moţe se koristiti i kod malih uzoraka. Nulta hipoteza glasi da dve nezavisne grupe potiču iz iste populacije i da im je distribucija podataka ista. Dobijeni rezultati su ekvivalentni Wilcoxon rank sum testu, pa se nekad zove i Mann-Whitney-Wilcoxon test. Mann-Whitney test se moţe koristiti i u situacijama kada je varijabla ordinalnog nivoa merenja, ali i intervalnog i racio (Nachar, 2008). On poredi meďusobno podatke iz jedne grupe sa drugom, svaku sa svakom. Formula je: (( ( +1 ))/2)- (( ( +1 ))/2)- 38

39 Gde predstavlja broj ispitanika u prvoj grupi, druge grupe, a je suma rangova koja se dodeljuje prvoj, a drugoj grupi. U( i ) predstavlja broj ispitanika jedne grupe koji prethode ili prate ispitanike druge grupe kada su skorovi jedne grupe sortirani u rastućem redosledu. Kao i kod drugih testova, nulta hipoteza se odbija ako je p manje od min( ) (koji predstavlja najmanje izračunate vrednosti obe U statistike). Prema nekim autorima (Nacharm 2008, prema Landers, 1981) Mann-Whitney U test predstavlja jedan od neparametrijskih testova sa najvećom moći (u slučaju kada se ona gleda kao verovatnoća prihvatanja/odbijanja nulte hipoteze), pa čak i u situaciji postojanja malog uzorka. Ipak, u poreďenju sa parametrijskim testovima on ima manju moć, ali to je činjenica koja prati svaki od njih Kruskal-Wallis test Kruskal Wallis je neparametrijski test koji testira razliku izmeďu više grupa nominalnog nivoa merenja i jedne ordinalne varijable. Koncept na kom se zasniva je komparacija sredine rangova grupa (pretpostavlja da su isti u svim grupama), bez pretpostavke o distribuciji podataka. TakoĎe, vaţno je ispuniti pretpostavku da ispitanici budu meďusobno nezavisni. Nulta hipoteza Kruskal-Wallis testa se zasniva na tome da su oblici distribucija u svim grupama isti (McDonald, 1984) i da potiču iz istih populacija. Konceptualno je sličan Mann- Whitney U testu. Započinje sortiranjem dobijenih rezultata od najniţih ka najvišim. Tokom rada se ne obraća paţnja na grupu kojoj rezultat pripada, a nakon toga se dodeljuju brojevi skorovima od 1 do n. Nakon rangiranja podataka, podaci se povezuju sa grupama kojima pripadaju i dodaju se rangovi svake grupe pojedinačno (Field, 2009). Na rang utiče samo veličina uzorka. Matematički izraz za Kruskal-Wallis izgleda: H = ( ) ( ) Gde je R i suma rangova za svaku grupu, N predstavlja ukupnu veličinu uzorka a n i veličinu uzorka svake pojedinačne grupe. Ukratko rečeno, postupak Kruskal-Wallis testa se zasniva na rangiranju podataka, računanja sredina rangova svake pojedinačne grupe, nakon čega se odreďuju značajne razlike i računa test statistika. Naravno, na samom kraju se računa p vrednost na osnovu koje se posmatra statistička značajnost Koeficijent korelacije Definicije korelacije su brojne, mnogi autori su se bavili ovom temom i istraţivali je. Korelacija ispituje stepen povezanosti varijabli, u odnosu na njihov stepen povezanosti i smer, kao i statističku značajnost. Moţe ispitivati vezu izmeďu dve, ali i više varijabli. Vaţno je napomenuti da stepen korelacije ne podrazumeva i objašnjenje kauzalnosti, što se posebno naglašava prilikom interpretacije podataka. Vrste korelacije klasifikacija prema Sharma (Sharma, 2005): 1. Pozitivne i negativne korelacije 2. Jednostavne, parcijalne i višestruke korelacije 39

40 3. Linearne i nelinearne korelacije Koeficijent korelacije se kreće u rasponu -1 do +1, a predznak govori o smeru veze, da li je pozitivna (obe pojave rastu ili opadaju zajedno) ili negativna (obrnuta situacija, jedna pojava raste dok druga opada). Jačinu veze odreďuje koeficijent korelacije na osnovu njegove apsolutne vrednosti. Postoji više kriterijuma jačine koeficijenta korelacije, jedan od njih je prema Cohenu (Palant, 2011, prema Cohen, 1988): 1. Mala r = 0,10-0,29 2. Srednja r = 0,30-0,49 3. Velika r = 0,50-1 Koeficijent korelacije je vaţan kod ispitivanja multikolinearnosti varijabla u regresionim modelima, a moţe se i samostalno koristiti za utvrďivanje povezanosti pojava. Postoji više koeficijenata korelacije a njihov izbor zavisi od nivoa merenja varijable koje su planirane da se ispituju. U tabeli 1. date su vrste koeficijenta korelacije u zavisnosti od nivoa merenja varijabli. 1 Tip (nivo merenja) varijable Y Kategorijalna (nominalni) Dihotomna Dihotomna pretpostavljena normalna Rang (ordinalni) Intervalni ili srazmerni Kategorijalna (nominalni) Koeficijent kontingencije C Kramerov V koeficijent Kendalov koeficijent konkordance W Tip (nivo merenja) varijable X Dihotomna Dihotomna Rang pretpostavljena (ordinalni) normalna Fi koeficijent Kendalov τ (tau) koeficijent Pointbiserijski koeficijent r pbis Tetrahotični koeficijent r tet Biserijski koeficijent r bis Rang koeficijent ρ (ro) Rang koeficijent ρ (ro) Tabela 1.- Vrste koeficijenata korelacije u zavisnosti od nivoa merenja varijabli Intervalni ili srazmerni Pirsonov produktmoment koeficijent r xy U radu će biti objašnjeni Sprimanov, Kendalov tau i Kendalov koeficijent konkordance, jer su varijable koje će biti obraďivane nominalnog (i dihotomno nominalnog) i ordinalnog nivoa merenja i u zavisnosti od kombinacije nivoa merenja, biće korišćen odreďen koeficijent korelacije Spirmanov koeficijent korelacije Spirmanov koeficijent korelacije predstavlja neparametrijski koeficijent korelacije, rang koeficijent. Razvio ga je psiholog Čarls Edvard Spirman godine. Predstavlja zamenu za linearni koeficijent korelacije, a koristi se u situacijama kada Pirsonov koeficijent nije

41 moguće primeniti, kad se ne zna distribucija ili distribucija ne ispunjava pretpostavku normalnosti. Matematički izraz je: ( ) Gde R predstavlja rang koeficijent korelacije, Spirmanov koeficijent. Prvobitno se svi podaci rangiraju, posebno za x i y. Rangovima sortiranih podataka se dodeljuju simboli u(x) i v(y). Razlika izmeďu svakog para je d = u v nakon čega se računa kvadrat svake razlike koji se sabiraju preko. Na kraju, kad se sve ubaci u gornji izraz, dobije se Spirmanov koeficijent korelacije R (negde u literature obeleţen i sa r s kada se govori o korelaciji koja se računa na osnovu uzorka). Interpretacija Spirmanovog koeficijenta korelacije se takoďe interpretira preko tri elementa: visina apslutne vrednosti koeficijenta, znaka koeficijenta i statističke značajnosti Kendalov tau koeficijent korelacije Ovaj koeficijent predstavlja još jedan neparametrijski koeficijent korelacije koji je davno pronaďen. Fechner ga je razvijao, ali nedugo nakon njega je Kendal napravio godine ono što danas nazivamo Kendalovim koeficijentom korelacije. Slično kao Spirmanov koeficijent, radi sa rangovima i to na takav način što kalkuliše konkordante C i diskordante D u okviru uporednih opservacija u grupama. Nagib zavisi od toga da li su parovi opservacija iz grupa konkordanti ili diskordanti. Konkordantni znači da su rangovi oba elementa x i > x j i y i > y j ili (obrutnog znaka < oba), a diskordantni u obrnutoj situaciji, kada je x i < x j i y i > y j ili obrnuto. U situacijama kada su konkordanti, nagib će biti pozitivan, a u drugom slučaju, negativan (Curell, 2015). Matematički izraz, za situacije bez vezanih rangova je: ( ) Iz čega se moţe primetiti da je ( ) Kendalov koeficijent konkordance W Kendalov koeficijent konkoredance je nastao kao posledica potrebe da se meri povezanost meďu varijablama koje imaju tri i više modaliteta, kao produţetak Spirmanovog i Kendalovog tau koeficijenata korelacije (Gibbons, 1993). Matematički izraz je: ( ) Gde je W koeficijent konkordance koji treba da se izračuna. Nedostaje još formula za S: ( ) 41

42 gde S računamo kao sumu kvadrata odstupanja sume rangova oko k(n+1)/2 (što predstavlja sumu rangova svake varijable), R i predstavlja sumu rangova, n rangirane karakteristike a k broj ispitanika koji vrše rangiranje u procesu. S se moţe dobiti i računanjem: [ ( ) ] ali se prethodna formula koristi radi jednostavnijeg izračunavanja. Adekvatan je kao koeficijent korelacije i primenljiv, kada je potrebno dati procenu povezanosti setova k rangova. Ima široku primenu. 2. METODOLOŠKI DEO Narodna banka Srbije (u daljem tekstu NBS) za interne potrebe sprovodi redovna mesečna istraţivanja inflacionih očekivanja privrednih subjekata, sindikata, stanovništva, finansijskog sektora koji obuhvata banke i osiguravajuća društva (jednim imenom, ekonomskih subjekata). Rezultati istraţivanja predstavljaju smernice koje se koriste prilikom donošenja odluka u vezi sa inflacionom targetiranjem. U okviru rada će biti upotrebljeni podaci NBS-a, sakupljani za privredne subjekte u periodu koji kreće od decembra i narednih 23 mesečnih talasa istraţivanja (longitudinalno panel istraţivanje). Longitudinalna metoda prati uzorak ispitanika kroz vreme (dane, nedelje, mesece, godine ) i one su najčešće prospektivne (Petrie, Sabin, 2000). Definicija longitudinalnih studija prema drugom autoru (Twisk, 2003), glasi da su to studije u kojima se rezultirajuća varijabla ponovljeno meri u nekoliko različitih vremenskih tačaka. Vaţna prednost longitudinalnih studija je praćenje pojedinačnog razvoja ispitanika ili neke pojave kroz vreme tokom kojeg se posmatra, dok su najčešće mane, novac i vreme koje je potrebno uloţiti, ali i osipanje uzorka tokom trajanje studije. Napominje se da su podaci u radu korišćeni uz pismenu saglasnost NBS-a, a da ih je sakupljala agencija za istraţivanje trţišta i javnog mnjenja Ninamedia Kliping doo putem PAPI, CATI i CAWI metode. Pismena saglasnost NBS-a se odnosila na korišćenje podataka o (ne)prisustvu preduzeća u longitudinalnom uzorku i njihovim karakteristikama uz zaštitu identiteta učesnika, bez korišćenja konkretnih rezultata koji su predstavljali odgovore na pitanja u okviru projekta. 2.1.Metoda sakupljanja podataka CATI CATI (Computer Assisted Telephone Interviewing telefonska anketa) je jedna od često korišćenih metoda sakupljanja podataka u Srbiji. Iako je metoda koja donosi dobar odnos cena/vreme realizacije, postoje brojni problemi sa kojima se istraţivači suočavaju kad je u pitanju primena date metode u praksi. Prednosti primene CATI metode - usled odnosa kvaliteta podataka i cene, kao i vremena realizacije istraţivačkog projekta, CATI metoda je još uvek popularna u Srbiji, kako za klijente, tako i za agencije koje primenjuju CATI kao način sakupljanja podataka. Optimalna veličina uzorka od n=1200 se moţe sakupiti za prosečno 4-5 radnih dana, u trajanju ankete oko 6-7 minuta, uz oko 35 anketara koji anketiraju u proseku 5,5 sati po danu (podaci dati na 42

43 osnovu profesionalnog iskustva autora rada za 10-ak godina bavljenja u sferi istraţivanja). Brzina sakupljanje podataka je prednost nad terenskom PAPI/CAPI metodom koja zahteva i vreme distribucije materijala anketarima na terenu, vraćanje upitnika radi pregleda i kontrole i slično. Cena CATI istraţivanja je u odnosu na PAPI jeftinija više puta, tako da se klijenti pre opredeljuju za povoljnije opcije. Kvalitet podataka je adekvatan kad se maksimalno vodi računa o potpunosti baze brojeva telefona iz kojih se uzorkuju ispitanici, kao i o reprezentativnosti uzorka, odnosno minimalizuju sledeći navedeni nedostaci. Lični kontakt je jedna od prednosti jer omogućava smanjenje i kontrolisanje odziva ispitanika, koja umnogome zavisi od umešnosti anketara da objasni cilj i navede ispitanika da učestvuje u istraţivanju. Jednostavnost kontrole rada anketara je jedna od vaţnih prednosti CATI istraţivanja jer su kompjuterski podrţana. Na osnovu ličnog iskustva u oblasti sakupljanja podataka, uočavaju se praktični problemi vezani za CATI: CATI nedostaci - Nekada je u Srbiji postojao samo jedan operater fiksne telefonije, a sada su se priključili i ostali. Ipak i dalje postoji jedan dominantan na trţištu fiksne telefonije sa preko 2 miliona fiksnih telefonskih brojeva za fizička lica. Postoji 3 mogućnosti da se doďe do baze podataka glavnog operatera kupovina odreďenog broja telefonskih brojeva direktno od operatera, koji ograničava maksimalni broj kupljenih brojeva (nije moguće da jedno fizičko lice ili kompanija kupe sve brojeve, dozvoljeno je oko brojeva), skidanje brojeva sa zvaničnog sajta operatora ili da se koriste rasponi postojećih centrala brojeva. Svaki od navedenih načina ima svoje nedostatke. Prvobitno gledano, ukoliko ne postoji legalan način kupovine celokupnog imenika glavnog operatera, nije moguće doći do svih korisnika fiksne telefonije. Drugo, skidanje brojeva ručno sa sajta operatera traje veoma dugo i nosi velike troškove. Nelegalno skidanje brojeva sa sajta nije moguće ili je teško izvodljivo putem softvera, jer sajt sadrţi zabrane eksploatacije ove vrste. Treće, ukoliko bi se napravili rasponi centrala pozivnih brojeva za neko mesto, postoji veliki broj tzv. praznih brojeva koji još uvek nisu dodeljeni pa se troši vreme i novac na zvanje nepostojećih brojeva, ali i odreďen broj ljudi koji su sakrili svoje lične fiksne telefona da ne budu dostupni javnosti i imeniku koji je online, a samim tim se dovodi u nepriliku da će se pozvati neki broj bez mogućnosti objašnjenja odakle on ispitivaču. Poslednje i najvaţnije, nemaju svi ljudi u Srbiji fiksni telefon, a neki imaju čak i do 8 brojeva na jednoj kućnoj adresi. Prema podacima Republičkog regulatornog tela iz 2014.godine (poslednji zvanični dostupni podaci), ukupno 82,7% pojedinačnih domaćinstava poseduje fiksni telefon (Janković, 2015), dok 90,6% domaćinstava poseduje mobilni telefon. Posmatrajući podatke Republičkog zavoda za statistiku i zvanično objavljenog izveštaja (Kovačević, Pavlović, Šutić, 2015), upotreba mobilnog telefona raste od 2013, preko do godine: 86,9%, 90,6%, 90,3%. Na sajtu glavnog operatera, postoje greške u klasifikacijama a pored toga, baza se vremenom menja pa je neophodno često aţuriranje. Pored glavnog operatera, tu su i drugi, koji su u poslednjih nekoliko godina uveli fiksne telephone kao uslugu. Još uvek ne postoji način da se doďe do kompletnih jedinstvenih baza podataka fiksnih telefona. Pored svega navedenog, postoji trend pada korišćenja fiksnih telefona. Veliki broj graďana koristi mobilne telefone i ne javlja se na fiksne telefone tako da je broj neupotrebljenih brojeva mnogo veći nego što je bio pre nekoliko godina. GraĎani su svakodnevno izloţeni velikom broju institucija koje zovu na fiksne telefone: banke koje nude kredite, direktna prodaja, političke stranke i ostali. Ovo je pogotovo osetno kod graďana iz regiona Beograda sa kojima se popunjavaju kvote tek na kraju kad se ispune ostali delovi Srbije. Demografske karakteristike graďana koji se javljaju na telefon su posebna specifičnost 43

44 kada se radi ispitivanje na uzorku opšte populacije. Na telefon se najčešće javljaju ţene, stariji graďani koji su raspoloţeni da učestvuju u nekom istraţivanju, graďani sa visokim obrazovanjem, a veoma slabo muškarci, mladi, graďani Beograda i osobe sa niţim obrazovnim nivoima. Imajući u vidu sve navedeno, moţe se reći da se za CATI metodu, iako upotrebljiva, mora paţljivo rukovati uzorkom i ulaznom referentnom bazom kontakata. TakoĎe, CATI se moţe koristiti i za anketiranje ispitanika koji su korisnici mobilnih telefona. Jedan od velikih nedostataka je taj što ne postoji jedinstvena baza podataka svih operatera koji posluju na domaćem trţištu koja bi bila dostupna agenciji koja sakuplja podatke. Ipak, veoma je korisno kada se radi istraţivanje sa bazom podataka klijenta koji naručuje istraţivanje i ima brojeve mobilnih telefona svojih korisnika. Ubacivanjem telefonskog fajla u softver za CATI, dobija se mogućnost slučajnog uzorkovanja. Još jedan od nedostatka CATI-ja je vremenska ograničenost trajanja upitnika. Praksa pokazuje da su ankete čija je duţina više od 15 minuta često neuspešne, teško je doći do ispitanika, dolazi do prekidanja upitnika na pola (usled čega su sakupljeni podaci nevalidni) i slično. Optimalna duţina upitnika ispod 10 minuta pokazuje zadovoljavajuće rezultate na opštoj populaciji. Sa specifičnom ciljnom javnošću kao što je stručna i poslovna javnost, neophodno je imati kraću anketu od toga, usled nedostatka vremena potencijalnih ispitanika. CATI koristi samo ljudski glas ili neki zvuk kod ispitanika, dok informacije na osnovu ostalih čula nije moguće dobiti vid, ukus, dodir, miris. CATI danas, iako ima mnogo navedenih nedostataka, dostiţe svoju punu primenu, posebno kod istraţivanja u kojima postoje uzorci u panelima u kojima se longitudinalno sakupljaju podaci od relativno stabilnog uzorka subjekata. Omogućava brzo, efikasno i pouzdano beleţenje i čuvanje podataka, uz postojanje direktnog kontakta sa ispitanicima putem telefona. Sledi prikaz prednosti i mana CATI metode zabeleţenih u literaturi. Prednosti CATI metode su relativno jeftino i brzo sakupljanje podataka, kvalitetan uzorak koji omogućava da se obuhvate subjekti koji su široko raspršeni po teritoriji. Neki autori tvrde da su osetljivija pitanja bolja za telefonsko sakupljanje podataka (Burns, Bush, 2003) dok za mane kaţu da ispitanik moţe da koristi samo čulo sluha a ne i vida, pa ne moţe da mu se pokaţe odreďeni material koji se istraţuje. Kod terenskog istraţivanja licem u lice anketar moţe da vidi i govor tela ispitanika, ima kontakt očima, moţe da sakupi više informacija i da uradi i dugačke intervjue. Osim toga, putem telefona nije moguće davati liste sa odgovorima jer je veliki koginitivni napor da se zapamti navedeno. Kontaminirajuće za telefonske ankete je i porast broja ljudi koji koriste automatske sekretarice, identifikaciju poziva a usled porasta broja telemarketara koji nude direktnu prodaju putem telefona, veći je i otpor ispitanika da se jave na nepoznate brojeve i učestvuju u istraţivanju. Tehnička realizacija CATI istraţivanja putem softvera u praksi Postoje brojni softveri kojima se moţe realizovati CATI istraţivanje. Ono što je njihova zajednička karakteristika jeste da sadrţe slučajan odabir ispitanika i veliki broj specifičnosti koje olakšavaju rad istraţivačima: veliki broj kompleksnih filtera, sve vrste pitanja, rotaciju obeleţja i modaliteta unutar istih kad se odgovori čitaju, neki od njih mogu da reprodukuju zvuk ispitanicima i slično. Omogućavaju detaljnu statistiku o broju poziva, onih koji su se javili i odbili da učestvuju, broj realizovanih anketa od strane anketara, broj pozvanih brojeva od strane anketara, merenje prosečne duţine trajanja ankete, na nivou pojedinačnog anketara, grupe anketara, projekta... Postoje licencirane verzije softvera koje se mogu naći u prodaji na različitim nivoima: iznajmljivanje softvera, kupovina na neodreďeno uz povremeno 44

45 odrţavanje, kupovina na licencu od godinu dana. Kompjuter u ovom slučaju moţe umnogome da olakša posao istraţivaču. Podaci se direktno unose u softver, puni se baza koja leţi iza aplikacije (često MySQL) i ima mogućnost eksportovanja u različite formate (SPSS, excel, csv, ASCII...). Neki od softvera imaju automatsko pozivanje, drugi ne, ali ukupno posmatrajući, predstavljaju koristan alat prilikom sakupljanja podataka. 2.2.Metoda sakupljanja podataka CAWI CAWI Computer Assisted Web Interviewing veb anketiranje. Primena CAWI metode prikupljanja podataka je u porastu, kako kod nas, tako i u svetu. Njene prednosti i mane biće prikazane iz ugla iskustvenih, ali i teorijskih zapaţanja. Autor rada je sakupljala podatke putem CAWI metode u poslednjih 7 godina u okviru agencije za istraţivanje trţišta i javnog mnjenja, koristeći agencijski razvijen softver, kao i licencirani softver za ovu namenu. CAWI je raďen u skladu sa zahtevima različitih klijenata tokom vremena, a jedan od njih je i projekat istraţivanja Narodne banke Srbije čiji će se podaci koristiti kao podloga za upotrebu različitih analiza. Prednosti CAWI metode najveća prednost CAWI metode koju je praksa do sada pokazala se zasniva na tome da ispitanik ima mogućnost da odgovori u vreme koje mu najviše odgovara, bez uznemiravanja od strane agencije koja prikuplja podatke, preko linka koji dobije putem ličnog a. Za prikupljanje podataka nije vaţno odakle se odgovara jer je link dostupan sa bilo kog računara, tako da je praktičan za upotrebu. Softver u kom se link programira u upitnik sa korisničke strane je veoma jednostavan za upotrebu i omogućava pisanje instrukcija ispitaniku šta da radi da bi prešao na sledeće pitanje. Prednost CAWI je i ta što daje osećaj anonimnosti jer nije moguće dobiti informaciju ko je popunio anketu, pa ni preko IP adrese sa koje dolazi računar, jer samo policija, sud i ostali drţavni organi imaju mogućnost da dobiju informacije te vrste, tako da su ispitanici zaštićeni. Nije ograničena striktnom duţinom upitnika kao što je slučaj kod CATI-ja. Prednost je cena, jer je potrebno minimalno resursa da bi se sakupili podaci (nema troškova rada anketara niti telefona), kao i relativno brzo vreme realizacije. Nedostaci CAWI metode dešava se da zaštitni sistemi različitih institucija i preduzeća ne dozvoljavaju da se otvori link koji je poslat od strane agencije jer ga detektuje kao virus. Pored toga, ispitanik samostalno popunjava upitnik i moguće su greške u unosu, preskakanju pitanja, davanja odgovora na pitanja na pogrešnom mestu i slično. Ove greške je moguće proveriti naknadnim pozivanjem ispitanika i kontrolom potencijalnih grešaka, uz rizik uznemiravanja ispitanika ponovnim zvanjem, čime se produţava vreme potrebno za realizaciju projekta. Najveći nedostatak CAWI metode je mali odziv (u proseku iznosi oko 10% odgovorenih u odnosu na broj poslatih upita podatak dat iskustveno). Slanjem na veliki broj ova, pozivanjem za učešće u istraţivanju, dobija se višestruko manji odziv ispitanika, osim ukoliko nije u pitanju veb panel. Načini sakupljanja podataka u kojima ne postoji direktan lični kontakt sa potencijalnim ispitanicima dovodi do sniţenog odziva, jer anketari igraju vaţnu ulogu u pristupu potencijalnim učesnicima u projektu. CAWI metodom moguće je dobiti i zvučne informacije, dok do informacija na osnovu čula mirisa, dodira i ukusa nije moguće dobiti. Veb panel je način sakupljanja podataka koji je baziran na CAWI metodi, prilikom kojeg se učesnici registruju u bazu. Motivisani su da popunjavaju ankete jer sakupljaju odreďene poene, koji se mogu zameniti za simboličnu materijalnu ili nematerijalnu nagradu. U slučaju panela, odziv je mnogo viši nego u klasičnim istraţivanjima putem CAWI-ja. Ipak, vaţno je reći i to da sakupljanje potencijalnih ispitanika za veb panel traje dugo i košta, a moguće je dobiti ih u relativno kratkom vremenskom periodu putem Fb 45

46 kampanja koje su atraktivne korisnicima ove društvene mreţe, uz odgovarajuće troškove koji prate ovakvo punjenje baze novih korisnika panela. Korišćenje Interneta u Srbiji nije toliko napredovalo kao u drugim zemljama. U Srbiji je 65,3% lica koristilo Internet u poslednja tri meseca, 1,0% ispitanika koristilo je Internet pre više od tri meseca, a 3,1% pre više od godinu dana. Čak 30,6% ispitanika nikad nije koristilo Internet. U odnosu na godinu, za 2,5% povećao se broj korisnika Interneta, za 10,9% u odnosu na godinu, a za 17,8% u odnosu na godinu (Kovačević, Pavlović, Šutić, 2015). Samim tim, primena CAWI istraţivanja kod nas nije u tolikom obimu kao što je slučaj u drugim zemljama gde je korišćenje Interneta daleko prisutnije. Teorija - prednosti i nedostaci CAWI metode (Burns, Bush, 2003): Prednosti CAWI istraţivanja su brojni. U inostranstvu, moguće je kupiti velike baze podataka ispitanika pa se samim tim lako i brzo prikupljaju podaci. Anketari ne vrše uticaj na ispitanike prilikom sakupljanja, postoji fleksibilnost, a rezultati su lako dostupni i često odmah vidljivi na Internetu u realnom vremenu nakon završenog projekta. Cena je takoďe prednost jer je CAWI jeftiniji od drugih metoda. Ipak, njegovi nedostaci su da je usmeren samo na populaciju koja ima/koristi Internet, što ne daje reprezentativnost cele populacije nego samo online populacije. Kao što je već napomenuto, odziv na CAWI je niţi od ostalih metoda, a kako ispitanik sam popunjava upitnik mogući su nedovoljno kvalitetni odgovori i ovim putem nije moguće da ispitanik oseti ukus nekog proizvoda. Posmatrajući navedeno, CAWI i ostala internet istraţivanja imaju mnogo mana, ali pošto su brza i jeftina, sve više se primenjuju u svetu, a ta praksa stiţe i u Srbiju. Tehnička realizacija CAWI putem softvera u praksi Isprogramirana anketa u CAWI softveru šalje se putem pristupnog linka na imejl ispitanicima. Ispitanici pored linka, dobijaju i kratko uputstvo u kom se objašnjava cilj istraţivanja i ostale informacije od značaja, kao i kontakt osobe kojoj mogu da se obrate ukoliko imaju bilo kakvih pitanja ili tehničkih problema. Optimalna varijanta je korišenje kombinovanog sakupljanja podataka, kad su u pitanju ove dve metodologije. Istraţivanje ide sve više ka tome da je neophodno sakupljanje podataka iz više izvora i njihovo modeliranje u sistem radi dobijanja pouzdanih procena i informacija koje klijenti traţe. U praksi to znači najčešće dve stvari: kontaktiranje potencijalnog ispitanika putem CATI-ja, slanje CAWI linka i naknadno pozivanje ukoliko je mali odziv. Istraţivanje CATI ili CAWI U literaturi je pronaďen primer komparacije CATI I CAWI sakupljanja podataka. Uočava se da nema statistički značajnih razlika izmeďu dve grupe podataka. Uočena je razlika od par procentnih poena u odgovorima u zavisnosti od metode sakupljanja podataka, koje nisu bile statistički značajne (Camillo, Conti, Ghiselli, 2011). Istraţivanje Statističkog zavoda Holandije (Janssen, 2006) bavilo se problemom odziva potencijalnih učesnika istraţivanja.testiran je CAWI u kojem je odziv bio 25-30%. Zaključeno je da se kombinacija CATI CAWI preporučuje u istraţivanjima. Drugi zaključak ukazuje na to da postoji razlika u preferencijama ciljnih grupa pri izboru metode kojim će biti anketirani. Stariji, oni koji nisu u braku, razvedeni roditelji, udovci, etničke manjine i ljudi sa niţim primanjima u maloj meri odgovaraju na CAWI. 46

47 2.3 Metoda sakupljanja podataka PAPI PAPI metoda prikupljanja podataka terensko istraţivanje sa ispitanicima putem intervjua licem u lice. Predstavlja sakupljanje podataka u kojem anketar usmene odgovore ispitanika beleţi na unapred pripremljen odštampan merni instrument. Prednosti PAPI metode- PAPI omogućava da se na terenu dopre do ljudi koji odgovaraju svim karakteristikama populacije koja se ispituje, gde je potencijalni referentni okvir cela populacija, bez ograničenja da ispitanik mora da poseduje telefon ili računar/telefon sa internetom da bi odgovorio na pitanja. Nije ograničena vremenskim trajanjem ankete koliko CATI, omogućava lični kontakt sa ispitanikom i mogućnost objašnjenja pitanja/termina/cilja istraţivanja/načina popunjavanja upitnika ukoliko je neophodno. TakoĎe, PAPI omogućava da ispitanik koristi svoja čula ukoliko to projekat zahteva da pogleda dizajn, pomiriše nov proizvod, dodirne predmet, čuje sve potrebne informacije i stimuluse. PAPI je najkompletnija metoda sakupljanja podataka, imajući u vidu mogućnost korišćenja svih čula ispitanika. Nedostaci PAPI metode unos podataka moţe da dovede do grešaka, unošenjem nakon sakupljenog materijala sa terena. Greške su vidljive tek naknadno kad su podaci već u bazi i kad je sve završeno. Najveći nedostatak je cena i veliki broj instruisanih ljudi na terenu, kako bi svi na isti način doprineli dobijanju pouzdanih podataka. U literaturi je pronaďeno istraţivanje koje se bavilo komparacijom izmeďu PAPI, CATI I CAWI istraţivanja (Kagerbauer, Manz, Zumkeller, 2013), koje je pokazalo da postoji tendencija da ljudi koji su u penziji preferiraju CATI umesto CAWI, dok mlaďi više CAWI. Što se tiče PAPI dizajna, po nalazima ovog istraţivanja podjednako je bio preferiran u svim segmentima populacije i postizao je iste odzive za istraţivanje kao CATI I CAWI. Na osnovu prethodno naďenih primera istraţivanja efikasnosti različitih metodoloških pristupa, moţe se zaključiti da su razlike meďu odgovorima neznačajne u odnosu na korišćenu tehniku. Ipak, preporučuje se korišćenje odreďene metode sakupljanja podataka u odnosu na ciljnu grupu. Istraţivanje koje je imalo za cilj komparaciju (Fuchs, Couper, Hansen, 2000) CAPI I PAPI sakupljanja podataka, daje rezultate da CAPI traje nešto duţe u odnosu na PAPI, zbog toga što ispitanici ne pišu nego treba da kucaju, ali razlike koje su pronaďene su više u smislu dizajna izmeďu PAPI I CAPI nego razlike same tehnologije. Tehnička realizacija PAPI u praksi Odštampane upitnike koordinator anketarske mreţe šalje anketarima na teren koji, ako je u pitanju opšta populacija, sadrţi tačno odreďenu procedure kretanja po terenu i odabira ispitanika. Poštovanjem procedure, anketar sakuplja podatke i naknadno putem linka koji dobije sa svojom šifrom, unosi podatke na server agencije. Ukoliko je ciljna grupa preduzeće, anketar se najavljuje i traţi dozvolu za dolazak kod odreďene osobe koja je predviďena da učestvuje u istraţivanju, nakon čega se ponavlja postupak kao i kod opšte populacije. 47

48 2.4.Metoda sakupljanja podataka CAPI CAPI metoda prikupljanja podataka Computer Assisted Personal Interviewing, metoda koja je identična PAPI metodi, samo što se odgovori ispitanika ne beleţe na papir nego u ureďaj koji ima pristup linku na serveru na kom se sakupljaju podaci. Prednost CAPI metode smanjena mogućnost grešaka prilikom unosa, mogućnost direknog uvida u rad anketara dok je još na terenu, povećana mogućnost kontrole anketara (neki CAPI program imaju GPS modul koji prati anketara na terenu i tačno se moţe videti kuda se kreće). Instruisanjem anketara da će biti praćen na terenu pomoću ovog modula povećava se svest o njegovoj kontroli i doprinosi povećanom kvalitetu sakupljanja podataka. Nedostaci CAPI metode skupa infrastruktura ureďaji na kojima se radi velika su početna investicija, mnogi rade na bazi slanja podataka putem Interneta, a u Srbiji je mnogo opština koje nisu pokrivene dovoljno jakim Internet signalom, ureďaji se kvare, oštećuju, anketari moraju da prolaze posebnu obuku da bi ih koristili, baterija ureďaja se kod dugačkih anketa brzo prazne. Preostali nedostaci isti su kao i kod PAPI metode. Tehnička realizacija CAPI u praksi Programiranu anketu anketari pokreću putem linka koji dobiju, zajedno sa ureďajem kojim pristupaju serveru (neohodna Internet konekcija), radi se pitanje po pitanje dok se ne doďe do kraja upitnika, kada se podaci automatski šalju na server agencije, prilikom čega je moguć uvid i kontrola par sekundi nakon popunjene ankete u realnom vremenu. 2.5.Opis metodologije sakupljanja podataka Narodne banke Srbije Metodologija sakupljanja podataka, prema stepenu kontrole istraţivanja, spada pod neeksperimentalno istraţivanje, prema uslovima u kojima se vrše, spada pod naturalističko odnosno terensko istraţivanje, prema nameni je primenjeno istraţivanje (Todorović, 2008). Prema vrsti dobijenih podataka, u pitanju je kvantitativno istraţivanje. Istraţivanje inflacionih očekivanja privrednih subjekata čije je učešće u uzorku tema ovog rada je upravo kombinacija najboljih karakteristika prethodno opisanih CATI/CAWI metoda. Prvobitna metoda, licem u lice putem papira i olovke i odlaskom na teren (kojem je prethodila telefonska najava uzorkovanih preduzeća) dovodi do ličnog kontakta, upoznavanja i slanja na teren obučenih anketara koji su sakupili ulazne podatke (kontakte, osobe koje bi učestvovale u longitudinalnom projektu i ostale relevantne informacije). Nakon toga, adekvatni predstavnici preduzeća su upitani da li bi im za naredni mesec više odgovaralo da budu ispitivani putem CATI ili CAWI metode. Svaki naredni mesec to pitanje im je ponovljeno, kako bi im se izašlo u susret da popunjavaju upitnik na način kako to njima odgovara. Sa tim u vezi, kombinacija navedenih metoda bi trebalo da daje svoj puni efekat i omogući dobijanje što pouzdanijih podataka. Metoda sakupljanja podataka za prvi mesec istraţivanja (decembar 2014.) predstavljala je kvantitativno, terensko istraţivanje PAPI metodom, odnosno intervjuisanje licem u lice, gde bi obučeni anketari postavljali pitanja adekvatnim osobama i odgovore unosili na papir. Unos podataka se potom obavljao preko licenciranog softvera na server, uz logičku kontrolu unosa. Profesionalni licencirani program za sakupljanje podataka omogućava kreiranje neograničenog broja upitnika, njihovo ureďivanje i dizajniranje u skladu sa zahtevima svakog pojedinačnog istraţivanja. Podaci su bili skladišteni u MySQL bazu iz koje bi se eksportovali u SPSS bazu i excel bazu radi dalje analize podataka. 48

49 Planirano sakupljanje podataka je 36 meseci. Metoda sakupljanja podataka za preostalih 35 meseci istraţivanja je kvantitativno, telefonsko istraţivanje CATI metodom uz podršku CAWI istraţivanja (slanje imejlova firmama za popunjavanje podataka putem linka). Podaci se direktno unose u licencirani softver na serveru, uz logičku kontrolu unosa i potrebne filtere. Prilikom pozivanja telefonom predstavnika preduzeća koji učestvuje u projektu, dešava se u više navrata da traţenu osobu nije moguće dobiti na telefon, da se ne javlja ili da nije umogućnosti da razgovara. Pomoću CATI-ja ispitanik daje direktno odgovore anketaru, koje on zapisuje u CATI softver, dok kod CAWI ankete, ispitanik ima mogućnost da odgovori u vreme koje njemu odgovara, a samim tim ostavlja mogućnost i više vremena za razmišljanje u vezi sa ispitivanom temom. CATI je u tom smislu praktičniji kao metoda kada se ispitanik prvobitno upoznaje sa pitanjima, jer postoji mogućnost da anketar pojasni sve potrebne nejasnoće i da ga vodi kroz čitav proces, dok kod CAWI-ja toga nema i svodi se na samopopunjavanje od strane ispitanika, a samim tim i mogućnost da doďe do greške prilikom unosa ili preskočenog pitanja ili slično. Na kraju, za obe metode baza se kontroliše i traţe se sumnjivi odgovori koji se proveravaju. Napominje se da se uvek pozivaju isti ispitanici koji su prethodnog meseca učestvovali u istraţivanju, prilikom čega se regrutuju novi tek kad neko od prvobitnih učesnika odustane iz projekta iz različitih razloga, što se u terminima analize preţivljavanja naziva dogaďajem Uzorkovanje preduzeća Uzorački okvir tj. uzorački skup su podaci Agencije za privredne registre, završni računi preduzeća za godinu. Kako je projekat krenuo u decembru godine, nisu postojali podaci na APR-u za godinu i to je razlog usled kog je uzeta kao referentna godina za uzorkovanje preduzeća. Kasnije je raďeno naredno uzorkovanje jer je bio vaţan koncept koji panel ima zadrţavanje ispitanika u bazi tokom trajanja celokupnog projekta. Uzorak je sistematski sa slučajnim početkom i izveden prema teorijskom modelu kada se bira uzorak sa proporcionalnim verovatnoćama uključenja, a po kriterijumu veličine godišnjeg prometa (poslovnog prihoda). Slučajnim izborom preduzeća u okviru uzorka, traţe se subjekti za učešće u istraţivanju. Veličina uzorka je 100 privrednih subjekata svakog meseca (veliki uzorci). Ponderisanje se vrši na osnovu pondera za ocenu totala obeleţja koji predstavljaju inverzne verovatnoće uključenja koje su proporcionalne veličinama poslovnog prihoda za svaku jedinicu (preduzeće) iz populacije. Uzorkovanje i ponderisanje je vršio Republički zavod za statistiku. Modalitet veličine preduzeća su mikro (do 10 zaposlenih), mala preduzeća (11-49 zaposlenih), srednja preduzeća ( zaposlenih) i velika preduzeća (250 i više zaposlenih). Prvobitno je uzorkovano je 535 preduzeća, jer je u pitanju uzorak koji treba da predstavlja panel za 100 preduzeća mesečno za navedeni period. Usled potreba i osipanja uzorka u prvim mesecima istraţivanja, napravljeno je i drugo uzorkovanje prilikom kojeg je u uzorak uključeno 1015 preduzeća iz kog bi mogli da se pozivaju da učestvuju u panelu. Kada neko od preduzeća prestane da učestvuje u istraţivanju, zamenjuje se prvim narednim preduzećem sa liste koja je sortirana prema datom uzorku, prema preporuci RZS-a. Rezerva u inicijalnom uzorku je značajna da bi uzorak preţiveo do kraja planiranog projekta. Kako delatnost preduzeća nije bila kriterijum uzorkovanja, delatnosti su veoma različite i definisane šifarnikom o delatnostima i čine sastavni deo baze podataka. 49

50 2.5.2.Ispitanici Ispitanici u projektu su osobe koje su u mogućnost da ispred preduzeća daju odgovor o inflacionim očekivanjima (finansijski direktor, generalni direktor, računovoďa ili neka druga osoba, koja ima dovoljno znanja i informacija na osnovu kojih daje odgovore na pitanja) Merni instrument Dostavljen od strane NBS-a, upitnik sa identičnim setom pitanja vezanim za procenu inflacionih očekivanja, u kojima je jedina promena iz meseca u mesec bio naziv meseca za koji su ispitanici procenjivali parametre po zahtevu NBS-a Varijable i ostali podaci o projektu Varijable u istraţivanju: u okviru istraţivanja ima više varijabli, od kojih su samo neke od njih bile iskorišćene za potrebe ovog rada. Napominje se da nije korišćen nijedan podatak koji je predstavljao odgovor preduzeća na upitnik NBS-a u projektu. Sve varijable koje su analizirane tokom rada su opšta ili izvedena obeleţja samih preduzeća ili broja meseci koliko su učestvovali u istraţivanju. To su sledeće varijable: 1. Šifrovan naziv preduzeća koji je učestvovao u istraţivanju. Šifre su se dodeljivale po brojevima 1 do n, a šifrovanje se radi radi zaštite podataka preduzeća koje je učestovovalo u istraţivanju i etičkih standarda ovog rada. Varijabla je nominalnog nivoa merenja. Na osnovu ove varijable, pravi se nova u kojoj se utvrďuje prisutnost/neprisutnost preduzeća u uzorku tokom posmatranog vremena. Ova varijabla se ne prikazuje nigde prilikom obrade podataka, osim što je imala ulogu ključa koji je omogućavao praćenje odreďenog preduzeća kroz mesece. Učestvovanje je binarna, dihotomna varijabla sa dva modaliteta. 2. Veličina preduzeća kao varijabla ordinalnog nivoa merenja, sa 4 modaliteta: mikro preduzeće, malo preduzeće, srednje preduzeće, veliko preduzeće. Klasifikacija preduzeća je preuzeta u odnosu na kriterijume sa APR-a (Agencija za privredne registre, Republika Srbija, 2015). Kriterijumi razvrstavanja se vezuju za Zakon o računovodstvu, korišćenjem podataka iz Bilansa stanja i Bilansa uspeha, kao i podataka o prosečnom broju zaposlenih iz zahteva za javno objavljivanje redovnog godišnjeg izveštaja, gde se gleda prosečan broj zaposlenih, poslovni prihod i prosečna vrednost poslovne imovne, kako bi se razvrstala privredna društva, zadruge i preduzetnici. 3. Metod sakupljanja podataka kao varijabla nominalnog nivoa merenja modaliteta: CATI, CAWI, PAPI prethodno objašnjene. 4. Vreme preţivljavanja varijabla ordinalnog nivoa merenja koje označava broj meseci koliko je preduzeće preţivelo u uzorku, gde najmanji moţe biti 1 a najveći kao broj meseci kada je napravljen presek stanja da se radi obrada za potrebe rada, 23. Brojevi su celi jer se projekat istraţivanja izvodi jednom mesečno u tačnim vremenskim razmacima. Vreme preţivljavanja je rekodirano u 4 kategorije radi smanjenja raspršenosti podataka, jer je veliki broj ćelija imao frekvenciju manju od 5. 50

51 Kategorije su 1-8 meseci, 9-21 mesec, meseci. Kategorije su namerno nejednako definisane, jer su raďene u odnosu na frekvenciju i distribuciju podataka, kako bi se koliko je moguće napravile ravnomernije prve dve kategorije. 5. Varijabla statusa je nominalnog nivoa merenja i predstavlja status cenzurisane vrednosti (0) ili neuspeh (1) i ima dihotomne vrednosti. 6. Varijabla region varijabla nominalnog niovoa merenja koja sadrţi 4 modaliteta (Vojvodina, Beograd, Istočna sa Juţnom Srbijom, Zapadna Srbija sa Šumadijom). Klasifikacija regiona je preuzeta od Republičkog zavoda za statistiku. 7. Varijabla tip delatnosti varijabla nominalnog nivoa merenja, koja ima veliki broj delatnosti po šifarniku APR-a koje su rekodirane u tri delatnosti, tako da obeleţje dobija tri modaliteta veštačkim putem: proizvodnja, trgovina i ostalo. 8. Broj zaposlenih varijabla ordinalnog nivoa merenja, koja ima 4 modaliteta, veštački grupisanih u skladu sa klasifikacijom koja se koristi kao jedan od kriterijuma za odreďivanje veličine preduzeća prema Agenciji za privredne registre: do 10, do 50, do 250, preko 250. Period realizacije: sprovoďenje istraţivanja od 15. u mesecu, predaja izveštaja do kraja meseca, svakog meseca pod istim uslovima. Istraţivanje se sprovodi od 15. u mesecu po zahtevu NBS-a. Softver za analizu podataka: SPSS 20.0 i excel. Obrada podataka za potrebe istraţivanja podrazumeva pregled unetih podataka, komparacija u odnosu na prethodne talase pojedinačnih odgovora ispitanika, logičku kontrolu i čišćenje baze podataka. Nakon prvog istraţivanja prate se trendovi u odnosu na prethodne talase istraţivanja komparacijom odgovora. Kako dobijeni podaci o inflacionim očekivanjima nisu predmet ovog rada i zbog zaštite internih informacija od značaja NBS-a, koriste se podaci koji se dobijaju sakupljanjem osnova za planiranu obradu podataka koja sledi. Vremenski period nakon kog se ponavlja istraţivanje: istraţivanje se sprovodi na mesečnom nivou u periodu od 36 meseci prilikom čega se za potrebe ovog projekta uzimaju podaci prvih 23 talasa istraţivanja. 51

52 3. REZULTATI 3.1.DESKRIPTIVNA STATISTIKA Veličina uzorka svaki mesec je bila 100 preduzeća. Tokom 23 meseca učestvovalo je ukupno 155 preduzeća, ali je 19 njih isključeno iz obrade podataka koji su sakupljani PAPI metodom i po završetku prvog meseca prestali da učestvuju u projektu. Razlog za ovo je bio kontaminacija podataka i dobijanja podataka da su statistički značajni, a nisu (nakon isključenja istih, menjaju se podaci). Nakon isključenja, celokupan rad je dalje raďen na n=136 preduzeća. Preduzeća dolaze najčešće iz regiona Vojvodine, 39%, nakon čega slede preduzeća iz Zapadne Srbije sa Šumadijom (29,4%), zatim iz Beograda, 23,5% i na kraju iz Istočne i Juţne Srbije, 8,1%. Moţe se primetiti disproporcija u odnosu na statističku podelu regiona u Srbiji prema RZS-u, gde je Vojvodina slabija u odnosu na dobijene podatke ove raspodele (oko 27% je Vojvodina po RZS-u), a Istočna i Juţna Srbija su zastupljene u manjoj meri nego što je to slučaj po RZS-ovim podacima. Kako se kriterijum odabira prilikom uzorkovanja preduzeća odnosio na prihode preduzeća, a ne njegovu regionalnu pripadnost, moţe se primetiti da je ekonomski najslabiji deo Srbije najmanje i zastupljen u uzorku, pa su rezultati objašnjivi. Najviše ima velikih preduzeća, 49,9%, nakon čega slede skoro pa podjednako srednje 25 % i malo sa 25,7% učešća. Broj zaposlenih je uzet prema klasifikaciji APR-a,pa kako ima najviše velikih preduzeća tako i ima 36,8% preduzeća sa 250 i više zaposlenih, 33,1% onih sa zaposlenih, 26,5% sa i 3,7% sa 10 i manje zaposlenih. Kada je u pitanju opis uzorka po pitanju delatnosti preduzeća, skoro sve tri oblasti su pribliţno zastupljene: proizvodnja sa 31,6%, trgovina sa 32,4%, ostalo sa 36%. Broj meseci u uzorku je za 23 meseca po jednom preduzeću, bio u rasponu od 22 meseca, gde je artimetička sredina 16,8, mediana 22, a standardna devijacija 7,9, mod 23. Mediana je 22 jer je visoka frekvencija preduzeća koja su duţe ostajala u uzorku, po 22 i 23 meseca, pa sredina distribucije kada se poreďa po rastućem redosledu izaďe na vrednost 22 meseca. Raspon je velik, ali broj meseci u uzorku nije normalno distribuiran pa je samim tim i medijana pomerena na viši iznos, 22. Nakon što se rekodira varijabla na 4 kategorije, dobija se da ima 19,9% preduzeća koja su preţivela 1-8 meseci, 22,1% onih koja su preţivela 9-21 mesec i 58,1% preduzeća koja su u uzorku meseca. 10,3% preduzeća je pokazalo prekid u kontinuitetu tokom praćenja, tako da se moţe zaključiti da su preduzeća bila relativno odgovorna u popunjavanju upitnika tokom vremena. Po 50% je bilo učešće metoda CATI i toliko za CAWI u preostaloj bazi na kojoj je vršena finalna obrada podataka. Tri četvrtine, 73,5% preduzeća je od 136 njih preţivelo u uzorku tokom trajanja projekta, dok je 26,5% odustalo i doţivelo ispadanje iz panela. 3.2.KOKS PH MODEL Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu broj meseci preživljavanja preduzeća u panelu. Navedena hipoteza pretpostavlja da su svi regresioni koeficijenti u modelu jednaki 0 i da nema efekta nijedne prediktorske varijable ubačene u model. 52

53 Konkretno u ovom slučaju postavljeno je pitanje koji prediktori utiču na vreme preţivljavanja u uzorku i statistička značajnost je vaţan pokazatelj. Prvobitna tabela ispisa iz SPSS govori o tome da je u analizu je ušlo ukupno 136 preduzeća, od čega je 73,5% odnosno 100 njih cenzurisano, a 36 (26,5%) onih kojima se dogaďaj desio, odnosno koje su napustile istraţivanje u posmatranom periodu. Nije bilo nedostajućih vrednosti u bazi. Potrebno je napomenuti da na uzorku od 136 slučajeva iz baze podataka, tačno je podeljeno po 68 onih koji su preteţno koristili kao metod sakupljanja podataka web anketu (CAWI), odnosno telefon (CATI). Za potrebe Koks PH modela, kodirano je 1= web, 0= telefon. Nulta hipoteza glasi da ne postoji razlika izmeďu krivih preţivljavanja. RaĎen je Koks PH model sa Backwise Conditional ulaznim metodom. On isključuje korak po korak sve potencijalne prediktore koji imaju p-vrednost ispod 0,10 a uključuje one koji imaju 0,05 i niţe vrednosti u univarijantnoj Koks PH analizi, zbog toga što je bilo potrebno da se naďe kombinacija adekvatnih varijabli koje se isključuju da bi se dobila jasnija situacija i pokušalo da se odgovori na cilj ovog istraţivanja. To znači da prediktori koji imaju verovatnoću da im je p vrednost manja od kriterijuma 0,10 neće biti uvršteni u naredne korake analize kako bi se model iščistio od statistički neznačajnih koeficijenata. Step -2 Log Likelihood Omnibus Tests of Model Coefficients b Overall (score) Change From Previous Step Change From Previous Block Chi-square df Sig. Chi-square df Sig. Chi-square df Sig. 1 a 326,469 13,693 12,321 15,804 12,200 15,804 12,200 a. Variable(s) Entered at Step Number 1: region_podela delatnost prekidd rekod_preteznimetod brojzaposlenih velicina b. Beginning Block Number 1. Method = Backward Stepwise (Conditional LR) Tabela 2.- Omnibus test Omnibus test pokazuje da model sa svim prediktorima nije statistički značajan (p=0,321). Tabela broj 3 koja sledi, ukazuje na regresioni koeficijent B, njegove standardne greške, Wald statistiku (b/se) 2, p vrednost, Exp(B) i 95% intervale poverenja za Exp(B). Prema podacima, varijabla veličina preduzeća je statistički značajna i selektovana kao značajan faktor koji utiče na duţinu ţivota preduzeća u uzorku. Step 1 Variables in the Equation B SE Wald df Sig. Exp(B) 95,0% CI for Exp(B) region_podela 3,686 3,297 Lower Upper region_podela(1) -,828,447 3,438 1,064,437,182 1,048 region_podela(2) -,615,451 1,865 1,172,541,224 1,307 region_podela(3) -,526,675,607 1,436,591,157 2,220 delatnost 1,001 2,606 delatnost(1),009,433,000 1,983 1,009,432 2,359 delatnost(2) -,378,436,752 1,386,685,291 1,611 prekidd,251,511,241 1,624 1,285,472 3,500 53

54 Variables in the Equation rekod_preteznimetod -,133,362,136 1,713,875,430 1,779 brojzaposlenih 6,349 3,096 Brojzaposlenih (1) 9,154 80,351,013 1, ,276,000 2,344E+072 Brojzaposlenih (2) 10,184 80,352,016 1, ,041,000 6,592E+072 Brojzaposlenih (3) 11,440 80,355,020 1, ,316,000 2,327E+073 velicina 5,883 2,053 velicina (1) -,507,674,566 1,452,602,161 2,256 velicina (2) -1,944,889 4,782 1,029,143,025,817 Tabela 3. - Varijable u jednačini Varijable sa negativnim koeficijentima B vrednosti se povezuju sa smanjenjem količnika rizika, sa povećanjem vremena preţivljavanja, pa tako veća preduzeća koja imaju više B koeficijente negativnog predznaka imaju i manju verovatnoću rizika i povećanja vremena preţivljavanja. Sa druge strane, Exp(B) kada je manji od 1, to ukazuje na činjenicu da se rizik smanjuje u odnosu na referentnu grupu koja je u ovom slučaju za veličinu preduzeća modalitet malo preduzeće. Grafikon 2.- Funkcija preţivljavanja u odnosu na veličinu preduzeća Navedeni grafikon pokazuje krivu preţivljavanja u odnosu na veličinu preduzeća. Velika preduzeća imaju najviše verovatnoće da duţe preţive u odnosu na srednja i mala preduzeća. Iako preteţna metoda sakupljanja podataka preduzeća nije statistički značajna, dat je prikaz funkcije preţivljavanja kako bi se videla komparacija prema dve različite metode što je bio osnovni cilj ovog rada. Na narednom grafikonu 3 se moţe uočiti da je veći rizik kod web prikupljanja podataka u odnosu na proteklo vreme. Prediktor metoda sakupljanja podataka nije statistički značajan i ne utiče na vreme preţivljavanja preduzeća u uzorku. Ukoliko bi se zanemarila statistička značajnost i samo posmatrao grafikon 3 kod funkcije preţivljavanja, moţe se videti da protokom vremena duţe ostaju preduzeća čiji su podaci sakupljani putem CATI metode. 54

55 Grafikon 3.- Funkcija preţivljavanja i rizika za metod sakupljanja podataka Kako je prediktor veličina preduzeća u modelu jedini davao jasan odgovor da je u okviru svih prediktora statistički značajan, uraďena je grafička funkcija rizika kako bi se videlo da li dolazi do ukrštanja-presecanja linija na grafikonu. Grafikon 4.- Prikaz funkcije rizika svih prediktora uključenih u model, sa izdvojenom linijom za veličinu preduzeća Osnovna pretpostavka Koks PH modela se bazira na tome da su rizici izmeďu grupa proporcionalni, odnosno ako se rizici na grafikonu presecaju, PH pretpostavka ne moţe biti zadovoljena. Kako je na dobijenom grafiku jasno vidljivo da se linije ne seku tokom vremena, moţe se reći da je PH pretpostavka zadovoljena i da je model sa svim prediktorima prikladan. Tako, grafikon govori o tome da velika preduzeća imaju manji rizik, a mala veliki, tj. da se povećanjem stepena veličine preduzeća smanjuje rizik. Moţe se zaključiti da veličina preduzeća ima vaţnu ulogu u duţini vremena preţivljavanja preduzeća u panelu i da je model adekvatan za korišćenje na ovom skupu podataka. 3.3.ORDINALNA REGRESIJA Hipoteza koja je postavljena na početku a koja se testira ordinalnom regresijom je glasila: Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu broj meseci 55

56 preživljavanja u uzorku. Navedena hipoteza pretpostavlja da su svi regresioni koeficijenti u modelu jednaki 0 i da nema efekta nijedne prediktorske varijable ubačene u model. U okviru obrade podataka putem ordinalne regresije, uzeti su u obzir svi nezavisni prediktori u modelu: region, veličina preduzeća, broj zaposlenih, delatnost preduzeća, metoda sakupljanja podataka, prekid u kontinuitetu sakupljanja podataka, dok je kao zavisna varijabla uzet broj meseci u uzorku koliko su preduzeća učestvovala, rekodiran na tri stepena. Osnovna i prva dobijena tabela ispisa iz SPSS (tabela 31. iz priloga) govori o opštim podacima koji su ušli u model. N predstavlja frekvenciju svih ulaznih varijabli modela, prediktorske i zavisne. Kako je ovaj segment već dat u deskriptivnom delu uzorka istraţivanja, neće biti dalje interpretiran (136 ispitanika bez nedostajućih opservacija). Ono što se javlja prvi put u radu je marginalni procenat, koji je u stvari učešće svakog pojedinačnog modaliteta u obeleţju. Na samom početku ispisa iz SPSS stoji upozorenje da ima 120 (54,1%) ćelija koje u kombinaciji zavisne varijable sa prediktorskim nivoima imaju frekvenciju 0, što je posledica raspršenja podataka u obradi. Ovaj podatak se treba uzeti u obzir jer moţe značajno da utiče na vrednosti Goodness-of-Fit testa i vrednosti χ2 testa, ali je smanjen rekodiranjem zavisne varijable sa 23 originalne kategorije na 3 kategorije (smanjeno raspršenje sa 91% na 54,1% ćelija koje imaju frekvenciju manju od 5). Tabela koja daje informacije u vezi sa fitovanjem modela je tabela broj 4. iz koje se čita informacija o tome da li model poboljšava mogućnost da prediktujemo rezultirajuću varijablu. Podaci govore o tome da (χ2 =13,824, df=12, p=0,312) da ne postoji statistička značajnost modela ne postoji poboljšanje osnovnog modela u odnosu na prediktovani model. Model Fitting Information Model -2 Log Chi-Square df Sig. Likelihood Intercept Only 206,511 Final 192,687 13,824 12,312 Link function: Logit. Tabela 4. - Informacije o fitovanju modela Sa druge strane, Goodness-of-Fit iz tabele 5. sadrţi χ2 test koji testira da li dobijeni podaci fituju sa modelom (koliko model dobro predviďa podatke), prilikom čega se kreće od nulte hipoteze da je fitovanje dobro. Moţe se zaključiti da su postojeći i prediktovani podaci slični i da je model dobar (prihvata se nulta hipoteza (χ2 =153,322, df=134 a p=0,121). Goodness-of-Fit Chi-Square df Sig. Pearson 153, ,121 Deviance 148, ,178 Link function: Logit. Tabela 5.- Goodness-of Fit informacije Još jedan indikator koji moţe da govori o modelu je Pseudo R 2 tabela: 56

57 Pseudo R-Square Cox and Snell,097 Nagelkerke,113 McFadden,052 Link function: Logit. Tabela 6.- Pseudo R 2 Kao što je već u teoriji napomenuto, najčešće interpretiran je Nagelkerke, koji govori da je 11,3% varijansi zavisne varijable objašnjeno prediktorima u modelu, što je malo. To se moţe objasniti činjenicom da verovatno postoji više vaţnih faktora koji mogu da prediktuju duţinu preţivljavanja uzorka preduzeća u panelu nego što su dati prediktori u modelu. Nizak Nagelkerke govori o tome da je skup svih prediktora ubačenih u model slab indikator zavisne varijable za bilo koje preduzeće. Kako postoje tri indikatora koji govore o tome, moţe se reći da navedeni skup prediktora objašnjava 5,2%-11,3% varijanse zavisne varijable. Najvaţniji deo modela je vezan za procenu parametara, koja daje prikaz specifične veze izmeďu prediktora i zavisne varijable, nalazi se u tabeli 7: Threshold Location Parameter Estimates Estimate Std. Error Wald df Sig. 95% Confidence Interval Lower Bound Upper Bound [meseci_na_3 = 1,00] -1,501 1,414 1,127 1,288-4,272 1,270 [meseci_na_3 = 2,00] -,345 1,409,060 1,807-3,106 2,416 [region_podela=1,00] -,150,718,044 1,835-1,558 1,258 [region_podela=2,00],225,674,111 1,739-1,097 1,547 [region_podela=3,00],167,691,058 1,809-1,188 1,522 [region_podela=4,00] 0 a [velicina=1,00] veliko 2,705,940 8,288 1,004,864 4,547 [velicina=2,00] srednje 1,130,759 2,219 1,136 -,357 2,617 [velicina=3,00] malo 0 a [broj_zaposlenih=1,00] 250 i više -3,465 1,469 5,563 1,018-6,344 -,586 [broj_zaposlenih=2,00] ,373 1,331 3,180 1,075-4,982,235 [broj_zaposlenih=3,00] ,904 1,156,611 1,434-3,170 1,362 [broj_zaposlenih=4,00] 10 i manje 0 a [delatnost=1,00] -,199,447,198 1,656-1,075,677 [delatnost=2,00] -,073,451,026 1,872 -,957,812 [delatnost=3,00] 0 a [prekidd=,00],756,583 1,682 1,195 -,387 1,899 [prekidd=1,00] 0 a [rekod_preteznimetod=1,00],017,360,002 1,962 -,689,723 57

58 Link function: Logit. Parameter Estimates [rekod_preteznimetod=2,00] 0 a a. This parameter is set to zero because it is redundant. Tabela 7.- Procena parametara Prva kolona nazvana threshold prikazuje zavisnu varijablu modela sa svim modalitetima broj meseci koje je preduzeće preţivelo u istraţivanju. Kada se u modelu nalaze prediktorske kategorijalne varijable, broj koeficijenata koji se računaju je jedan manje od broja postojećeg broja modaliteta u modelu. Tada kategorija koja ima koeficijent 0 u proceni, predstavlja referentnu kategoriju. U okviru ordinalne regresije korišćene su obrnute skale broja zaposlenih i veličine preduzeća, jer nije postojala opcija odabira da li će se porediti podaci u odnosu na prvu ili poslednju referentnu kategoriju, pa kako je kod Koks PH modela i logističke regresije odabrana opcija da ide u odnosu na prvu kategoriju, navedene varijable su tako podešene da bi se poreďenje radilo u odnosu na prvu najmanju kategoriju. Prema onom što je od opcija u SPSS 20.0 prisutno ukazuje na to da je podešavanje kod nje namešteno tako da poredi poslednju kategoriju kao referentnu sa ostalim modalitetima prediktora. Tabela procene govori o tome da postoje dva prediktora koja su značajna, broj zaposlenih i veličina preduzeća, koji utiču na vreme preţivljavanja preduzeća u uzorku. Ostali prediktori ne doprinose značajno vremenu preţivljavanja preduzeća, jer nisu značajni. Koeficijent ordinalne regresije za broj zaposlenih je negativnog znaka i daje informaciju da je povezan sa niţim skorovima u kategorijama zavisne varijable (kodirani broj meseci preţivljavanja u uzorku). Ukoliko preduzeće ima više zaposlenih, manje je verovatno da će duţe preţiveti u uzorku. Ovaj koeficijent opada kako dolazi do smanjenja broja zaposlenih u preduzećima. Koeficijenti procene za veličinu preduzeća su pozitivni i govore o tome da se povećanjem broja zaposlenih u preduzećima smanjuju apsolutne vrednosti koeficijenata, a u podacima to znači da su se povezuju sa većim skorovima kategorija broja meseci preţivljavanja. Tu je jasna situacija da veća preduzeća duţe preţivljavaju u uzorku i pozitivni koeficijent se povezuje sa duţim vremenom preţivljavanja u uzorku. Navedeni nalaz potvrďuje dobijene rezultate Koks PH modela u prethodnom delu. Kako nalaz koji je dobijen deluje kontradiktorno, da preduzeća koja su veća duţe preţivljavaju u uzorku a sa druge strane da preduzeća sa manjim brojem zaposlenih duţe preţivljavaju u uzorku, sledi pokušaj objašnjenja uz dopunske analize koje su uraďene radi provere dobijenih podataka. Grafikon 5.- Grafički prikaz broja zaposlenih u odnosu na originalno vreme preţivljavanja u mesecima izraţen u kumulativom procentu i u kumulativnim frekvencijama 58

59 Grafikon 5, koji koristi originalne podatke ukazuje na stanje broja zaposlenih u odnosu na broj meseci u uzorku prikaz pomoću kumulativnih frekvencija i procenata. Moţe se primetiti da preduzeća sa više zaposlenih u manjoj meri preţivljavaju u uzorku, što je kontradiktorno činjenici da veća preduzeća preţive duţe u uzorku jer su ova dva prediktora u visokoj korelaciji. Sa jedne strane, vaţno je napomenuti da je za klasifikaciju veličine preduzeća prema kriterijumu APR-a, veličina zavisi od broja zaposlenih samo kao jedan faktor od postojećih 4 na osnovu kojih se razvrstavaju preduzeća, ali bez obzira na to, jedino što moţe da objasni navedene podatke koji su meďusobno kontradiktorni je prikaz distribucije tabele 8. koja sledi: broj meseci u uzorku 1,00 2,00 3,00 4,00 5,00 7,00 8,00 9,00 10,00 11,00 12,00 13,00 14,00 15,00 19,00 broj meseci u uzorku * broj zaposlenih Crosstabulation broj zaposlenih Total 10 i manje i više Count % within broj zaposlenih 0,0% 2,8% 4,4% 4,0% 3,7% Count % within broj zaposlenih 0,0% 0,0% 4,4% 8,0% 4,4% Count % within broj zaposlenih 20,0% 0,0% 2,2% 2,0% 2,2% Count % within broj zaposlenih 0,0% 2,8% 6,7% 0,0% 2,9% Count % within broj zaposlenih 0,0% 2,8% 2,2% 2,0% 2,2% Count % within broj zaposlenih 0,0% 0,0% 2,2% 4,0% 2,2% Count % within broj zaposlenih 0,0% 0,0% 6,7% 0,0% 2,2% Count % within broj zaposlenih 0,0% 2,8% 2,2% 6,0% 3,7% Count % within broj zaposlenih 0,0% 2,8% 2,2% 10,0% 5,1% Count % within broj zaposlenih 0,0% 2,8% 0,0% 2,0% 1,5% Count % within broj zaposlenih 0,0% 2,8% 0,0% 2,0% 1,5% Count % within broj zaposlenih 0,0% 0,0% 0,0% 2,0% 0,7% Count % within broj zaposlenih 0,0% 5,6% 4,4% 0,0% 2,9% Count % within broj zaposlenih 0,0% 13,9% 0,0% 0,0% 3,7% Count % within broj zaposlenih 0,0% 0,0% 2,2% 2,0% 1,5% 59

60 Total 21,00 22,00 23,00 Count % within broj zaposlenih 0,0% 2,8% 2,2% 0,0% 1,5% Count % within broj zaposlenih 40,0% 16,7% 24,4% 8,0% 16,9% Count % within broj zaposlenih 40,0% 41,7% 33,3% 48,0% 41,2% Count % within broj zaposlenih 100,0% 100,0% 100,0% 100,0% 100,0% Tabela 8.- Prikaz distribucije broja meseci u uzorku u odnosu na broj zaposlenih Ono što se uočava što dovodi do kontaminacije podataka jeste niska frekvencija preduzeća koja imaju manje od 10 zaposlenih (n=5), što dovodi do toga da 4 od 5 preduzeća koja imaju manje od 10 zaposlenih su imale visok broj meseci preţivljavanja (22 i 23 meseca). Kako je slična situacija sa narednom kategorijom broj zaposlenih 11-50, koja je nešto bolja jer je raspršenje nešto veće meďu kategorijama broja meseci preţivljavanja u uzorku, na kraju se zaključci ordinalne regresije koji se donose, moraju tumačiti u skladu sa navedenom devijacijom. Slična je situacija dobijena i kod analize preţivljavanja, kada se pogledaju grafici funkcija preţivljavanja i rizika za broj zaposlenih, ali nisu tumačeni jer nisu dobijeni statistički značajni regresivni koeficijenti u Koks PH modelu za taj prediktor. broj meseci u uzorku Report broj zaposlenih Mean N 10 i manje 18, , , i više 16, Total 16, Tabela 9.- Ukrštanje prosečnog broja preţivljavanja u uzorku sa brojem zaposlenih u preduzećima TakoĎe, ako se pogledaju podaci van ordinalne regresije tabele 9, samo ukršteni proseci broja preţivelih meseci u uzorku u odnosu na broj zaposlenih u preduzećima, dobija se informacija da zaposleni u poslednje dve kategorije ostvaruju niţe proseke u odnosu na više dve kategorije (oko 16 za zaposlenih i preko 250, a oko 18 za one koji imaju ispod 50). Rezultati bi trebali da budu u paralelnoj ravni za svaku kategoriju zavisne varijable, ukoliko je pretpostavka o paralelnosti ispunjena. Ordinalna regresija daje informacije o testu paralelnih linija čiji je poţeljan rezultat da ne bude statistički značajan, a u ovom slučaju (χ2 =23,735, df=12, p=0,022) je značajan i govori o tome da je upitna validnost testa, a koeficijenti nisu jednaki na svim nivoima i u tom slučaju je preporučljivije koristiti neki manje zahtevan model. To znači da se dobijeni rezultati tumače tako da se uzima sve u obzir i da dobijeni rezultati, regresioni koeficijenti i zaključci nisu dovoljno pouzdani. Kako bi se proverilo da li najniţa kategorija broja zaposlenih povlači podatke ordinalne regresije i dovodi do neadekvatnosti modela, uraďen je rekod varijable broj zaposlenih gde su spojene kategorije do 10 zaposlenih i u jednu i sa tri modaliteta uraďena ponovo ista ordinalna regresija. Rezultati govore o tome da se nešto smanjio broj ćelija koje imaju frekvenciju niţu od 5 na 53,2%, da model nije statistički značajan i da ne poboljšava 60

61 prediktivnu vrednost u odnosu na osnovni (χ2 =13,220, df=11, p=0,279), da testiranje fitovanja podataka sa modelom je dobro, jer su postojeći i prediktovani podaci slični (χ2 =148,537, df=131 a p=0,140), da pseudo R² objašnjava varijansu zavisne varijable prediktorima 5%-10,8%, dok procene parametara ponovo ukazuju na to da su statistički značajni prediktori veličina preduzeća i broj zaposlenih, da veća preduzeća će da ostanu duţe u uzorku, kao i preduzeća sa manje zaposlenih. U ovom slučaju, test paralelnih linija ukazuje na adekvatnost modela jer nije statistički značajan (χ2 =16,182, df=11, p=0,135). Iako su podaci ukazali na to da je regresivni model adekvatan, da podaci dobro fituju, treba uzeti u obzir mogući uticaj na χ2 test i njegove vrednosti jer ima preko 50% ćelija što je mnogo više od pretpostavljenih 20% koje su dozvoljene da imaju vrednosti manje od 5 u modelu. Pored kompletnog višestrukog modela ordinalne regresije, raďeni su i modeli sa pojedinačnim ubačenim prediktorima u odnosu na zavisnu varijablu broj meseci preţivljavanja u uzorku, s obzirom na to da je dobijeno da svi prediktori u modelu ordinalne regresije nisu adekvatni i ne prolaze test paralelenih linija. 61

62 U tabeli 10 su crvenim obeleţeni elementi koji su poţeljni (dobro fitovanje modela, podataka, značajni koeficijenti i adekvatan test paralelnih linija). Prediktor Fitovanje modela Goodness-of-Fit Nagelkerke i Cox Snell Procena parametara Test paralelnih linija χ2 df p χ2 df p χ2 df p Region 0, ,988 0, ,870 0,001 i 0,001 Nema značajnih 0, ,870 Veličina preduzeća 1, ,489 1, ,384 0,012 i 0,010 Nema značajnih 1, ,377 Broj zaposlenih 1, ,702 8, ,031 0,012 i 0,010 Nema značajnih 12, ,006 Delatnost preduzeća Prekid u kontinuitetu Metod sakupljanja 0, ,638 1, ,454 0,008 i 0,007 Nema značajnih 1, ,446 1,787 1,0181 2, ,119 0,015 i 0,013 Nema značajnih 2, ,134 0, , ,548 0,001 i 0,001 Nema značajnih 0, ,548 Tabela 10. Rezultati pojedinačnih prediktora u ordinalnoj regresiji sa zavisnom varijablom Uočava se da je prediktovani model poboljšan u odnosu na osnovni samo kod prediktora prekid u kontinuitetu, gde postoji statistička značajnost. Kod svih prediktora osim broja zaposlenih, podaci dobro fituju sa modelom, prihvata se nulta hipoteza da je fitovanje podataka dobro. Ipak, Nagelkerke je kod svih prediktora nizak i ne prelazi 0,015 (prekid u kontinuitetu), čime se smatra da model slabo objašnjava podatke. Sledeća kolona govori o tome da nije pronaďen nijedan statistički značajan parametar. Na kraju, test paralelnih linija je značajan samo kod broja zaposlenih, tako da se moţe zaključiti da je model bolji kada se koristi pojedinačno za svaki prediktor nego grupno za sve, imajući u vidu test paralelnih linija i odrţivost modela. Ipak, ni po jednom parametru u odnosu na prediktore pojedinačno, nisu pronaďeni statistički značajni koeficijenti koji utiču na vreme preţivljavanja izraţenih u trostepenoj zavisnoj varijabli.

63 3.4. LOGISTIČKA REGRESIJA Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu prekid u kontinuitetu sakupljanja podataka. Navedena hipoteza pretpostavlja da su svi regresioni koeficijenti u modelu jednaki 0 i da nema efekta nijedne prediktorske varijable ubačene u model. U okviru obrade podataka putem logističke regresije, uzeti su u obzir svi nezavisni prediktori kao što su: region, veličina preduzeća, klasifikacija broja zaposlenih, rekodirana delatnost preduzeća, metoda sakupljanja podataka, dok je kao rezultirajuća zavisna varijabla uzeta binarna varijabla da li je bilo prekida ili ne u okviru započetog sakupljanja podataka. Ispunjena je pretostavka o pitanju veličine uzorka, jer ih je 136 u modelu. Kako je logistička regresija osetljiva na multikolinearnost, a postoji podatak u okviru rada da postoji visoka korelacija dva prediktora (veličina preduzeća i broj zaposlenih), uraďena je provera kolinearnosti i dobijeni rezultati ukazuju da ni tolerance ni VIF ne pokazuju visoke vrednsoti prediktora region, veličina preduzeća, broj zaposlenih, delatnost preduzeća, preteţni metod i vreme preţivljavanja rekodirane na tri stepena, nisu u multikolinearnosti sa varijablom prekid u kontinuitetu i iz tog razloga obrada moţe biti nastavljena. Ukupan broj ispitanika je 136, nije bilo nedostajućih vrednosti po prediktorima. U internom obeleţavanju zavisne varijable, data originalna vrednost ne imala je vrednost 0 (nije bilo prekida tokom sakupljanja podataka), a da vrednost 1 (kod u SPSS da je postojao prekid tokom sakupljanja podataka). Prvi deo obrade se opisuje kao nulti model (step 0, model bez prediktora koji sadrţi samo odsečak), s obzirom na to da SPSS daje mogućnost uvida u iteracije obrade. Kada se posmatra tabela 11, moţe se videti da u nultom modelu observed prikazuje frekvenciju 0 i 1 koji su se našli u okviru zavisne varijable, dok predicted je oznaka prediktovanih 0 i 1 u nultom modelu. Classification Table a,b Observed Predicted prekid u kontinuitetu Percentage Ne Da Correct Ne ,0 prekid u kontinuitetu Step 0 Da 14 0,0 Overall Percentage 89,7 a. Constant is included in the model. b. The cut value is,500 Tabela 11.- Klasifikaciona tabela osnovnog modela Moţe se primetiti da prekid u kontinuitetu sakupljanja podataka nije imalo 122, a 14 je imalo što dovodi do 89,7% onih koji su imali stalan kontinuitet (ukazuje na visoku lojalnost učešća u projektu) i govori o tome da su podaci ispravno klasifikovani u tom procentu. Nakon toga drugi korak u SPSS je uvrštavanje prediktora u model i ponovno ispisivanje rezultata (Step 1). Prvobitno se testira model u potpunosti, a ispis je u Tabeli 12.

64 Step 1 Omnibus Tests of Model Coefficients Chi-square df Sig. Step 16,618 11,120 Block 16,618 11,120 Model 16,618 11,120 Tabela 12.- Omnibus test Drugi korak iteracije tokom obrade je step 1, raďen metodom Enter, uočava se da ne postoji prediktivni kapacitet jer model nije značajan uvrštavanjem prediktora u model ne dolazi do poboljšanja njegove predikcije. Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke R Square 1 73,549 a,115,237 a. Estimation terminated at iteration number 20 because maximum iterations has been reached. Final solution cannot be found. Tabela 13. Sumarni model Tabela koja opisuje sumarni model govori o tome da je Nagelkerke R 2 što se tumači da 23,7% varijanse zavisne varijable dolazi od prediktorskih varijabli. Pokazatelji se nazivaju pseudo jer nisu realni iznosi nego su vrednosti R 2. Oba pokazatelja govore da model objašnjava 11,5%-23,7%% varijanse zavisne varijable. Sledeća tabela (14) je Hosmer i Lemeshow test, govori o tome da je model dobar. Hosmer and Lemeshow Test Step Chi-square df Sig. 1 8,536 7,288 Tabela 14.- Hosmer i Lemeshow test Step 1 Observed prekid u kontinuitetu Classification Table a Predicted prekid u kontinuitetu Ne Da Percentage Correct Ne ,2 Da 14 0,0 Overall Percentage 89,0 a. The cut value is,500 Tabela 15.- Klasifikaciona tabela Nakon toga sledi tabela 15. koja sada pokazuje uočene i prediktivne vrednosti sa uključenim prediktorima u model i zaključiti da prediktori ne dovode do poboljšanja (u osnovnom modelu je bilo 89,7% a sada 89%). Model je tačno klasifikovao 99,2% slučajeva koji nemaju prekid u kontinuitetu. Sledi tabela prediktora nakon uključivanja u model (tabela 16): 64

65 Step 1 a Variables in the Equation B S.E. Wald df Sig. Exp(B) region_podela 6,756 3,080 region_podela(1) -2,338,950 6,064 1,014,097 region_podela(2) -1,593,890 3,207 1,073,203 region_podela(3) -,691 1,094,400 1,527,501 delatnost 4,839 2,089 delatnost(1) -1,198,843 2,019 1,155,302 delatnost(2) -1,973,914 4,663 1,031,139 rekod_preteznimetod(1) 1,039,682 2,320 1,128 2,825 brojzaposlenihobrnuto 4,248 3,236 brojzaposlenihobrnuto(1) 18, ,126,000 1, ,329 brojzaposlenihobrnuto(2) 20, ,126,000 1, ,745 brojzaposlenihobrnuto(3) 19, ,126,000 1, ,266 velicina_recode 2,943 2,230 velicina_recode(1) -1,448 1,214 1,422 1,233,235 velicina_recode(2),068 1,216,003 1,956 1,070 Constant -19, ,126,000 1,999,000 a. Variable(s) entered on step 1: region_podela, delatnost, rekod_preteznimetod, brojzaposlenihobrnuto, velicina_recode. Tabela 16.- Varijable u jednačini Tabela govori o tome da osnovni faktori koji utiču na to da li će preduzeće imati prekide u kontinuitetu ili ne je region. Ostali prediktori nisu značajni. Na kraju sumarno rečeno, raďena je logistička regresija kako bi se utvrdilo koji faktori utiču na prekide u kontinuitetu sakupljanja podataka preduzeća i u okviru modela su uvršteni prediktori veličina preduzeća, broj zaposlenih, delatnost, metod sakupljanja podataka, region. Model nije statistički značajan χ2(11,n=136)=16,618, p<0,05 ali je dobar (Hosmer and Lemeshow Test <0,05). Model se moţe objasniti uvrštenim prediktorskim varijablama izmeďu 11,5% (Cox i Snell) i 23,7% (Nagelkerke) varijanse. TakoĎe, model pokazuje da sa prediktorima moţe da dobro klasifikuje 89% ispitanika. U okviru pojedinačnih doprinosa prediktorskih varijabli modelu, uočava se da su statistički značajan samo region, gde preduzeća iz Vojvodine imaju najveću verovatnoću da nemaju prekide u kontinuiteta u odnosu na preduzeća iz drugih regiona, što se potvrďuje u prosecima vremena preţivljavanja po regionima, u kojem region Vojvodine ima najduţi prosek u odnosu na ostale tabela

66 3.5. χ2 TEST Mean region Report broj meseci u uzorku Beograd 16,3438 Vojvodina 17,0377 Zapadna Srbija sa Šumadijom 16,8000 Istočna i Juţna Srbija 16,6364 Total 16,7721 Tabela 17.- Ukrštanje prosečnog broja vremena preţivljavanja sa regionom Obrada podataka je raďena i putem χ2 testa, što je bio pokušaj da se uoči veza izmeďu ukrštenih prediktora sa rekodiranim brojem meseci koliko su preduzeća preţivela u uzorku. χ2 test je ukršten sa rekodiranom varijablom broj meseci, kako bi se smanjio broj kategorija sa kojima se ukršta, da bi se došlo do manje raspršenosti meďu podacima. Dobijeni podaci pokazuju da kada se ukršta sa originalnom varijablom broja meseci, usled 23 kategorije, dolazi do velikog broja ukrštanja koja imaju daleko više preko 20% ćelija koje imaju frekvenciju manju od 5, tako da je ovaj deo kompletno isključen iz obrade. Iz tog razloga, rekodirana je u novu varijablu sa 3 modaliteta: 1-8 meseci, 9-21 meseci, meseca. Nejednako klasifikovani rasponi broja meseci su uslovljeni raspodelom frekvencija po originalnim modalitetima, kako bi se ublaţile razlike meďu grupama (poslednja vuče više od 50% uzorka pa je rekodiranje prve dve kategorije uraďeno tako da budu pribliţno podjednake po frekvencijama, kako bi se izbeglo dobijanje statistički značajnih rezultata zbog neravnomerno distribuiranih kategorija u obeleţju). Slede hipoteze koje su postavljene u radu: 1. Ne postoji statistički značajna veza izmeďu metode preteţnog sakupljanja podataka i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. 2. Ne postoji statistički značajna veza izmeďu delatnosti preduzeća i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. 3. Ne postoji statistički značajna veza izmeďu regiona i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. 4. Ne postoji statistički značajna veza izmeďu veličine preduzeća i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. 5. Ne postoji statistički značajna veza izmeďu broja zaposlenih u preduzećima i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. 6. Ne postoji statistički značajna veza izmeďu prekida u kontinuitetu i kategorisanim brojem meseci preţivljavanja preduzeća u uzorku. Ukrštanje nove, rekodirane varijable broj meseci (rekodiranim u tri kategorije) sa prediktorskim varijablama ne daje statistički značajne rezultate. Jačina uticaja je opisana Kramerovim V koeficijentom koji pokazuje jačinu veze meďu varijablama, po Koenovom kriterijumu veličine uticaja. Region, nije statistički značajan (χ2=0,845, df=6, p=0,991, V=0,056), kao ni veličina preduzeća (χ2=3,566, df=4, p=0,468, V=0,114), delatnost preduzeća (χ2=2,459, df=4, 66

67 p=0,652, V=0,095), preteţni metod (χ2=0,479, df=2, p=0,787, V=0,059). Iz obrade su isključena ukrštanja sa prekidom u kontinuitetu (33,3% ćelija ima frekvenciju manju od 5) i brojem zaposlenih (25% ćelija ima frekvenciju manju od 5). 3.6.Kruskal-Wallis i Mann-Whitney U testovi UraĎen je prosek broja meseci koje su preduzeća preţivela u uzorku. Testirani su uslovi za t- test i ANOVA-u, ali kako nije zadovoljena pretpostavka normalne distribucije (Kolgomorov-Smirnov test: statistic=0,328, df=136, p=0,000; Shapiro-Wilk statistic=0,755, df=136, p=0,000 - postoji statistički značajno odstupanje od normalne raspodele) raďene su njihove neparametrijske zamene, Kruskal-Wallis i Mann-Whitney U testovi. Pre testiranja hipoteza uraďeno je ukrštanje prosečnog broja meseci preţivljavanja sa prediktorima, bez testiranja značajnosti ovih aritmetičkih sredina. Dobijeni podaci pokazuju da je povećanjem broja zaposlenih, manji prosek trajanja preduzeća u uzorku, pa preduzeća sa 250 i više zaposlenih u proseku ostaju u uzorku 13,4 meseci, dok oni sa 10 i manje zaposlenih, 18,6. TakoĎe najviše traju preduzeća iz domena ostalih delatnosti, sa prosekom trajanja 15,9 meseci, trgovina je 14,6, a proizvodnja 13,9. Dati su proseci bez komentarisanja o statističkoj značajnosti meďusobnih rezultata. Što se tiče prekida u kontinuitetu, proseci trajanja iznose 17,0 koji nisu imali prekida i 14,7 za one koji su prekidali. Hipoteza koja je opšte postavljena za ovaj deo obrade je bila ne postoji statistički značajna razlika u distribuciji varijable broj meseci preživljavanja u uzorku u odnosu na region (veličinu preduzeća, broj zaposlenih, metod, prekid u kontinutetu, delatnost). Kruskal-Wallis je testirao hipotezu sa prediktorima region, veličina preduzeća, broj zaposlenih, delatnost, a Mann Whitney U, sa metodom sakupljanja podataka i prekidom u kontinuitetu. Kruskal-Wallis ukazuje da ne postoji nijedan statistički značajan prediktor u testiranju sa originalnom varijablom broj preţivljenih meseci u uzorku, odnsono distribucija ove varijable u uzorku je ista kroz sve kategorije regiona (p=0,797). Slična je situacija i sa ostalim prediktorima (veličina preduzeća p=0,377; broj zaposlenih 0,707; delatnost preduzeća p=407). Kod Mann-Whitney U testa, ne postoji značajnosti kod preteţnog metoda sakupljanja podataka (p=0,883). Mann-Whitney U test je otkrio statistički značajnu razliku u broju preţivelih meseci u uzorku u odnosu na prekid u kontinuitetu (nepostojanje prekida Md=22, n=122 i postojanje prekida Md=16,5, n=14), U= 546,500, z=-2,290, p=0,022, r=0,19. SPSS nema u sebi izračunavanje veličine uticaja pa je ona u ovom primeru raďena ručno, jer su postojali svi elementi za njegovo računanje. Potrebni elementi su z, veličina uzorka n i dobija se: r=z/ = -2,290/11, =0, što pokazuje da je r pribliţno iznosio 0,2. 67

68 Koenov kriterijum za veličine uticaja (Palant, 2011) je (0,1 mali uticaj; 0,3 srednji uticaj, 0,5 veliku uticaj, što bi značilo da se dobijena veličina uticaja (r=0,2) moţe svrstati izmeďu malog i srednjeg. 3.7.KORELACIJE VARIJABLI Dobijeni podaci ukazuju na nema jake niti statistički značajne povezanosti izmedju prediktora i trostepene rekodirane varijable broj meseci preţivljavanja u uzorku. Ispitivana je veza izmeďu varijabli broj preţivljenih meseci u uzorku i veličine preduzeća i broja zaposlenih, a pošto su sve tri ordinalnog nivoa merenja, korelacija je računata pomoću Spirmanovog koeficijenta korelacije. MeĎu prediktorima postoji korelacija koja je jaka i statistički značajna, meďu varijablama veličina preduzeća i broj zaposlenih gde postoji pozitivna povezanost, visoka i statistički značajna (r=0,813, p=0,01). Posmatrajući broj meseci i prediktore, uočava se da ne postoji niti statistički značajna niti visoka korelacija (sa veličinom preduzeća, r= - 0,085, p=0,328; sa brojem zaposlenih, r=0,065, p=0,453). Nakon toga, postupak ispitivanja povezanosti izmeďu vremena preţivljavanja u uzorku izraďenih u broju meseci sa varijablama prekid u kontinuitetu i metodom i dobijeni su slični rezultati nema jake niti statistički značajne povezanosti meďu varijablama (metod r= 0,028, p=0,731; prekid u kontinuitetu r= - 0,118, p=0,153). Ispitivanje je raďeno putem Kendalovog tau koeficijenta koji ispituje vezu izmedju ordinalne i dihotomnih varijabli. Poslednji koeficijent korelacije koji je računat je Kendalov koeficijent konkordance W, koji isituje vezu izmeďu varijabli broj meseci u uzorku (3 stepena, ordinalna) i varijabli nominalnog nivoa merenja, delatnost i region. Rezultati ukazuju da koeficijenti korelacije nisu jaki (r=0,084 za delatnost i r=,025 za region). Rezultati ispitivanja povezanosti izmeďu varijabli ukazuju da ne postoje jake niti statistički značajne veze, osim dva predkitora meďusobno, broj zaposlenih i veličina preduzeća. 68

69 4. DISKUSIJA 4.1. Uvodni deo Marketinška istraţivanja u Srbiji se obavljaju u specijalizovanim agencijama koje sakupljaju podatke od različitih ciljnih grupa pojedinaca, institucija, preduzeća Na osnovu iskustvenih i javno dostupnih izveštaja, uočava se da se primenjena statistika u okviru istraţivanja svodi najčešće na korišćenje deskriptivne statistike, χ2 testa i eventualno korelacija i regresije. Zahtevi klijenata su takvi da se većina postojećih analiza zanemaruje jer ne postoje zahtevi, znanja, potrebe za detaljnijom obradom podataka. Zahtevi klijenata se svode na dobijanje procenata po svakom pojedinačnom pitanju, prosečnih ocena pojave koje se ocenjuju ili eventualno traţenja razlika u stavovima meďu ciljnim grupama. Najčešći nivo merenja su nominalni i ordinalni, a varijable su uglavnom kategorijalnog tipa. Samim tim, ne koriste se napredne statistike i kompleksnije analize. Ovaj rad predstavlja pokušaj da se prikaţe primena statistike na jedan istraţivački projekat iz prakse, koji se sprovodi na specifičnoj grupi subjekata-preduzeća, kako bi se prvobitno utvrdio uticaj metode sakupljanja podataka CATI i CAWI na vreme preţivljavanja preduzeća u longitudinalnom uzorku, ali i koje varijable (region, veličina preduzeća, broj zaposlenih, prekid u kontinuitetu sakupljanja podataka, delatnost) imaju uticaja. Za ove potrebe su korišćeni podaci istraţivanja Narodne banke Srbije. Tokom obrade raďene su sledeće statističke analize: deskriptivna statistika, χ2test, korelacija (Spirmanov, Kenadl tau i Kendalov koeficijent konkordance), Kruskal-Wallis test, Mann- Whitney U test, Koks PH model iz analize preţivljavanja, logistička i ordinalna regresija, sa ciljem dobijanja detaljnijih informacija o vremenu trajanja preduzeća u uzorku i prediktorima koji na njih utiču, kao i dodatnim pitanjima koje je analiza otvorila. Diskusija koja sledi pratiće pojedinačne hipoteze uz objašnjenja zbog čega su baš date statistike korišćene, uz pokušaj tumačenja dobijenih rezultata. Istraţivanje za potrebe NBS-a se radilo 23 meseca (od 36 planiranih), kada je napravljen presek stanja za potrebe ovog rada. Objedinjeno je 23 baza podataka u jednu koja je obraďivana. U pitanju su ispitivanja inflacionih očekivanja privrednog sektora čiji podaci kao konkretni odgovori neće biti prikazani. Koristiće se samo podaci da li je odreďeno preduzeće učestvovalo u istraţivanju ili ne, iz meseca u mesec, kao i podaci o preduzećima (region, delatnost, veličina, broj zaposlenih, prekid u kontinuitetu sakupljanja podataka, metod sakupljanja podataka). Napominje se da imena preduzeća kao i njihovi podaci su zaštićeni i svako preduzeće je kodirano 1 do 136, u cilju poštovanja odredbe o poverljivosti podataka. Svaki mesec je učestvovalo 100 preduzeća u istraţivanju. Cilj je bio da se ista preduzeća zadrţe što duţe u longitudinalnom projektu, kako bi se mogli pratiti trendovi. Uzorkovanje je obuhvatilo preduzeća od kojih su podaci dobijeni anketiranjem licem u lice, nakon čega su preduzeća mogla da biraju da li će da nastave anketiranje putem web ili telefonske ankete. Najvaţnije istraţivačko pitanje je bilo da li postoji uticaj metoda sakupljanja podataka na duţinu preţivljavanja preduzeća u longitudinalnom uzorku.

70 4.2. Sumirani rezultati Osnovna ideja rada je bila da se uoči koje varijable utiču na duţinu preţivljavanja preduzeća u longitudinalnom uzorku, kako bi se eventualno moglo uticati na neke od navedenih parametara u cilju odrţavanja preduzeća u uzorku tokom panela što duţe. Metoda sakupljanja podataka je posmatrana kao glavni prediktor na koji se moţe direktno uticati i njemu je bila posvećena posebna paţnja u teorijskom delu rada. Ispitanici u preduzećima su odlučivali da li ţele da budu anketirani putem CATI ili CAWI metode i zanimljiv je podatak da je identičan broj onih koji su traţili navedene metode (po n=68). Kako se kroz prethodne analize provlači informacija da su veličina preduzeća i broj zaposlenih u njima varijable koje su imale statističku značajnost uticaja na zavisnu varijablu (ordinalna regresija i Koks PH model) u okviru ukrštanja proseka duţine preţivljavanja preduzeća izraţenih u broju meseci sa veličinom preduzeća, su dobijeni podaci koji su veoma slični: veliko 17,3 meseci ostaje u uzorku, srednje 16,1, malo 16,4. Kada se posmatra broj zaposlenih u odnosu na prosečnu duţinu preţivljavanja preduzeća u uzorku, dolazi se do rezultata da povećanjem broja zaposlenih, smanjuje se prosek trajanja preduzeća u uzorku, pa preduzeća sa 250 i više zaposlenih u proseku traju 13,4 meseci, dok oni sa 10 i manje zaposlenih, 18,6. Koks PH model pokazuje da se nulta hipoteza (ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu vreme preţivljavanja u mesecima) moţe odbaciti jer u višestrukom modelu u kojem su ubačeni svi prediktori, dolazi do statistički značajnog predikora veličina preduzeća. Hipoteza je tako formulisana da pretpostavlja da su svi regresioni koeficijenti u modelu 0 i da nema efekata prediktorskih varijabli na vreme preţivljavanja preduzeća u panelu. Moţe se reći da bi ovo bila osnovna analiza kojom je trebalo ispitati navedeni problem istraţivanja, a da su ostale sporedne i dopunske, dok bi ordinalna regresija trebalo da predstavlja komparativnu analizu kojom bi se utvrďivalo da li se dobijaju slični rezultati. Grafikon funkcije rizika modela za varijablu veličina preduzeća ukazuje da se linije tokom vremena ne seku, što znači da je ispunjena PH pretpostavka o konstantnosti rizika tokom vremena. Ukupno je bilo 26,5% preduzeća kojima se dogaďaj desio, a 73,5% preduzeća koja su cenzurisana i dalje ostala u uzorku. Kada se model posmatrao na nivou pojedinačno ubačenih prediktora, nisu se uočili statistički značajni prediktori (region χ2=2,295, df=3,p=0,514; veličina preduzeća χ2=1,607, df=2,p=0,448; broj zaposlenih χ2=3,381, df=3,p=0,337; delatnost χ2=0,789, df=2,p=0,674; prekid u kontinuitetu χ2=0,620, df=1,p=0,431). Sa Backwise (Conditional) metodom ubacivanjem u obradu Koks PH modela, po koracima se moţe primetiti da ostaje samo veličina preduzeća i kao značajni prediktor. Velika preduzeća imaju najveću verovatnoću ostanka u uzorku, za razliku od malih čija se verovatnoća smanjuje kako odmiče vreme posmatranja panela. Preduzeća imaju negativan B koeficijent, a veća preduzeća koja imaju više B koeficijente negativnog predznaka imaju i manju verovatnoću rizika i povećanja vremena preţivljavanja. Sa druge strane, Exp(B) kada je manji od 1, to ukazuje na činjenicu da se rizik smanjuje u odnosu na referentnu grupu koja je u ovom slučaju za veličinu preduzeća modalitet malo preduzeće. Uočava se da je Koks PH model bio dobar model za obradu podataka i da je ipak pored mnogih neznačajnih varijabli dobijen prediktor koji ima uticaj na vreme preţivljavanja. Nakon Koks PH modela, raďena je i ordinalna regresija kao komparativni regresioni model koji bi testirao da li će se na istim podacima dobiti jednaki prediktori koji imaju statistički 70

71 značajan uticaj na zavisnu varijablu. Nulta hipoteza - Ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu broj meseci preţivljavanja u uzorku se odbacuje. Vaţno je napomenuti da je na samom početku ordinalne regresije dat ispis SPSS-a da 54,1% ćelija koje imaju manju frekvenciju od 5, što odmah govori o tome da se rezultati posmatraju sa oprezom, jer utiče na Goodness-of-fit i χ2 test. Odmah u startu u ordinalnom modelu se uočava da nema razlike izmeďu nultog modela i prediktovanog i da prediktori ubačeni u model nisu podigli mogućnost prediktovanja podataka (df=12, χ2 =13,824, p=0,312). Ukoliko se to zanemari i krene se u dalju obradu, dobija se informacija da Goodness-of-Fit daje zaključak da podaci dobro fituju sa modelom (χ2 =153,322, df=134 a p=0,121). Pored navedenog, Nagelkerke ne daje visok % objašnjene varijanse zavisne varijable (0,113). Značajni koeficijenti koji utiču na vreme preţivljavanja u uzorku su broj zaposlenih i veličina preduzeća. Ukoliko je preduzeće ima više zaposlenih, manje je verovatno da će duţe preţiveti u uzorku. Ovaj koeficijent opada kako dolazi do smanjenja broja zaposlenih u preduzećima. Koeficijenti procene za veličinu preduzeća su pozitivni i govore o tome da se povećanjem broja zaposlenih u preduzećima smanjuju apsolutne vrednosti koeficijenata, a u podacima to znači da su se povezuju sa većim skorovima kategorija broja meseci preţivljavanja. Tu je jasna situacija da veća preduzeća duţe preţivljavaju u uzorku i pozitivni koeficijent se povezuje sa duţim vremenom preţivljavanja u uzorku. Navedeni nalaz potvrďuje dobijene rezultate Koks PH modela u prethodnom delu. Ipak, vaţno je napomenuti i to da su rezultati upitni jer 54% ćelija ima frekvenciju manju od 5, ali i ordinalna regresija u modelu sa svim prediktorima ne ispunjava pretpostavku paralelnih linija pa se njeni rezultati uzimaju sa rezervom. Kod ordinalne regresije raďene sa pojedinačnim prediktorima, ni po jednom parametru u odnosu na prediktore pojedinačno, nisu pronaďeni statistički značajni koeficijenti koji utiču na vreme preţivljavanja izraţenih u trostepenoj zavisnoj varijabli. Moţe se primetiti da je ordinalna regresija zahtevnija u odnosu na Koks PH model i da ne prolazi testiranje adekvatnosti u ovom konkretnom slučaju na istim podacima, mada daje iste rezultate po pitanju prediktora veličina preduzeća, ukoliko bi se podaci posmatrali da su značajni, iako višestruki model nije prošao test paralelenih linija. Koks PH model je bio robustniji za iste podatke. Logistička regresija je bila primer kako se moţe koristiti u okviru ispitivanja preduzeća, u kojoj je zavisna binarna varijabla bila prekid u kontinuitetu sakupljanja podataka, a sve nezavisne varijable su bile isti prediktori koji su i ranije korišćeni u prethodnim analizama. Ona potvrďuje nultu hipotezu koja glasi da ne postoji statistički značajan uticaj prediktorskih varijabli na zavisnu varijablu prekid u kontinuitetu sakupljanja podataka. Iako su prediktori veličina preduzeća i broj zaposlenih u visokoj korelaciji, nakon provere kolinearnosti dobijaju se rezultati da nema visokog VIF ni tolerance, pa je ispunjen uslov da se radi logistička regresija sa ovakvim prediktorima. Model nije statistički značajan χ2(11,n=136)=16,618, p<0,05 ali je dobar (Hosmer and Lemeshow Test <0,05). Modelom sa uvrštenim prediktorskim varijablama se moţe objasniti izmeďu 11,5% (Cox i Snell) i 23,7% (Nagelkerke) varijanse. TakoĎe, model sa ubačenim prediktorima moţe da dobro klasifikuje 89% ispitanika. U okviru pojedinačnih doprinosa prediktorskih varijabli modelu, uočava se da su statistički značajni region, gde preduzeća iz Vojvodine imaju najveću verovatnoću da nemaju prekide u kontinuitetu u odnosu na preduzeća iz drugih regiona. 71

72 Za t-test i ANOVU nisu ni postavljane hipoteze jer nisu bili ispunjeni uslovi za njenu primenu, ne postoji normalna distribucije podataka. Moţe se primetiti da je problem parametrijskih testova to što zavise od raspodele i samim tim nisu mogli biti upotrebljeni u ovom slučaju iako bi bili značajni za rad, pa je raďena njihova neparametrijska zamena, Kruskal-Wallis i Mann-Whitney U test, sa svim prediktorima u odnosu na originalnu varijablu broj meseci preţivljavanja u uzorku. Jedan prediktor se izdvojio kod Mann- Whitney U testa, prekid u kontinuitetu, dok sva ostala testiranja su potvrdila nulte hipoteze nema statistički značajne razlike u distribuciji varijable broj meseci koje su preduzeća preţivela u uzorku u odnosu na prediktore. Sledeća obrada koja je raďena putem χ2 testa, imala je postavljene hipoteze od kojih se nijedna ne moţe potvrditi, jer nije bilo nijednog prediktora koji bi se pokazao kao statistički značajan u odnosu na zavisnu varijablu broj preţivelih meseci u uzorku. Sa druge strane, prvobitna prepreka je bila prevelika raspršenost podataka pa je test u startu pokazao da nije validan za korićenje u mnogim ukrštanjima, te je iz tog razloga raďeno rekodiranje varijable broj preţivelih meseci u uzorku, a zatim je ponovo ukrštan (ćelije su imale visok % onih koje imaju frekvenciju manju od 5). Bez obzira na rekodiranje u cilju saţimanja raspršenih podataka, iz obrade su morala biti isključena 2 ukrštanja iz istog razloga: brojem zaposlenih (25% ćelija ima frekvenciju manju od 5), prekid u kontinuitetu (33,3% ćelija ima frekvenciju manju od 5). Preostala ukrštanja su bila validna: region (χ2=0,845, df=6, p=0,991), veličina preduzeća (χ2=3,566, df=4, p=0,468), delatnost preduzeća (χ2=2,459, df=4, p=0,652), preteţni metod (χ2=0,479, df=2, p=0,787), ali nisu bila značajna. χ2 test bi bolje funkcionisao sa većim uzorkom odnosno sa varijablama koje imaju manji broj kategorija (u ovom slučaju pogotovo zavisne varijable), jer iako je neparametrijski i ne zavisi od distribucije podataka kao što je to slučaj kod ANOVE, ima svoja ograničenja koja sputavaju njegovo korišćenje na varijablama koje imaju velik broj modaliteta. Pretpostavlja se da bi povećanje uzorka dovelo do toga da sve varijable mogu biti validne za ukrštanja, sa frekvencijom do 20% koja je ispod 5 i time ispunile uslov za kvalitetnije rezultate. Korelacije zavisne varijable sa prediktorima nisu pokazale nijednu statistički značajnu povezanost tako da se hipoteza ne postoji statistički značajna povezanost prediktorskih varijabli sa varijablom dužina preživljavanja preduzeća u uzorku prihvata, uz raďen Spirmanov, Kendal tau i Kendalov koeficijent konkordance, u zavisnosti od nivoa merenja prediktorskih varijabli. Podaci koji su dobijeni na osnovu Koks PH modela i ordinalne regresije, ali indikativno putem χ2 testa, korelacija, Kruskal-Wallis i Mann-Whitney U testova, kao i ukrštenih proseka sa metodom sakupljanja podataka, govore o tome da se potvrďuju rezultati prethodnih istraţivanja koji govore da nema statistički značajne razlike meďu načinima sakupljanja podataka (Camillo, Conti, Ghiselli, 2011), nego da je pitanje više ciljnih grupa nego samog metoda (Kagardbauer, Manz, Zumkeller, 2013). Kako su u ovom projektu istraţivanja sami ispitanici imali mogućnost da biraju da li ţele CATI ili CAWI kao načine sakupljanja podataka, moguće da je to odgovor na pitanje zašto nema meďusobne razlike. Imajući u vidu vaţnost njihovih podataka po ekonomski sistem Srbije, moţe se primetiti da njihovo višemesečno ostajanje u uzorku preduzeća, kao i visok broj onih koji nemaju prekide u kontinuitetu sakupljanja podataka, daju ipak kvalitetne podatke praćenja jedne pojave u panelu koji toliko dugo traje. 72

73 5.ZAKLJUČAK Marketinška istraţivanja su uzela sve više maha u Srbiji, broj agencija koje se time bave se povećava, statistika kao svakodnevno izveštavanje po medijima na različite načine širi se meďu opštom populacijom. Ciljne grupe od kojih se sakupljaju podaci su različite, od pojedinaca, preko institucija do poslovnih subjekata sa kojima se rade istraţivanja. Načini sakupljanja podataka su raznovrsni, dok su softveri u sve široj upotrebi. Povećanjem penetracije Interneta u Srbiji, dolazi do razvoja novih metoda za sakupljanje podataka, a Internet ne koriste više samo mladi. Statistika nalazi sve veću primenu u ovakvoj razvijajućoj atmosferi. Izveštaji agencija su uglavnom svedeni na deskriptivnu statistiku uz korišćenje najčešće χ2 testa. Rad je imao za cilj da utvrdi uspešnost CATI i CAWI metode sakupljanje podataka na vreme preţivljavanja preduzeća u longitudinalnom uzorku, kao i koje od varijabli koje opisuju preduzeća imaju najveći uticaj na vreme preţivljavanja (veličina preduzeća, region iz kog potiče preduzeće, broj zaposlenih, delatnost kojom se preduzeće bavi, postojanje ili ne prekida u kontinuitetu sakupljanja podataka). Prediktor na koji je stavljen akcenat i kojim se moţe manipulisati u cilju postizanja duţeg ostanka u uzorku tokom trajanja projekta je metoda sakupljanja podataka (CATI ili CAWI). MeĎutim, ni po Koks PH modelu niti ordinalnoj regresiji, ni χ2 testu ili Kruskal-Wallis ili Mann-Whitney U testu, nisu uočene značajne razlike u preţivljavanju u uzorku u odnosu na metod sakupljanja podataka, što je bila jedna od osnovnih ideja rada. Moţe se zaključiti da ukoliko se u okviru privrednih subjekata radi istraţivanje i da se daje izbor ispitanicima, da li će se koristiti CATI ili CAWI metoda sakupljanja podataka, njihov odabir ne bi uticao na rezultate i obe metode bi bile podjednako efikasne. Zaključak je primenljiv u praksi za naredna istraţivanja. Od ostalih prediktora (region, veličina preduzeća, broj zaposlenih, delatnost preduzeća, prekid u kontinuitetu sakupljanja podataka) izdvaja se veličina preduzeća kao značajni prediktori kod Koks PH modela, dok se kod ordinalne regresije izdvaja veličina preduzeća i broj zaposlenih ali su rezultati upitni jer se dovodi u pitanje adekvatnost modela i ispunjenosti pretpostavki. Rezultati govore o tome da što je veće preduzeće ima potencijal da duţe ostane u uzorku a da preduzeća sa manjim brojem zaposlenih duţe opstaju u uzorku, ali kako je distribucija podataka preduzeća sa manjim brojem zaposlenih takva da je veoma mali uzorak od kojih je većina dugo preţivljava u uzorku, moţe se razmišljati kao o devijaciji u podacima koja utiče na ishod u ordinalnoj regresiji, kao jedan razlog. Drugi moţe biti neispunjenost testa paralelnih linija ili 54% ćelija koje imaju niţu frekvenciju od predviďene pa je ordinalni model upitan u odnosu na dobijene rezutlate. Kod logističke regresije se dobija informacija da je region statistički značajan prediktor, da preduzeća iz ovog regiona imaju veću verovatnoću da nemaju prekida u kontinuitetu sakupljanja podataka, a taj region sadrţi najduţe vreme preţivljavanja ukoliko se posmatra prosečna duţina preţivljavanja preduzeća u odnosu na region. Što se tiče podataka i vaţnosti prediktora na duţi ostanak u okviru panela, to je jedino što se izdvaja. Što se primene u praksi i dobijenih nalaza tiče, daje mogućnost podsticanja manjih i srednjih preduzeća na različite načine, kako bi se duţe odrţali u uzorku, radi dobijanja što kvalitetnijih podataka. 73

74 Sa druge strane, što se tiče samih obrada koje su raďene, uočene su neke prednosti i mane. χ2 test nije pokazao značajnosti i bilo je problema sa validacijom usled velikog broja kategorija zavisne varijable (23 modaliteta), što je dovelo do toga da iako je bila rekodirana na samo 3 modaliteta, 2 hipoteze nisu mogle ni biti tumačene jer je raspršenje bilo veliko i nije bilo moguće interpretirati podatke jer je veliki broj ćelija imao frekvenciju manju od 5, pa su izbačene iz analize. Sam test nije ukazao na značajnosti koje su pokazali modeli Koks PH i ordinalna regresija. Preporuka za praksu za dalji rad sa χ2 testom se odnosio na definisanje ulaznih varijabli vezanih za broj modaliteta varijabli ili povećanje uzorka ubuduće, kako bi se moglo iskoristiti što više od podataka. ANOVA i t-test bi dali korisne podatke, ali nisu ispunjeni preduslovi o normalnosti distribucije pa su raďeni Kruskal Wallis i Mann-Whitney U test, koji su ukazali da nema statistički značajne razlike u originalnoj varijabli broj meseci preţivljavanja preduzeća u uzorku ni za jedan prediktor osim za prekid u kontinuitetu. Kao najrobustnija analiza se pokazao Koks PH, gde je PH pretpostavka mogla biti zadovoljena pa samim tim i model je bio validan za interpretaciju na nivou višestruko ubačenih prediktora u model. Izdvojio je veličinu preduzeća kao varijable od značaja koje imaju uticaj na zavisnu varijablu. Ipak Koks PH model je model koji baš sluţi za analizu preţivljavanja pa ne čudi što je pokazao najbolje rezultate u primeni u praksi. Ono što se pokazalo veoma korisnim u praksi su grafici koje model daje, o funkciji preţivljavanja i rizika, koje na vizuelan i veoma jasan način pokazuju kako se kreću funkcije u zavisnosti od vremena po pojedinačnom modalitetu prediktorskih varijabli. Ordinalna regresija ima, kao i svaka od regresija, dosta uslova koji moraju biti zadovoljeni da bi se mogla realizovani i da bi model bio adekvatan (fitovanje podataka, razlika nultog i prediktovanog modela, test paralelnih linija..). Ona je pokazala isti značajan prediktor kao i Koks PH model, ali kako njeni rezultati sa višestruko ubačenim prediktorima u model nisu prošli test paralelnih linija, rezultati se moraju tako i tumačiti. U pojedinačnim modelovanjima zavisne varijable i pojedinačnih prediktora, nije bilo značajnosti, što je bio slučaj i sa Koks PH modelom pojedinačno modeliranje nije ukazalo na statistički značajne prediktore u modelu. Na kraju, prikazana je primena logističke regresije u ispitivanju preduzeća i imala je samo jedan značajan predikor ubačen u model (prekid u kontinuitetu), tako da se ne moţe komentarisati sa aspekta komparacije sa ordinalnom regresijom ili Koks PH modelom. Vaţna napomena koja se tiče podataka koji su obraďivani (zbog Koks PH modela) jeste da su prediktorske varijable, vremenski nezavisne iako je projekat longitudinalni i sakupljani tokom 23 meseca. Sva preduzeća su meďusobno nezavisna i nijedna vremenski zavisna varijabla nije korišćena. Jedina variabla za koju se moţe reći da zavisi od vremena je prekid u kontinuitetu, ali je ona obraďena kao binarna da/ne varijabla i to je razlog usled kog podaci nisu obraďivani kao longitudinalni, nego transferzalni u kojima su i analize tako prilagoďene. Na osnovu dobijenih informacija iz rada, mogu se formulisati dve preporuke za dalje istraţivanje. Jedna je vezana direktno za podatke dobijene iz obrade - mali broj značajnih prediktora na vreme preţivljavanja, kao i mali % objašnjene varijanse (Nagelkerke) ukazuje da pored navedenih varijabli koje su date kao prediktorske, postoji još prostora za neko drugo istraţivanje koje bi eventualno moglo da pokaţe koji su to prediktori kojima bi se zaključilo šta treba uraditi kako bi preduzeća što duţe ostala u uzorku. Druga se tiče konceptualne ideje vezane za primenu modela koji se koristi iz biomedicine, Koks PH modela, u novoj sferi, ispitivanja preduzeća. Postoji razlika u tome što kod analize preţivljavanja u okviru biomedicine, dogaďaj znači smrt i taj ispitanik se više ne moţe pratiti u uzorku. U okviru ispitivanja preduzeća, mogu da se vrate ponovo u uzorak posle nekog 74

75 vremena, što nije moguće u biomedicini. Preporuka za dalje istraţivanje bi bila, ukoliko do sada to niko nije uradio, da se dopuni formula modela tako da moţe da uvrsti prekide u sakupljanju podataka tokom trajanja projekta u validnu kalkulaciju. Samim tim primena Koks PH modela mogla bi da ima širu primenu nego što ima danas. 75

76 6.LITERATURA Abdelaal, M.M.A. i Zakria, S.H.E.A.(2015). Modeling Survival Data by Using Cox Regression Model. American Journal of Theoretical and Applied Statistics. 4(6): Agencija za privredne registre. Kriterijumi za razvrstavanje i granične vrednosti za 2015.godinu. Dostupno na Agresti, A. (2010). Analysis of ordinal categorical data (Vol. 656). John Wiley i Sons. Ananth, C. V., i Kleinbaum, D. G. (1997). Regression models for ordinal responses: a review of methods and applications. International journal of epidemiology, 26(6), Armnstrong, B., i Sloan, M. (1989). Ordinal regression models for epidemiologic Data. American Journal of Epidemiology, 129(1), Bergerud, W. (1996). Introduction to Regression Models: with worked forestry examples. Biom. Info. Hand. 7. Res. Br., BC Min. For., Victoria, BC Work. Pap, 26, Burns, A. C., i Bush, R. F. (2000). Marketing research. Globalization, 1(7). Camillo, F., Ghiselli, S., i Conti, V. (2011). Integration of different data collection techniques using the propensity score (No. 4). Cox, D. R. (1972). Regression Models and Life Tables (with Discussion). Journal of the Royal Statistical Society, Series B 34: Curell, G.(2015). Scientific Data Analysis. Oxford: Oxford University Press. Field, A. P. (2009). Discovering statistics using SPSS:(and sex and drugs and rock'n'roll). Los Angeles Thousand Oaks, California: SAGE Publications. Fox, J. (2002). Cox proportional-hazards regression for survival data. An R and S-PLUS companion to applied regression, Fuchs, M., Couper, M., i Hansen, S. E. (2000). Technology Effects: Interview Duration in CAPI and Paper and Pencil Surveys. Developments in Survey Methodology. Ljubljana, Slovenia, Gingrich, R.(1992). Introductory statistics for the social sciences. Deparmant of sociology and Social Sciences. Regina: University of Regina. 76

77 Gibbons, J.D.(1993). Nonparametric measures of assotiation (Sage University Paper serios on Quantitative Applications in the Scial Sciences, serios no ). Newbury Park, CA:Sage. Hosmer, D. W., i Lemeshow, S. (2000). Special topics. Applied Logistic Regression, Second Edition, pristupljeno Janke, S. J., i Tinsley, F. (2005). Introduction to linear models and statistical inference. John Wiley i Sons. Janković, M. et al. (2015). Pregled tržišta telekomunikacija i poštanskih usluga u Republici Srbiji u 2014.godini. Beograd: Regulatorna agencija za elektronske komunikacije i poštanske usluge (RATEL). Preuzeto sa web.pdf Janssen, B. (2006). Web data collection in a mixed mode approach: an experiment. Proceedings of Q. Kagerbauer, M., Manz, W., i Zumkeller, D. (2013). Analysis of PAPI, CATI, and CAWI methods for a multiday household travel survey. In Transport survey methods: Best practice for decision making (pp ). Emerald Group Publishing Limited. Kleinbaum, D. G. (1998). Survival Analysis, a Self Learning Text. Biometrical Journal, 40(1), Kleinbaum, D. G., i Klein, M. (2006). Survival analysis: a self-learning text. 2 nd edition. Department of Epidemiology Rolling School of Public Health at Emory University. Knapp T.R. (1990). Treating ordinal scales as interval scales: an attempt to resolve the controversy. Nurs Res;39: Kovačević, M., Pavlović, K., Šutić, V. (2015). Upotreba informaciono-komunikacionih tehnologija u Republici Srbiji. Domaćinstva/pojedinci, preduzeća. Beograd: Republički zavod za statistiku Srbije McCullagh, P. (1980). Regression models for ordinal data. Journal of the royal statistical society. Series B (Methodological), McDonald, J.H. (2014). Handbook of Biological Statistics (3rd ed.)., Maryland: Sparky House Publishing Baltimore, pp

78 Nachar, N. (2008). The Mann-Whitney U: A Test for Assessing Whether Two Independent Samples Come from the Same Distribution.Tutorials in Quantitative Methods for Psychology. vol. 4(1), p O'Connel, A.A.(2006). Logistic regression for ordinal response variables. Series: Quantitative Applications in the Social Sciences. New Delphi: Sage Publications Pallant, J. (2011). Priručnik za preţivljavanje u SPSS: prevod 4. Izdanja. Beograd: Mikro knjiga. Peduzzi, P., Concato, J., Feinstein, A. R., i Holford, T. R. (1995). Importance of events per independent variable in proportional hazards regression analysis II. Accuracy and precision of regression estimates. Journal of clinical epidemiology, 48(12), Peng, C. Y. J., Lee, K. L., i Ingersoll, G. M. (2002). An introduction to logistic regression analysis and reporting. The journal of educational research, 96(1), 3-14 Petrie, A., Sabin, C.(2000). Medical Statistics at Glance.Blackwell Science Ltd. Rodriguez, G. (2010). Survival models: Chapter7. University of Princeton. pristupljeno dana Sharma, A.K.(2005). Text Book of Correlation and Regression.New Delphi: Discovering Publishing House. Smith T., Smith B. (2013). Survival analysis and the application of Cox s proportional Pristupljeno 2.maj 2017 Todorović, D. (2008). Metodologija psiholoških istraživanja. Beograd. Centar za primenjenu psihologiju. Twisk, J. W. (2013). Applied longitudinal data analysis for epidemiology: a practical guide. Cambridge University Press. hazards modeling using SAS pristupljeno dana predavanje.pdf pristupljeno dana

79 7.PRILOZI Prilog 1. Output statistike opisa uzorka N broj meseci u uzorku Valid 136 Missing 0 Mean 16,7721 Median 22,0000 Mode 23,00 Std. Deviation 7,86456 Tabela 18.- Opis meseci u uzorku Valid Region Frequency Percent Valid Percent Cumulative Percent Beograd 32 23,5 23,5 23,5 Vojvodina 53 39,0 39,0 62,5 Zapadna Srbija sa Šumadijom 40 29,4 29,4 91,9 Istočna i Juţna Srbija 11 8,1 8,1 100,0 Total ,0 100,0 Tabela 19.- Opis regiona Valid veličina preduzeća Frequency Percent Valid Percent Cumulative Percent Veliko 67 49,3 49,3 49,3 Srednje 35 25,7 25,7 75,0 Malo 34 25,0 25,0 100,0 Total ,0 100,0 Tabela 20.- Opis veličine preduzeća Valid broj zaposlenih Frequency Percent Valid Percent Cumulative Percent 250 i više zaposlenih 50 36,8 36,8 36, zaposlenih 45 33,1 33,1 69, zaposlenih 36 26,5 26,5 96,3 10 i manje zaposlenih 5 3,7 3,7 100,0 Total ,0 100,0 Tabela 21.- Opis broja zaposlenih Valid delatnost preduzeća Frequency Percent Valid Percent Cumulative Percent Proizvodnja 43 31,6 31,6 31,6 Trgovina 44 32,4 32,4 64,0 Ostalo 49 36,0 36,0 100,0 Total ,0 100,0 79

80 Tabela 22.- Opis delatnosti preduzeća Valid broj meseci u uzorku Frequency Percent Valid Percent Cumulative Percent 1,00 5 3,7 3,7 3,7 2,00 6 4,4 4,4 8,1 3,00 3 2,2 2,2 10,3 4,00 4 2,9 2,9 13,2 5,00 3 2,2 2,2 15,4 7,00 3 2,2 2,2 17,6 8,00 3 2,2 2,2 19,9 9,00 5 3,7 3,7 23,5 10,00 7 5,1 5,1 28,7 11,00 2 1,5 1,5 30,1 12,00 2 1,5 1,5 31,6 13,00 1,7,7 32,4 14,00 4 2,9 2,9 35,3 15,00 5 3,7 3,7 39,0 19,00 2 1,5 1,5 40,4 21,00 2 1,5 1,5 41,9 22, ,9 16,9 58,8 23, ,2 41,2 100,0 Total ,0 100,0 Tabela 23.- Opis meseci u uzorku Valid prekid u kontinuitetu Frequency Percent Valid Percent Cumulative Percent Ne ,7 89,7 89,7 Da 14 10,3 10,3 100,0 Total ,0 100,0 Tabela 24.- Opis prekida u kontinuitetu Valid rekod preteţnog metoda Frequency Percent Valid Percent Cumulative Percent Web 68 50,0 50,0 50,0 Telefon 68 50,0 50,0 100,0 Total ,0 100,0 Tabela 25.- Opis preteţnog metoda skaupljanja podataka Valid cenzorsip status Frequency Percent Valid Percent Cumulative Percent Preduzeće cenzurisano i dalje u uzorku ,5 73,5 73,5 DogaĎaj se desio, neuspeh 36 26,5 26,5 100,0 Total ,0 100,0 80

81 Tabela 26.- Opis Prilog 2- Analiza preţivljavanja output iz SPSS Warnings Since coefficients did not converge, no further models will be fitted. Tabela 27 Cases available in analysis Cases dropped Case Processing Summary N Percent Event a 36 26,5% Censored ,5% Total ,0% Cases with missing values 0 0,0% Cases with negative time 0 0,0% Censored cases before the earliest event in a stratum 0 0,0% Total 0 0,0% Total ,0% a. Dependent Variable: broj meseci u uzorku Tabela 28.- Sumarna tabela region_podela b Categorical Variable Codings a,c,d,e,f,g Frequency (1) (2) (3) 1,00=Beograd ,00=Vojvodina ,00=Zapadna Srbija sa Šumadijom ,00=Istočna i Juţna Srbija delatnost b 2,00=Trgovina ,00=Proizvodnja ,00=Ostalo prekidd b,00=ne ,00=Da 14 1 rekod_preteznimetod b 1,00=Web ,00=Telefon 68 1 brojzaposlenihobrnuto b 1,00=10 i manje ,00= ,00= ,00=250 i više velicina_recode b 2,00=srednje ,00=Malo a. Category variable: region_podela (region) 3,00=veliko

82 b. Indicator Parameter Coding c. Category variable: delatnost (delatnost preduzeća) d. Category variable: prekidd (prekid u kontinuitetu) e. Category variable: rekod_preteznimetod (rekod preteţnog metoda) f. Category variable: brojzaposlenihobrnuto (broj zaposlenih) Categorical Variable Codings a,c,d,e,f,g g. Category variable: velicina_recode (velicina preduzeca) Tabela 29.- Kodiranje varijabli Omnibus Tests of Model Coefficients -2 Log Likelihood 342,273 Tabela 30.- Omnibus test 82

83 Block 1: Method = Backward Stepwise (Conditional LR) Step 1-2 Log Likelihood a Region (1) Region (2) Region (3) Iteration History b Coefficient delatnost(1) delatnost(2) prekidd rekod_preteznimetod brojzaposlenih (1) brojzaposlenih (2) brojzaposlenih 1 327,999 -,859 -,740 -,637,043 -,248,243 -,149 1,110 2,034 2,947 -,310-1, ,813 -,827 -,617 -,525,006 -,373,254 -,137 2,139 3,160 4,386 -,494-1, ,594 -,828 -,615 -,526,009 -,378,251 -,133 3,151 4,182 5,437 -,507-1, ,515 -,828 -,615 -,526,009 -,378,251 -,133 4,153 5,183 6,439 -,507-1, ,486 -,828 -,615 -,526,009 -,378,251 -,133 5,153 6,184 7,440 -,507-1, ,475 -,828 -,615 -,526,009 -,378,251 -,133 6,154 7,184 8,440 -,507-1, ,471 -,828 -,615 -,526,009 -,378,251 -,133 7,154 8,184 9,440 -,507-1, ,470 -,828 -,615 -,526,009 -,378,251 -,133 8,154 9,184 10,440 -,507-1, ,469 -,828 -,615 -,526,009 -,378,251 -,133 9,154 10,184 11,440 -,507-1,944 a. Beginning Block Number 0, initial Log Likelihood function: -2 Log likelihood: 342,273 b. The information matrix became singular after 9 iterations Tabela 31.- Istorija iteracija u obradi podataka (3) velicina (1) velicina (2)

84 Time Baseline Cum Hazard Survival Table At mean of covariates Survival SE Cum Hazard 1,00,000,977,065,023 2,00,000,949,142,052 3,00,000,945,156,057 4,00,000,930,196,073 5,00,000,915,236,089 7,00,000,900,276,106 8,00,000,884,316,124 9,00,000,857,383,155 10,00,000,845,411,168 11,00,000,839,425,175 12,00,000,827,455,190 13,00,000,820,470,198 19,00,000,813,486,206 Tabela 32.- Tabela preţivljavanja Covariate Means and Pattern Values Mean Pattern region (1),390,390,390,390 region (2),294,294,294,294 region (3),081,081,081,081 delatnost(1),324,324,324,324 delatnost(2),360,360,360,360 prekidd,103,103,103,103 rekod_preteznimetod,500,500,500,500 brojzaposlenih (1),265,265,265,265 brojzaposlenih (2),331,331,331,331 brojzaposlenih (3),368,368,368,368 velicina (1),257,000 1,000,000 velicina_(2),493,000,000 1,000 Tabela 33.- Sredine kovarijata

85 Prilog 3.- Ordinalna regresija, Ispis iz SPSS Warnings There are 120 (54,1%) cells (i.e., dependent variable levels by combinations of predictor variable values) with zero frequencies. Tabela 34 meseci_na_3 region veličina preduzeća broj zaposlenih delatnost preduzeća prekid u kontinuitetu rekod preteţnog metoda Case Processing Summary N Marginal Percentage 1-8 meseci 27 19,9% 9-21 meseci 30 22,1% meseci 79 58,1% Beograd 32 23,5% Vojvodina 53 39,0% Zapadna Srbija sa Šumadijom 40 29,4% Istočna i Juţna Srbija 11 8,1% Veliko 67 49,3% Srednje 35 25,7% Malo 34 25,0% 250 i više zaposlenih 50 36,8% zaposlenih 45 33,1% zaposlenih 36 26,5% 10 i manje zaposlenih 5 3,7% Proizvodnja 43 31,6% Trgovina 44 32,4% Ostalo 49 36,0% Ne ,7% Da 14 10,3% Web 68 50,0% Telefon 68 50,0% Valid ,0% Missing 0 Total 136 Tabela 35.- Sumarna tabela 85

86 Test of Parallel Lines a Model -2 Log Likelihood Chi-Square df Sig. Null Hypothesis 192,687 General 168,952 b 23,735 c 12,022 The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit. b. The log-likelihood value cannot be further increased after maximum number of step-halving. c. The Chi-Square statistic is computed based on the log-likelihood value of the last iteration of the general model. Validity of the test is uncertain. Tabela 36.- Test paralelnih linija Ordinalna regresija sa brojem zaposlenh na 3 varijable Warnings There are 115 (53,2%) cells (i.e., dependent variable levels by combinations of predictor variable values) with zero frequencies. Tabela 37 meseci_na_3 region veličina preduzeća delatnost preduzeća prekid u kontinuitetu rekod preteţnog metoda broj zaposlenih 1=250 i više Case Processing Summary N Marginal Percentage 1-8 meseci 27 19,9% 9-21 meseci 30 22,1% meseci 79 58,1% Beograd 32 23,5% Vojvodina 53 39,0% Zapadna Srbija sa Šumadijom 40 29,4% Istočna i Juţna Srbija 11 8,1% Veliko 67 49,3% Srednje 35 25,7% Malo 34 25,0% Proizvodnja 43 31,6% Trgovina 44 32,4% Ostalo 49 36,0% Ne ,7% Da 14 10,3% Web 68 50,0% Telefon 68 50,0% 250 i više zaposlenih 50 36,8% zaposlenih 45 33,1% ispod 49 zaposlenih 41 30,1% 86

87 Valid ,0% Missing 0 Total 136 Tabela 38 Model Fitting Information Model -2 Log Likelihood Chi-Square df Sig. Intercept Only 205,125 Final 191,904 13,220 11,279 Link function: Logit. Tabela 39 Goodness-of-Fit Chi-Square df Sig. Pearson 148, ,140 Deviance 146, ,164 Link function: Logit. Tabela 40 Pseudo R-Square Cox and Snell,093 Nagelkerke,108 McFadden,050 Link function: Logit. Tabela 41 Threshold Location Parameter Estimates Estimate Std. Wald df Sig. 95% Confidence Interval Error Lower Bound Upper Bound [meseci_na_3 = 1,00] -,613,894,471 1,493-2,365 1,138 [meseci_na_3 = 2,00],540,892,366 1,545-1,209 2,289 [region=1,00] -,106,713,022 1,882-1,503 1,291 [region=2,00],214,668,103 1,748-1,095 1,524 [region=3,00],175,686,065 1,799-1,170 1,519 [region=4,00] 0 a [velicina=1,00] 2,675,935 8,181 1,004,842 4,508 [velicina=2,00] 1,100,751 2,149 1,143 -,371 2,571 [velicina=3,00] 0 a [delatnost=1,00] -,175,446,154 1,694-1,049,698 [delatnost=2,00] -,005,444,000 1,991 -,874,865 [delatnost=3,00] 0 a [prekidd=,00],786,582 1,824 1,177 -,355 1,927 [prekidd=1,00] 0 a

88 Parameter Estimates [rekod_preteznimetod=1,00],007,359,000 1,985 -,698,711 [rekod_preteznimetod=2,00] 0 a [brojzaposlenih=1,00] -2,600,958 7,362 1,007-4,477 -,722 [brojzaposlenih=2,00] -1,519,748 4,120 1,042-2,986 -,052 [brojzaposlenih=3,00] 0 a Link function: Logit. a. This parameter is set to zero because it is redundant. Tabela 42 Test of Parallel Lines a Model -2 Log Likelihood Chi-Square df Sig. Null Hypothesis 191,904 General 175,722 b 16,182 c 11,135 The null hypothesis states that the location parameters (slope coefficients) are the same across response categories. a. Link function: Logit. b. The log-likelihood value cannot be further increased after maximum number of stephalving. c. The Chi-Square statistic is computed based on the log-likelihood value of the last iteration of the general model. Validity of the test is uncertain. Tabela 43 Prilog 4.- Logistička regresija Ispisi iz SPSS Case Processing Summary Unweighted Cases a N Percent Selected Cases Included in Analysis ,0 Missing Cases 0,0 Total ,0 Unselected Cases 0,0 Total ,0 a. If weight is in effect, see classification table for the total number of cases. Tabela 44 Dependent Variable Encoding Original Value Internal Value Ne 0 Da 1 Tabela 45 88

89 region broj zaposlenih delatnost preduzeća velicina preduzeca rekod preteţnog metoda Categorical Variables Codings Frequency Parameter coding (1) (2) (3) Beograd 32,000,000,000 Vojvodina 53 1,000,000,000 Zapadna Srbija sa Šumadijom 40,000 1,000,000 Istočna i Juţna Srbija 11,000,000 1, i manje 5,000,000, ,000,000, ,000 1,000, i više 50,000,000 1,000 Proizvodnja 43,000,000 Trgovina 44 1,000,000 Ostalo 49,000 1,000 Malo 34,000,000 srednje 35 1,000,000 veliko 67,000 1,000 Web 68,000 Telefon 68 1,000 Tabela 46.- Kodiranje kategorijalnih varijabli Variables in the Equation B S.E. Wald df Sig. Exp(B) Step 0 Constant -2,165,282 58,864 1,000,115 Tabela 47.- Varijable u modelu bez prediktora Step 0 Variables Variables not in the Equation Score df Sig. region 4,789 3,188 region (1) 2,019 1,155 region (2),479 1,489 region(3),806 1,369 delatnost 2,660 2,264 delatnost(1),102 1,749 delatnost(2) 1,444 1,230 rekod_preteznimetod(1),319 1,573 brojzaposlenih 2,803 3,423 brojzaposlenih(1) 1,190 1,275 brojzaposlenih(2) 2,016 1,156 brojzaposlenih(3),007 1,931 velicina 1,544 2,462 velicina(1),151 1,697 velicina(2) 1,409 1,235 89

90 Overall Statistics 14,520 11,206 Tabela 48.- Isključene varijable iz modela Prilog 5. Output Ukrštanje broja trajanja u uzorku u odnosu na prediktorske varijable, bez računanja statističke značajnosti (ANOVE) broj meseci u uzorku * rekod preteţnog metoda Mean rekod preteţnog metoda broj meseci u uzorku Web 16,6912 Telefon 16,8529 Total 16,7721 Tabela 49.- Prosek meseci u odnosu na metod sakupljanja podataka broj meseci u uzorku * prekid u kontinuitetu Mean prekid u broj meseci u kontinuitetu uzorku Ne 17,0082 Da 14,7143 Total 16,7721 Tabela 50.- Prosek meseci u odnosu na prekid sakupljanja podataka u kontinuitetu broj meseci u uzorku * cenzorsip status Mean cenzorsip status broj meseci u uzorku Preduzeće cenzurisano 20,5700 i dalje u uzorku DogaĎaj se desio, 6,2222 neuspeh Total 16,7721 Tabela 51.- Prosek meseci u odnosu na status cenzurisanja i dogaďaj broj meseci u uzorku * region Mean region broj meseci u uzorku Beograd 16,

91 Vojvodina 17,0377 Zapadna Srbija sa Šumadijom 16,8000 Istočna i Juţna Srbija 16,6364 Total 16,7721 Tabela 52.- Prosek meseci u odnosu na region broj meseci u uzorku * veličina preduzeća Mean veličina broj meseci u preduzeća uzorku Veliko 17,3284 Srednje 16,0857 Malo 16,3824 Total 16,7721 Tabela 53.- prosek meseci u odnosu na veličinu preduzeća broj meseci u uzorku * broj zaposlenih Mean broj zaposlenih broj meseci u uzorku 250 i više zaposlenih 16, zaposlenih 16, zaposlenih 18, i manje zaposlenih 18,6000 Total 16,7721 Tabela 54.- Prosek meseci u odnosu na broj zaposlenih broj meseci u uzorku * delatnost preduzeća Mean delatnost broj meseci u preduzeća uzorku Proizvodnja 15,9535 Trgovina 16,5000 Ostalo 17,7347 Total 16,7721 Tabela 55.- Prosek meseci u odnosu na elatnost preduzeća 91

92 Prilog 6 Χ² test output, ukrštanje sa rekodiranom zavisnom varijablom 1-8 meseci meseci_na_ meseci meseci Total Crosstab Beograd region Vojvodina Zapadna Srbija sa Šumadijom Istočna i Juţna Srbija Count Total Expected Count 6,4 10,5 7,9 2,2 27,0 % within region 21,9% 20,8% 17,5% 18,2% 19,9% Count Expected Count 7,1 11,7 8,8 2,4 30,0 % within region 21,9% 18,9% 25,0% 27,3% 22,1% Count Expected Count 18,6 30,8 23,2 6,4 79,0 % within region 56,2% 60,4% 57,5% 54,5% 58,1% Count Expected Count 32,0 53,0 40,0 11,0 136,0 % within region 100,0% 100,0% 100,0% 100,0% 100,0% Tabela 56.- Ukrštanje broja meseci i regiona Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square,845 a 6,991 Likelihood Ratio,844 6,991 Linear-by-Linear Association,034 1,855 N of Valid Cases 136 a. 2 cells (16,7%) have expected count less than 5. The minimum expected count is 2,18. Tabela 57.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,079,991 Cramer's V,056,991 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 58.- Fi i Kremer koeficijenti 92

93 meseci_na_3 Total 1-8 meseci 9-21 meseci meseci Crosstab veličina preduzeća Veliko Srednje Malo Count Total Expected Count 13,3 6,9 6,8 27,0 % within veličina preduzeća 16,4% 28,6% 17,6% 19,9% Count Expected Count 14,8 7,7 7,5 30,0 % within veličina preduzeća 20,9% 17,1% 29,4% 22,1% Count Expected Count 38,9 20,3 19,8 79,0 % within veličina preduzeća 62,7% 54,3% 52,9% 58,1% Count Expected Count 67,0 35,0 34,0 136,0 % within veličina preduzeća 100,0% 100,0% 100,0% 100,0% Tabela 59.- Ukrštanje broja meseci sa veličinom preduzeća Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square 3,566 a 4,468 Likelihood Ratio 3,386 4,495 Linear-by-Linear Association,687 1,407 N of Valid Cases 136 a. 0 cells (0,0%) have expected count less than 5. The minimum expected count is 6,75. Tabela 60.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,162,468 Cramer's V,114,468 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 61.- Fi i Kramer koeficijenti 93

94 1-8 meseci meseci_na_ meseci meseci Total Crosstab broj zaposlenih Total 250 i više zaposlenih zaposlenih zaposlenih 10 i manje zaposlenih Count Expected Count 9,9 8,9 7,1 1,0 27,0 % within broj zaposlenih 20,0% 28,9% 8,3% 20,0% 19,9% Count Expected Count 11,0 9,9 7,9 1,1 30,0 % within broj zaposlenih 24,0% 13,3% 33,3% 0,0% 22,1% Count Expected Count 29,0 26,1 20,9 2,9 79,0 % within broj zaposlenih 56,0% 57,8% 58,3% 80,0% 58,1% Count Expected Count 50,0 45,0 36,0 5,0 136,0 % within broj 100,0% 100,0% 100,0% 100,0% 100,0% zaposlenih Tabela 62.- Ukrštanje borja meseci i broja zaposlenih Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square 9,526 a 6,146 Likelihood Ratio 11,006 6,088 Linear-by-Linear Association,839 1,360 N of Valid Cases 136 a. 3 cells (25,0%) have expected count less than 5. The minimum expected count is,99. Tabela 63.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,265,146 Cramer's V,187,146 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 64.- Fi i Kramer koeficijenti 94

95 meseci_na_3 Total 1-8 meseci 9-21 meseci meseci Crosstab delatnost preduzeća Proizvodnja Trgovina Ostalo Count Total Expected Count 8,5 8,7 9,7 27,0 % within delatnost preduzeća 20,9% 22,7% 16,3% 19,9% Count Expected Count 9,5 9,7 10,8 30,0 % within delatnost preduzeća 27,9% 15,9% 22,4% 22,1% Count Expected Count 25,0 25,6 28,5 79,0 % within delatnost preduzeća 51,2% 61,4% 61,2% 58,1% Count Expected Count 43,0 44,0 49,0 136,0 % within delatnost preduzeća 100,0% 100,0% 100,0% 100,0% Tabela 65.- Ukrštanje broja meseci i delatnosti preduzeća Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square 2,459 a 4,652 Likelihood Ratio 2,512 4,642 Linear-by-Linear Association,768 1,381 N of Valid Cases 136 a. 0 cells (0,0%) have expected count less than 5. The minimum expected count is 8,54. Tabela 66.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,134,652 Cramer's V,095,652 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 67.- Fi i Kramer koeficijenti 95

96 meseci_na_3 Total 1-8 meseci 9-21 meseci meseci Crosstab prekid u kontinuitetu Ne Da Total Count Expected Count 24,2 2,8 27,0 % within prekid u kontinuitetu 19,7% 21,4% 19,9% Count Expected Count 26,9 3,1 30,0 % within prekid u kontinuitetu 19,7% 42,9% 22,1% Count Expected Count 70,9 8,1 79,0 % within prekid u kontinuitetu 60,7% 35,7% 58,1% Count Expected Count 122,0 14,0 136,0 % within prekid u kontinuitetu 100,0% 100,0% 100,0% Tabela 68.- Ukrštanje broja meseci i prekida u kontinuitetu sakupljanja podataka Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square 4,425 a 2,109 Likelihood Ratio 4,030 2,133 Linear-by-Linear Association 1,403 1,236 N of Valid Cases 136 a. 2 cells (33,3%) have expected count less than 5. The minimum expected count is 2,78. Tabela 69.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,180,109 Cramer's V,180,109 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 70.- Fi i Kramer koeficijenti 96

97 Crosstab rekod preteţnog metoda Total Web Telefon Count Expected Count 13,5 13,5 27,0 1-8 meseci % within rekod preteţnog 22,1% 17,6% 19,9% metoda Count Expected Count 15,0 15,0 30,0 meseci_na_ meseci % within rekod preteţnog 20,6% 23,5% 22,1% metoda Count Expected Count 39,5 39,5 79, meseci % within rekod preteţnog 57,4% 58,8% 58,1% metoda Count Expected Count 68,0 68,0 136,0 Total % within rekod preteţnog 100,0% 100,0% 100,0% metoda Tabela 71.- Ukrštanja broja meseci sa preteţnim metodom sakupljanja podataka Chi-Square Tests Value df Asymp. Sig. (2- sided) Pearson Chi-Square,479 a 2,787 Likelihood Ratio,480 2,787 Linear-by-Linear Association,184 1,668 N of Valid Cases 136 a. 0 cells (0,0%) have expected count less than 5. The minimum expected count is 13,50. Tabela 72.- Značajnost testa Nominal by Nominal Symmetric Measures Value Approx. Sig. Phi,059,787 Cramer's V,059,787 N of Valid Cases 136 a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. Tabela 73.- Fi i Kramer koeficijenti 97

98 Prilog 7 - Korelacije varijabli Spearmanov koeficijent korelacije Correlations meseci_na_3 veličina preduzeća broj zaposlenih Correlation Coefficient 1,000 -,085,065 meseci_na_3 Sig. (2-tailed).,328,453 Spearman's rho veličina preduzeća broj zaposlenih N Correlation Coefficient -,085 1,000,813 ** Sig. (2-tailed),328.,000 N Correlation Coefficient,065,813 ** 1,000 Sig. (2-tailed),453,000. N **. Correlation is significant at the 0.01 level (2-tailed). Tabela 74.- Korelacija broja meseci, veličine preduzeća i broja zaposlenih Correlations meseci_na_3 rekod preteţnog metoda prekid u kontinuit etu Correlation Coefficient 1,000,028 -,118 meseci_na_3 Sig. (2-tailed).,731,153 Kendall's tau_b rekod preteţnog metoda prekid u kontinuitetu N Correlation Coefficient,028 1,000,048 Sig. (2-tailed),731.,574 N Correlation Coefficient -,118,048 1,000 Sig. (2-tailed),153,574. N Tabela 75.- Korelacija broja meseci, metoda i prekida u kontinuitetu Ranks Mean Rank delatnost preduzeća 1,38 meseci_na_3 1,62 Tabela 76.- Sredine rangova 98

99 Test Statistics N 136 Kendall's W a,084 Chi-Square 11,378 df 1 Asymp. Sig.,001 a. Kendall's Coefficient of Concordance Tabela 77.- Kendalov koeficijent korelacije Ranks Mean Rank meseci_na_3 1,57 region 1,43 Tabela 78.- Sredina rangova Test Statistics N 136 Kendall's W a,025 Chi-Square 3,375 df 1 Asymp. Sig.,066 a. Kendall's Coefficient of Concordance Tabela 79.- Kendalov koeficijent korelacije Prilog 8. - Mann Whiteny broj meseci u uzorku Rekod preteţnog metoda Ranks rekod preteţnog metoda N Mean Rank Sum of Ranks Web 68 68, ,50 Telefon 68 68, ,50 Total 136 Tabela 80.- Rangovi u odnosu na metod sakupljanja podataka Test Statistics a broj meseci u uzorku Mann-Whitney U 2279,500 Wilcoxon W 4625,500 Z -,147 Asymp. Sig. (2-tailed),883 99

100 Test Statistics a a. Grouping Variable: rekod preteţnog metoda Tabela 81.- Mann Whitney i značajnost Prekid u kontinuitetu broj meseci u uzorku Ranks prekid u kontinuitetu N Mean Rank Sum of Ranks Ne , ,50 Da 14 46,54 651,50 Total 136 Tabela 82.- Sredine rangova u odnosu na prekid u kontinuitetu Test Statistics a broj meseci u uzorku Mann-Whitney U 546,500 Wilcoxon W 651,500 Z -2,290 Asymp. Sig. (2-tailed),022 a. Grouping Variable: prekid u kontinuitetu Tabela 83.- Mann Whitney U i značajnost prekid u kontinuitetu Report Median broj meseci u uzorku Ne 22,0000 Da 16,5000 Total 22,0000 Tabela 84.- Mediane prekida u kontinuitetu u odnosu na broj meseci 100

101 Prilog 9.- Kruskal Wallis Ranks region N Mean Rank Beograd 32 64,48 Vojvodina 53 71,48 broj meseci u uzorku Zapadna Srbija sa Šumadijom 40 69,49 Istočna i Juţna Srbija 11 62,23 Total 136 Tabela 85.- Sredine rangova u odnosu na region Test Statistics a,b broj meseci u uzorku Chi-Square 1,016 df 3 Asymp. Sig.,797 a. Kruskal Wallis Test b. Grouping Variable: region Tabela 86.- Značajnost Kruskal Wallis Ranks veličina preduzeća N Mean Rank Veliko 67 73,07 broj meseci u uzorku Srednje 35 63,30 Malo 34 64,84 Total 136 Tabela 87.- Sredine rangova u odnosu na veličinu preduzeća 101

102 Test Statistics a,b broj meseci u uzorku Chi-Square 1,953 df 2 Asymp. Sig.,377 a. Kruskal Wallis Test b. Grouping Variable: veličina preduzeća Tabela 88.- Značajnost Kruskal Wallis Ranks broj zaposlenih N Mean Rank 250 i više zaposlenih 50 69, zaposlenih 45 63,62 broj meseci u uzorku zaposlenih 36 73,18 10 i manje zaposlenih 5 73,60 Total 136 Tabela 89.- Sredine rangova u odnosu na broj zaposlenih Test Statistics a,b broj meseci u uzorku Chi-Square 1,394 df 3 Asymp. Sig.,707 a. Kruskal Wallis Test b. Grouping Variable: broj zaposlenih Tabela 90.- Značajnost Kruskal Wallis 102

103 Ranks delatnost preduzeća N Mean Rank Proizvodnja 43 64,59 broj meseci u uzorku Trgovina 44 65,90 Ostalo 49 74,27 Total 136 Tabela 91.- Sredine rangova u odnosu na delatnost preduzeća Test Statistics a,b broj meseci u uzorku Chi-Square 1,799 df 2 Asymp. Sig.,407 a. Kruskal Wallis Test b. Grouping Variable: delatnost preduzeća Tabela 92.- Značajnost hi kvadrata Tabela 93.- Rezultati Kruskal Wallis u odnosu broj meseci i region Tabela 94.- Rezultati Kruskal Wallis testa u odnosu na broj meseci i veličinu preduzeća 103

104 Tabela 95.- Rezultati Kruskal Wallis testa u odnosu na broj meseci i broj zaposlenih Tabela 96.- Rezultati Kruskal Wallis testa u odnosu na broj meseci i delatnost preduzeća Tabela 97.- Rezultati Mann Whitney U testa u odnosu na broj meseci i prekid u kontinuitetu Tabela 98.- Rezultati Mann Whitney U testa u odnosu na broj meseci i preteţni metod sakupljanja podataka 104

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije Biznis scenario: U školi postoje četiri sekcije sportska, dramska, likovna i novinarska. Svaka sekcija ima nekoliko aktuelnih projekata. Likovna ima četiri projekta. Za projekte Pikaso, Rubens i Rembrant

More information

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan.

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan. SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan. 1) Kod pravilnih glagola, prosto prošlo vreme se gradi tako

More information

Uvod u relacione baze podataka

Uvod u relacione baze podataka Uvod u relacione baze podataka 25. novembar 2011. godine 7. čas SQL skalarne funkcije, operatori ANY (SOME) i ALL 1. Za svakog studenta izdvojiti ime i prezime i broj različitih ispita koje je pao (ako

More information

Podešavanje za eduroam ios

Podešavanje za eduroam ios Copyright by AMRES Ovo uputstvo se odnosi na Apple mobilne uređaje: ipad, iphone, ipod Touch. Konfiguracija podrazumeva podešavanja koja se vrše na računaru i podešavanja na mobilnom uređaju. Podešavanja

More information

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd,

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd, AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje Marko Eremija Sastanak administratora, Beograd, 12.12.2013. Sadržaj eduroam - uvod AMRES eduroam statistika Novine u okviru eduroam

More information

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri.

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri. Potprogrami su delovi programa. Često se delovi koda ponavljaju u okviru nekog programa. Logično je da se ta grupa komandi izdvoji u potprogram, i da se po želji poziva u okviru programa tamo gde je potrebno.

More information

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević GUI Layout Manager-i Bojan Tomić Branislav Vidojević Layout Manager-i ContentPane Centralni deo prozora Na njega se dodaju ostale komponente (dugmići, polja za unos...) To je objekat klase javax.swing.jpanel

More information

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB.

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB. 9.72 8.24 6.75 6.55 6.13 po 9.30 7.89 5.86 10.48 8.89 7.30 7.06 6.61 11.51 9.75 8.00 7.75 7.25 po 0.38 10.21 8.66 7.11 6.89 6.44 11.40 9.66 9.73 7.69 7.19 12.43 1 8.38 7.83 po 0.55 0.48 0.37 11.76 9.98

More information

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings Eduroam O Eduroam servisu Eduroam - educational roaming je besplatan servis za pristup Internetu. Svojim korisnicima omogućava bezbedan, brz i jednostavan pristup Internetu širom sveta, bez potrebe za

More information

DEFINISANJE TURISTIČKE TRAŽNJE

DEFINISANJE TURISTIČKE TRAŽNJE DEFINISANJE TURISTIČKE TRAŽNJE Tražnja se može definisati kao spremnost kupaca da pri različitom nivou cena kupuju različite količine jedne robe na određenom tržištu i u određenom vremenu (Veselinović

More information

STRUČNA PRAKSA B-PRO TEMA 13

STRUČNA PRAKSA B-PRO TEMA 13 MAŠINSKI FAKULTET U BEOGRADU Katedra za proizvodno mašinstvo STRUČNA PRAKSA B-PRO TEMA 13 MONTAŽA I SISTEM KVALITETA MONTAŽA Kratak opis montže i ispitivanja gotovog proizvoda. Dati izgled i sadržaj tehnološkog

More information

Port Community System

Port Community System Port Community System Konferencija o jedinstvenom pomorskom sučelju i digitalizaciji u pomorskom prometu 17. Siječanj 2018. godine, Zagreb Darko Plećaš Voditelj Odsjeka IS-a 1 Sadržaj Razvoj lokalnog PCS

More information

SAS On Demand. Video: Upute za registraciju:

SAS On Demand. Video:  Upute za registraciju: SAS On Demand Video: http://www.sas.com/apps/webnet/video-sharing.html?bcid=3794695462001 Upute za registraciju: 1. Registracija na stranici: https://odamid.oda.sas.com/sasodaregistration/index.html U

More information

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine UNIVERZITETUBEOGRADU RUDARSKOGEOLOŠKIFAKULTET DEPARTMANZAHIDROGEOLOGIJU ZBORNIKRADOVA ZLATIBOR 1720.maj2012.godine XIVSRPSKISIMPOZIJUMOHIDROGEOLOGIJI ZBORNIKRADOVA IZDAVA: ZAIZDAVAA: TEHNIKIUREDNICI: TIRAŽ:

More information

BENCHMARKING HOSTELA

BENCHMARKING HOSTELA BENCHMARKING HOSTELA IZVJEŠTAJ ZA SVIBANJ. BENCHMARKING HOSTELA 1. DEFINIRANJE UZORKA Tablica 1. Struktura uzorka 1 BROJ HOSTELA BROJ KREVETA Ukupno 1016 643 1971 Regije Istra 2 227 Kvarner 4 5 245 991

More information

Klasterizacija. NIKOLA MILIKIĆ URL:

Klasterizacija. NIKOLA MILIKIĆ   URL: Klasterizacija NIKOLA MILIKIĆ EMAIL: nikola.milikic@fon.bg.ac.rs URL: http://nikola.milikic.info Klasterizacija Klasterizacija (eng. Clustering) spada u grupu tehnika nenadgledanog učenja i omogućava grupisanje

More information

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA KOŽA I TEKSTIL ALU FELGE CJENIK APLIKACIJE CERAMIC PRO PROIZVODA Radovi prije aplikacije: Prije nanošenja Ceramic Pro premaza površina vozila na koju se nanosi mora bi dovedena u korektno stanje. Proces

More information

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI Za pomoć oko izdavanja sertifikata na Windows 10 operativnom sistemu možete se obratiti na e-mejl adresu esupport@eurobank.rs ili pozivom na telefonski broj

More information

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ DIZAJN TRENINGA Model trening procesa FAZA DIZAJNA CILJEVI TRENINGA Vrste ciljeva treninga 1. Ciljevi učesnika u treningu 2. Ciljevi učenja Opisuju željene

More information

Otpremanje video snimka na YouTube

Otpremanje video snimka na YouTube Otpremanje video snimka na YouTube Korak br. 1 priprema snimka za otpremanje Da biste mogli da otpremite video snimak na YouTube, potrebno je da imate kreiran nalog na gmailu i da video snimak bude u nekom

More information

Bušilice nove generacije. ImpactDrill

Bušilice nove generacije. ImpactDrill NOVITET Bušilice nove generacije ImpactDrill Nove udarne bušilice od Bosch-a EasyImpact 550 EasyImpact 570 UniversalImpact 700 UniversalImpact 800 AdvancedImpact 900 Dostupna od 01.05.2017 2 Logika iza

More information

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA Master akademske studije Modul za logistiku 1 (MLO1) POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA angažovani su: 1. Prof. dr Momčilo Miljuš, dipl.inž., kab 303, mmiljus@sf.bg.ac.rs,

More information

Primenjena logistička regresija

Primenjena logistička regresija UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU I INFORMATIKU Primenjena logistička regresija -master rad- Novi Sad, 2011. Sadržaj Predgovor... 3 1 Poreklo logističke funkcije...

More information

Struktura indeksa: B-stablo. ls/swd/btree/btree.html

Struktura indeksa: B-stablo.   ls/swd/btree/btree.html Struktura indeksa: B-stablo http://cis.stvincent.edu/html/tutoria ls/swd/btree/btree.html Uvod ISAM (Index-Sequential Access Method, IBM sredina 60-tih godina 20. veka) Nedostaci: sekvencijalno pretraživanje

More information

Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE)

Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE) Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE) SISTEMI ZA PODRŠKU ODLUČIVANJU dr Vladislav Miškovic vmiskovic@singidunum.ac.rs Fakultet za računarstvo i informatiku 2013/2014 Tema 2: Uvod u sisteme

More information

PROJEKTNI PRORAČUN 1

PROJEKTNI PRORAČUN 1 PROJEKTNI PRORAČUN 1 Programski period 2014. 2020. Kategorije troškova Pojednostavlj ene opcije troškova (flat rate, lump sum) Radni paketi Pripremni troškovi, troškovi zatvaranja projekta Stope financiranja

More information

Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu

Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu Drago Pupavac Polytehnic of Rijeka Rijeka e-mail: drago.pupavac@veleri.hr Veljko

More information

Mogudnosti za prilagođavanje

Mogudnosti za prilagođavanje Mogudnosti za prilagođavanje Shaun Martin World Wildlife Fund, Inc. 2012 All rights reserved. Mogudnosti za prilagođavanje Za koje ste primere aktivnosti prilagođavanja čuli, pročitali, ili iskusili? Mogudnosti

More information

IDENTIFYING THE FACTORS OF TOURISM COMPETITIVENESS LEVEL IN THE SOUTHEASTERN EUROPEAN COUNTRIES UDC : (4-12)

IDENTIFYING THE FACTORS OF TOURISM COMPETITIVENESS LEVEL IN THE SOUTHEASTERN EUROPEAN COUNTRIES UDC : (4-12) FACTA UNIVERSITATIS Series: Economics and Organization Vol. 10, N o 2, 2013, pp. 117-127 Review paper IDENTIFYING THE FACTORS OF TOURISM COMPETITIVENESS LEVEL IN THE SOUTHEASTERN EUROPEAN COUNTRIES UDC

More information

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE CJENOVNIK KABLOVSKA TV Za zasnivanje pretplatničkog odnosa za korištenje usluga kablovske televizije potrebno je da je tehnički izvodljivo (mogude) priključenje na mrežu Kablovskih televizija HS i HKBnet

More information

SEGMENTIRANA REGRESIJA SA PRIMENOM

SEGMENTIRANA REGRESIJA SA PRIMENOM UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU I INFORMATIKU Suzana Vidić SEGMENTIRANA REGRESIJA SA PRIMENOM - master rad - Mentor: prof. dr Zorana Luţanin Novi Sad, 2014.

More information

Nejednakosti s faktorijelima

Nejednakosti s faktorijelima Osječki matematički list 7007, 8 87 8 Nejedakosti s faktorijelima Ilija Ilišević Sažetak Opisae su tehike kako se mogu dokazati ejedakosti koje sadrže faktorijele Spomeute tehike su ilustrirae a izu zaimljivih

More information

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT TRAJANJE AKCIJE 16.01.2019-28.02.2019 ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT Akcija sa poklonima Digitally signed by pki, pki, BOSCH, EMEA, BOSCH, EMEA, R, A, radivoje.stevanovic R, A, 2019.01.15 11:41:02

More information

Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora regionalne konkurentnosti: Primer Republike Srbije (2013)

Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora regionalne konkurentnosti: Primer Republike Srbije (2013) Gledišta 167 Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora lne konkurentnosti: Primer Republike Srbije (2013) doi: 10.5937/ekonhor1402167V Nakon upućenih kritika na rad Korelaciona

More information

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION VFR AIP Srbija / Crna Gora ENR 1.4 1 ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION 1. KLASIFIKACIJA VAZDUŠNOG PROSTORA

More information

Priprema podataka. NIKOLA MILIKIĆ URL:

Priprema podataka. NIKOLA MILIKIĆ   URL: Priprema podataka NIKOLA MILIKIĆ EMAIL: nikola.milikic@fon.bg.ac.rs URL: http://nikola.milikic.info Normalizacija Normalizacija je svođenje vrednosti na neki opseg (obično 0-1) FishersIrisDataset.arff

More information

WWF. Jahorina

WWF. Jahorina WWF For an introduction Jahorina 23.2.2009 What WWF is World Wide Fund for Nature (formerly World Wildlife Fund) In the US still World Wildlife Fund The World s leading independent conservation organisation

More information

ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA

ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA Nihad HARBAŠ Samra PRAŠOVIĆ Azrudin HUSIKA Sadržaj ENERGIJSKI BILANSI DIMENZIONISANJE POSTROJENJA (ORC + VRŠNI KOTLOVI)

More information

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020.

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020. Idejno rješenje: Dubrovnik 2020. Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020. vizualni identitet kandidature dubrovnika za europsku prijestolnicu kulture 2020. visual

More information

Age-gender structure of. on Yugoslav population in Vojvodina Province. The number of Yugoslav population

Age-gender structure of. on Yugoslav population in Vojvodina Province. The number of Yugoslav population Tamara Kovačević, Milka Bubalo Živković, Anđelija Ivkov Age-gender structure of Yugoslav population Tamara Kovačević, Milka Bubalo Živković, Anđelija Ivkov1 Abstract Analysis and comparison of the overall

More information

STABLA ODLUČIVANJA. Jelena Jovanovic. Web:

STABLA ODLUČIVANJA. Jelena Jovanovic.   Web: STABLA ODLUČIVANJA Jelena Jovanovic Email: jeljov@gmail.com Web: http://jelenajovanovic.net 2 Zahvalnica: Ovi slajdovi su bazirani na materijalima pripremljenim za kurs Applied Modern Statistical Learning

More information

CILJ UEFA PRO EDUKACIJE

CILJ UEFA PRO EDUKACIJE CILJ UEFA PRO EDUKACIJE Ciljevi programa UEFA PRO M s - Omogućiti trenerima potrebnu edukaciju, kako bi mogli uspešno raditi na PRO nivou. - Utvrdjenim programskim sadržajem, omogućiti im kredibilitet.

More information

INSTALIRANJE SOFTVERSKOG SISTEMA SURVEY

INSTALIRANJE SOFTVERSKOG SISTEMA SURVEY INSTALIRANJE SOFTVERSKOG SISTEMA SURVEY Softverski sistem Survey za geodeziju, digitalnu topografiju i projektovanje u niskogradnji instalira se na sledeći način: 1. Instalirati grafičko okruženje pod

More information

RANI BOOKING TURSKA LJETO 2017

RANI BOOKING TURSKA LJETO 2017 PUTNIČKA AGENCIJA FIBULA AIR TRAVEL AGENCY D.O.O. UL. FERHADIJA 24; 71000 SARAJEVO; BIH TEL:033/232523; 033/570700; E-MAIL: INFO@FIBULA.BA; FIBULA@BIH.NET.BA; WEB: WWW.FIBULA.BA SUDSKI REGISTAR: UF/I-1769/02,

More information

H Marie Skłodowska-Curie Actions (MSCA)

H Marie Skłodowska-Curie Actions (MSCA) H2020 Key facts and figures (2014-2020) Number of RS researchers funded by MSCA: EU budget awarded to RS organisations (EUR million): Number of RS organisations in MSCA: 143 4.24 35 In detail, the number

More information

PROBLEM MULTIKOLINEARNOSTI U VIŠESTRUKOJ LINEARNOJ REGRESIJI

PROBLEM MULTIKOLINEARNOSTI U VIŠESTRUKOJ LINEARNOJ REGRESIJI 45 2 UDC: 519.852 MULTIKOLI Novaković Tihomir, Nikolić-Đorić Emilija, Mutavdžić Beba 1 U ovom radu razmatran je problem multikolinearnosti karakterističan za višestruku linearnu regresiju. Multikolinearnost

More information

3D GRAFIKA I ANIMACIJA

3D GRAFIKA I ANIMACIJA 1 3D GRAFIKA I ANIMACIJA Uvod u Flash CS3 Šta će se raditi? 2 Upoznavanje interfejsa Osnovne osobine Definisanje osnovnih entiteta Rad sa bojama Rad sa linijama Definisanje i podešavanje ispuna Pregled

More information

1.7 Predstavljanje negativnih brojeva u binarnom sistemu

1.7 Predstavljanje negativnih brojeva u binarnom sistemu .7 Predstavljanje negativnih brojeva u binarnom sistemu U decimalnom brojnom sistemu pozitivni brojevi se predstavljaju znakom + napisanim ispred cifara koje definišu apsolutnu vrednost broja, odnosno

More information

NIS PETROL. Uputstvo za deaktiviranje/aktiviranje stranice Veleprodajnog cenovnika na sajtu NIS Petrol-a

NIS PETROL. Uputstvo za deaktiviranje/aktiviranje stranice Veleprodajnog cenovnika na sajtu NIS Petrol-a NIS PETROL Uputstvo za deaktiviranje/aktiviranje stranice Veleprodajnog cenovnika na sajtu NIS Petrol-a Beograd, 2018. Copyright Belit Sadržaj Disable... 2 Komentar na PHP kod... 4 Prava pristupa... 6

More information

1. Multivarijaciona statistička analiza 1

1. Multivarijaciona statistička analiza 1 1. Multivarijaciona statistička analiza 1 Faktorska analiza Faktorska analiza predstavlja jednu od najpopularnijih multivarijacionih tehnika koja ima dva cilja: 1. Identifikacija i razumevanje osnovne

More information

ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP

ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP M. Mitreski, A. Korubin-Aleksoska, J. Trajkoski, R. Mavroski ABSTRACT In general every agricultural

More information

STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI

STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI Bosna i Hercegovina Agencija za statistiku Bosne i Hercegovine Bosnia and Herzegovina Agency for Statistics of Bosnia and Herzegovina STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI Jahorina, 05.07.2011

More information

Upotreba logističke regresije u modeliranju verovatnoće bankrota preduzeća

Upotreba logističke regresije u modeliranju verovatnoće bankrota preduzeća UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU I INFORMATIKU Marija Pešić Upotreba logističke regresije u modeliranju verovatnoće bankrota preduzeća -MASTER RAD- Mentor:

More information

MODELIRANJE RIZIKA U LOGISTIČKIM PROCESIMA SA PRIMENOM U TRANSPORTNOM OSIGURANJU

MODELIRANJE RIZIKA U LOGISTIČKIM PROCESIMA SA PRIMENOM U TRANSPORTNOM OSIGURANJU UNIVERZITET U BEOGRADU SAOBRAĆAJNI FAKULTET Vladimir M. Gajović MODELIRANJE RIZIKA U LOGISTIČKIM PROCESIMA SA PRIMENOM U TRANSPORTNOM OSIGURANJU DOKTORSKA DISERTACIJA Beograd, 2015 UNIVERSITY OF BELGRADE

More information

Tutorijal za Štefice za upload slika na forum.

Tutorijal za Štefice za upload slika na forum. Tutorijal za Štefice za upload slika na forum. Postoje dvije jednostavne metode za upload slika na forum. Prva metoda: Otvoriti nova tema ili odgovori ili citiraj već prema želji. U donjem dijelu obrasca

More information

THE PERFORMANCE OF THE SERBIAN HOTEL INDUSTRY

THE PERFORMANCE OF THE SERBIAN HOTEL INDUSTRY SINGIDUNUM JOURNAL 2013, 10 (2): 24-31 ISSN 2217-8090 UDK 005.51/.52:640.412 DOI: 10.5937/sjas10-4481 Review paper/pregledni naučni rad THE PERFORMANCE OF THE SERBIAN HOTEL INDUSTRY Saša I. Mašić 1,* 1

More information

41 ГОДИНА ГРАЂЕВИНСКОГ ФАКУЛТЕТА СУБОТИЦА

41 ГОДИНА ГРАЂЕВИНСКОГ ФАКУЛТЕТА СУБОТИЦА ANALYSIS OF TREND IN ANNUAL PRECIPITATION ON THE TERRITORY OF SERBIA Mladen Milanovic 1 Milan Gocic Slavisa Trajkovic 3 УДК: 551.578.1(497.11) 1946/01 DOI:10.14415/konferencijaGFS 015.066 Summary: In this

More information

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA:

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA: Past simple uporabljamo, ko želimo opisati dogodke, ki so se zgodili v preteklosti. Dogodki so se zaključili v preteklosti in nič več ne trajajo. Dogodki so se zgodili enkrat in se ne ponavljajo, čas dogodkov

More information

Automatske Maske za zavarivanje. Stella, black carbon. chain and skull. clown. blue carbon

Automatske Maske za zavarivanje. Stella, black carbon. chain and skull. clown. blue carbon Automatske Maske za zavarivanje Stella Podešavanje DIN: 9-13 Brzina senzora: 1/30.000s Vidno polje : 98x55mm Četiri optička senzora Napajanje : Solarne ćelije + dve litijumske neizmenjive baterije. Vek

More information

Struktura i organizacija baza podataka

Struktura i organizacija baza podataka Fakultet tehničkih nauka, DRA, Novi Sad Predmet: Struktura i organizacija baza podataka Dr Slavica Aleksić, Milanka Bjelica, Nikola Obrenović Primer radnik({mbr, Ime, Prz, Sef, Plt, God, Pre}, {Mbr}),

More information

Analiza uticaja liderstva u EFQM modelu

Analiza uticaja liderstva u EFQM modelu Analiza uticaja liderstva u EFQM modelu TIJANA G. CVETIĆ, Univerzitet u Kragujevcu, Stručni rad Fakultet inženjerskih nauka, Kragujevac UDC: 005.21 OLIVER M. MOMČILOVIĆ, Visoka škola strukovnih studija,

More information

DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO DOO PODGORICA

DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO DOO PODGORICA CRNA GORA (1}(02.17&r/4 Ver. O;:, fjr}/ ~ AGENCUA ZA ELEKTRONSKE KOM~~IKACUE J.O.O "\\ L\lax Montenegro" BrOJ o/-lj Podoor'ca.d:ioL 20/1g0d I POSTANSKU DEJATELNOST DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO

More information

POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU

POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU (Usaglašeno sa procedurom S.3.04 sistema kvaliteta Megatrend univerziteta u Beogradu) Uvodne napomene

More information

PERSONAL INFORMATION. Name: Fields of interest: Teaching courses:

PERSONAL INFORMATION. Name:   Fields of interest: Teaching courses: PERSONAL INFORMATION Name: E-mail: Fields of interest: Teaching courses: Almira Arnaut Berilo almira.arnaut@efsa.unsa.ba Quantitative Methods in Economy Quantitative Methods in Economy and Management Operations

More information

Poasonova regresija i primene

Poasonova regresija i primene UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATIČKI FAKULTET DEPARTMAN ZA MATEMATIKU I INFORMATIKU Poasonova regresija i primene - Master rad - Mentor: Kandidat: Prof. dr. Zagorka Sanja Bojović Lozanov-Crvenković

More information

Primena karakteristika jednakog kvaliteta kašnjenjeeho-gubitak paketa u projektovanju Internetskih govornih veza

Primena karakteristika jednakog kvaliteta kašnjenjeeho-gubitak paketa u projektovanju Internetskih govornih veza INFOTEH-JAHORINA Vol. 15, March 2016. Primena karakteristika jednakog kvaliteta kašnjenjeeho-gubitak paketa u projektovanju Internetskih govornih veza Aleksandar Lebl, Dragan Mitić, Predrag Petrović, Vladimir

More information

IZVEDBENI NASTAVNI PLAN

IZVEDBENI NASTAVNI PLAN Fakultet zdravstvenih studija Sveučilišta u Rijeci Kolegij: Napredna statistika u biomedicini i zdravstvu Voditelj: Prof. dr. sc. Gordana Brumini i Dr. sc. Andrica Lekić, Katedra: Katedra za temeljne medicinske

More information

Ekonomija. teorija i praksa. Economics. Theory and Practice. FAKULTET ZA EKONOMIJU I INŽENJERSKI MENADŽMENT u novom sadu UDK: 33 ISSN

Ekonomija. teorija i praksa. Economics. Theory and Practice. FAKULTET ZA EKONOMIJU I INŽENJERSKI MENADŽMENT u novom sadu UDK: 33 ISSN UDK: 33 ISSN 2217 5458 FAKULTET ZA EKONOMIJU I INŽENJERSKI MENADŽMENT u novom sadu Ekonomija teorija i praksa Economics Theory and Practice GODINA VI BROJ IV NOVI SAD, 2013. Economics Theory and Practice

More information

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze Trening: Obzor 2020. - financijsko izvještavanje i osnovne ugovorne obveze Ana Ključarić, Obzor 2020. nacionalna osoba za kontakt za financijska pitanja PROGRAM DOGAĐANJA (9:30-15:00) 9:30 10:00 Registracija

More information

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU KONFIGURACIJA MODEMA ZyXEL Prestige 660RU Sadržaj Funkcionalnost lampica... 3 Priključci na stražnjoj strani modema... 4 Proces konfiguracije... 5 Vraćanje modema na tvorničke postavke... 5 Konfiguracija

More information

Pojam i razvoj statistike. Statistika trostruki sadržaj. Skup se određuje: Vrste obilježja. Predmet i način statističkog istraživanja

Pojam i razvoj statistike. Statistika trostruki sadržaj. Skup se određuje: Vrste obilježja. Predmet i način statističkog istraživanja Pojam i razvoj statistike Skup numeričkih podataka (status stanje) Prvi začeci statistike datiraju nekoliko vjekova prije nove ere (Kina 4 g.p.n.e) Razvoj statistike razvoj informatičkog društva Statistika

More information

Serbian Mesopotamia in the South of the Great Hungarian (Pannonian) Plain. Tisza Tisa. Danube Dunav Duna V O J V O D I N A. Sava

Serbian Mesopotamia in the South of the Great Hungarian (Pannonian) Plain. Tisza Tisa. Danube Dunav Duna V O J V O D I N A. Sava The Effect of Migration on the Ethnic Structure of Population in Vojvodina Uticaj migracije na etničku strukturu stanovništva u Vojvodini A vándorlások hatása a népesség etnikai összetételére a Vajdaságban

More information

1. Instalacija programske podrške

1. Instalacija programske podrške U ovom dokumentu opisana je instalacija PBZ USB PKI uređaja na računala korisnika PBZCOM@NET internetskog bankarstva. Uputa je podijeljena na sljedeće cjeline: 1. Instalacija programske podrške 2. Promjena

More information

2. poglavlje - IDENTIFIKACIJA POTROŠAČA - od 62 do 80 strane (19 strana)

2. poglavlje - IDENTIFIKACIJA POTROŠAČA - od 62 do 80 strane (19 strana) Analizirana poglavlja Šapićeve disertacije Broj redova u radu Izvor preuzimanja Broj preuzetih redova 2. poglavlje - IDENTIFIKACIJA POTROŠAČA - od 62 do 80 strane (19 strana) 1. 62 strana 31 2. 63 strana

More information

MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE

MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE 3309 Pursuant to Article 1021 paragraph 3 subparagraph 5 of the Maritime Code ("Official Gazette" No. 181/04 and 76/07) the Minister of the Sea, Transport

More information

DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta. Hotel ODISEJ, POMENA, otok Mljet, listopad 2010.

DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta. Hotel ODISEJ, POMENA, otok Mljet, listopad 2010. DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta Hotel ODISEJ, POMENA, otok Mljet, 03. - 07. listopad 2010. ZBORNIK SAŽETAKA Geološki lokalitet i poucne staze u Nacionalnom parku

More information

Third International Scientific Symposium "Agrosym Jahorina 2012"

Third International Scientific Symposium Agrosym Jahorina 2012 10.7251/AGSY1203656N UDK 635.1/.8 (497.6 Republika Srpska) TENDENCY OF VEGETABLES DEVELOPMENT IN REPUBLIC OF SRPSKA Nebojsa NOVKOVIC 1*, Beba MUTAVDZIC 2, Ljiljana DRINIC 3, Aleksandar ОSTOJIC 3, Gordana

More information

Bear management in Croatia

Bear management in Croatia Bear management in Croatia Djuro Huber Josip Kusak Aleksandra Majić-Skrbinšek Improving coexistence of large carnivores and agriculture in S. Europe Gorski kotar Slavonija Lika Dalmatia Land & islands

More information

KVANTIFIKOVANJE VEROVATNOĆE DIFOLTA PREDUZEĆA U SRBIJI I RAZVOJ INTERNOG KREDITNOG REJTINGA ZA POTREBE BANKE

KVANTIFIKOVANJE VEROVATNOĆE DIFOLTA PREDUZEĆA U SRBIJI I RAZVOJ INTERNOG KREDITNOG REJTINGA ZA POTREBE BANKE UNIVERZITET U BEOGRADU FAKULTET ORGANIZACIONIH NAUKA mr Nebojša N. Nikolić KVANTIFIKOVANJE VEROVATNOĆE DIFOLTA PREDUZEĆA U SRBIJI I RAZVOJ INTERNOG KREDITNOG REJTINGA ZA POTREBE BANKE Doktorska disertacija

More information

ISTRAŢIVANJE MARKETINGA

ISTRAŢIVANJE MARKETINGA 1 Boris Tihi i Biljana Rađenović ISTRAŢIVANJE MARKETINGA Prvo izdanje Banjaluka, 2008. godina 2 3 SADRŢAJ Predgovor... 10 I DIO - ULOGA I ZNAČAJ ISTRAŢIVANJA MARKETINGA U PRIVREDNIM SUBJEKTIMA 1. Glava

More information

Advertising on the Web

Advertising on the Web Advertising on the Web On-line algoritmi Off-line algoritam: ulazni podaci su dostupni na početku, algoritam može pristupati podacima u bilo kom redosljedu, na kraju se saopštava rezultat obrade On-line

More information

Univerzitet u Novom Sadu. Fakultet tehničkih nauka. Odsek za računarsku tehniku i računarske komunikacije. Uvod u GIT

Univerzitet u Novom Sadu. Fakultet tehničkih nauka. Odsek za računarsku tehniku i računarske komunikacije. Uvod u GIT Univerzitet u Novom Sadu Fakultet tehničkih nauka Odsek za računarsku tehniku i računarske komunikacije Uvod u GIT Šta je git? Sistem za verzionisanje softvera kao i CVS, SVN, Perforce ili ClearCase Orginalno

More information

WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET!

WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET! WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET! WELLNESS & SPA DNEVNA KARTA DAILY TICKET 35 BAM / 3h / person RADNO VRIJEME OPENING HOURS 08:00-21:00 Besplatno za djecu do 6 godina

More information

Dr Dejan Bogićević, dipl. inž. saob., VTŠSS Niš Dušan Radosavljević, dipl. inž. saob., VTŠSS Niš; Nebojša Čergić, dipl. inž. saob.

Dr Dejan Bogićević, dipl. inž. saob., VTŠSS Niš Dušan Radosavljević, dipl. inž. saob., VTŠSS Niš; Nebojša Čergić, dipl. inž. saob. Dr Dejan Bogićević, dipl. inž. saob., VTŠSS Niš Dušan Radosavljević, dipl. inž. saob., VTŠSS Niš; Nebojša Čergić, dipl. inž. saob., Policijska uprava, Sremska Mitrovica PRAKTIČNA PRIMENA REZULTATA CRASH

More information

CRNA GORA

CRNA GORA HOTEL PARK 4* POLOŽAJ: uz more u Boki kotorskoj, 12 km od Herceg-Novog. SADRŽAJI: 252 sobe, recepcija, bar, restoran, besplatno parkiralište, unutarnji i vanjski bazen s terasom za sunčanje, fitnes i SPA

More information

1. MODEL (Ulaz / Zadržavanje / Stanje)

1. MODEL (Ulaz / Zadržavanje / Stanje) 1. MODEL (Ulaz / Zadržavanje / Stanje) Potrebno je kreirati model koji će preslikavati sledeći realan sistem: Svaki dan dolazi određen broj paleta u skladište Broj paleta na nivou dana se može opisati

More information

Windows Easy Transfer

Windows Easy Transfer čet, 2014-04-17 12:21 - Goran Šljivić U članku o skorom isteku Windows XP podrške [1] koja prestaje 8. travnja 2014. spomenuli smo PCmover Express i PCmover Professional kao rješenja za preseljenje korisničkih

More information

Permanent Expert Group for Navigation

Permanent Expert Group for Navigation ISRBC E Permanent Expert Group for Navigation Doc Nr: 2-16-2/12-2-PEG NAV October 19, 2016 Original: ENGLISH INTERNATIONAL SAVA RIVER BASIN COMMISSION PERMANENT EXPERT GROUP FOR NAVIGATION REPORT OF THE

More information

Upotreba selektora. June 04

Upotreba selektora. June 04 Upotreba selektora programa KRONOS 1 Kronos sistem - razina 1 Podešavanje vremena LAMPEGGIANTI 1. Kada je pećnica uključena prvi put, ili u slučaju kvara ili prekida u napajanju, simbol SATA i odgovarajuća

More information

Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi

Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi Ana Čobrenović, MPC Holding doc. dr Mladen Đurić, Fakultet organizacionih nauka 1 Uvod i definicije Rizik Organizacije se konstantno

More information

TEHNO SISTEM d.o.o. PRODUCT CATALOGUE KATALOG PROIZVODA TOPLOSKUPLJAJUĆI KABLOVSKI PRIBOR HEAT-SHRINKABLE CABLE ACCESSORIES

TEHNO SISTEM d.o.o. PRODUCT CATALOGUE KATALOG PROIZVODA TOPLOSKUPLJAJUĆI KABLOVSKI PRIBOR HEAT-SHRINKABLE CABLE ACCESSORIES TOPOSKUPJAJUĆI KABOVSKI PRIBOR HEAT-SHRINKABE CABE ACCESSORIES KATAOG PROIZVODA PRODUCT CATAOGUE 8 TEHNO SISTEM d.o.o. NISKONAPONSKI TOPOSKUPJAJUĆI KABOVSKI PRIBOR TOPOSKUPJAJUĆE KABOVSKE SPOJNICE kv OW

More information

IZRADA TEHNIČKE DOKUMENTACIJE

IZRADA TEHNIČKE DOKUMENTACIJE 1 Zaglavlje (JUS M.A0.040) Šta je zaglavlje? - Posebno uokvireni deo koji služi za upisivanje podataka potrebnih za označavanje, razvrstavanje i upotrebu crteža Mesto zaglavlja: donji desni ugao raspoložive

More information

Članci/Papers. Prednosti i nedostaci onlajn-istraživanja. Marina Petrović UVOD

Članci/Papers. Prednosti i nedostaci onlajn-istraživanja. Marina Petrović UVOD UDK 658.8:004.738.5, Pregledni rad Članci/Papers Prednosti i nedostaci onlajn-istraživanja Marina Petrović Apstrakt: Najnoviji metodološki pristup marketinškom istraživanju koji još uvek nije dovoljno

More information

Prvi koraci u razvoju bankarskog on-line sistema u Japanu napravljeni su sredinom 60-tih godina prošlog veka i to najpre za on-line, real-time obradu

Prvi koraci u razvoju bankarskog on-line sistema u Japanu napravljeni su sredinom 60-tih godina prošlog veka i to najpre za on-line, real-time obradu JAPAN Japan, kao zemlja napredne tehnologije, elektronike i telekomunikacija, je zemlja koja je u samom svetskom vrhu po razvoju i usavršavanju bankarskog poslovanja i spada među vodećim zemljama sveta

More information

PREFERENCES FOR NIGERIAN DOMESTIC PASSENGER AIRLINE INDUSTRY: A CONJOINT ANALYSIS

PREFERENCES FOR NIGERIAN DOMESTIC PASSENGER AIRLINE INDUSTRY: A CONJOINT ANALYSIS PREFERENCES FOR NIGERIAN DOMESTIC PASSENGER AIRLINE INDUSTRY: A CONJOINT ANALYSIS Ayantoyinbo, Benedict Boye Faculty of Management Sciences, Department of Transport Management Ladoke Akintola University

More information

CAME-LISTA USKLAĐENOSTI SA PART M CAME-PART M COMPLIANCE LIST

CAME-LISTA USKLAĐENOSTI SA PART M CAME-PART M COMPLIANCE LIST Hrvatska agencija za civilno zrakoplovstvo / Croatian Civil Aviation Agency Ulica grada Vukovara 284, 10 000 Zagreb Tel.: +385 1 2369 300 ; Fax.: +385 1 2369 301 e-mail: ccaa@ccaa.hr CAME-LISTA USKLAĐENOSTI

More information

ЗАВРШНИ (BACHELOR) РАД

ЗАВРШНИ (BACHELOR) РАД УНИВЕРЗИТЕТ У НОВОМ САДУ ФАКУЛТЕТ ТЕХНИЧКИХ НАУКА УНИВЕРЗИТЕТ У НОВОМ САДУ ФАКУЛТЕТ ТЕХНИЧКИХ НАУКА НОВИ САД Департман за рачунарство и аутоматику Одсек за рачунарску технику и рачунарске комуникације

More information

Pojava haosa u jednacini energetskog bilansa na dodirnoj povrsini Zemlje i atmosfere

Pojava haosa u jednacini energetskog bilansa na dodirnoj povrsini Zemlje i atmosfere UNIVERZITET U NOVOM SADU PRIRODNO-MATEMATICKI FAKULTET DEPARTMAN ZA FIZIKU Pojava haosa u jednacini energetskog bilansa na dodirnoj povrsini Zemlje i atmosfere - diplomski rad - Mentor: dr Darko Kapor

More information

3. Strukturna sistemska analiza... 2 3.1. Uvod... 2 3.1.1. Sadržaj... 2 3.1.2. Ciljevi... 3 3.2. Analiza sistema... 3 3.2.1. Sistem... 3 3.2.2. Analiza sistema... 4 3.2.3. Modelovanje sistema... 6 3.2.3.1.

More information

11 Analiza i dizajn informacionih sistema

11 Analiza i dizajn informacionih sistema 11 Analiza i dizajn informacionih sistema Informatika V.Prof.dr Kemal Hajdarević dipl.ing.el 25.4.2014 11:58:28 1 1. Kompjuter, Internet, i mrežne osnove 2. Kompjuterska industrija Informatika u stomatologiji

More information