VISOKA ŠKOLA ZA EKONOMIJU I INFORMATIKU PRIJEDOR. Akademska 2013/14 godina. POSLOVNA STATISTIKA. Prof. dr Rade Tanjga Mr Mitja Tanjga

Size: px
Start display at page:

Download "VISOKA ŠKOLA ZA EKONOMIJU I INFORMATIKU PRIJEDOR. Akademska 2013/14 godina. POSLOVNA STATISTIKA. Prof. dr Rade Tanjga Mr Mitja Tanjga"

Transcription

1 VISOKA ŠKOLA ZA EKONOMIJU I INFORMATIKU PRIJEDOR Akademska 013/14 godina. POSLOVNA STATISTIKA Prof. dr Rade Tanjga Mr Mitja Tanjga Banja Luka 013.

2 Izdavač ISA - Informatički savez Republike Srpske Za izdavača Prof. dr Rade Tanjga, predsjednik Tehnički urednik Mitja Tanjga Naslovna strana Dragan Drobac Copyright 013. ISA, Banja Luka Nijedan dio ove knjige ne smije se umnožiti, fotokopirati niti reprodukovati na bilo koji način bez dozvole izdavača. Štampa Grafid Banja Luka

3 Predgovor Knjiga Statistika rezultat je realizacije nastave iz predmeta Statistika na Visoke škole za ekonomiju i informatiku Prijedor. Knjiga je namjenjena studentima prve godine i kao takva u potpunosti slijedi nastavni plan i program. U knjizi je napravljen pokušaj da se statistika posmatra ne samo i nužno kao matamatička disciplina, već prije svega kao metodologija i skup alata za rješavanje nematematičkih problema. Zbog toga su izvođenja i dokazi pojedinih tvrdnji svedeni na minimum, a pažnja je usmjerena na način statističkog mišljenja i povezivanja tog načina mišljenja sa strukom (menadžmentom, ekonomijom, računarstvom i informatikom). Da bi se ovaj koncept udžbenika ostvario svaka izložena cjelina potkrepljena je sa više konkretnih primjera. Najviše je primjera iz medicine, što je i razumljivo s obzirom na iskustvo u realizaciji nastave za medicinare u periodu U Prijedoru, oktobar 013. Autori 3

4 Sadržaj: 1. Uvod Pojam i definicija statistike Razvoj statistike Klasifikacija statistike Statistička metodologija Osnovni statistički pojmovi Primjer primjene statistike 14. Deskriptivna statistika Prikupljanje podataka Određivanje cilja istraživanja Mjerne skale Metode prikupljanja podataka 1.. Sređivanje, grupisanje i prikazivanje podataka..1. Grupisanje podataka... Tabelarno prikazivanje statističkih podataka Grafičko prikazivanje statističkih podataka Dijagrami Deskriptivna statistika (statističko opisivanje) Relativni brojevi Mjere centralne tendencije Mjere varijabliteta Mjere oblika distribucije Analitička statistika Statistička analiza Ispitivanje razlike Greške u zaključivanju Jačina, efikasnost i osjetljivost metoda Analitički metodi Teorijska statistika Vjerovatnoća Slučajna varijabla i distribucija vjerovatnoće Uzorak i statistike uzorka Izbor uzorka Statistika uzorka Ispitivanje razlike Parametarski metodi za ispitivanje razlike Zed test Studentov t-test Zaključak Neparametarski metodi za ispitivanje razlike Hi kvadrat test 4

5 5... Primjena hi kvadrat testa kao testa slaganja Tablice kontigencije Tablice kontigencije tipa različitog od x Ograničenja i uslovi za primjenu hi kvadrat testa Zaključak Regresija i korelacija Regresija Uvod Regresioni model Regresiona analiza Evaluacija regresionog modela Procjena linije regresije Predviđanje pomoću regresije Linearni trend Korelacija Opšte napomene o upotrebi metoda regresije i korelacije Zaključak Korelacija ranga Statističke tablice Literatura 7 5

6 1. Uvod 1.1. Pojam i definicija statistike Riječ statistikaˮ, po svim izvorima, najvjerovatnije vodi porijeklo od latinske riječi status što znači stanje. Najprije se upotrebljavala da označi rezultat registrovanja numeričkih podataka o posmatranoj pojavi. Pojam statistika kao naziv nove nauke prvi je sredinom 18. vijeka (1748) upotrebio Gotfrid Ahenval (Gottfried Achenvall; ), profesor Univerziteta u Getingenu kad je sistemu numeričkog opisivanja države, njenih funkcija i elemenata, dao naziv statistika. Od profesora Gotfrida do danas statistika se do te mjere razvila da je nadmašila svoje prvobitno značenje. Danas, moderna statistika ima više značenja. Pod statistikom se, s jedne strane, podrazumijeva rezultat rada statističkih službi na prikupljanju, sređivanju, opisivanju i objavljivanju podataka. S druge strane, statistika podrazumijeva i obuhvata naučno istraživačku metodologiju i rezultate njene primjene. Ovdje ćemo se pozabaviti statistikom kao naučnim metodom i metodologijom istraživanja. Statistika je, kao naučni metod, grana opšte naučne metodologije. Međutim, s obzirom na činjenicu da je statistika neophodna u svim naučnim istraživanjima i istraživanjima uopšte, može se slobodno reći da je statistika osnovna grana opšte naučne metodologije. U tom smislu, statistika je metod kvantitativnog istraživanja masovnih pojava. Vodeći računa o činjenici da se statistički metod prilogođava specifičnostima i ciljevima istraživanja naučne discipline gdje se primjenjuje, statistika se može definisati i kao sistematizovani skup znanja o statističkim metodama. Dakle, statistika je, kao naučni metod, grana opšte naučne metodologije koja predstavlja sistematizovani skup znanja o statističkim metodama kvantitativnog istraživanja masovnih pojava. 1.. Razvoj statistike Razvojni put statistike, od prapočetaka do danas, veoma je dug i iznosi približno oko 6000 godina. U svom razvoju statistika se najprije razvijala kao potreba organizovanih društvenih zajednica - kao praksa. Statistička praksa, a time i statistika uopšte, primijenjivana je kod prebrojavanja stanovništva u Kini (4000 godina p.n.e.) i u Egiptu (3000 godina p.n.e.). Prvi pisani dokument o prvobitnom obliku statistike je Mojsijeva Knjiga brojeva iz 100. godine p.n.e. 6

7 7 Stari Grci su u Atini povremeno popisivali stanovništvo, vojsku i uvoz i izvoz roba. Međutim, najvažnija statistička aktivnost starog vijeka bio je rimski censusˮ koji se sprovodio svake pete godine od 550. godine p.n.e. pa do sedamdesetih godina nove ere. Cenzus je podrazumijevao registrovaanje svih slobodnih rimskih građana po broju, polu, starosti, mjestu stanovanja i imovinskom stanju. U srednjem vijeku praktično zamire svaka statistička aktivnost a objašnjenje se nalazi u feudalnoj rascjepkanosti Evrope. Prvi moderni periodični popisi stanovništva organizovani su u SAD godine a nedugo zatim organizuje se stalna statistička služba koja se bavi tekućom statistikom a kasnije i anketiranjem. Težnja da se sa statističke prakse pređe na statističku teoriju javila se već početkom 17. vijeka kad se javljaju dvije statističke škole: njemačka univerzitetska statistika i engleska politička aritmetika. Njemačka univerzitetska statistika shvaćena je kao državopis čiji je cilj uspostavljanje sistema obavještavanja o stanju države. Osnivač univerzitetske statistike bio je Herman Konring ( ), profesor Univerziteta u Helmštatu, koji se istovremeno bavio istorijom, pravom i medicinom. Engleska Politička aritmetika je u prvi plan svog interesa stavila ne praktično već naučno saznanje o društvu i društvenim pojavama i njihovim zakonitostima primjenom matematičkih metoda za obradu statističkih podataka. Osnivač ove škole bio je Džon Graunt ( ) dugogodišnji gradonačelnik Londona. Osnivačem savremene statistike smatra se belgijski astronom i statističar Adolf Ketle ( ). Osnovna Ketleova zasluga je uvođenje teorije vjerovatnoće u statistička istraživanja, kao sredstvo kontrole statističkih ocjena. Uvođenje teorije vjerovatnoće presudno je uticalo na razvoj statistike jer je omogućilo ne samo da statistika prodre u sve naučne oblasti nego i istraživanje činjenica koje se ne mogu obuhvatiti potpunim posmatranjem. Ovaj Ketleov rad dobio je na značenju tek poslije njegove smrti. Krajem 19. vijeka Karl Pirson ( ), biolog i statističar, razradio je metode statističkih ocjena na osnovu vjerovatnoće, teoriju distribucija i teoriju korelacije. Slijedeći Ketleovo i Pirsonovo djelo, u prvoj polovini 0. vijeka, razrađena je metoda uzorkovanja, metoda ocjene podataka iz uzorka i metoda statističkog eksperimenta. Ovdje se posebno ističu Fišer, Goset i Jets. U drugoj polovini 0. vijeka poseban stimulans brzom razvoju statistike dao je razvoj i primjena informacionih i telekomunikacionih tehnologija Klasifikacija statistike

8 Statistika se može klasifikovati u dvije osnovne kategorije: evidencionu statistiku; statistički metod istraživanja. Osnovni zadatak evidencione statistike je prikupljanje (registrovanje), sređivanje, opisivanje (uslovno) i objavljivanje numeričkih podataka o nekoj pojavi. Kao metod naučnih istraživanja statistika se može klasifikovati u više kategorija. Po osnovnoj klasifikaciji razlikuju se teorijska i primjenjena statistika, Po drugoj klasifikaciji i jedna i druga statistika mogu biti opšte i specijalne, odnosno, posebne statistike. Teorijska statistika Teorijska statistika je velika i veoma razgranata oblast primjenjene matematike. Ona ima zadatak da formira, objašnjava, dokazuje i usavršava statističke metode. Opšta teorijska statistika bazira se na teoriji vjerovatnoće, a čine je četiri fundamentalne oblasti: teorija raspodjela teorija statističkih ocjena teorija testova teorija povezanosti. Osim opšte teorijske statistike postoje i specijalne grane teorijske statistike: teorija programiranja, teorija diskriminacije itd. Primjenjena statistika Ustvari postoje primjenjene statistike koje se koriste za istraživanja u raznim naučnim oblastima i za razne praktične svrhe. Može ih se definisati kao teorijske statistike koje su prilagođene specifičnostima i potrebama bazične naučne discipline u kojoj se primjenjuju. To znači da postoji onoliko primjenjenih posebnih statistika koliko ima i oblasti istraživanja. Pored posebnih primjenjenih statistika postoji i opšta primjenjena statistika koja daje sintezu metodološkog i iskustvenog u primjeni statistike u raznim oblastima istraživanja Statistička metodologija 8

9 Okolina u kojoj čovjek živi i radi obiluje mnogim pojavama koje utiču na njegovu egzistenciju. Do ove konstatacije nije se moglo doći na osnovu izdvojenog posmatranja malog broja pojava u vremenu i prostoru. Pravilnost ponašanja i njihova zakonitost uočavala se samo pri posmatranju pojava koje su se javljale u velikom broju. Da bi se otkrila brojnost i raznovrsnost ovih pojava, ustanovilo njihovo porijeklo, saznala njihova suština, i predvidio njihov uticaj u budućnosti potrebno je, pored naših čula i vlastitog iskustva, koristiti pomoćne mjerne instrumente i metode među kojima najznačajnije mjesto zauzima statistika. Kao i sve nauke, i statistika ima svoju metodologiju čiji principi obezbjeđuju da svako ispitivanje vršeno u bilo kom vremenu, na bilo kom mjestu i sa bilo kojim ciljem prolazi kroz iste i već usvojene etape rada. Ovakav način rada omogućava da se vrši uspoređivanje rezultata različitih ispitivanja. Svako naučno ispitivanje mora se zasnivati, prije svega, na posmatranju. Kad se posmatranjem utvrdi postojanje izvjesne pojave, koja se želi ispitivati, tada se putem uspoređivanja, pretpostavki (hipoteza) i drugim metodama pristupa njenom objašnjavanju. Međutim, postoje razlike između raznih naučnih disciplina i one se odražavaju u samoj metodici ispitivanja i istraživanja pojava u živoj ili neživoj prirodi. Bez obzira na te razlike, sva ispitivanja ovih pojava zasnovana na statističkoj metodologiji podeljena su u tri etape: statističko posmatranje ili/i prikupljanje podataka, sređivanje i grupisanje podataka, obrada sa statističkom analizom. Prva etapa: Statističko posmatranje ili/i prikupljanje podataka Prva etapa obuhvata plansko i sistematsko registrovanje jedinica posmatranja koje sačinjavaju posmatrani statistički skup, a sastoji se iz dva dijela. Prvi se sastoji od niza elemenata kao što su: upoznavanje sa raspoloživim materijalom sličnih ispitivanja, određivanjem cilja, predmeta, jedinice i obilježja posmatranja, a drugi dio se sastoji od organizacije sprovođenja samog posmatranja i prikupljanja podataka. Druga etapa: Sređivanje i grupisanje podataka Druga etapa se sastoji u sistematizovanju prikupljenih statističkih podataka prema unaprijed dogovorenim obilježjima. Podaci se grupišu, prebrojavaju i dobijaju statističke serije koje se unose u statističke tabele a zatim se vrši sabiranje po kolonama i redovima. 9

10 10 Na taj način dobija se slika posmatrane masovne pojave u apsolutnim brojevima i tako sređeni i grupisani podaci mogu da služe i kao publikacioni materijal. Treća etapa: Obrada sa statističkom analizom Treća etapa sastoji se od upotrebe raznih računskih operacija kako bi se izvršila analiza dobijenih statističkih serija. Apsolutni brojevi se pretvaraju u relativne, vrše se poređenja pomoću mjera centralne tendencije (srednje vrijednosti i sl.), mjera varijabiliteta (disperzije i sl.), izračunava jačina međusobne zavisnosti itd., s ciljem dobijanja uvida u strukturu pojave koja se posmatrala i određivanja daljih tendencija stanja i kretanja pojave. U ovu etapu spadaju i komplikovanije statističke metode radi testiranja rezultata pojedinih grupa, vrše se razna ocjenjivanja parametara osnovnog skupa, potvrđuju, odbacuju, proširuju ili uopštavaju postavljene hipoteze i raznim grafičkim prikazima upotpunjavaju i potkrepljuju izvedeni zaključci. Svako statističko istraživanje ne mora nužno proći kroz sve tri etape. Prikazi pojedinih podataka pomoću tabela, koje se kao takve publikuju, redovno se završavaju sa drugom etapom. Korištenje prikupljenog, ali nesređenog i negrupisanog materijala i njegova analiza ili samo analiza tabelarnog materijala, predstavljaju drugu i treću ili samo treću etapu. Ali treba uočiti da postoji povezanost svih etapa rada i da one sačinjavaju jednu cjelinu o kojoj se mora voditi računa prije nego što se pristupi posmatranju odnosno prvoj etapi. U svim primjenjenim istraživanjima navedenu statističku metodologiju treba shvatiti kao pomoćnu, ali ipak nezaobilaznu metodologiju. Česti su slučajevi minimiziranja važnosti ove metodologije u pojedinim primjenjenim istraživanjima što se u pravilu završava na štetu kvaliteta istraživanja. Ova činjenica posebno vrijedi za prvu etapu kod planiranja istraživanja i eksperimenta. Ne vodeći računa i o statističkoj metodologiji, često istraživač dolazi u poziciju da eksperiment planira aposteriorno i time automatski ugrožava validnost ukupnog istraživanja. Poseban dio statističke metodologije, ili bolje rečeno statističke filozofije, je svijest o greškama. U statističkihm istraživanjima razlikuju se dvije vrste grešaka: greške u radu i greške u zaključivanju. Greške u radu mogu nastati u svim etapama statističkog istraživanja i dijele se na sistematske i slučajne. Sistematske greške su one koje se pri ponavljanju postupka (eksperimenta) stalno ispoljavaju na isti način. One su opasnije od slučajnih jer dovode u pitanje validnost istraživanja. Slučajne greške najčešće nastaju omaškom i pri ponavljanju postupka se javljaju u oba smisla što uglavnom dovodi do njihovog potiranja.

11 1.5. Osnovni statistički pojmovi Statistika je nauka (naučni metod, skup naučnih metoda) koja se bavi kvantitativnim i kvalitativnim istraživanjem masovnih pojava u cilju njihove deskripcije, analize i generalizacije zaključaka. Deskriptivna statistika opisuje različite grupe podataka koristeći se pri tom prikupljanjem, sortiranjem, prikazivanjem i raznim matematičkim operacijama za računanje opisnih (deskriptivnih) parametara. Inferencijalna statistika (statistika zaključivanja) donosi zaključke o čitavom skupu podataka u cilju relevantne procjene stvarnog i budućeg stanja, a na osnovu dijela podataka uzetih iz cjeline. Predmet posmatranja i proučavanja statistike je statistički skup. On predstavlja cjelinu sastavljenu od istovrsnih elemenata sa zajedničkim varijabilnim obilježjem (obilježjima). Statistički skup mora biti homogen, tj. sastavljen od istovrsnih i međusobno usporedivih elemenata. On mora biti varijabilan. Elementi skupa koji su istovrsni nikada nisu istovjetni u odnosu na zajedničko obilježje. Istovrsni elementi statističkog skupa, odnosno karakteristike jedinice posmatranja, bilo da su kvalitativne ili kvantitativne prirode, nazivaju se obilježjima. Ona mogu biti atributivna ili numerička, odnosno diskontinuirana ili kontinuirana. Atributivna obilježja ne izražavaju se cifrom tj. brojem. Atributivna obilježja mogu se prikazati samo opisno (npr. pol, starost, vrsta proizvoda, ishod poslovne analize, tip klime, brzina povrata investicije, oblik promjene, boja proizvoda, konzistencija materijala, intezitet proizvodnje, itd.). Pod varijacijom, variranjem, odnosno varijabilitetom, podrazumijeva se promjenjivost obilježja posmatranja od jedinice do jedinice posmatranja statističkog skupa. Varijabilnost obilježja je inherentno svojstvo statističkog skupa, odnosno, gubio bi se smisao postojanja statističkog skupa ukoliko bi sve jedninice posmatranja bile jednake. Varijabla je jedan kvantitet, jedan iznos, jedna vrijednost numeričkog obilježja (npr. 36,5 0 C aksilarne temperature), odnosno jedan kvalitet, jedan vid, jedna kategorija atributivnog obilježja (npr. normalna aksilarna temperatura. Podatak je bilo koja činjenica ili zapažanje za koju se unaprijed ne zna da li će uvećati znanje subjektu kome je upućena (koji s njom raspolaže). Podatak 11

12 je osnovni material, koji se u statistici opisuje i analizira. Generiše se mjerenjima ili prebrojavanjem zbog čega predstavlja i realizaciju neke slučajno promjenjive veličine. Slika 1.5.1: Podjela obilježja statističkog skupa Statističko istraživanje je kontinuirani spoznajni proces zasnovan na određenoj metodi i proceduri. Istraživanje se sastoji od: 1. Izbora istraživačkog problema (sa pretraživanjem i kritičkom evaluacijom odgovarajuće literature u cilju potvrde i definisanja konteksta istraživačkog problema);. Definisanja problema i predmeta istraživanja; 3. Formulacija ciljeva i hipoteza istraživanja: Ciljevi i hipoteze se formulišu s obzirom na relevantne varijable, istraživačke strategije i ograničenja; 4. Istraživački plan specificira vrste i veličine uzoraka, relevantne varijable, istraživačke strategije, istraživački dizajn itd; 5. Prikupljanje podataka (sa instrumentima mjerenja i njihovim kvalitetom, načinima i greškama mjerenja, kao i mjernim skalama dostupnim za istraživačku procjenu); 6. Eksploracija podataka: Priprema podataka koja uključuje formiranje istraživačke baze podataka i njihovu provjeru sa eventualnom modifikacijom ili transformacijom i opisivanje podataka alatima deskriptivne statistike; 7. Analiza podataka: Primjena principa vjerovatnoće u oblasti statistike zaključivanja i statističkih modela s ciljem donošenja odluka o tome da li podaci podržavaju eksperimentalnu hipotezu ili model; 1

13 8. Interpretacija i zaključivanje (koji mogu podržati postojeću teoriju ili praksu; mogu ukazati da je nova tehnika efektivnija od stare ili mogu ukazati na nove teotijske koncepte koji bolje opisuju ispitivni fenomen); 9. Saopštavanje rezultata istraživanja: Da bi naučno istraživanje imalo smisla treba ga publikovati. Publikovano istraživanje izloženo je metodološkoj kritici i može biti ponovljeno od strane drugih istraživača. Tek tada i takvo istraživanje može postati dio naučnog znanja. Eksperimentacija (eksperiment) i opservacija (posmatranje) Eksperimentacija (eksperiment) se koristi kod dobijanja podataka pri čemu smo prije svega zainteresovani za njihov uzročno-posljedični odnos. U eksperimentaciji se pretpostavlja da mi izazivamo promjene na subjektu da bi utvrdili veličinu i uticaj eventualne promjene na njemu. Observacija (posmatranje) se koristi kod dobijanja podataka kada su u pitanju samo odnosi, bilo da je riječ o povezanosti ili razlikama među varijablama. Uzorkovanje je proces formiranja (reprezentativnog) uzorka: Uzorak je odabrani podskup osnovnog statističkog skupa (uzorak može biti slučajan ili neslučajan, reprezentativna ili nereprezentativan). Mjerenje je postupak po kome se proizvode podaci kroz opservaciju ili eksperimentaciju. Teorija mjerenja bavi se odnosom i vezom između podataka i realnosti. Karakteristike mjerenja su: Nivo mjerenja - priroda mogućih mjerenja među opservacijama u različitim kategorijama. nominalni nivo mjerenja - nema nivoa mjerenja između kategorija; ordinalni nivo mjerenja - opservacije u jednoj kategoriji uspoređuju se relativno sa onima u drugoj; numerički - intervalni i omjerni nivo mjerenja - opservacije u jednoj kategoriji funkcionalno se odnose prema onima u drugoj. Proces mjerenja definiše prirodu dozvoljenog odnosa između opservacija u istoj kategoriji. Kod diskretnog procesa mjerenja sve opservacije u jednoj kategoriji predstavljene su istim brojem dok su kod neprekidnog procesa mjerenja opservacije u jednoj kategoriji predstavljene definisanim intervalom brojeva. Uslovljenost mjerenja definiše odnos između opservacija u skupovima kategorija. Razlikuju se: nezavisni odnosi (sve opservacije su usporedive) i red/kolona zavisni odnosi (mjerenja se obavljena u više vremena). 13

14 Nedostajući podaci (mjerenja nisu obavljena, mjerenja su obavljena ali nisu zabilježena). Skale mjerenja Postoje četiri tipa skala mjerenja koje se razlikuju po tipu brojeva koje proizvodi mjerenje specifične varijable (tzv. Stivensova klasifikacija): Nominalna skala je najjednostavnija i najmanje informativna od svih i kod mjerenja varijable uključuje samo imenovanje, kategorizaciju ili klasifikaciju njenih mogućih vrijednosti. Proizvedena mjerenja su kvalitativna, a ako se kategorijama dodijeljuju brojevi oni su samo kodovi i ne predstavljaju stvarne kvantitete. Izmjena vrijednosti nominalne skale može se vršiti bez gubitka informacije. Ordinalna skala je sljedeći nivo mjerenja koji uključuje rangiranje vrijednosti varijable (prvi, drugi, treći itd.) Intervalna skala je mjerna skala na kojoj su razlike između sukcesivnih vrijednosti varijabli uvijek jednake, ali bez apsolutne nulte tačke. Omjerna skala pored jednakosti rastojanja između uzastopnih vrijednosti ima i apsolutnu nulu. Instrument mjerenja je tehnologija koja se koristi za mjerenja. Postoje sljedeći instrumenti mjerenja: upitnik, intervju, opservacija, objektivne i subjektivne mjere, standardizovane mjere i testovi Primjer primjene statistike Interesantan je primjer svjesne primjene statistike u medicini: Statistika je prvi put upotrebljena svjesno u dokazivanju hipoteze zasnovane na medicinskim razmatranjima sredinom devetnaestog vijeka. Desilo se to u porodilištu Bečke Akušerske klinike, kada je Ignac Filip Zimelvajs (Ignaz Philipp Semmelweis, ) godine morao natjerati svoje kolege da poštuju higijenske mjere rada. U to vrijeme još se ništa nije znalo o patogenim bakterijama (niti o bakterijama uopšte) kao o živim bićima koja uzrokuju bolesti. Bolest od koje su stradale porodilje dobro je bila poznata u to vrijeme - to je bila puerperalna sepsa. Zimelvajsov problem bio je u tome što se i poslije uvođenja higijenskih mjera pri smještaju porodilja pojavljivala smrtnost. No ona je u toku prethodnog perioda, od 1840 do 1846 godine, iznosila 10,7%, a već u prvoj 14

15 godini primjene ovih higijenskih mjera, 1847, pala na 5,% da bi sljedeće, 1848 godine, bila 1,3%. Zimelvajs je dobro shvatio dvije važne okolnosti. Prvo, smrtnost je značajno smanjena i to smanjenje može se objasniti, može se shvatiti kao posljedica uvođenja higijenskih mjera u smještaju porodilja (Tragajući za ovim podacima, Leski je utvrdio da je Zimelvajs smrtnost ocjenjivao na osnovu dovoljnog broja porodilja: bilo ih je 110, 1847 ih je bilo 3375, a u 1848 godini 3556). Zimelvajs se, zahvaljujući statističkoj analizi uvjerio da je smrtnost porodilja značajno manja i da je uzročna promjena u sprovođenju higijenskih mjera smještaja porodilja. Drugo, puerperalna sepsa nije iskorjenjena, a to se može objasniti time da na puerperalnu sepsu, osim higijenskih mjera, vjerovatno utiču i drugi faktori koji u tom trenutku nisu bili poznati ili interesantni za istraživanje. Na ovom primjeru mogu se zapaziti neke osnovne statističke pojave i definisati osnovni statistički pojmovi. Zimelvajs je porodilje posmatrao isključivo kao tragična ljudska bića koja mogu u toku porođaja i neposredno poslije njega umrijeti. Stanje koje se svodi na to da je porodilja mrtva je relevantna osobina, pored beskonačno mnogo drugih osobina, a koje se mogu zapažati i zabilježiti kod porodilje. Ovo stanje - biti mrtav - dato je u punom iznosu. Porodilja ili je mrtva, ili nije mrtva, odnosno živa je. Nije važno da li je bolesna, da ima visoku temperaturu, ili bolove. Važno je da nije mrtva. Činjenica da je bolesnica još živa bilježi se da kod nje ne postoji stanje relevantno za aktuelno ispitivanje, odnosno da nije mrtva. Za manje sretne jedinke, bilježi se da je došlo do pojave relevantnog stanja - nije više živa nego je porodilja mrtva. To što je porodilja mrtva, bez obzira što sadrži u sebi neispisani roman čovjekovog života i stradanja, svodi čitavu složenu istoriju na svega jednu, vještački izolovanu kategoriju - obilježje posmatranja. Pošto je dato u punom iznosu, znači da porodilja ne može biti mrtvija, niti među njima postoje one koje su najmrtvije, ovakvo obilježje posmatranja naziva se atributivno ili kvalitativno. Posmatrajmo za trenutak malo bolje ovo kvalitativno obilježje. Očigledno je da prethodno mora postojati dogovor o tačno definisanom stanju koje zaslužuje atribut mrtav. To je dogovor o kategoriji unutar koje će se prebrojavati svaki od nosilaca pozitivnog događaja. Zapazimo da svaka porodilja može pripadati samo dvjema kategorijama koje se uzajamno isključuju (živ-mrtav). To je karakteristika binomnih populacija. Statistički posmatrano, postoji ukupan broj ispitanica koje mogu biti nosioci jedne od dvije alternativne osobine. 15

16 16 Za sada je zbog određenih medicinskih razloga bitno da se tačno odredi broj porodilja koje su podlegle sepsi i zbog toga pripadaju kategoriji mrtvih. Odnos ukupnog broja mrtvih prema ukupnom broju i mrtvih i živih, tj. prema ukupnom broju posmatranih porodilja definiše empirijsku vjerovatnoću da se pri ponovljenom posmatranju pri istom sticaju okolnosti i istim uslovima ponovi isti rezultat posmatranja. Ova vjerovatnoća se opisuje odnosom u kome je brojilac broj mrtvih, a imenilac ukupan broj posmatranih: broj mrtvih porodilja vjerovatnoća P (broj mrtvih broj živih) porodilja Simbol P preuzet je od latinske riječi Probabilitas što znači vjerovatnoća. Broj mrtvih može da se smanjuje i da se povećava. Najmanja moguća vrijednost je 0 (nema niti jednog smrtnog slučaja), tada je vjerovatnoća da se pri ponovljenom posmatranju opservira isti odnos mrtvih prema svim ispitanicama jednaka nuli. Najveća vrijednost broja mrtvih može biti takva, da sve posmatrane ispitanice podlegnu i da nema niti jedne žive. Tada će odnos brojnika prema nazivniku u odnosu koji opisuje vjerovatnoću biti tačno 1: vjerovatnoća sve posmatrane porodilje mrtve P 1 (sve mrtve 0 živih) porodilja Prema tome, veličina pokazatelja vjerovatnoće može da dobije sve vrijednosti između 0 i 1. To se piše na sljedeći način: 0 P 1,00 a čita pe je jednako ili veće od nule i jednako ili manje od jedan. U binarnom načinu opisivanja atributivnih obilježja uobičajeno je da se očekivani događaj označava sa p, a ona druga alternativna osobina (suprotan događaj) sa q. Prema tome, može se pisati da je: p + q = 1 odakle se lako nalazi da je: p = 1 - q Treba imati u vidu da prihvatanjem definicije o kategoriji kvalitativnog obeležja nije izbjegnuta promjenjivost koja je opšta pojava u prirodi. Čak i takva svojstva kao mrtav podležu diskusiji. Poznato je da se danas opšti dogovor o definiciji mrtav mijenja zbog problema presađivanja organa. Problem ne mora uvijek dobiti dimenzije sudsko-medicinskog spora. Na primjer, za nekog ljekara jedan bolesnik može biti cijanotičan, a za drugog ne. Posebno je zanimljivo da, na primjer, jedan ljekar čuje šum na srcu a drugi ne. Neka atributivna obilježja, kao hrabrost, agitiranost, sugestibilnost, itd. u načelu su podložna ličnim tumačenjima.

17 17 Ova intrinsična varijabilnost unutar prividno tačno definisane kategorije može biti razlog za različiti rezultat ponovljenog statističkog posmatranja. Ponovimo još jednom da statistika sa posebnom pažnjom proučava značajnost zapaženih razlika upravo zbog toga što ponekad nije lako ocijeniti prirodu razlike, odnosno izbjeći grešku. Do greške dolazi ako se slučajno nastala razlika proglasi za značajnu. Posljedica je to što se ma koji prethodni događaj bez osnova proglašava za uzrok nastale promjene (posljedice). To je tzv. greška prvog reda, kada stvarno značajna razlika ostaje neprimijećena - uzrok nastale promjene se neće otkriti. Na primjeru Zimelvajsovih razmatranja može se objasniti još jedan važan statistički pojam. Pretpostavka da smrtnost u sve tri ispitivane grupe ispitanica (onih iz razdoblja , onih iz 1947 i onih iz 1948 godine) nije značajno smanjena, nego je do ovih razlika došlo zbog slučajnih kolebanja naziva se nulta hipnoza. Ako se ova pretpostavka može odbaciti, moramo dokazati da je razlika značajna: poređene grupe nisu više iste, nego se u pogledu obilježja posmatranja (umiranje od sepse) između sebe suštinski razlikuju i u Zimelvajsovom slučaju ta razlika je nastala uvođenjem higijenskih mjera smještaja porodilja. Ovako upotpunjena, logična objašnjenja promjena koja sadrži i uzrok promjena naziva se radna hipoteza. Dokazna moć radne hipoteze je suverena i otvorena za dalja usavršavanja teorije i sistema kojem pripada. Ovaj postupak Zimelvajsa izjednačuje se sa Liverijeovim otkrićem planete koja još nije viđena, ali je do njenog postojanja čovjek došao utvrđujući značajna odstupanja susjednih nebeskih tijela od svojih teorijskih putanja. Statistika suprotstavlja svakoj nultoj hipotezi radnu hipotezu, što znači da odstupanje od nulte hipoteze mora biti bar u elementarnom smislu vezano za neki (relevantan) uzrok. Inače u svakom drugom slučaju, statistika ne želi da se upliće u probleme van domašaja svoje moći nego svaku hipotezu suprotnu od nulte objašnjava kao alternativnu hipotezu. Dakle, sve porodilje koje su dospjele u posmatranje samo su dio svih porodilja koje se mogu zamisliti da su postojale i postoje do Zimelvajsovog doba. Kada se govori o statističkom posmatranju, u ovom slučaju svih posmatranih porodilja, jedino okolnost da neke od porodilja nesrećno podliježu sepsi ili ne predstavlja obilježje relevantno za statističko zaključivanje. Prema tom obilježju (podliježe sepsi - ne podliježe sepsi) formiran je osnovni skup ili populacija. Tri grupe ispitanica obuhvaćenih Zimelvajsovim razmatranjem čine tri uzorka istog osnovnog skupa, ako među njima nema razlika. Pošto Zimelvajs nije imao na raspolaganju moćna sredstva statističke provjere nulte hipoteze kao što postoje danas (Hi-kvadrat test je Abbe opisao

18 još u osamnaestom vijeku, ali nije se primenjivao sve do početka devetnaestog vijeka kada ga je ponovo otkrio Pearson), svoje je razmatranje zasnivao na elementarnim odnosima teorije vjerovatnoće. Ovaj rad Zimelvajsa, iako se bitno razlikuje, i metodološki i konceptualno, od današnjih statističkih istraživanja na velika vrata uveo je statistiku u medicinska istraživanja. Od Zimelvajsa do danas primjenjena statistika (medicinska statistika) dala je ogroman i nemjerljiv doprinos razvoju medicine. S druge strane medicinske potrebe bile su veliki motiv i stimulans za razvoj statističkih metoda u primjenjenom obliku ali i u teorijskom smislu pa se može reći da je medicina značajno i nemjerljivo uticala na razvoj statističkih metoda i statistike uopšte. Gotovo da i nema područja ljudske djelatnosti za koje ne bi vrijedila ova tvrdnja. 18

19 . Deskriptivna statistika Statističke metode istraživanja masovnih pojava mogu se podijeliti u dvije osnovne grupe. Prva grupa obuhvata metode prikupljanja, sređivanja i prikazivanja podataka i metode određivanja parametara skupova podataka. Ova grupa spada u domen deskriptivne statistike. Drugoj grupi pripadaju metode statističke analize, čiji je osnovni zadatak objašnjenje varijabiliteta pomoću klasifikacionih, korelacionih i drugih statističkih pokazatelja, kao i statističko zaključivanje na osnovu uzorka. Ovim metodama bavi se analitička statistika i statistika zaključivanja (inferencijalna statistika), koja se, međutim, ne može strogo razgraničiti od deskriptivne statistike..1. Prikupljanje, sređivanje i obrada statističkih podataka.1.1. Određivanje cilja istraživanja U prvoj etapi statističkog istraživanja rješavaju se metodološki problemi istraživanja. Određuju se: problem i predmet, cilj i hipotetički okvir, jedinice, obilježja, vrijeme posmatranja, instrumenti istraživanja, šeme grupisanja i obrade i drugo. Prije svega se definiše problem i postavlja cilj istraživanja, jer od njih zavise i metodološko-tehničke i organizacione osnove istraživanja. Problem i cilj se moraju postaviti jasno, konkretno i precizno, kako bi se što bolje definisali predmet istraživanja, obilježja i jedinice posmatranja. Nejasno definisan problem i cilj može dovesti kako do suvišnih pitanja, što dodatno opterećuje i poskupljuje statističko istraživanje, tako i do ispuštanja pitanja neophodnih za dobijanje rezultata zbog kojih se statističko istraživanje sprovodi. Planom prikupljanja podataka određuju se i definišu modaliteti istraživanja i događaji koji će se obuhvatiti, a u sklopu njihovih definicija i način mjerenja i iskazivanja. Mjerenje nije uvijek moguće izvršiti sa istom preciznošću. Nivo mjerenja zavisi od prirode same pojave i posmatranih obilježja. Tako se uspjeh studenata, na primjer, može mjeriti i iskazivati opisno (odličan, vrlo dobar, dobar, dovoljan, slab) ili brojčano (10, 9, 8, 7, 6, 5). Radnike možemo razvrstati na nekvalifikovane (NKV), kvalifikovane (KV), visoko kvalifikovane (VKV), i (ili) na kvalifikovane, polukvalifikovane i nekvalifikovane, zavisno od cilja istraživanja. Tjelesnu temperaturu možemo 19

20 klasifikovati kao atributivno obilježje (normalna, snižena, povišena, visoka) ili mjereno na mjernoj skali T 0 C..1.. Mjerne skale Svaki nivo mjerenja ima posebnu skalu sa određenim jedinicama mjere, pri čemu se uspješnost mjerenja izražava količinom prikupljenih informacija. Postoje četiri nivoa mjerenja i četiri mjerne skale: nominalna, ordinalna, intervalna i skala odnosa ili omjerna skala. Nominalna skala je najnepreciznija. U ovoj skali brojevi se koriste kod pojava koje se mogu klasifikovati samo na određen broj i tip modaliteta. Tako se klasifikuju pol, bračno stanje itd. Modalitete bračnog stanja možemo redom označiti sa: 1,, 3, 4 (neuženjen/neudata sa 1, oženjen/udata sa, udovac/udovica sa 3 i razveden/razvedana sa 4). Broj je upotrebljen kao simbol i ne iskazuje kvalitet, već služi za odvajanje i obilježavanje različitih modaliteta. Modaliteti bračnog statusa mogli su biti navedeni bilo kojim redom. Između ovih modaliteta ne postoji obavezan radoslijed, ali se oni međusobno isključuju. Mjerenje se svodi na razvrstavanje po određenoj šemi - na klasifikaciju. Za atributivna obilježja koja imaju veliki broj modaliteta (zanimanje, uzrok smrti, naziv bolesti itd.) razvrstavanje (klasifikacija) se vrši u srodne grupe u okviru posmatranog obilježja. Jednoobrazno utvrđeni nazivi grupa i podgrupa nazivaju se nomenklature (nomenklatura djelatnosti, nomenklatura robe, nomenklatura uzroka smrti, nomenklatura bolesti (Međunarodna klasifikacija bolesti 10. Revizija, nomenklatura zanimanja, itd.). Ordinalna skala svodi mjerenje modaliteta na njihovo rangiranje po značaju s obzirom na usvojene kriterijume i to brojevima koji označavaju rang, ali ne pokazuju veličinu njihovog razlikovanja. Tako, na primjer, lokaciju prodavnica možemo označiti kao: izuzetno povoljnu, povoljnu, osrednju, nepovoljnu i izuzetno nepovoljnu ili ove modalitete rangirati počevši od rednog broja 1 za izuzetno povoljnu pa do rednog broja 5 za izuzetno nepovoljnu lokaciju. Na ovaj način dobija se redoslijed značaja pojedinih modaliteta, prvi je bolji od drugog (ili obratno), Međutim ni ova skala ne omogućava sagledavanje mjere razlikovanja pojedinih modaliteta. Drugi po rangu može se razlikovati mnogo više od prvog po rangu nego treći od drugog itd. Relativan značaj pojedinih modaliteta zavisi i od samog broja modaliteta. Na primjeru lokacija to bi značilo da je peta lokacija istovremeno i najgora. Međutim, ukoliko je broj modaliteta, na primjer 100 rangiranih počevši od najboljeg ka lošijem, peti u rangu bio bi u ovom slučaju među najboljima. 0

21 1 Intervalna skala prikazuje istovremeno redoslijed modaliteta i mjeru njihovog razlikovanja. Intevalnu skalu karakteriše određena jedinica mjere, na primjer, za kalendarsko vrijeme, za potencijalnu energiju, za temperaturu itd. Skala na termometru pokazuje kolika je temperatura u datom tenutku, a u usporedbi sa prethodnim mjerenjem može se vidjeti kolika je apsolutna razlika razultata mjerenja: za deset stepeni više, za pet stepeni manje itd. Međutim, veličine jedinica intervalne skale ne moraju biti jednoznačno određene, već se biraju po nekom kriterijumu. Može postojati više različitih intervalnih mjera za mjerenje iste veličine. Tipičan primjer je mjerenje temperature (Celzijusova i Farenhajtova skala), gdje se kod svake skale nula nalazi na različitoj fizičkoj temperaturi i gdje temperaturne jedinice nisu međusobno jednake. Ovakvih primjera ima više kod usporedbe metričkog i anglosaksonskog sistema mjerenja. Skala odnosa (omjerna skala) daje najviši nivo mjerenja. Ona obezbjeđuje značenje bilo kog odnosa mjernih objekata, kao što su: visina u centimetrima, tjelesna masa u kilogramima, starost u godinama, prihod u konvertibilnim markama i sl. Omjernu skalu ne karakteriše samo upotreba jedinice mjerenja nego i prava nulta tačka. Činjenica da je termometar na nuli (intervalna skala) ne znači odsustvo temperature. Međutim, kad se kod omjerne skale vaga zaustavi na nuli to znači da nema mase. Omjerna skala dopušta izražavanje proporcionalnog odnosa modaliteta koji se mjere. Na primjer, pakovanje šećera koje ima tri puta više mjernih jedinica od drugog pakovanja tri puta je teže. Ova skala je, prema tome, najpreciznija. Često se i intervalna i omjerna skala nazivaju i kardinalnim skalama Metode prikupljanja podataka Da bi se saznale karakteristike ranije definisanog statističkog skupa, bira se ona metoda posmatranja (prikupljanja podataka) koja će sa najmanje troškova obezbjediti tražene rezultate. To znači da se za svaku statističku akciju treba odabrati najefikasnija metoda. Pojava koja se istražuje može se posmatrati na svim jedinicama statističkog skupa (potpuno posmatranje) ili samo na jednom njegovom dijelu (djelimično posmatranje). Potpuno posmatranje ostvaruje se, uglavnom, u vidu statističkih popisa i u vidu tekuće registracije (statistički izvještaji). U prvom slučaju radi se o utvrđivanju stanja pojave (popis stanovništva) u jednom momentu a u drugom slučaju radi se o kontinuiranom praćenju pojave. Od metoda (tehnika) koje stoje na raspolaganju za realizaciju statističkog posmatranja razlikuju se: statistički popis, statistički izvještaj i statistički uzorak.

22 Statistički popis je takav oblik posmatranja pri kojem se obuhvataju sve jedinice posmatranja jednog statističkog skupa u određenom momentu koji se naziva kritični momenat. Vremenski intervali između popisa su relativno veliki (popis stanovništva svakih deset godina). Statistički izvještaj obezbjeđuje snimanje promjena statističkog skupa u sukcesivnim vremenskim intervalima. Statističke izvještaje sprovode izvještajne jedinice na statističkim upitnicima i u rokovima koji su propisani metodološkim uputstvima statističkih organa koji organizuju određenu statističku izvještajnu službu. Statistički uzorak se primjenjuje po pravilu kao zamjena ili dopuna popisne metode posmatranja, ali i kao zamjena za izvještajnu metodu. Osnovni problemi koji se moraju riješiti kod statističkog uzorka su: izbor vrste uzorka, način izbora jedinica u uzorak, veličina uzorka. Bez obzira na metodu koja se primijenjuje kod statističkog posmatranja, važno je obezbjediti jednoobrazno prikupljanje podataka. Jednoobraznost se obezbjeđuje izradom odgovarajućih upitnika (unaprijed pripremljenih) kod kojih su zastupljana sva pitanja (mjerenja) koja su od interesa za posmatranu pojavu i istraživanje... Sređivanje, grupisanje i prikazivanje podataka Sređivanje i osnovna obrada prikupljenih podataka veoma je obiman, a u organizaciono-tehničkom smislu veoma složen posao. Zbog efikasnosti u radu potrebno je izraditi plan sređivanja statističkog materijala kojim se predviđa tehnika sređivanja i rokovi. Sređivanje statističkog materijala dijeli se na centralizovano, decentralizovano i kombinovano, što zavisi od prirode pojave, mjesta sređivanja itd. Kao rezultat sređivanja statističkog materijala dobijaju se statističke serije, koje se mogu definisati kao nizovi sređenih statističkih podataka koji prikazuju strukturu skupa po nekom obilježju, ili raspored skupa u prostoru, ili promjenu skupa u vremenu...1. Grupisanje podataka Da bi se prikupljeni materijal mogao koristiti u svrhe statističkog istraživanja treba ga učiniti preglednim. Da bi se bolje shvatio problem preglednosti uzmimo primjer istorija bolesti pacijenata u ambulanti porodične medicine. Svi podaci oubičajeno se nalaze u zdravstvenom kartonu pacijenta. Nazvan je zdravstveni karton zato što su

23 3 na i u kartonskom omotu smješteni svi podaci o svakom pacijentu uključujući: - Demografske podatke: godina rođenja, pol, ime i prezime, jedinstveni matični broj, broj osiguranja, stručna sprema, zanimanje, podaci o zaposlenju itd.; - Anamnestičke podatke: lična anamneza, porodična anamneza, socijalna anamneza, profesionalna anamneza itd.; - Faktore rizika: pretilost, status zavisnosti (droga, duvan, alkohol, alergijski status, fizička aktivnost, osjetljivost na stres itd.; - Podaci o posjetama porodičnom ljekaru; - Laboratorijski nalazi; - Specijalistički nalazi itd. Za potrebe pojedinačnog rada s pacijentima doktor mara imati sve podatke o pacijentu u zdravstvenom kartonu (elektronskom zapisu). Međutim, za potrebe bilo koje vrste istraživanja, koja u principu posmatra pacijenta u srednjem, odnosno tipičnog pacijenta, jasno je po sebi da takvi podaci za, na primjer, 000 pacijenata ne mogu biti pregledni ako ih posmatramo pojedinačno. Treba ih učiniti preglednim. Zbog toga (preglednosti) kao logično se postavlja pitanje (zadatak): Možemo li sve relevantne podatke za sve pacijente svrstati na jedan papir A4 formata? Ako u tome uspijemo podatke ćemo napraviti preglednima jer ih istraživač može obuhvatiti jednim pogledom. Pokušajmo odgovoriti na ovo pitanje! Preglednost prikupljenog materijala postiže se prije svega metodom grupisanja. Grupisanje je od velikog značaja u statistici jer osigurava sprovođenje svih ostalih statističkih metoda. Pravilno grupisanje je osnov objektivnog uvida u postojeće stanje. U skladu sa ciljem istraživanja ono ističe značajne činjenice i na taj način omogućava pravilno ocjenjivanje u daljem statističkom radu. Da bi grupisanje podataka bilo ispravno treba se držati osnovnih pravila grupisanja: sveobuhvatnost, sistematičnost i određenost. Sve jedinice statističkog skupa moraju biti obuhvaćene grupisanjem. Raspored jedinica posmatranja unutar skupina (grupa) dobijenih grupisanjem kao i skupina unutar cjeline, tj. statističkog skupa, treba da bude povezan u skladan (logički ili numerički) sistem. Homogenost je maksimalno izražena unutar skupina dobijenih grupisanjem, a odnos samih skupina među sobom mora da dopušta kvalitativnu i kvantitativnu diferencijaciju, ako je grupisanje pravilno izvedeno. Grupisanje je metoda razvrstavanja jedinica posmatranja statističkog skupa u grupe ili grupne intervale. Svrstavanje jedinica posmatranja u grupe odnosno

24 grupne intervale je saglasno specifičnostima karakteristika jedinica posmatranja odnosno obilježjima. Jedinice posmatranja koje su nosioci numeričkih kontinuiranih obilježja razvrstavaju se u grupne intervale gradacija ovog obilježja. Pri formiranju grupnih intervala potrebno je držati se osnovnih pravila i redosljeda. Prvi korak je utvrđivanje minimalne i maksimalne vrijednosti empirijskih podataka da bi sve vrijednosti statističkog skupa bile obuhvaćene grupisanjem. Nadalje, praveći razliku maksimalne i minimalne vrijednosti utvrdi se koliki je raspon vrijednosti jedinica posmatranja. Na osnovu izračunatog raspona i prirode ispitivane pojave utvrđuje se širina grupnog intervala. Ukoliko je manji broj grupnih intervala, tj. ukoliko su intervali veći dobija se u preglednosti, ali se gubi u informaciji i obratno. Rješenje je kompromis i treba omogućiti solidnu preglednost i dovoljno dobru informaciju. No bez obzira na njihov broj, potrebno je da grupni intervali budu jednake širine da bi bili međusobno usporedivi. Kada se odrede ekstremne vrijednosti i odredi širina grupnog intervala prelazi se na određivanje granica intervala. Svaki interval razumljivo ima dvije granice, donju i gornju. Donja granica prvog intervala, koja obavezno mora da sadrži minimalnu empirijsku vrijednost, treba da bude broj koji je djeljiv sa širinom intervala. Na primjer, ako je širina grupnog intervala tri mjerne jedinice donja granica prvog intervala mora biti djeljiva sa tri, ili ako je širina grupnog intervala 5 mjernih jedinica donja granica prvog intervala biće broj koji se završava sa 5 ili nulom, itd. Opšte pravilo je da donja granica prvog intervala bez obzira na širinu intervala može da počne nulom. Granice intervala moraju biti jasno razgraničene. Donja granica aktuelnog intervala mora biti za jedinicu mjere veća od gornje granice prethodnog intervala. Gornja granica posljednjeg intervala određuje se sa istom tačnošću sa kojom su vršena mjerenja. Na primjer, ako su empirijski podaci dati u cijelim brojevima jedinice mjere i širina intervala će se formirati sa cijelim brojevima odnosno ako su empirijske vrijednosti mjerene sa jednom, dvije ili tri decimale mjerne jedinice i širina intervala biće određena sa jednom, dvije ili tri mjerne jedinica respektivno. Primjer 1. Trajanje kompletne remisije kod 35 bolesnika od ANL (akutne nelimfoblastne leukemije) iznosilo je 1, 5, 10, 3, 11, 4, 14, 14, 6, 14, 9, 3, 4, 17, 9, 3, 38,, 8, 1, 3, 6, 4, 34, 1, 1, 6, 3, 5, 10, 11, 3, 1, 7 i 6 mjeseci. Grupisati date podatke. 4

25 Problem rješavamo tako da formiramo radnu tabelu u kojoj je prva kolona interval (dužina remisije), druga kolona pojedinačan način zapisivanja podataka o svakom slučaju, a treća kolona učestalost podataka u intervalu (frekvencija). Tabela..1.1.a: Grupisanje prema dužini remisije grupisanje sa širinom intervala od 6 mjeseci Dužina remisije Broj bolesnika (f) 0 6 ///// ///// //// ///// ///// ///// // 5 30 / // 37 4 / 1 Ukupno Tabela..1.1.b: Grupisanje prema dužini remisije grupisanje sa širinom intervala od 10 mjeseci Dužina remisije Broj bolesnika (f) 0 10 ///// ///// ///// ///// ///// //// /// /// 3 Ukupno Tabela..1.1.c: Grupisanje prema dužini remisije grupisanje sa širinom intervala od 5 mjeseci Dužina remisije Broj bolesnika (f) 0 5 ///// ///// / ///// /// ///// /// / // 6 30 / // / 1 Ukupno Granice intervala date su cijelim brojem što je u saglasnosti sa empirijskim podacima. Minimalna vrijednost je 1, maksimalna 38, raspon 37 mjeseci, a širina grupnog intervala 6 mjeseci. Donja granica prvog intervala počinje 5

26 nulom. Kod sva tri slučaja grupisanja postupak je ispravan, ali se postavlja pitanje koju širinu intervala odabrati. Kad su u pitanju jedinice posmatranja koje podliježu dekadskom zakonu prirodno je odabrati interval koji odgovara dekadskoj mjeri, dok vrijeme treba uzimati sa intervalima vremenskih jedinica itd. Primjer. Grupisati vrijednosti hemoglobina 10 zdravih osoba: 150,5-170, - 130,8-160, - 10,3-160,5-150,7-160,7-140, gr/l. Tabela..1.: Grupisanje hemoglobina grupisanje sa širinom intervala od 0 gr/l. Hemoglobin Broj osoba (f) 10,0-130,9 // 140,0-150,9 /// 3 160,0-170,9 ///// 5 Ukupno U primjeru, empirijski podaci dati su sa tačnošću od jedne decimale pa su i granice intervala čija širina iznosi 0 gr/l utvrđene sa tačnošću jedne decimale. Ova širina intervala određena je na osnovu širine raspona od 49,9 gr/l. Donja granica prvog intervala počinje vrijednošću manjom od minimalne empirijske vrijednosti (10,3 gr/l), koja je djeljiva sa tj. širinom intervala. Broj intervala određen je tako da posljednji treći interval obuhvata maksimalnu empirijsku vrijednost (170, gr/l). Jedinice posmatranja koje su nosioci numeričkih diskontinuiranih obilježja razvrstavaju se u grupne intervale ili grupne gradacije numeričkog diskontinuiranog obilježja. Kada diskontinuirano numeričko obilježje ima veliki raspon vrijednosti, jedinice posmatranja se svrstavaju u grupne intervale (primjer 3). Primjer 3. Grupisati vrijednosti eritrocita 0 zdravih osoba. Vrijednosti iznose: 4,15-4,50-4,580-4,345-4,680-4,080-4,460 4,90-4,830-4,950-4,60-4,390-4,690-4,45 5,050-4,680-4,750-4,790-4,50-4,490 x 10 1 /1. 6

27 Tabela..1.3: Grupisanje eritrocita grupisanje diskontinuiranog numeričkog obilježja sa širinom intervala od 0,0 x 10 1 /l. Broj eritrocita Broj osoba (f) 4,00-4,19 // 4,0-4,39 //// 4 4,40-4,59 ///// 5 4,60-4,79 ///// / 6 4,80-4,99 // 5,00-5,19 / 1 Ukupno Grupni intervali numeričkog diskontinuiranog obilježja dati su uvijek cijelim brojevima jer ovo obilježje može da uzima samo cijele vrijednosti iz brojnog intervala u kome varira. Ukoliko numeričko diskontinuirano obilježje ima mali broj vrijednosti tj. mali raspon, jedinice posmatranja razvrstavaju se u grupe koje odgovaraju pojedinim vrijednostima obilježja (primjer 4). Primjer 4. Grupisati podatke prema broju spontanih pobačaja 50 slučajno izabranih ginekoloških pacijentica: 0, 0, 0, 1, 0, 0,, 0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1,, 0, 0, 0, 1, 0, 0, 0,, 0, 0, 3, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0. Tabela..1.4: Grupisanje spontanih pobačaja grupisanje diskontinuiranog numeričkog obilježja sa malim brojem vrijednosti širina interval ne postoji, postoje grupe čiji broj odgovara broju modaliteta (pobačaja) Broj pobačaja Broj pacijentica (f) ///// ///// ///// ///// 0 ///// ///// ///// /// 38 1 ///// /// 8 /// 3 3 / 1 Ukupno

28 Ako su jedinice posmatranja nosioci atributivnih obilježja razvrstavaju se u grupe koje su u skladu sa kvlitativnom diferencijacijom obilježja. Ove grupe odgovaraju kategorijama odnosno vidovima atributivnog obilježja (primjer 5). Primjer 5. Celularni imunitet kod 8 bolesnika od reumatiodnog artritisa ispitivan je kožnim testovima sa antigenima PPD, SK-SD (streptokinaza, streptodornaza) i DM-O (Dermatofitin-0). Prikazati broj pozitivnih reakcija u zavisnosti od vrste testa. Pozitivna reakcija je infiltrat veći od 5/5 mm. Rezultati testova su: PPD: 100/100, 0, 1/15, 15/10, 10/10, 10/10, 0/0, 15/15 mm. SK-SD: 100/10, 10/10, 10/10, 0, 0, 0, 0, 0/15 mm. DM-0: 0, 0, 5/5, 0, 5/5, 30/5, 7/7, 10/10 mm. Tabela..1.5: Grupisanje celularnog imuniteta prema vristi pozitivnih reakcija na pojedine testove broj grupa odgovara broju testova Broj pozitivnih Vrsta tijela reakcija (f) PPD ///// // 7 SK SD //// 4 DM D ///// 5 Ukupno 16 Razvrstavanje jedinica posmatranja u grupe ili grupne intervale izvršeno je pomoću crtica po sistemu jedna horizontalna na četiri vertikalne. Ovakav način razvrstavanja jedinica posmatranja (prikazan kroz primjere 1-5) je najjednostavniji ali i najmanje pouzdan i pogodan način sortiranja podataka. Primjenjiv je samo u slučaju malog statističkog skupa. Ukoliko je broj jedinica posmatranja veliki pogodniji su drugi načini ručnog ili mašinskog (računarskog) sortiranja. Broj jedinica posmatranja koje odgovaraju jednom kvalitetu, u vidu atributivnog obeležja, zove se učestalost odnosno frekvencija i obilježava se simbolom f. Apsolutna frekvencija je rezultat objektivnog posmatranja, brojenja ili mjerenja empiriskih podataka. Ona se izražava u mjernim jedinicama empiriskih vrijednosti. Ako se apsolutna frekvencija jednog vida atributivnog obilježja ili jednog iznosa numeričkog obilježja stavi u odnos prema ukupnom broju jedinica statističkog skupa dobija se relativna frekvencija. Ona se izražava u vidu decimalnog broja ili češće procenta. I apsolutna i relativna frekvencija mogu biti kumulativne. Kumulativne 8

29 9 frekvencije predstavljaju sukcesivne zbirove frekvencija pojedinih grupa odnosno grupnih intervala. Ako je u pitanju numeričko obilježje kumulisanje može početi od grupe ili grupnog intervala sa najnižim ili pak s najvišim vrijednostima obilježja (rastuća i opadajuća kumulativna funkcija). Kod atributivnog obilježja kumulisanje se vrši po logičkom sistemu progresije tog obilježja. Bez obzira na početak kumulisanja, frekvencija svake sukcesivne grupe ili grupnog intervala dodaje se prethodnim tako da je posljednja kumulativna frekvencija jednaka sumi svih frekvencija. Primjer 6. Distribucije frekvencija umiranja 17 bolesnika od aplastične anemije u periodu od šest mjeseci. Tabela..1.6: Distribucija frekvencija (učestalosti) umiranja bolesnika od aplastične anemije Apsolutne frekvencije Relativne frekvencije Mjeseci Pojedinačne Kumulativne Pojedinačne Kumulativne 0,0 1, ,35 0,35 1,1, ,353 0,588,1 3, ,176 0,764 3,1-4,0 15 0,118 0,88 4,1-5, ,059 0,941 5,1-6, ,059 1 Ukupno: 17 / 1 / Prikaz raspoređivanja jedinica posmatranja statističkog skupa po grupama ili grupnim intervala obilježja naziva se distribucija frekvencija odnosno raspodjela učestalosti. Distribucija frekvencija omogućuje sagledavanje strukture ispitivane pojave uspoređivanjem frekvencija pojedinih grupa ili grupnih intervala kao dijelova pojave sa cjelinom tj. ukupnim brojem jedinica posmatranja statističkog skupa. Nizovi jedinica posmatranja statističkog skupa sređeni u grupe ili grupne intervale obilježja nazivaju se statističkim serijama. S obzirom na vrstu obilježja razlikujemo atributivne i numeričke statističke serije. Ako su jedinice posmatranja uređene u odnosu na numeričko obilježje u pitanju su numeričke variacione serije. Posebne vrste statističkih serija su vremenske i prostorne statističke serije. Vremenske serije, koje su formirane po obilježju vremena bilo da je ono izraženo u numeričkoj ili atributivnoj formi, bitne su za ispitivanje dinamike pojave. Prostorne statističke serije, nastale kao rezultat uređivanja jedinica posmatranja statističkog skupa po obilježju prostora, koriste u upoznavanju prostorne distribucije frekvencija.

30 ... Tabelarno prikazivanje statističkih podataka Svrha prikazivanja statističkih podataka je brz i lak uvid u rezultate prikupljanja i grupisanja u cilju publikovanja ili dalje statističke obrade (deskripcije i analize). Statistički podaci prikazuju se u tabelarnoj i grafičkoj formi. Tabeliranje je pregledno prikazivanje, prethodno grupisanih podataka, tabelom. Statistička tabela mora sadržavati naslov, redni broj, šemu i izvore podataka. Naslov tabele sastoji se od tačnog i detaljnog opisa predmeta, mjesta i vremena ispitivanja (odnosno registrovanja podataka i izvora podataka). Redni broj tabele obično se nalazi između naslova i šeme tabele. Šema tabele mora biti po obliku maksimalno prilagođena sadržaju tabele. Ona ima oblik pravougaonika ili kvadrata izdijeljenog horizontalnim ili vertikalnim linijama na manja polja koja se nazivaju ćelije (cells). Vertikalni nizovi ćelija čine kolone, a horizontalni redove. Šematski dio tabele sastoji se od pretkolone, zaglavlja, srca tabele i zbirnih ćelija. Predkolonu sačinjava prva kolona, a zaglavlje prvi dio ćelija. Predkolonom i zaglavljem dat je tačan opis obilježja i njegovih grupa, odnosno one sačinjavaju opisni dio šeme. Numerisani redovi i kolone rubrika, koji čine srce tabele i mogu se u cilju isticanja odvojiti od ostalog dijela tabele debljom ili dvostrukom linijom, sadrže konkretne numeričke podatke. Zbirne ćelije, odnosno ćelije u kojima su rezultati sumiranja podataka iz srca tabele zauzimaju posljednji red i posljednju kolonu tabele. One moraju biti označene različitim izrazima (npr. ukupno i svega). Što se tiče izvora podataka uobičajeno je da se oni navode ispod šeme tabele. Na narednoj slici dat je izgled tabele koja se dobija iz Excela. Na njoj je prikazan prostor za tabelu u užem smislu (veliki pravougaonik) i prostor za opis tabele sa šest malih pravougaonika. Rezervisani prostor za opis tabele dijeli se na zaglavlje (header) i podnožje (footer), a svaki od njih ima tri mogućnosti za opis tabele (lijevi, centralni i desni pravougaonik). 30

31 Zaglavlje: Lijevi dio Zaglavlje: Centralni dio Zaglavlje: Desni dio Tabela: Radni dio Podnožje: Lijevi dio Podnožje: Centralni dio Podnožje: Desni dio Slika...1: Izgled tabele dobijene iz Excela Na narednom prikazu daje se tradicionalni način izrade tabele. Tabela...1: Klasičan izgled tabele može se praviti ručno ili pomoću računara (uobičajen izgled do pojave sprerad sheet alata (Excel i sl.) Naziv tabele Naziv institucije Tabela br. ZAGLAVLJE Zbir po redovima Redni broj kolone Red Predkolona Rubrika Zbir po kolonama Ukupan zbir Izvor podataka Potpis Redni broj reda Primjer 1. Kolona Kod dvadeset slučajno izabranih bolesnika hematološkog odjeljenja Interne klinike pregledom krvi utvrđeno je sljedeće pripadništvo krvnim grupam AB0 i Rh sistema: od 14 Rh pozitivnih 5 bolesnika imalo je 0, 3 A, 4 B i AB grupu, a od 6 Rh negativnih krvnu grupu 0 imalo je, A, B 1 i AB 1 bolesnik. Dobijene rezultate prikazati tabelom. 31

32 Tabela...: Distribucija bolesnika hematološkog odeljenja Interne klinike po krvnim grupama. Redni Krvne grupe Rh broj 0 A B AB Ukupno Pozitivni Negativni Svega Kod klasičnih tabela uobičajeno je da se formira drugi red odozgo (0, 1,, 3, 4, 5, 6) koji iznačava redni broj kolone, a služi(o je) kao skraćeno zaglavlje za prenos (nastavak) tabele na sljedeću stranu. Kod tabela urađenih pomoću softverskih alata, takva vrsta označavanja zaglavlja nije uobičajena. Da bi ispunila svoj zadatak tabela mora da bude: a) Pregledna, tj. ne smije da bude suviše opširna, odnosno mora da ima ograničen broj redova i kolona; b) Jasna i razumljiva, odnosno oznake u predkoloni i zaglavlju moraju biti precizne i detaljne; Treba izbjegavati skraćenice. Ako su skraćenice neizbježne potrebno je da budu tipične i međunarodno prihvaćene. Kod netipičnih skraćenica, neposredno ispod tabele, potrebno je napraviti legendu u kojoj se objašnjavaju skraćenice; v) Potpuna, što znači da svaka ćelija mora biti popunjena bilo brojem ili odgovarajućim znakom u slučaju kada broj nedostaje iz bilo kojih razloga. Ako se upotrebljavaju znakovi koji nisu standardizovani potrebno ih je u legendi dodatno objasniti; g) Tehnički dobra i pravilna, što znači da mora biti po obliku, veličini rubrika i njihovom odnosu prilagođena sadržaju tj. veličini brojeva, znakova i opisa. Tabele se prema sadržaju dijele u dvije grupe. Prvu grupu čine prosta i složena tabela. Proste tabele su one koje sadrže samo jednu statističku seriju, a složene dvije ili više statističkih serija. Prema tome prva podjela izvršena je u odnosu na broj statističkih serija za razliku od druge gde je kao osnov za klasifikovanje uzet broj i raščlanjenost obilježja. Drugu grupu tabela čine elementarne i kombinovane tabele. Ukoliko je tabelom prikazano jedno raščlanjeno obilježje, takvu tabelu nazivamo elementarnom. Kombinovane tabele sadrže podatke koje se odnose sa dva ili više raščlanjenih obilježja. S obzirom na ulogu koju imaju u statističkim istraživanjima tabele dijelimo na obradne, analitičke i publikacione. Svaka od njih je po obliku i sadržaju 3

33 prilagođena svrsi. Za razliku od obradnih i velike većine publikacionih tabela koje sadrže uglavnom apsolutne brojeve, analitičke tabele sadrže gotovo sve vrste statističkih parametara (relativne brojeve, srednje vrijednosti, mjere varijabiliteta itd.). Primjer. Za date pojedinačne podatke, prikazati distribuciju bolesnica sa primarnim karcinomom grlića materice po stadijumima bolesti na početku liječenja. Tabela...3: Distribucija bolesnica sa primarnim karcinomom grlića materince po stadijumima bolesti na početku liječenja Broj Red. br. Stadijum bolesnica Prvi 5 Drugi 90 3 Treći 87 4 Četvrti - 5 Ukupno 18 Tabela sadrži jednu statističku seriju pa prema tome pripada grupi prostih tabela. Istovremeno ona je i elementarna tabela jer je obeležje (oboljenje) raščlanjeno u grupe (stadijumi). Primjer 3. Tabela...4: Distribucija oboljenja studenata registrovana u Zavodu za mentalno zdravlje u Beogradu u periodima 1968/71. i 197/75. godine. Redni broj Dijagnoza Period Prvi Drugi Ukupno Neuroze Psihoze Psihosomatski poremećaji Epilepsija Druge dijagnoze Svega Tabela sadrži više statističkih serija (3) i pripada složenim tabelama. Međutim, kako sadrži podatke koji se odnose na više raščlanjenih obilježja () ujedno je i kombinovana tabela. 33

34 ..3. Grafičko prikazivanje statističkih podataka Statističke tabele, ma kako precizno i pravilno sastvaljene ipak zahtjevaju dosta vremena i pažnje za tumačenje odnosno uočavanje onoga što je bitno. Mnogo lakše i brže se uočavaju rezultati grupisanja pomoću grafičkog prikazivanja. Grafičko prikazivanje je metod prikazivanja grupisanih i tabelarnih podataka u vizuelnoj formi. Značaj upotrebe grafičkih prikaza u statističkim istraživanjima objašnjava se činjenicom da je uspoređivanje veličina pomoću slika jasnije nego pomoću brojki. Slika upadljivije ističe razlike u veličinama i oblike raznih odnosa. Međutim, mora se posebno naglasiti da se crtežom ne može zamijeniti tabela već da crtež ilustruje tabelu. Grafički prikaz samo je veoma korisna dopuna - pomoćno sredstvo koje služi da se u cjelini sagleda posmatrana pojava dok se njeni unutrašnji odnosi mogu vidjeti samo iz statističke tabele koja sadrži osnovne podatke. Grafičke prikaze dijelimo u dvije velike grupe prema tome da li se statistički podaci prikazuju oznakama i simbolima ili geometrijskim oblicima. U prvu grupu spadaju kartogrami i simbolički crteži. U drugu grupu spadaju dijagrami. Ukoliko se statistički podaci prikazuju u geometrijskim oblicima, takve grafičke prikaze nazivamo dijagramima. Dijagrami, kao geometrijski oblici izražavanja statističkih veličina imaju šire i raznovrsnije mogućnosti prikazivanja. Veličine se mogu uspoređivati pomoću tački (kota), linija (dužina), površina i tijela. U odnosu na način prikazivanja razlikujemo sljedeće grupe dijagrama: tačkaste, linijske, površinske i prostorne. Tačkasti (korelacioni), odnosno dijagram rasturanja opisan je u poglavlju o korelaciji. Linijski dijagram ima samo jednu dimenziju i uspoređivanje pomoću dužina može da obuhvati samo vrijednosti, odnosno frekvencije jednog obilježja. U grupu linijskih dijagrama ubrajamo sljedeće: - poligon frekvencija, - kriva frekvencija, - vremenski linijski dijagram, - štapićasti dijagram, - kumulativni (integralni) dijagram, - polarni dijagram. 34

35 Površinski dijagrami pružaju šire mogućnosti uspoređivanja. Njima uspoređujemo dvije dimenzije. Veličina pojave izražena je srazmjerno velikom površinom (npr. dva puta brojnija pojava prikazana je dva puta većom površinom). U ovu grupu ubrajamo sljedeće dijagrame: - stubičasti dijagram, - histogram frekvencija, - kružni dijagram. Najzad, stereogrami, odnosno prostorni dijagrami treba da pruže najšire mogućnosti uspoređivanja jer su izraženi sa tri dimenzije. Međutim, uočavanje odnosa prikazanih u tri dimenzije je komplikovano, odnosno ispravan način prikazivanja nije dovoljno impresivan. Na primjer, iako je kocka B dva puta, po zapremini, veća od kocke A neostavlja taj utisak na gledaoce. A B Slika..3.1: Prikaz pomoću stereorama: kocka B dva puta veća od kocke A Ako je ipak, iz nekog razloga, potrebno trodimenzinalno prikazivanje, tada se najbolji način kojim se izbjegava pomenuti nedostatak sastoji u tome da se različite vrijednosti prikažu sabiranjem jednakih zapreminskih jedinica. Na primjer, ako je pojava A tri puta veća od pojave B prva će se prikazati jednom kockom, a druga sa tri kocke jednake među sobom i istovjetne sa kockom koja prikazuje veličinu pojave A. A B Slika..3.: Prikaz pomoću stereorama: stereoram B tri puta veća od stereorma A prikladniji prikaz 35

36 Zbog navedenih razloga stereogrami se manje upotrebljavaju u statističkim istraživanjima. Dijagrami, grafički prikazi pomoću geometrijskih oblika, konstruišu se u sljedećim sistemima: pravouglom, polarnom i ugaonom. Pravougli koordinatni sistem naziva se još kartezijanski ili dekartov po svom autoru, francuskom matematičaru i filozofu Rene Dekartu. Osnov ovog sistema čine dvije prave koje se sijeku pod uglom od 90 stepeni i postavljaju se tako da jedna bude horizontalna, a druga vertikalna. Horizontalna prava zove se apcisna osa ili x osa, a vertikalna ordinatna osa ili y osa. Kako su to brojne ose, one obavezno moraju biti označene strelicama. Presjek osa sačinjava koordinatni početak i on se označava 0. Na ove dvije ose prenose se skale ispitivanih jedinica posmatranja i to tako da počevši od 0 pa desno na apcisnoj osi (horizontalna osa) imamo pozitivne, a lijevo negativne vrijednosti, dok su na ordinatnoj osi (vertikalna osa) pozitivne vrijednosti iznad, a negativne ispod nule (apscisne ose). Ravan dekartovog koordinatnog sistema tako je podijeljena na četiri dijela koji se zovu kvadranti i koji su počev od pozitivnog smjera x ose, suprotno kretanju kazaljke na satu označeni redom kao I, II, III, IV kvadrant. Slika..3.3: Pravougli koordinatni sistem Položaj tačke u ravni ovog sistema određuje se rastojanjem tačke od apcisne i ordinatne ose. Mjerni broj rastojanja neke tačke od ordinatne ose naziva se apcisa te tačke i obilježava se sa x, a mjerni broj rastojanja od apcisne ose zove se ordinata te tačke i obilježava se sa y. Apcisa i ordinata tačke zajedno 36

37 su njene koordinate. Na primjer koordinate tačke A na slici su i 3 što se bilježi A (,3). One imaju pozitivne vrijednosti jer se nalaze u prvom kvadrantu. Tačka B(-3,5) koja se nalazi u drugom kvadrantu ima negativnu apcisu, dok je ordinata pozitivna. Prikazivanje statističkih podataka u kartezijanskom sistemu dobija različite oblike (razbacane tačke, isprekidane linije, pojedinačne dužine ili površine u raznim odnosima). U pravouglom koordinatnom sistemu konstruišu se sljedeći dijagrami: dijagram rasturanja, poligon, kriva i histogram frekvencija, vremenski linijski dijagram, kumulativni dijagram i štapićasti dijagram. Polarni koordinatni sistem dobio je ime po tome što prikazuje podatke po polupravama koje idu iz jednog centra (pola) zrakasto u sve pravce. R R 1 POLARNA OSA Slika..3.4: Polarni koordinatni sistem Kako su ove poluprave brojne ose, one se obavezno obilježavaju strelicama i nazivaju se radijusi. Radijus na kome se nalazi mjerna skala obično polazi od pola horizontalno na desno i zove se polarna osa. Rastojanje od pola (dužina radijusa) predstavlja prvu ordinatu neke tačke. Ona se obilježava sa R. Druga ordinata je ugao koji taj radijus zaklapa sa polarnom osom, odnosno ugao između dva radijusa. Ovaj ugao koji se naziva polarnim uglom obilježava se sa alfa. Ugao alfa još se naziva i uglom azimuta po ugledu na geografski polarni sistem. Položaj tačke u polarnom koordinatnom sistemu prema tome određen je dužinom radijusa i polarnim uglom. U polarnom koordinatnom sistemu konstruiše se polarni dijagram. 37

38 Ugaoni koordinatni sistem omogućuje da se vrijednosti obilježja prikazuju veličinom ugla alfa koji zaklapaju dva proizvoljna poluprečnika (r). U ovom sistem konstruiše se kružni dijagram. r r Slika..3.5: Kružni koordinatni sistem Na brojne ose koordinatnog sistema mogu se nanositi različite mjerne skale. Najčešće su u upotrebi aritmetička i logaritamska skala. Aritmetička skala se karakteriše istovjetnim jediničnim dužinama na brojnoj osi koje odgovaraju istim razlikama u veličini pojave. Na primer, razmak između 3 i 4 isti je kao i razmak između 5 i 6 ili pak razmak između 10 i 15 jednak je razmaku od 0 i 5 itd. Logaritamska skala za razliku od aritmetičke nema iste razmake na brojnoj osi, već su one u nekom odnosu (u nekoj razmjeri, logaritamskoj) pa prema tome ne odgovaraju istim razlikama u veličini pojave. Na primjer razmak od 1 do 10 je isti kao i onaj od 10 do 100 i od 100 do 1000 ili je odnos takav da je razmak od do 4 isti kao od 4 do 8, od 8 do 16, itd. U zavisnosti od vrste mjerne skale sa brojnim osama dobijaju se različiti koordinatni sistemi, ali i različiti papiri za grafičko prikazivanje. Ako je na obe brojne ose nanesena skala sa aritmetičkom podjelom u milimetrima dobija se milimetarski koordinatni sistem i papir. Logaritamski koordinatni system i papir je onaj koji na obima osama ima logaritamsku skalu, a semiliogaritmski koordinatni sistem i papir je onaj kod kojeg je jedna brojna osa razmjerena po aritmetičkoj, a druga po logaritamskoj skali. Pri izboru mjerne skale brojnih osa treba voditi računa o tome šta se prikazuje (tj. kakve vrste i u kakvom odnosu su empirijski podaci) i kakva se analiza želi. Bez obzira na vrstu sistema i dijagrama, pravilno odabranih i obilježenih, pri grafičkom prikazivanju moraju se poštovati neki osnovni zajednički principi. Treba izbjegavati da se na jednom grafikonu ucrtava više linija ako se time gubi osnovna funkcija grafičkog prikazivanja, mogućnost uspoređivanja i praćenja kretanja prikazanih pojava. Pri konstrukciji grafikona mora se 38

39 voditi računa o izboru razmjere, jer se može steći različit pa i pogrešan utisak. Zato se pri čitanju grafikona zaključak donosi tek kad se usporede razmjere vrijednosti skala. Kada je riječ o razmjerama moramo napomenuti da razmjeru na y osi pravouglog koordinatnog sistema određuje najveća frekvencija i da ona po nepisanom pravilu iznosi 3/4 x ose (y=3/4 x). Da bi ispunili pravilo da u koordinatnom sistemu mjerne jedinice idu od koordinatnog početka, tj. od nule, u slučaju kad imamo disproporciju veličina, moramo prekinuti jednu ili obe ose (zavisno od podataka) nekim od uobičajenih znakova (na primjer: ). Da bi grafikoni bili pregledni u slučaju kada se unose vrijednosti na grafikon moraju se poštovati pravila da se one unose u prostor koji je pogodan...4. Dijagrami Izbor grafikona zavisi od vrste obilježja, prirode pojave i cilja istraživanja. Ovdje ćemo se usmjeriti na određivanje grafikona kroz primjere. Histogram frekvencija Histogram frekvencija se koristi za prikazivanje stanja distribucije frekvencija jednog numeričkog kontinuiranog obeležja. Histogram pripada grupi površinskih dijagrama koji se konstruišu u pravouglom koordinatnom sistemu tako što se na apcisnu osu nanose grupni intervali, a na ordinatnu osu broj slučajeva u svakom intervalu, tj. frekvencija. S obzirom da se na y osu nanosi frekvencija ona se može označiti i simbolom za frekvenciju (f). Histogram se dobija kada se nad grupnim intervalima konstruišu pravougaonici koji se međusobno dodiruju, a čije površine ili visine ako su grupni intervali jednake širine predstavljaju njihove frekvencije. 39

40 Primjer 1. Data je distribucija frekvencija 9 zdravih osoba u odnosu na nivo fibrinogena. Prikazati je grafički. Tabela..4.1: Distrubucija frekvencija zdravih osoba u odnosu na fibrinogen Broj Fibrinogen ispitanika (g/l) (f),00 -,49 4,50 -,99 3 3,00-3,49 7 3,50-3,99 4 4,00-4,49 6 4,50-4,99 5,00-5,49 5,50-5,99 1 Ukupno 9 Slika..4.1: Distrubucija frekvencija zdravih osoba u odnosu na fibrinogen Ako je potrebno naročito naglasiti frekvenciju, vrijednosti se upisuju iznad svakog pravougaonika. 40

41 Primjer. Prikazati histogramom frekvencija podatke o distribuciji bolesnika od ulkusa po godinama starosti. Tabela..4.: Distrubucija bolesnika od ulkusa u odnosu godine starosti Godine života Broj bolesnika (f) Ukupno 730 Slika..4.: Distrubucija bolesnika od ulkusa u odnosu godine starosti U prethodnom primjeru distribucija frekvencija data je sa jednakim intervalima tako da konstrukcija histograma frekvencija nije predstavljala problem. U ovom primjeru grupni intervali posmatranog obilježja (godine starosti nisu jednake širine). Da bi se konstruisao histogram frekvencija sa nejednakom širinom intervala potrebno je da se prvo frekvencije svedu na zajednički interval pa se tek onda tako transformisane frekvencije nanose na ordinatu. Postupak je sljedeći. Utvrde se širine grupnih intervala. U našem primjeru one iznose 5, 10, 15, 0 i 5 godina. Izabere se zajednički grupni interval. Za nas je to 5 godina (jer su svi intervali djeljivi sa 5). Dijeljenjem grupnih intervala sa jediničnim utvrđuje se koliko su puta oni veći od jediničnog intervala. Mi smo dobili sljedeće vrijednosti 1,, 3, 4 i 1. Nadalje, empirijska frekvencija umanjuje se sada za onoliko koliko su puta jedinični intervali manji od grupnih intervala (60:1-100: - 10:3-30:4-40:1). 41

42 Konačni rezultati su sljedeći iznosi frekvencija: 60, 50, 70, 80 i 40. One predstavljaju nove ordinate. Da bi konstrukcija ovog dijagrama do kraja bila ispravna treba obratiti pažnju koliko se jediničnih dužina nanosi na apcisnu osu za svaki grupni interval. Histogram frekvencija je vrlo precizan u prikazivanju distribucije frekvencija numeričkih kontinuiranih obilježja. Međutim, ovaj dijagram ima i jedan nedostatak. Histogram frekvencija nije pogodan kada treba vršiti grafička poređenja. U ovom slučaju preglednost je smanjena. Poligon frekvencija Poligonom frekvencija se prikazuje stanje numeričkih, prekidnih i neprekidnih obilježja. On pripada grupi linijskih dijagrama. Konstruiše se u pravouglom koordinatnom sistemu na taj način da se grupni intervali, odnosno grupe obilježja nanose na apcisnu osu, a frekvencije, odnosno broj slučajeva u klasnom intervalu ili grupi, na ordinatnu osu. Poligon se dobija tako da se iz sredine grupnih intervala ili iz grupa dižu ordinate na koje se nanose odgovarajuće frekvencije koje se označavaju nekim znakom (tačka, kružić, zvjezdica). Spajajući oznake na ordinatama pravom linijom dobija se izlomljena, poligonalna linija. Primjer 1. Ispitivan je nivo antihemofilnog globulina (AHG, VIII faktor koagulacije) kod 9 bolesnika od prave hemofilije (hemofilija A). Dobijenu distribuciju prikazati pomoću poligona frekvencije. Tabela..4.3: Distrubucija bolesnika od hemofilije A u odnosu na nivo antihemofilnog globulina AHG - A (%) Broj bolesnika 0,5-0,9 3 1,0-1,4 1,5-1,9,0 -,4 1,5 -,9 1 Ukupno 9 4

43 Slika..4.3: Distrubucija bolesnika od ulkusa u odnosu godine starosti Pri konstrukciji ovog dijagrama ordinate se nanose na vertikale dignute iz sredine intervala jer na taj način moguća greška najmanje dolazi do izražaja. Poligonalna linija, nikada se ne spaja sa apcisnom osom. Ukoliko se vrijednosti frekvencija upisuju u poligonalnu liniju to se čini uvijek, radi preglednosti, u prostoru većeg ugla. Pri konstrukciji poligona frekvencija za numerička kontinuirana obilježja čija je distribucija prikazana sa nejednakim grupnim intervalima važe pravila kao i za konstrukciju histograma frekvencija pod istim uslovima. Primjer. Ispitivanjem hromozoma u koštanoj srži bolesnika koji se nalazi u fazi blastne transformacije hronične mijeloidne leukemije (HML) nađeno je da od ukupno 40 ispitanih ćelija koštane srži ima 83 sa klona, 73 sa 3 klona i 84 sa 4 klona. Prikazati nađene rezultate poligonom frekvencija. Tabela..4.4: Distrubucija ćelija bolesnika u odnosu na broj klona Broj kolona Broj ćelija Ukupno 40 43

44 Slika..4.4: Distrubucija ćelija bolesnika u odnosu na broj klona Ovdje se radi o numeričkom prekidnom obilježju (broj klona) pa ordinate dižemo direktno iz grupe. Primjer 3. Usporediti grafički distribuciju frekvencija bolesnika sa peptičkim ulkusom (gastričnim i duodenalnim) u odnosu na nivo vrijednosti serumskog gastrina (pg/ml). Tabela..4.5: Distrubucija bolesnika sa ulkusom u odnosu na nivo serumskog gastrina Serumski gastrin (pg/ml) Ulkus duodeni Ulkus ventrikuli Ukupno

45 Slika..4.5: Distrubucija bolesnika sa ulkusom u odnosu na nivo serumskog gastrina Kako je u pitanju numeričko kontinuirano obilježje grafički se može histogramom ili poligonom frekvencija. S obzirom da je potrebno vršiti poređenje pogodniji je poligon frekvencija jer daje pregledniju sliku. Ukupan broj frekvencija je isti pa se upoređivanje može izvršiti sa apsolutnim vrijednostima. Da ukupan broj jedinica posmatranja nije jednak morale bi se najprije obe grupe svesti na zajedničku osnovu, odnosno izračunati procentni iznos frekvencija, pa tek onda izvršiti grafičko poređenje. Uz svaki dijagram na kome se prikazuje poređenje neophodno je oformiti legendu koja objašnjava crtež. Primjer 4. Prikazati grafički distribuciju frekvencija ćelija (%) po stadijumima sazrijevanja granulocitne loze u normalnim uslovima. Tabela..4.6: Distrubucija ćelija u odnosu na stadijum sazrijevanja granulocitne loze Stepen sazrijevanja Ćelije (%) Mijeloblasti 8 Promijelociti 13 Mijelociti 34 Metamijelociti 45 45

46 Slika..4.6: Distrubucija ćelija u odnosu na stadijum sazrijevanja granulocitne loze Iako je obilježje (stepen sazrijevanja) atributivne prirode mi smo datu distribuciju frekvencija prikazali poligonom frekvencija. Poligon frekvencija može se upotrebljavati za grafičko prikazivanje atributivnih obilježja samo u slučaju kada postoji usvojen, prirodni redosljed modaliteta toga obilježja kao u ovom primjeru. Kriva frekvencija Krivom frekvencija prikazuju se grafički isključivo kontinuirana obilježja. Pripada grupi linijskih dijagrama i konstruiše se u pravouglom koordinatnom sistemu na taj način što se vrijednosti obilježja u vidu grupnih intervala nanose na apcisnu osu a frekvencija na ordinantnu osu. Za razliku od histograma i poligona frekvencija kriva frekvencija je vrlo specifična, kako po svom izgledu tako i po smislu odnosno značenju. Ako se pri crtanju histograma ili poligona frekvencija na apcisnu osu nanose vrlo mali intervali obilježja, a pri tome je broj slučajeva svakog intervala vrlo veliki, umjesto izlomljene linije dobija se gusti niz tačaka čijim spajanjem se obrazuje pravilna i glatka kriva linija. Uz pretpostavku se da se broj slučajeva povećava do beskonačnosti, a obilježje posmatranja dijeli u sve manje grupne intervale do beskonačno malih (infinitezimalnih), tada se dobija kontinuirana, glatka, kriva linija koja se naziva se krivom frekvencija. 46

47 Y-Axis X-Axis Slika..4.7: Kriva frekvencija Ovaj dijagram u stvari je jedna teoretska linija maksimalno prilagođena empirijskim podacima. Matematičke metode prilagođavanja veoma su komplikovane, a osnove grafičkog prilagođavanja su već iznijete. Značaj krive frekvencija je dvostruk. Prvo, površine između bilo koje dvije koordinate srazmjerne su teoretskoj frekvenciji odgovarajućeg intervala vrijednosti obilježja. Drugo, za svaku vrijednost obilježja, znači i za vrijednosti koje nisu date empiriskim podacima, možemo utvrditi teoretsku frekvenciju. Način prikazivanja distribucija frekvencija krivom frekvencija od velike je važnosti za teoriju raspodjela. Kumulativni dijagram Kumulativnim dijagramom se prikazuju sukcesivni zbirovi vrijednosti obilježja. On pripada grupi linijskih dijagrama. Konstruiše se u pravouglom koordinatnom sistemu na taj način što se vrijednosti obilježja nanose na apscisnu osu a frekvencija na ordinantu osu. Kumulativni dijagram se dobije kada se ordinate iznad grupa (sredina grupnih intervala) povežu isprekidanom pravim linijom. Kod ovog dijagrama vrijednosti ordinata za svaki pojedini grupni interval ili grupu ne unosi se od početka, već od vrijednosti frekvencije prethodnog intervala. Na ovaj način vrijednost ordinate jednog intervala ili grupe sa frekvencijama prethodnog intervala odnosno grupe čini kumulativnu frekvenciju. 47

48 Spajanjem ovako dobijenih tačaka formira se izlomljena linija koja ravnomjerno raste ili opada prema frekvencijama sukcesivnih grupa ili grupnih intervala u zavisnosti od toga kako smo vršili kumulaciju. Primjer 5. Prikazati kumulativnim dijagramom distribuciju frekvencija umiranja 84 bolesnika sa akutnim infarktom miokarda u petogodišnjem periodu. Tabela..4.8: Distrubucija frekvencija umiranja bolesnika sa akutnim infoarktom miokarda u odnosu na godine Godine Broj Kumulativna umrlih frekvencija Ukupno 84 / Slika..4.8: Distrubucija frekvencija umiranja bolesnika sa akutnim infoarktom miokarda u odnosu na godine Vremenski linijski dijagram Vremenski linijski dijagram se upotrebljava za prikazivanje jedne ili više pojava u vremenu. Njime se prikazuju takozvane neciklične pojave. To su pojave čije se vrijednosti ne ponavljaju na isti način iz jednog u drugi vremenski period. Ovaj dijagram je posebno značajan zbog toga što omogućava prognoziranje daljeg toka posmatrane pojave. Pripada grupi linijskih dijagrama. Konstruiše se u pravouglom koordinatnom sistemu na taj način što se na apcisnu osu 48

49 nanosi jedinica vremena a na ordinatnu osu nanosi se frekvencija. Dijagram sa dobije tako što se ordinate iznad vremnske ose povežu razlomljenom pravom linijom. Primjer 6. Prosječne vrijednosti retikulocita, 5 bolesnika od perniciozne anemije lječenih heparonom ( 6 cm kubnih / 4 časa) iznosile su po danima terapije:, 5, 18, 30, 38, 47, 15, 8, 6, 3, 5, 4, 4, 4%. Prikazati grafički retikulocitnu krizu ovih bolesnika. Tabela..4.9: Distrubucija prosječnih vrijednosti retikulocita % po danima terapije Dani terapije Prosječna vrijednost retikulocita % I II 5 III 18 IV 30 V 38 VI 47 VII 15 VIII 8 IX 6 X 3 XI 5 XII 4 XIII 4 XIV 4 Ukupno 13,50 Slika..4.9: Distrubucija prosječnih vrijednosti retikulocita % po danima terapije 49

50 Štapićasti dijagram Štapićasti dijagram koristi se za prikazivanje stanja jednog prekidnog numeričkog obilježja. Pripada grupi linijskih dijagrama i konsturiše se u pravouglom koordinatnom sistemu na taj način što se grupe nanose na apcisnu osu, a frekvencija na ordinatnu osu. Dobija se tako što se u visini ordinate odgovarajuće grupe nacrta pravougaonik najmanje moguće širine (štapić). Primjer 7. Prikazati grafički distribuciju frekvencija 60 bolesnika od ANL (akutne nelifoblastne leukemije) po broju kura potrebnih za postizanje remisije. Tabela..4.10: Distrubucija bolesnika od akutne nelimfoblastne leukemije u odnosu na broj kura Broj kura Broj bolesnika Ukupno 60 Slika..4.10: Distrubucija bolesnika od akutne nelimfoblastne leukemije u odnosu na broj kura 50

51 Stubičasti dijagram Stubičasti dijagram se koristi za prikazivanje jednog ili više atributivnih obilježja. Pripada grupi površinskih dijagrama. Za razliku od ostalih dijagrama on ima samo jednu brojnu osu i ona obično odgovara ordinatnoj osi pravouglog koordinatnog sistema. Umjesto na apscisnu osu obilježje se nanosi na polupravu koja polazi od nule brojne ose i nema mjernu skalu. Kao takva ona služi isključivo kao podloga za crtanje i nije označena strelicom. Primjer 8. Prikazati grafički Besissovu megakariocitnu diferencijalnu formulu zdravih osoba. Tabela..4.11: Distrubucija megakariocita (%) u odnosu na stadijum sazrijevanja Stadijum sazrijevanja Megakariociti (%) I 6 II 1 III 73 Slika..4.11: Distrubucija megakariocita (%) u odnosu na stadijum sazrijevanja 51

52 Primjer 9. Aktivnost diaminooksidaze (DAO) u patološkim trudnoćama uporediti na istom dijagramu. Tabela..4.1: Distrubucija trudnica u odnosu na aktivnost diaminooksidaze u patološkim trudnoćama Dijagnoza Broj trudnica kod kojih je DAO Procenat trudnica kod kojih je DAO Smanjena Normalna RH Senzibilizacija Nefropatija gravidarum Hipertenzija areterijalis Ukupno Povišena Ukupno Smanjena Normalna Povišena Slika..4.1.a: Distrubucija trudnica u odnosu na aktivnost diaminooksidaze u patološkim trudnoćama Slika..4.1.b: Distrubucija trudnica u odnosu na aktivnost diaminooksidaze u patološkim trudnoćama 5

53 Broj trudnica sa smanjenom, normalnom ili povišenom aktivnošću DAO iz tri patološke trudnoće nije jednak, zato smo morali svedsti broj trudnica na zajedničku osnovu tj. izračunati frekvenciju u procentima pa tek onda vršiti grafičko poređenje stubičastim dijagramom. Kružni dijagram Kada treba grafički prikazati strukturu jedne pojave (odnos dijelova prema cjelini) upotrebljava se kružni dijagram. Kružni dijagram pripada grupi površinskih dijagrama. Površina cijelog kruga predstavlja pojavu u cjelini, a površine pojedinih isječaka dijelove te cjeline tj. pojave. Konstuiše se u ugaonom sistemu veličinom ugla alfa preko odnosa 100 % = 360 o tj. 1 % = 3,6 o. Primjer 10. Od opisa prvog abnormalnog hemoglobina HB-S (Pauling i dr god.) do danas otkriveno je 46 abnormalnih hemoglobina od kojih 7 alfa varijante, 13 beta varijante, 8 delta varijante, 11 gama varijante, 9 s delecijom jedne ili više aminokiselina, 7 produkti fuzije, 7 produkti elongacije. Prikazati grafički strukturu abnormalnih hemoglobina. Tabela..4.13: Distrubucija abnormalnih hemoglobina u odnosu na varijante Abnormalni hemoglobini Apsolutna frekvencija Procenti Stepeni Alfa 7 9,7 105,37 Beta 13 53,66 193,18 Delta 8 3,5 11,70 Gama 11 4,47 16,10 S delecijom 9 3,67 13,1 Produkti fuzije 7,84 10, Produkti elongacije 7,84 10, Ukupno ,00 360,00 53

54 Slika..4.13: Distrubucija abnormalnih hemoglobina u odnosu na varijante Primjer 11. Prikazati grafički strukturu elemenata čija se jedinjenja nalaze u živim organizmima ako se zna da plastičnih ima 13, katalitičkih 16 a rijetkih nestalnih 7. Tabela..4.14: Distrubucija elemenata u živim organizmima po vrstama Elementi Broj Procenti Plastični 13 36,11 Katalitički 16 44,45 Rijetki nestalni 7 19,44 Ukupno

55 Polarni dijagram Polarni dijagram se upotrebljava za prikazivanje kretanja jedne ili više pojava u vremenu. Za razliku od linijskog vremenskog dijagrama polarnim dijagramom prikazuju se ciklične pojave. On pripada grupi linijskih dijagrama a konstruiše se u polarnom koordinatnom sistemu na taj način što se na radijuse čiji je broj određen veličinom ugla alfa nanosi frekvencija ili nivo pojava jednog vremenskog perioda. Spajanjem tačaka koje odgovaraju frekvenciji svakog radijusa dobija se izlomljena linija koja predstavlja polarni dijagram. Primjer 1. Prikazati grafički broj oboljelih od gripa po mjesecima jedne godine i usporediti ih sa godišnjim prosjekom koji iznosi 135 oboljelih po mjesecu. Tabela..4.15: Distrubucija oboljelih od gripa po mjesecima Mjeseci Broj oboljelih Januar 160 Februar 170 Mart 180 April 170 Maj 150 Jun 100 Jul 80 Avgust 50 Septembar 100 Oktobar 130 Novembar 160 Decembar 170 Ukupno 160 Slika..4.15: Distrubucija oboljelih od gripa po mjesecima 55

56 Dijagram se dobija na taj način što se 360 stepeni podijeli sa 1 (brojem mjeseci) i dobiju uglovi od 30 stepeni pomoću kojih se ucrtavaju radijusi. Karakteristično je za polarne dijagrame da se vrijednost prvog i posljednjeg radijusa ne spajaju s obzirom na to da se ne zna kolika će frekvencija biti u prvom intervalu sljedećeg vremenskog razdoblja koji se posmatra. Da bi se usporedile pojedine mjesečne frekvencije oboljelih sa prosjekom oboljelih za čitavu godinu, ucrtava se krug sa centrom u centru polarnog dijagrama i poluprečnikom koji odgovara godišnjem prosjeku oboljelih. Drugi grafički prikazi Kartogrami Kartogram se upotrebljava za prikazivanje teritorijalne rasprostranjenosti jedne ili više pojava tj. za prikazivanje geografskih serija. Kao takav kartogram ima relativno ograničenu upotrebu u statističkim istraživanjima. Prikaz pismenosti/nepismenosti u bivšoj SFRJ po republikama LEGENDA Pismeni Nepismeni Simbolički crteži Simbolički crteži su grafički prikazi koji služe prvenstveno u propagandne svrhe. To su popularni prikazi pojava. To su popularni prikazi pojava. Konstruišu se na taj način što se slikom pojave prikazuje sama pojava (veličinom kreveta - broj kreveta u bolnici, izgledom djeteta - njegovo fizičko stanj itd.). Razlike u intenzitetu moraju se prikazivati različito velikim simbolima (po površini odnosno opsegu) ali je bolje ako se to čini većim ili manjim brojem simbola jer je takav prikaz kvantitativno lakše uočljiv i statistički ispravniji. Vještina je da se za pojavu koju prikazujemo pronađe prikladan simbol koji sam po sebi objašnjava pojavu. 56

57 Prikaz porasta stanovništva u svijetu.. 3. Deskriptivna statistika (statističko opisivanje) Za sticanje što boljeg uvida i sagladavanje međusobnih odnosa statističkog skupa, nakon prikupljanja, sređivanja i prikazivanja, vrši se statistička deskripcija (opis) statističkog skupa. Postupkom statističke deskripcije određuju se relativni odnosi, mjere centralne tendencije, mjere varijabiliteta i mjere oblika raspodjele frekvencija posmatranog statističkog skupa. Na ovaj način istraženi su i definisani svi relevantni parametri koji statistički skup (podatke) opisuju što se najčešće tretira kao jedna od faza rješavanja istraživačkog problema. Ovdje će se izložiti osnovni pojmovi i definicje i dati primjeri upotrebe: Relativnih brojeva (Pokazatelja strukture, Indeksa, Koeficijenata); Mjera centralne tendencije (Aritmetičke sredine, Moda, Medijane); Mjera varijabiliteta (Apsolutnih mjera varijaviliteta: Intervala varijacije; Standardne devijacije; Relativnih mjera varijaviliteta: Koeficijenta varijacije; Zed vrijednosti) Relativni brojevi Podaci o istraživanoj pojavi (istraživačkom problemu) dobijaju se mjerenjem ili prebrojavanjem jedinica posmatranja i daju se apsolutnim brojevima. Ovi brojevi su osnovni (izvorni) podaci i omogućavaju uvid u stvarno stanje posmatrane pojave i predstavljaju njenu elementarnu deskripciju. Međutim, ovi podaci (apsolutini brojevi), iako nezamjenjivi, često imaju ograničenu upotrebnu vrijednost, posebno kad je potrebno vršiti razne usporedbe. Apsolutni brojevi su pogodni kod uspoređivanja pojava koje su isključivo istoimene, istovrsne i istovjetne uz uslov da su jednakih intenziteta (obima ili nivoa). Da bi se međusobno mogle uspoređivati pojave koje ne ispunjavaju uslove za upotrebu apsolutnih brojeva, kao dopuna koriste se relativni brojevi. 57

58 Reletivni brojevi (definicija) Relativni brojevi su statistički parametri koji omogućavaju usporedbu posmatranih pojava bez obzira na njihovu raznoimenost, raznovrsnost, različitost, nivo ili obim. Relativni brojevi mogu se izračunavati samo ako su poznata dva apsolutna broja koja su u bilo kom obliku u međusobnom odnosu, u nekoj vezi. Relativni broj označava se sa R b i dobija se kao količnik dva apsolutna broja. U broiocu ovog količnika nalazi se računska, vrijednost koja se uspoređuje V r. U imeniocu razlomka nalazi se osnovna, bazna vrijednost, vrijednost s kojom se uspoređuje V b. Relativni broj se dobija preko izraza: R b = V r / V b Iz izraza za relativni broj proizlaze sljedeće relacije: V r = V b * R b i V b = V r / V b Primjer 1. Od 33 pacijenta kojima su rađene laboratorijske pretrage u laboratoriji Doma zdravlja kod 158 pacijenata rađena je KKS (kompletna krvna slika) i DKS (diferencijalna krvna slika) dok je kod ostalih pacijenata rađena smo KKS. U kakvom je odnosu broj pacijenata sa KKS i DKS prema ukupnom broju pacijenata kojima je rađen nalaz krvi. R b = V r / V b = 158/33 = 0,6781 Rezultat dijeljenja broioca imeniocem je decimalni broj. Da bi se olakšalo tumačenje poređenja na osnovu relativnih brojeva s obzirom da je decimalni broj često vrlo mali i sa mnogo decimala (što nije pogodno za donošenje pravilnog zaključka) on se množi sa 100 i izražava u procentima ili se množi sa 1000 i izražava u promilima. Izražen u procentima rezultat iz prethodnog primjera 0,6781 iznosi 67,81%. Ukoliko se tako dobijen relativni broj koristi za dalja računanja uzima se njegova tačna vrijednost, međutim ukoliko se koristi kao konačni rezultat tada se zaokružuje na prvi cijeli broj. Posebno se zaokruživanje radi kad je riječ o parametru kome po njegovoj prirodi ne odgovara decimalni broj (broj ljudi i slično). 58

59 Primjer. Na osnovu podataka o broju vakcinisanih (00) i procenta izvršenja plana vakcinacije (80%) izračunati broj predviđenih za vakcinaciju. V b = V r / R b * 100 = 00 / 80 * 100 = 50 Primjer 3. Koliki je ukupan procenat djece sa abnormalnim hemoglobinom otkriven u periodu 6 godina na određenoj teritoriji ako je u kliničkom materijalu otkriveno 5, odnosno 1%, a u populacionim istraživanjima 6, odnosno 0, 6% djece. Vr1 *100 5*100 V b1 500 R 1 V V V V b1 *100 R 6*100 0,6 r b b r b Vr1 Vr Vb 1 Vbr Da bi se izračunao zajednički procenat mora se voditi računa o veličini baze. Ako su one jednake po veličini zajednički procenat može se lako izračunati sabiranjem procenata i dijeljenjem toga zbira brojem sabiraka. Ukoliko bazne vrijednosti nisu jednake (što je naš slučaj) zajednički procenat se izračunava ili na prikazani način ili pomoću izraza za aritmetičku sredinu procenta. Kada se govori o procentima kao najčešćem načinu izražavanja relativnih brojeva može se njegova matematička definicija (procenat je decimalni razlomak sa imeniocem 100) transformisati u statističku. Tako se može reći da je procenat relativni broj čija baza vrijednosti iznosi 100. Proporcije Na isti način, pomoću relativnog broja može se definisati još jedan pojam koji je čest u statistici. Proporcije su relativni brojevi čija je bazna vrijednost jednaka jedinici. One su uvijek dijelovi nečega i ne mogu nikada da prevaziđu total koji iznosi 59

60 jedan. Odnos između procenata i proporcija je takav da je procenat 100 puta veći od proporcije, odnosno proporcija je 1/100 procenata. Relativni brojevi se dijele na: 1. Pokazatelje strukture pojave - Indeksi strukture. Pokazatelje nivoa pojave - Koeficjenti 3. Pokazatelji dinamike pojave - Indeksi dinamike Među koeficjentima inteziteta nalaze se i: stopa nataliteta, stopa mortaliteta, stopa smrtnosti dojenčadi, stopa prevalencije (mjera oboljelih na određenom području (na 1000; 10000; stanovnika), stopa incidencije (broj novootkrivenih od iste bolesti u toku kalendarske godine itd Mjere centralne tendencije Često se u svakodnevnom životu čuju izrazi, prosječno, tipično ili srednje. Tako se govori o prosječnoj dužini života, prosječnom kulturnom nivou, prosječnoj inteligenciji, prosječnom obrazovanju, srednjem uspjehu, srednjem standardu, tipičnom izgledu, tipičnoj klimi itd. Prosjek u ovom smislu je najuočljivija i najčešće prisutna određena specifičnost, karakteristika koja na neki način reprezentuje pojavu o kojoj dajemo mišljenje. Međutim, određivanje prosjeka neke pojave na osnovu utiska koje pojedinac ili grupa stiču o toj pojavi, shodno svom znanju i iskustvu subjektivno je i neprecizno. Objektivnu ocjenu prosjeka pojave dobijamo tek statističkom obradom numeričkih vrijednosti kojima je pojava izražena. U statističkom smislu prosjek, srednja vrijednost, mjera koncentracije odnosno mjera centralne tendencije je jedan broj, jedna vrijednost koja kao reprezntativna zmjenjuje sve druge vrijednosti obilježja. Pravo da se jedna vrijednost obilježja odredi za reprezentativnu nalazi se u činjenici da vrijednost i jedinica posmatranja pokazuju centralnu tendenciju, tj. pokazuju manje ili više izrazitu težnju da se u distribuciji frekvencija okupljaju oko centralnih vrijednosti obilježja. Srednja vrijednost sintetizuje i predstavlja sve vrijednosti jedinica posmatranja u ispitivanom obilježju. Ona uprošćava i uopštava opis statističkog skupa omogućujući da se lakše uoči tipično i dominantno u varijabilnosti vrijednosti jedinica posmatranja. Srednja vrijednost se može određivati različitim metodama. Izbor metoda određivanja srednje vrijednosti zavisi od toga koja će metoda pružiti najreprezentativniju srednju vrijednost obilježja, s obzirom na prirodu pojave i svrhu proučavanja. 60

61 U odnosu na metod određivanja, srednje vrijednosti dijelimo u dvije grupe. Prvu grupu čine pozicione, lokacione srednje vrijednosti koje se određuju prema položaju koji zauzimaju u distribuciji frekvencija. Ovoj grupi srednjih vrednosti pripadaju medijana i mod. Drugu grupu srednjih vrijednosti na koju se uglavnom odnosi naziv "prosjek" čine računske, matematičke srednje vrijednosti od kojih u medicini najčešće nalazi primjenu aritmetička sredina, harmoniska, kvadratna i kubna sredina. One se dobijaju kao rezultat izvjesnih matematičkih operacija koje obuhvataju sve vrijednosti obilježja statističkog skupa. Zbog toga na njih utiču sve vrijednosti obilježja, pa i one ekstremne dok na pozicione srednje vrednosti one nemaju uticaja. S druge strane medijana i mod odgovaraju datim individualnim vrijednostima dok prosjeci ne moraju da odgovaraju konkretnim vrijednostima obilježja. No bez obzira na vrstu, srednje vrijednosti moraju da ispunjavaju opšte uslove. One se mogu određivati različitim metodama, tj. mjerilima ali se moraju uvijek izračunavati na jedan jedini tačno određen način. Sve srednje vrijednosti veće su od najmanje, a manje od najveće pojedinačne vrijednosti obilježja, odnosno njihova vrijednost nalazi se u intervalu između najviše i najniže vrijednosti obilježja. Kada su sve vrijednosti jedinica posmatranja jednog obilježja jednake, srednja vrijednost jednaka je toj vrijednosti obilježja. Sve srednje vrijednosti su apsolutne mjere centralne tendencije, tj. izražene su istim mjernim jedinicama kao i jedinice posmatranja statističkog skupa Aritmetička sredina Aritmetička sredina se brzo shvata, jednostavno izračunava i lako kontroliše pa se zbog toga najčešće primjenjuje u statističkim istraživanjima. Ona se obilježava simbolom x. Dobija se na taj način što se saberu sve vrijednosti jedinica posmatranja ispitivanog obilježja pa se dobijeni zbir podijeli sa ukupnim brojem jedinica posmatranja. Matematički izrazi za izračunavanje aritmetičke sredine zavise od vrste i forme podataka. Aritmetička sredina za individualne, negrupisane vrijednosti jedinica posmatranja izračunava se preko sljedećeg izraza: x i N i 1 N x i 61

62 U ovom izrazu x (iks bar) označava aritmetičku sredinu, ( sigma) je simbol za zbir odnosno sumu (sumiranje se vrši od i=1 do i=n jedinica posmatranja), x i predstavlja pojedinačne vrijednosti (od prve do posljednje) jedinica posmatranja ispitivanog obilježja, a N ukupan broj jedinica posmatranja. Primjer 1. Vrijeme krvarenja 5 bolesnika sa trombocitopenijom esencijalis iznosi 4' - 8' - 6' - 10' - 4'. Izračunati aritmetičku sredinu vremena krvarenja ovih bolesnika. Rješenje: x x ,40' Aritmetička sredina za grupisane vrijednosti jedinica posmatranja izračunava se preko izraza: x s k s 1 s k s 1 gdje je sa f s označena frekvencija grupe ili grupnog intervala vrijednosti obilježja, sa x ' s označena je sredina pojedinog grupnog interval, a sa f s N suma frekvencija grupnih intervala koja je jednaka je ukupnom broju jedinica posmatranja N. Sumiranje se vrši po članovima grupnog intervala od s=1 do s=k). Prema tome aritmetička sredina grupisanih podataka dobija se kao količnik sume proizvoda vrijednosti obilježja i odgovarajućih frekvencija i sume frekvencija. Aritmetička sredina izračunata po svom matičnom izrazu naziva se često uravnotežena tj. ponderisana jer pokazuje da su pojedine vrijednosti obilježja uzete u račun prema njihovoj težini ili ponderu, tj. prema relativnoj važnosti koju određuju njihove frekvencije. f s f x s ' s 6

63 Primjer. Izračunati prosječnu vrijednost frekvencija radijalnog pulsa u minuti prikazanog distribucijom frekvencija kod 15 zdravih osoba. x f x' fx' Ukupno 15 / 1065 x x s k s 1 s k s f s f x s ' s 71[ o / min] U slučaju kada je frekvencija jedinica posmatranja razvrstana u grupne intervale obilježja, kao što je to u ovom primjeru, kao vrijednost obilježja se uzima sredina grupnog intervala jer zamjenjivanjem svih vrijednosti grupnog intervala njegovom sredinom čini se najmanja greška. Sredina grupnog intervala x ' s se određuje dijeljenjem zbira graničnih vrijednosti intervala sa dva. 63

64 Primjer 3. Koliki je prosječan broj porođaja 1 višerotki. Broj porođaja dat je distribucijom frekvencija. X f fx Ukupno 1 34 x x s k 34 1 s 1 s k s 1 f s f x s ' s,833 3 U datom primjeru frekvencije jedinica posmatranja razvrstane su u grupe vrijednosti obilježja pa se aritmetička sredina izračunava na već pomenuti način. U ovom slučaju pažnju treba obratiti na rezultat aritmetičke sredine. Ako se kao prosječna vrijednost numeričkog diskontinuiranog obilježja dobije decimalni broj potrebno ga je zaokružiti na prvu cijelu vrijednost (osim u slučaju ako se sa njim nastavlja statistička obrada odnnosno ako izračunata aritmetička sredina služi za dobijanje drugih statističkih parametara). Aritmetička sredina aritmetičkih sredina Aritmetička sredina aritmetičkih sredina izračunava se preko sljedećeg matematičkog izraza: X ik i i1 ik i1 a x a i i 64

65 U ovom izrazu X (iks dva bar) označava aritmetičku sredinu aritmetičkih i k sredina, a a i ukupan zbir jedinica posmatranja svih grupa iz kojih su i1 izračunate pojedinačne aritmetičke sredine. Kao što vidimo iz ovog izraza, aritmetička sredina aritmetičkih sredina dobija se kada se zbir proizvoda pojedinačnih aritmetičkih sredina i broja jedinica posmatranja iz kojih su one izračunate podijele sa ukupnim brojem jedinica posmatranja. Primjer 4. U eksperimentu za utvrđivanje najniže frekvencije vibracija zvučnog talasa koje čovjek može da osjeti kao ton učestvovale su tri osobe. Prosječna vrijednost prvog ispitanika dobijena iz četiri pokušaja iznosi 1,5 cikla u sekundi. Prosječna vrijednost drugog ispitanika dobijena iz tri pokušaja iznosi 15,67 cikla u sekundi. Kod trećeg ispitanika prosječna vrijednost dobijena iz dva pokušaja iznosi 11,5 cikla u sekundi. Kolika je prosječna vrijedost frekvencija vibracija zvučnog talasa dobijena u ovom eksperimentu? 4 *1,5 3*15,67 *11,5 10,01 X 13, Zašto nije dobro računati ovako? 1,5 15,67 11,5 39,67 X 13, 3 3 Ovakav način je dozvoljen samo ako u svakoj grupi ima isti broj jedinica posmatranja. Pri izračunavanju ove aritmetičke sredine moramo voditi računa o bazi, tj. o broju jedinica posmatranja na osnovu koga su izračunate elementarne aritmetičke sredine. Ukoliko grupe imaju različit broj podataka izračunavanje se vrši preko datog matematičkog izraza. Međutim, da je broj jedinica posmatranja bio isti u svakoj grupi iz koje se izračunava prosta aritmetička sredina bilo bi dozvoljeno da se aritmetička sredina izračunava kao količnik zbira elementarnih aritmetičkih sredina i njihovog broja. Aritmetička sredina relativnih brojeva Na sličan način izračunava se aritmetička sredina relativnih brojeva. Ako relativni broj obilježimo sa P (s obzirom da se najčešće izražava u procentima) matematički izraz za izračunavanje aritmetičke sredine relativnih brojeva imaće oblik: 65

66 P ik i i1 ik i1 a P a i i Kao i kod aritmetičke sredine aritmetičkih sredina i pri izračunavanju aritmetičke sredine relativnog broja mora se voditi računa o veličini baze na osnovu koje je on izračunat. O ovome je već bilo riječi u poglavlju o relativnim brojevima. Ovdje samo možemo podvući da se aritmetička sredina relativnih brojeva ne može izračunati ako se ne poznaju apsolutni brojevi iz kojih su oni izračunati. Primjer 5. Izračunati procenat petogodišnjeg preživljavanja 00 bolesnika sa tumorom bubrežnog parenhima ako je data sljedeća distribucija frekvencija po stadijumu anatomskog razvoja tumora. Stadijum razvoja tumora Broj oboljelih Procenat preživjelih I 18 78% II 51 61% III 13 18% IV 8 0% P ik a i i1 ik i1 a P i i P P Ne smije se računati ovako: 18* 78 51* 61 13*18 8* ,64 34% 00 P ,

67 67 Ukupno petogodišnje preživljavanje iznosi 34%, a ne 39% koliko bi se dobilo da je izračunata prosta aritmetička sredina ( )/4=39,5%, tj. da je zanemarena veličina grupe na osnovu koje je izračunat procenat. Karakteristike aritmetičke sredine: Tačnost izračunavanja aritmetičke sredine lako se kontroliše zahvaljujući specifičnim osobinama ove mjere centralne tendencije. One se odnose na odstupanje individualnih vrednosti jedinica posmatranja od aritmetičke sredine obilježja. a) Nulta suma razlike Algebarski zbir odstupanja pojedinih vrijednosti jedinica posmatranja od aritmetičke sredine vrijednosti obilježja jednak je nuli ( x x 0), odnosno zbir pozitivnih odstupanja jednak je zbiru negativnih odstupanja od aritmetičke sredine. Odstupanja sa različitim predznakom javljaju se zbog toga što se aritmetička sredina nalazi u intervalu između minimalne i maksimalne vrijednosti jedinica posmatranja. Aritmetička sredina izravnava odstupanja u apsolutnim iznosima tj. izravnava apsolutnu varijaciju serije. Ona u nizu brojeva ima isto značenje koje ima tačka težišta u mehaničkom sistemu pa se često naziva i težište rezultata, tj. težište vrijednosti obilježja. Da je ovo tačno možemo dokazati jednostavnim eksperimentom. Ako se histogram frekvencija kojim je predstavljena neka distribucija frekvencija kontroliše na tvrdom i teškom materijalu (npr. dasci) i izreže, može se postaviti u ravnotežu ako mu je oslonac u tački koja odgovara aritmetičkoj sredini obilježja. "Težina" vrijednosti jedinica posmatranja jednog obilježja (koje se ogleda u odstupanju od aritmetičke sredine obilježja) iznad i ispod aritmetičke sredine uvijek je jednaka. b) Metod najmanjih kvadrata Zbir kvadrata odstupanja pojedinih vrijednosti jedinica posmatranja od aritmetičke sredine vrijednosti obilježja jednak je minimum ( x x min ). Drugim riječima suma kvadrata odstupanja od aritmetičke sredine manja je od sume kvadrata odstupanja od bilo koje druge sredine tj. srednje vrijednosti. Ona predstavlja minimum što se može i matematički dokazati.

68 N N ( xi x) i1 i1 ( x x ) i 0 Matematički dokazana ova osobina aritmetičke sredine zauzima jedno od najvažnijih mjesta u statistici. Tu osobinu formulisao je Gaus (Gauss) godine pod imenom "Metod (princip) najmanjih kvadrata". Ona glasi: "Suma kvadrata grešaka mora biti minimalna (ako pod greškom podrazumijevamo odstupanje vrijednosti od aritmetičke sredine)". Na taj način aritmetička sredina se uzima kao najreprezentativnija i kao najverovatnija vrijednost reprezentativnog obilježja. c) Princip homogenosti Aritmetička vrijednost može da reprezentuje samo homogeni statistički skup tj. skup u kome nema velikih odstupanja vrijednosti jedinica posmatranja. Ovo ograničenje upotrebe aritmetičke sredine proizlazi iz činjenice da na aritmetičku sredinu kao i na sve druge računske srednje vrijednosti utiče svaka vrijednost jedinice posmatranja, a posebno ekstremne vrednosti. One pomjeraju "vuku" aritmetičku sredinu ka sebi i na taj način onemogućavaju njenu reprezentativnost. d) Princip linearnosti Ako su dva obilježja vezana linearnom funkcijom, tada su i njihove aritmetičke sredine vezane tom istom linearnom funkcijom, to jest: ako je y b 0 b1 x tada je i y b b 0 1 x Zbog naprijed navedenih karakteristika aritmetička sredina nije dobar reprezentant prosjeka u slučaju kada je distribucija frekvencija asimetrična ili ako je broj podataka mali, a varijabilitet veliki Medijana Medijana ili centralna vrijednost je srednja vrijednost po položaju. To je ona vrijednost obilježja koja odgovara srednjem članu niza jedinica posmatranja poredanim po veličini obilježja. Kao centralna vrijednost ona dijeli sumu frekvencija na dva jednaka dijela. Polovina ukupnog broja jedinica posmatranja nalazi se sa jedne strane tj. ispod, a polovina sa druge strane tj. iznad medijane. Medijana se obilježava sa M ili češće sa Me. Dobija se na sljedeći način: a) jedinice posmatranja poredaju se po veličini; b) odredi se mjesto medijane, tj. utvrdi se srednji član jedinice 68

69 posmatranja; c) pročita se ili izračuna vrijednost obilježja koja odgovara pronađenom srednjem članu niza jedinica posmatranja. Određivanje mjesta medijane tj. srednjeg člana niza jedinica posmatranja zavisi od njihovog broja i forme u kojoj su prezentirane. Mjesto medijane (MMe) za individualne negrupisane vrijednosti jedinica posmatranja određuje se preko izraza: MMe = (N + 1) / gdje je N broj članova datog niza odnosno broj jedinica posmatranja. Ako je broj članova niza neparan sama medijana se dobija ako se pročita vrijednost obilježja koju ima jedinica posmatranja određena gornjim izarazom kao srednji član niza. Primjer 1. Koificjent inteligencije (IQ) 9 odraslih osoba iznose: 97, 101, 105, 110, 111, 113, 115,118, 10. Odrediti medijanu e 5 e 111 x Medijana se nalazi na petom mjestu, a iznosi 111 jer je to vrijednost obilježja koja se u rastućem nizu jedinice posmatranja (97, 101, 105, 110, 111, 113, 115, 118, 10) nalazi na petom mjestu. Ovo je bio primjer za neparan broj jedinica posmatranja. Ako je broj članova niza paran, medijana se mora izračunavati. U ovom slučaju ona se dobija kao artimetička sredina onih vrijednosti obilježja posmatranja koje pripadaju jedinicama posmatranja koje graniče sa prethodno određenim mjestom medijane MMe. Mjesto medijane u parnom nizu se ne poklapa sa konkretno datim podacima već se nalazi između dvije jedinice posmatranja. Primjer. Pri određivanju količine dvadesetočasovnog urina (l) dobijeni su sljedeći rezultati za osam zdravih osoba: 0,90; 1,100; 1,00; 1,50; 1,300; 1,350; 1,400; 1,550. Odrediti medijanu. 69

70 1 8 1 e 4,5 1,50 1,300 e 1,75 Mjesto medijane je 4,5 a ona iznosi 1,75 jer je to aritmetička sredina vrijednosti obilježja koja se u rastućem nizu jedinica posmatranja 0,90; 1,100; 1,00; 1,50; 1,300; 1,350; 1,400; 1,550, nalaze na četvrtom i petom mjestu. Mjesto medijane za sređene, grupisane vrijednosti jedinica posmatranja određuje se preko izraza f 1 e gdje je f suma svih frekvencija tj. ukupan broj jedinica posmatranja ( f N ). Da bi se dobila vrijednost medijane grupisanih podataka potrebno je poslije utvrđivanja mjesta medijane napraviti kumulativni niz frekvencija i pomoću njega procijeniti ili odrediti medijanu. Primjer 3. Kolika je medijana vremena mišićne reakcije (sec) 17 osoba. Kumulativna Reakcija (sek) Broj osoba frekvencija 0, , , , ,5 17 Ukupno 17 / f 1 e 17 1 e 9 e 0,50sek Mjesto medijane je 9, a medijana iznosi 0,50 sekundi što je vrijednost treće kumulisane grupe obilježja u kojoj se nalazi deveta po redu jedinica posmatranja. 70

71 Primjer 4. Odrediti medijanu vrijednosti triglicerida /mmol/l/ u plazmi 40 zdravih osoba prikazanih distribucijom frekvencija Trigliceridi Kumulativna Sredina grupnog Broj osoba (mmol/l) frekvencija intervala 0,30-0, ,45 0,60-0, ,75 0,90-1, ,05 1,0-1, ,35 1,50-1, ,65 Ukupno 40 / / f e 0,5 e 1,05 Mjesto medijane iznosi 0,5 a sama medijana 1,05 mmol/l. Ova vrijednost je procijenjena zamjenjivanjem svih vrijednosti trećeg grupnog intervala njegovom sredinom. Za serije grupisanih podataka medijana se dobija interpolacijom između donje i gornje granice intervala grupe u kojoj se medijana nalazi, tj.: N f1 Me l 1 i f gdje je: l 1 - donja granica medijalnog intervala, N - broj članova posmatrane serije, Σf 1 - zbir frekvencija predmedijalnog intervala i - dužina medijalnog intervala. f Me - frekvencija medijalnog intervala Medijana se ponekad naziva i drugim kvartilom s obzirom na mogućnost podjele jedne serije na četiri jednaka dijela. Ako se serija podataka rangiranih po veličini podijeli na četiri jednaka dijela, vrijednosti obilježja koje ih dijele nazivaju se kvartilima: prvi kvartil Q 1, drugi kvartil Q, treći kvartil Q 3. Na isti način, ako seriju podijelimo na 10 odnosno na 100 jednakih dijelova dobiće se decili odnosno percentili. Svi ovi pokazatelji određuju se na sličan način kao i medijana. Tako se, na primjer, za grupisane podatke prvi i treći kvartil određuju na osnovu sljedećih izraza: Me 71

72 N f 3N 1 Q1 l 4 f1 1 i Q3 l 4 1 i f f gdje je: l 1 - donja granica medijalnog intervala, N - broj članova posmatrane serije, Σf 1 - zbir frekvencija do kvartilnog intervala f Q - frekvencija kvartilnog intervala i - dužina kvartilnog intervala. Q 1 Q 3 Prvi kvartil - Q 1 je ona vrijednost obilježja posmatranja od koje 5% elemenata skupa uređenih po veličini ima manju ili jednaku vrijednost tog obilježja. Treći kvartil - Q 3 je ona vrijednost obilježja posmatranja od koje 75% elemenata skupa uređenih po veličini ima manju ili jednaku vrijednost tog obilježja Mod (Modus) Mod ili tipična, dominantna vrijednost je srednja vrijednost po položaju. To je ona vrijednost obilježja koja se najčešće javlja. U distribuciji frekvencija mod je vrijednost obilježja kojoj odgovara najveća frekvencija, a na dijagramu ona vrijednost na x osi kojoj odgovara najveća ordinata. Mod se obilježava sa Mo. Kada su date individualne, negrupisane vrijednosti jedinica posmatranja mod se određuje jednostavno inspekcijom tj. uočavanjem najveće vrijednosti obilježja. Primjer 1. Sedam zdravih osoba ima sljedeće vrijnosti glikoze u krvi: 5,0; 4,; 5,4; 5,0; 5,1; 5,4; 5,0 mmol/l. Odrediti modalnu vrijednost. Mo=5,0 mmol/l S obzirom da je broj podataka mali vrlo lako se uočava da se vrijednost od 5,0 javlja tri puta, vrijednost od 5,4 dva puta, a po jedanput 4, i 5,1 mmol/l. Prema tome je Mo= 5,0 mmol/l jer se ova vrijednost najčešće javlja. Ako su jedinice posmatranja prikazane distribucijom frekvencija po grupama, mod se također lako određuje uočavanjem vrijednosti obilježja grupe kojoj odgovara najveća frekvencija jedinica posmatranja. 7

73 Primjer. Podaci o prekidu napada paroksizmalne superventrikularne tahikardije kod 9 bolesnika, intravenskom aplikacijom lijeka dati su distribucijom frekvencija. Odrediti modalnu vrijednost. Doza lijeka (x) Broj bolesnika 1/ 1 3/ Ukupno 9 Mo=1 Modalna vrijednost je jedna doza lijeka jer je kod 7 do 9 bolesnika napad prekinut ovom dozom. Ako su jedinice posmatranja prikazane distribucijom frekvencija po grupnim intervalima aproksimativna modalna vrijednost je sredina onog intervala koji ima najveću frekvenciju. Međutim, za preciznije određivanje modalne vrijednosti u ovom slučaju koristi se sljedeći izraz: f f1 o i f f1 f f3 gdje je l donja granica modalnog intervala, i je širina grupnog intervala, f je frekvencija modalnog intervala, f 1 frekvencija prethodnog intervala, a f 3 frekvencija sljedećeg intervala. Primjer 3. Odrediti modalnu vrijednost distribucije frekvencija bolesnika od akutnog miokarda po godinama života. Mo = 45 godina Godine života Broj bolesnika Ukupno:

74 Najveća frekvencija (147) odgovara drugom intervalu (40-49) pa prema tome tipična vrijednost obilježja kao sredina odgovarajućeg intervala iznosi 45 godina. Preciznija modalna vrijednost obilježja može se dobiti preko navedenog izraza: f f1 o i f f f f o , Ako se na ovaj način odredi mod u datom primjeru dobija se preciznija vrednost tipičnih godina javljanja infarkta kod ispitivanih 364 bolesnika koja iznosi 47,34. Grafički se takođe može dobiti približna vrijednost moda preko histograma frekvencija. Ovako određena modalna vrijednost jednaka je onoj vrijednosti apcisne ose koja se dobija spuštanjem vertikale iz presjeka dijagonala koje spajaju krajnju vrijednost prethodnog sa krajnjom vrijednošću modalnog intervala i početnu vrijednost sljedećeg sa početnom vrijednošću modalnog intervala. Distribucije frekvencija u kojima se pojavljuje samo jedna maksimalna vrijednost grupe ili grupnog intervala nazivaju se unimodalne raspodjele. Nekada su jedinice posmatranja reprezentirane distribucijom frekvencija u kojoj jedna ili više grupa odnosno grupnih intervala ima maksimalnu frekvenciju. Ako dvije susjedne grupe ili grupna intervala distribucije frekvencija imaju iste maksimalne iznose mod je granična vrijednost tih grupa, odnosno intervala (npr , 15-16, Mo=14,5) unimodalne distribucije frekvencija. U slučaju kada su intervali sa istim maksimalnim frekvencijama razdvojeni samo jednom grupom odnosno intervalom raspodjela je i dalje unimodalna ali vrijednost procjenjenog moda u ovom slučaju ne može nas zadovoljiti. Ukoliko su grupe ili grupni intervali sa istim maksimalnim frekvencijama razdvojeni sa dvije grupe ili grupna intervala takva raspodjela frekvencija nije više unimodalna već je bimodalna ili multimodalna (polimodalna) u zavisnosti od toga da li ima dvije ili više istih maksimalnih frekvencija. Mod kao tipična srednja vrijednost upotrebljava se u slučajevima kada želimo nešto naročito da istaknemo. Na nju ne utiču ni vrijednosti jedinica posmatranja kao na aritmetičku sredinu ni broj jedinica posmatranja kao na medijanu već samo frekvencija jedinica posmatranja statističkog skupa. 3

75 Odnos mjera centralne tendencije Kada su jedinice posmatranja pravilno i simetrično raspoređene po grupama ili grupnim intervalima distribucija frekvencija osnovne srednje vrijednosti, aritmetička sredina, medijana i mod se poklapaju, odnosno imaju iste jednake iznose. x sr =M e = M o Slika : Grafički prikaz odnosa osnovnih srednjih vrijednosti kod simetrične krive frekvencija. Kada su jedinice posmatranja asimetrično raspoređene po grupama ili grupnim intervalima raspodjele frekvencija, srednje vrijednosti imaju različite iznose koji su u takvom odnosu da se medijana uvijek nalazi između moda i aritmetičke sredine. Kod unimodalnih, asimetričnih ili umjereno asimetričnih raspodjela učestalosti između ove tri srednje vrijednosti postoji prilično stabilan odnos. Medijana se u tom slučaju nalazi na trećini puta od aritmetičke sredine ka modu. Prema tome, kada poznajemo dve od ovih srednjih vrednosti možemo odrediti treću prema izrazu: o 3 e x 75

76 M o M e x sr Slika.3..4.: Grafički prikaz odnosa osnovnih srednjih vrijednosti kod krive frekvencije koja je asimetrična ulijevo (negativna asimetrija) a iskošena u udesno (pozitivna iskošenost). Y-Axis X-Axis X MeMo Slika : Grafički prikaz odnosa srednjih vrijednosti kod krive frekvencija koja je asimetrična udesno (pozitivna asimetrija) a iskošena ulijevo (negativna iskošenost) Mjere varijabitileta Srednje vrijednosti predstavljaju, odnosno na neki način zamjenjuju statistički skup. Ukoliko su jedinice posmatranja gusto grupisane oko srednjih vrijednosti, ona dobro reprezentuje statistički skup. Naprotiv, ako koncentracija jedinica posmatranja oko srednje vrijednosti nije dovoljno izražena srednja vrijednost nije dobar reprezentat statističkog skupa. U izvjesnim slučajevima može se desiti da jedinice posmatranja ne pokazuju centralnu tendenciju pa tada srednja vrijednost koja se može i u ovom slučaju izračunati ništa ne reprezentuje. Srednja vrijednost suvišnim 76

77 uproštavanjem može dovesti do pogrešne i nejasne slike o statističkom skupu. Tako dva ili više statističkih skupova mogu imati istu srednju vrijednost, a da se ipak međusobno znatno razlikuju bilo po tome što im je raspon vrijednosti jedinica posmatranja različit ili zbog toga što vrijednosti jedinica posmatranja pokazuju različitu disperziju (slika). Ovo se može najbolje sagledati na sljedećem primjeru: Dato je šest serija sa po sedam jedinica posmatranja prema tabeli Tabela.3.3.1: Šest serija sa istom aritmetičkom sredinom Jedinica posmatranja Serija (I) Serija (II) Serija (III) Serija (IV) Serija (V) Serija (VI) Srednja vrijednost Sve serije imaju istu srednju vrijednost x 8, 00, međutim kako se vidi sa donjih grafičkih prikaza serije se između sebe znatno razlikuju jer nisu jednako distribuirane. 77

78 Prema tome, same srednje vrijednosti nisu dovoljne da bi se dobro i pravilno predstavio statistički skup. Da bi srednje vrijednosti dobile svoju pravu važnost treba odrediti kako i koliko, odnosno da li se uopšte jedinice posmatranja grupišu oko neke srednje vrijednosti. Utvrđivanje i mjerenje gustine grupisanja odnosno odstupanja od srednje vrijednosti vrši se statističkim parametrima koje nazivamo mjere varijabilnosti odnosno mjere disperzije. Pod varijabilitetom se kao što je već rečeno podrazumijeva promjenjivost obilježja od jedinice do jedinice posmatranja statističkog skupa. Disperzija, tj. rasturenost vrijednosti jedinica posmatranja ima specifično značenje. Ona predstavlja odstupanje, devijaciju vrijednosti obilježja od izvjesne srednje vrijednosti. Poželjno je da vrijednosti pokazatelja disperzije imaju neko konkretno značenje sa prostim i očevidnim svojstvima, da zavise 78

79 od svih vrijednosti statističkog skupa, da se jednostavno izračunavaju i da su pogodne za dalju obradu. Mjere disperzije se prema načinu izražavanja dijele u dvije grupe. Prvu grupu čine: - raspon ili interval varijacije, - interkvartilna razlika, - srednje apsolutno odstupanje, - prosječno kvadratno odstupanje (varijansa), kovarijansa i standardna devijacija. To su apsolutne mjere varijabiliteta pa se izražavaju istim mjernim jedinicama kojima su izražene i jedinice posmatranja. Drugu grupu čine: - koeficjent varijacije i - standardizovana odnosno noramalizovana (z) vrijednost Ovo su relativne mjere varijabiliteta i izražavaju se u procentima ili decimalnim brojevima Interval varijacije Interval varijacije ili raspon je najjednostavnija, ali i najgrublja mjera varijabiliteta. Interval varijacije pokazuje razmak od najmanje do najveće vrijednosti obilježja. Obilježava se sa R ili I i dobija se preko izraza: R= I = max min Znači da se interval varijacije dobija kao razlika maksimalne i minimalne vrijednosti obilježja. Primjer Odrediti interval varijacija za sljedeće vrijednosti aksilarne temperature: 38, - 37,0-36,8-37,5-39,1-36,5-37,8-38,6-39,4-40,1-37,6-40,0-39,6-37,9-38,5. I = max - min = 40,1-36,5 = 3,6 0 Raspon kao mjera varijabilnosti daje uvid o ponašanju samo ekstremnih vrijednosti obilježja dok o varijabilitetu unutar intervala i o grupisanju jedinica posmatranja oko srednje vrijednosti tj. aritmetičke sredine ne daje nikakve informacije. S obzirom da zavisi od krajnjih vrijednosti obilježja statističkog skupa interval varijacije ima još jedan nedostatak. Što je veći broj jedinica posmatranja vjerovatnije je da će se među njima pojaviti veći raspon krajnjih vrijednosti. 79

80 Interkvartilna razlika Da bi se eliminisao uticaj ekstremnih vrijednosti jedinica posmatranja statističkog skupa na iznos ivervala varijacije, izračunava se kao dopunska mjera interkvartilna razlika, odnosno razlika između prvog i trećeg kvartila: i q Q 3 Q 1 Interkvartilna razlika isključuje 5% podataka sa najnižim vrijednostima i 5% podataka sa najvišim vrijednostima jedinica posmatranja statističkog skupa. Ako je interval varijacije veliki a interkvartilna razlika mala to znači da na krajevima distribucije statističkog skupa postoje ekstremne vrijednosti ali da ostali članovi skupa ne pokazuju veliki varijabilitet. Kada je i interkvartilna razlika velika, slika o varijabilitetu skupa nije dovoljno jasna, tim prije što se i ova mjera zasniva na razlici samo dva člana skupa Standardna devijacija Standardna devijacija je mjera varijabiliteta koja se najčešće upotrebljava tj. ima najširu primjenu u statistici. To je mjera varijabilnosti kojom se mjeri odstupanje (disperzija, odnosno devijacija) vrijednosti obilježja od aritmetičke sredine, tj. gustina grupisanja podataka oko aritmetičke sredine. Što je vrijednost standardne devijacije manja, manje je i odstupanje (svake jedinice posmatranja ili prosječno odstupanje svih jedinicama posmatranja) od aritmetičke sredine, tj. manji je varijabilitet, a veća gustina grupisanja vrijednosti jedinica posmatranja oko aritmetičke sredine. Standardna devijacija najčešće se obilježava sa SD ili (sigma). Dobija se na dva načina: preko razlike empirijskih vrijednosti jedinica posmatranja od aritmetičke sredine i direktno iz empirijskih jedinica posmatranja. Bez obzira na način računanja, pri izračunavanju standardne devijacije kao i pri izračunavanju drugih statističkih parametara mora se voditi računa o formi prezentiranja podataka. Ako se standardna devijacija izračunava preko razlike vrijednosti jedinica posmatranja od aritmetičke sredine koristi se izraz SD SD gde je SD oznaka za standardnu devijaciju, a SD je varijansa. Prema tome standardna devijacija je pozitivna vrijednost drugog korjena varijanse. SD var ijansa 80

81 Varijansa, srednje kvadratno odstupanje je mjera varijabilnosti koja se dobija kao količnik sume kvadratnih odstupanja vrijednosti jedinica posmatranja od aritmetičke sredine i ukupnog broja jedinica posmatranja. Kao mjera varijabiliteta ona nije pogodna za statističku upotrebu jer se kvadriranjem razlika dobijaju velike vrijednosti. Vađenjem kvadratnog korena iz varijanse dobija se standardna devijacija koja je mnogo pogodnija mjera varijabiliteta u statističkim istraživanjima. Kako se varijansa za negrupisane apsolutne vrijednosti dobija preko izraza SD a za grupisane podatke preko izraza SD i N i1 ik i1 f i N x x i ik i1 i f i x x zamjenom u izraz za standardnu devijaciju dobija se da je standardna devijacija za negrupisane podatke i za grupisane podatke SD in i1 in xi x xi N i1 N x SD i N i 1 f i i N x i x f i xi i k i1 f i i1 i k i1 f i x Prva forma ovih izraza koristi se u slučaju kada je aritmetička sredina decimalan broj što znači da je upotreba matematičkog izraza zavisna od podataka. Upotrebljava se ona forma odgovarajućeg izraza koja olakšava i ubrzava dobijanje rezultata. Da bi se na ovaj način izračunala vrijednost standardne devijacije potrebno je prethodno izračunati aritmetičku sredinu. Postupak izračunavanja preporučljivo je obavljati u formi radnih tabela jer se time smanjuje mogućnost radne greške pri računskim operacijama. Primjer 1. Odrediti varijabilnost sljedećih vrijednosti holesterola u serumu: 4,5-4,1-5,3-4,4-4,7-4,0-5,5-5,1-6,0-6,4 mmol/l. 81

82 n x i x i x x i x 1 4,5-0,5 0,5 4,1-0,9 0,81 3 5,3 0,3 0,09 4 4,4-0,6 0,36 5 4,7-0,3 0, ,5 0,5 0,5 8 5,1 0,1 0, ,4 1,4 1,96 Ukupno ,8 xi X N SD xi x N 5mmol / l x SD 5 0,76mmol / l 5,8 10 0,76mmol / l Empirijski podaci nisu grupisani pa je primijenjen odgovarajući izraz i to u formi koja odgovara cijelom broju aritmetičke sredine. Primjer. Ocjene životne sposobnosti novorođenčeta prikazane su distribucijom frekvencija. Odrediti varijabilitet. Broj n Ocjena (x) fx fx novorođenčadi Ukupno / f i xi x f SD i f x f 175 7,954 i i i x 141 SD 7,954 1,35 1,151 x SD 7,954 1,151 8

83 Empirijski podaci sređeni su u distribuciji frekvencija po grupama pa je u skladu sa tim izvršen izbor matematičkog izraza, a njegova forma odgovara decimalnom broju aritmetičke sredine. Primjer 3. Odrediti varijabilnost vitalnog kapaciteta pluća 0 osoba. Podaci su prezentovani distribucijom frekvencija. n Vitalni kapacitet Broj osoba (f) x 1 f i x i f i (x i ) Ukupno / 0 / f i x x f SD i i f x i f x x SD ml i i ,038 Empirijski podaci prikazani su distribucijom frekvencija po grupnim intervalima pa se kao i za izračunavanje aritmetičke sredine i ovdje uzima kao vrijednost obilježja sredina intervala. Standardnom devijacijom može se vršiti upoređivanje varijabiliteta istih obilježja ali pod uslovom da su aritmetičke sredine iste ili se vrlo malo razlikuju Koeficijent varijacije (relativna mjera verijabiliteta) Koeficjent varijacije (relativna standardna varijacija) je mjera varijebiliteta koja omogućava poređenje varijabilnosti različitih obilježja kao i istih obilježja sa različitom aritmetičkom sredinom. Ovu funkciju koeficjent varijacije ima zahvaljujući svom osnovnom svojstvu da je neosjetljiv na promjenu veličine mjerila. Koeficjent varijacije obilježava se simbolom CV ili samo V. Dobija se kao količnik standardne devijacije i aritmetičke sredine: SD CV V. x

84 Obično se izračunava u procentima pa gornji izraz glasi CV SD / x *100. Dakle, koeficjent varijacije je standardna devijacija izražena u procentima aritmetičke sredine.iz same formule se vidi da je koeficjent varijacije manji što je standardna devijacija manja u odnosu na aritmetičku sredinu i obrnuto. Prema tome varijabilitet pojave je utoliko manji ukoliko je manji koeficjent varijacije. Kako je varijabilitet pojave obrnuto proporcionalan sa homogenošću jedinica posmatranja to koeficjent varijacije koristimo istovremeno i kao mjeru homogenosti. Homogenost neke pojave je veća ukoliko je koeficjent varijacije manji. Pojava je homogena ako je koeficjent varijacije manji od 30% (CV<30%). Koeficjent varijacije se upotrebljava u slučaju kada se želi utvrditi: a) u kome obilježju neka grupa varira više, a u kome manje; b) koja od grupa varira više a koja manje u istom obilježju. Primjer 1. Rezultati mjerenja tjelesne visine i mase 10 studentica su: X tv 168cm, SD tv 1, 1cm, X tm 6kg, SD tm 3, kg, dok su 10 studenata imali ove rezultate: X t 160cm, SDtv 1, cm, X tm 78kg, SD tm, 5kg. Da li studenti više variraju u visini ili masi i da li u masi više variraju studenti ili studentice. Rješenje: Koeficijent varijacije visine (studenti) SDtv 1, CV m * 100 *100 0,67% X 180 tv Koeficijent varijacije težine (studenti) SDtm,5 CV m * 100 *100 3,% X 78 tm Koeficijent varijacije težine (studentice) 84

85 SDtm 3, CV z * 100 *100 5,16% X 6 tm Koeficijent varijacije visine (studentice) SDtv 1,1 CV z * 100 *100 0,65% X 168 tv Kako je koeficjent varijacije visine studenata (0,67%) manji od koeficjenta varijacije mase studenata (3,%) može se zaključiti da studenti više variraju u težini nego u visini. Poređenjem koeficjenta varijacije težine studentica (5,16%) sa koeficjentom varijacije težine studenata (3,%) dolazi se do zaključka da studentice više variraju u masi od studenata. Isti zaključak vrijedi i u odnosu na polove (ženski, muški) Zed vrijednost (položaj pojedinačnog rezultata u skupu) Varijabilitet se može ocjenjivati ne samo sa stanovišta distribucije frekvencija kao cjeline, nego i sa stanovišta individualnih podataka. Mjera ove varijacije je zed vrijednost. Zed vrijednost naziva se još i standardizovana, standardna ili normalizovana zed vrijednost. Zed vrijednost je relativna mjera varijabiliteta. Označava se, zbog razlikovanja od zed testa, samo malim latiničnim slovom zed - z. Izražava se kao decimalni broj. Zed vrijednost je proistekla iz karakteristika standardne normalne raspodjele. Po definiciji, zed vrijednost je odstupanje jedne vrijednosti obilježja posmatranja od njegove aritmetičke sredine izraženo u dijelovima standardne devijacije. Prema tome, zed vrijednost se dobije kada se razlika jedne vrijednosti obilježja posmatranja i njegove aritmetičke sredine podijeli sa odgovarajućom standardnom devijacijom obilježja posmatranja. z X X X SD X z x x x sd Prvi od gornjih izraza (sa velikim slovima i velikim slovom u indeksu) koristi se određivanje zed vrijednosti osnovnog skupa, a drugi (sa malim slovima i malim slovom u indeksu) za određivanje zed vriednosti uzorka. Zed vrijednost ima velike i značajne mogućnosti primjene. Iz definicije i formule se vidi da se pomoću zed vrijednosti dobija informacija o odnosu jedinice posmatranja prema skupu, bilo osnovnom bilo uzorku. x 85

86 Zed vrijednošću se može određivati i porediti stanje i ponašanje jedinica posmatranja i u onim empirijskim situacijama gdje su mjerenja vršena različitim mjernim sistemima ili mjernim jedinicama iste vrste ali različite težine tj. iznosa. Međutim, zed vrijednost se prije svega koristi za određivanje položaja rezultata u grupi. Primjer 1. Stanje psihomotorike jedne grupe ispitanika procjenjivano je primjenom dva testa (T 1 i T ). Test T 1 ima maksimum 15 bodova a test T ima maksimum 10 bodova. Aritmetička sredina i standardna devijacija iznosile su na prvom testu 7,0 i 1,0 a na drugom 60,0 i 14,0 bodova. Usporediti stanje psihomotorike ispitanika A (T 1 = 9; T =74 boda) i B (T 1 = 6; T =90 bodova). Ukupno na oba testa ispitanik A je postigao 83 boda a ispitanik B 96 bodova. Iz odnosa bodova moglo bi se zaključiti da ispitanik B ima bolju psihomotoriku od ispitanika A, jer veći broj bodova označava bolje stanje psihomotorike. Ovaj zaključak međutim nije ispravan jer težina bodova korištenih testova nije ista. Prvi test ima interval variranja od 15 bodova (T 1 = 15-0 = 15 bodova) a drugi 10 bodova (T = 10-0 =10). Jedan bod prvog testa vrijedi osam bodova drugog testa (T / T 1 =10/15=8) odnosno jedan bod drugog testa teži 0,15 bodova prvog testa (T 1 / T =15/10=0,15). Znači, da bi se došlo do ispravnog zaključka potrebno je ujednačiti težinu bodova bilo množenjem bodova prvog testa sa osam bilo dijeljenjem bodova drugog testa sa 0,15. Na taj način dobijaju se novi skorovi. Ispitanik A ima skor od 146 odnosno 18,15 a ispitanik B 138 odnosno 17,5. Prema tome ispitanik A ima bolju psihomotoriku od ispitanika B. Do ispravnog zaključka može se doći jednostavnije primjenom zed vrijednosti z A z A1 z A z B z B z B 1,14 1, Ispitanik A ima skor od tri standardne devijacije a ispitanik B od 1,14 standardnih devijacija. Zed vrijednost ispitanika A veća je od zed vrijednosti ispitanika B pa se može zaključiti da ispitanik A ima bolju psihomotoriku od ispitanika B. 86

87 Primjer. Aritmetička sredina i standardna devijacija glikemije ispitanika grupe A iznosile su 90,0 i 7 mg %, a grupe B 5,0 i 1,5 mmol/l. Usporediti nivo glikemije ispitanika A 3 (117 mg %) i B 5 (6,5 mmol/l). Glikemija ispitanika grupe A određivana je u starim, a grupe B u novim jedinicama mjera. Korištenjem zed vrijednosti može se i bez konverzije mjernih jedinica, na jednostavniji način, dobiti odgovor na postavljeno pitanje. x x z A3 1 sd 7 7 z x x x 6,5 5,0 1,5 sd 1,5 1,5 B5 x 1 Na osnovu zed vrijednosti može se zaključiti da oba ispitanika imaju isto povećanje glikemije u odnosu na prosjek svoje grupe. U ovom konkretnom slučaju ispitanici ustvari imaju isti nivo glikemije, jer obe grupe ispitanika imaju isti prosječni nivo (90 mg % = 5,0 mmol/l) i varijabilitet (7/90 = 0,3; 1,5/5,0 = 0,3) vrijednosti glikemije. Primjer 3. U cilju procjene zdravstvenog stanja jedne grupe ispitanika određivane su, između ostalog, vrijednosti četiri tipa lipida u krvi. Dobijeni rezultati prikazani su tabelarno. Lipidi Statistički parametri X sr SD Jedinica mjere Ukupni holesterol 4,5 0,9 mmol/l HDL - holesterol 55,5 11,1 mg/dl Trigleceridi 1,4 0,3 mmol/l LDH - holesterol 90,0 18,0 mg/dl Usporediti nivo lipida u krvi ispitanika A (H=8 mmol/l; HDL-H=90 mg/dl; T= mmol/l; LDH-H=115 mg/dl) i ispitanika B (H=7 mmol/l; HDL-H=50 mg/dl; T=1,8 mmol/l; LDH-H=100 mg/dl). 87

88 Zed vrijednost Lipidi A B Ukupni holesterol (8-4,5)/0,9=3,89 (7-4,5)/0,9=,78 HDL - holesterol (90-55)/11=3,14 (50-55,5)/11=-0,50 Trigleceridi (-1,4)/0,8=,14 (1,8-1,4)/0,8= 1,43 LDH - holesterol (115-90)/18=1,39 (100-90)/18= 0,56 Ukupno 3,89+3,14+,14+1,39=10,56 4,77-0,5=4,47 Prosječno 10,56/4= +,64 4,7/4= +1,07 Ispitanik A ima prosječno povećanje lipida za,64 sd, a ispitanik B takođe ima prosječno povećanje lipida, ali za 1,07 sd. Ispitanik B ima manje prosječno povećanje lipida u krvi. Sudeći po nivou lipida u krvi ispitanik B ima bolje stanje zdravlja od ispitanika A Uspoređivanje varijabiliteta Procjena varijabiliteta neke pojave se vrši na osnovu odnosa aritmetičke sredine i standardne devijacije. Ako se upoređuje varijabilitet dvije pojave razlikujemo sljedeće mogućnosti, odnosno situacije: a) ako je X Y, a SD x SD y varijabilitet je isti; b) ako je X Y, a SDx SDy varijabilitet je manji tamo gde je manja standardna devijacija i obrnuto; c) ako je X Y, a SDx SD y varijabilitet je manji tamo gde je veća aritmetička sredina i obrnuto; d) ako je X Y, a SDx SD y mora se izračunati koeficjent varijacije i tamo gde je on manji, manji je i varijabilitet odnosno veća je homogenost Mjere oblika distribucije Pored mjera centralne tendencije i mjera varijabiliteta u pokazatelje distribucije pojave ubrajaju se i mjere oblika distribucije i to: mjera asimetrije i mjera spljoštenosti distribucije frekvencija posmatranog statističkog skupa. Distribucija frekvencija statističkog skupa je simetrična kad frekvencije vrijednosti obilježja ravnomjerno opadaju ili rastu počevši od aritmetičke 88

89 sredine, a asimetrična je kad elementi skupa pokazuju tendenciju grupisanja oko vrijednosti obilježja koja se nalazi ispod ili iznad srednje vrijednosti. U zavisnosti od odnosa frekvencije srednjih vrijednosti i frekvencije ostalih vrijednosti obilježja distribucija je više ili manje spljoštena. Za određena mjerenja u statistici koriste se odstupanja vrijednosti obilježja od aritmetičke sredine skupa na određeni stepen, tzv. centralni momenti distribucije (M). Nulti moment (M 0 ) jednak je jedinici, prvi moment (M 1 ) jednak je nuli, drugi moment (M) jednak je varijansi a treći (M 3 ) i četvrti moment (M 4 ) koriste se za izraunavanje relativnih mjera asimetrije i spljoštenosti. Za mjerenje asimetrije koristi se treći moment, a za mjerenje spljoštenosti četvrti moment distribucije frekvencija koji su za grupisane podatke dati sa izrazima: k 1 k M 3 f i ( xi x) M 4 N fi ( xi x) i1 N i1 Kako su i treći i četvrti moment izraženi u istim jedinicama mjere kao i empirijski podaci na osnovu kojih se računaju oni nisu pogodni kao mjere koje služe za usporedbu sa drugim rezultatima. Zbog toga se izračunavaju relativni pokazatelji oblika distribucija frekvencija statističkog skupa. Koeficijent asimetrije Odnos trećeg momenta i standardne devijacije na treći stepen određuje koeficijent asimetrije koji se označava sa i iznosi: M 3 a3 3 SD Za simetrične distribucije frekvencija koeficijent asimetrije jednak je nuli, a u slučaju postojanja asimetrije koeficijent 3 različit je od nule. Od smjera asimetrije zavisi da li će koeficijent biti pozitivan ili negativan. Kod pozitivne asimetrije (asimetrija"udesno") koeficijent 3 je veći od nule (pozitivan) dok je kod negativne asimetrije (asimetrija "ulijevo") manji od nule (negativan). Što je koeficijent 3 veći od nule (bez obzira na smjer) to je asimetrija distribucije frekvencija veća. Za distribuciju frekvencija se kaže da je umjereno asimetrična ako se vrijednost 3 kreće u intervalu od -0,5 do +0,5 (uz uslov da je različit od nule), a van tog intervala distribucija frekvencija je znatno asimetrična. 89

90 x Me Mo Slika a) Simetri~na distribucija frekvencija x Me Mo Slika b) Negativno asimetri~na distribucija frekvencija Mo Me x Slika c) Pozitivno asimetri~na distribucija frekvencija 90

91 Kod simetrične distribucije frekvencija vrijednosti aritmetičke stedine, medijane i moda međusobno su jednake ( o ). Kod pozitivne asimetrije (asimetrije "udesno") pomjera se aritmetička sredina u odnosu na mod ka većim vrijednostima jedinica posmatranja, odnosno vrijedi: x M e M o. Kod negativne asimetrije (asimetrije "ulijevo") pomjera se aritmetička sredina u odnosu na mod ka manjim vrijednostima jedinica posmatranja, odnosno vrijedi: x M e M. x M e M Kad je distribucija simetrična ovaj koeficijent jednak je nuli. Za asimetrične distribucije vrijednost ovog koeficijenta kreće se u intervalu 1. Ova svojstva Pirson (Pearson) je iskoristio za definiciju koeficijenta asimetrije, koji predstavlja odnos razlike aritmetičke sredine i moda prema standardnoj devijaciji, tj.: x M o SK 1 SD Zbog nedostataka moda kao mjere centralne tendencije, a imajući u vidu da je M o x 3( x M e ) u slučaju kad asimetrija nije velika, može se Pirsonov koeficijent asimetrije iskazati i u obliku: 3( x M e) SK SD Kad je ovaj koeficijent jednak nuli to je znak da je distribucija simetrična, a kad se njegove vrijednosti približavaju 3 to, zavisno od predznaka, označava naglašenu pozitivnu ili negativnu asimetriju distribucije frekvencija. Još se koristi, kao mjera asimetrije, i mjera zasnovana na vrijednostima prvog i trećeg kvartila i medijane, poznata pod nazivom Bovlijev (Bowley) koeficijent asimetrije. Ova mjera asimetrije polazi od činjenice da je kod asimetričnih distribucija frekvencija razlika između trećeg kvartila i medijane jednaka razlici medijane i prvog kvartila, tj. Q 3 - M e = M e Q 1. Odatle izraz za ovaj koeficijent glasi: ( Q S a 3 1 o 1 Q3 ) M Q Q e 91

92 Vrijednost Bovlijevog koeficijenta asimetrije jednaka je nuli za simetričnu distribuciju, dok mu se u slučaju asimetrične distribucije vrijednost kreće u interval 1. Koficijent spljoštenosti Odnos četvrtog momenta i standardne devijacije na četvrti stepen predstavlja relativnu mjeru spljoštenosti, koja se označava sa 4 : M 4 SD Ako je 4 = 3, smatra se da distriducija ima normalnu spljoštenost. Ako je 4 > 3 distriducija je više izdužena, odnosno spljoštenost je manja od normalne. Ako je α 4 < 3 distriducija je više spljoštena, odnosno spljpštenost je veća od normalne (Slike a, b, c). 4 4 Slika a) Oblici spljoštenosti: spljoštenost manja od normalne 4 > 3 Slika b) Oblici spljoštenosti: normalna spljoštenost 4 = 3 9

93 Slika c) Oblici spljoštenosti: spljoštenost veca od normalne 4 < 3 3. Analitička statistika 3.1. Statistička analiza Statistička analiza predstavlja posljednju i istovremeno krunsku fazu kako statističke obrade tako i kompletnog istraživanja. Statistička analiza je matematičko logički postupak donošenja zaključaka o problemu istraživanja, na osnovu rezultata adekvatno odabranih i pravilno primjenjenih specifičnih statističkih metoda, analitičkih metoda. Primjena svakog analitičkog metoda rezultira donošenjem statističkog zaključka. Statistički zaključci donose se na osnovu egzaktnih matematičko-statističkih pravila odlučivanja specifičnih za primjenjeni tip analitičkog metoda. Na osnovu statističkog zaključka donose se stručni zaključak, u oblasti u kojoj se istražuje, na primjer, zaključak u oblasti prirodnih, tehničkih, agronomskih, medicinskih, drustvenih, humanističkih nauka. Logičko transponovanje statističkog u stručni zaključak veoma je osjetljiv tranutak statističke analiza jer interpretacija statističkog zaključka nije više stvar egzaktnih statističkih pravila nego opšteg i stručnog iskustva i sposobnosti analitičkog rezonovanja istraživača. Objedinjavanjem značenja svih stručnih zaključaka formira se opšti, generalizovani zaključak o problemu istraživanja. Ukoliko generalizovani zaključak sadrži nove zakonomjernosti o ispitivanom problemu on postaje teorija bazične nauke u kojoj je primjenjeno statističko istraživanje. Statistički zaključci o problemu istraživanja donose se najčešće na osnovu ispitivanja reprezentativnog dijela osnovnog skupa tj. na osnovu rezultata dobijenih obradom podataka iz uzorka. Apsolutna vjerodostojnost (tačnost) ovako dobijenih zaključaka, odnosno apsolutna podudarnost zaključka dobijenog na osnovu uzorka sa zaključkom koji bi se dobio ispitivanjem osnovnog skupa, može se slobodno smatrati nevjerovatnim događajem. Zaključci izvedeni na osnovu ispitivanja uzorka uvijek, manje ili više, odstupaju od zaključaka dobijenih na osnovu ispitivanja osnovnog skupa. 93

94 Oni prema tome predstavljaju procjenu pravog stanja ispitivanog problema u osnovnom skupu. Zbog toga, zaključci izvedeni na osnovu ispitivanja uzorka uvijek sa sobom nose mogućnost manje ili veće greške. Naučnu vrijednost obezbjeđuje im mogućnost utvrđivanja stepena njihove izvjesnosti tj. sigurnosti. Sigurnost statističkog zaključivanja garantuje, unaprijed izračunata maksimalno dozvoljena greška u zaključivanju. Određivanje nivoa greške, a preko nje i nivoa sigurnosti, statističkog zaključka omogućava teorija vjerovatnoće. Osnovni pojmovi bitni za razumijevanje statističkog načina zaključivanja su: - vjerovatnoća sigurnosti, - vjerovatnoća greške i - nivo značajnosti. Vjerovatnoća sigurnosti: Vjerovatnoća sigurnosti (izvjesnosti) je minimalna vjerovatnoća koja govori u prilog donesenog zaključka. Ona garantuje ispravnost zaključka. Vjerovatnoća greške: Vjerovatnoća greške (rizika) je maksimalna vjerovatnoća dopustive greške u zaključivanju. Vjerovatnoća sigurnosti i vjerovatnoća greške su parcijalne komplementarne vjerovatnoće pa se dopunjuju do vrijednosti ukupne vjerovatnoće, do jedinice ili do sto procenata. Nivo značajnosti: Komplementarni odnos vjerovatnoće sigurnosti i vjerovatnoće greške tj. rizika definiše nivo značajnosti zaključka. Konvencijom su utvrđena dva granična nivoa značajnosti. "Minimalni nivo značajnosti": Minimalni nivo značajnosti u medicinskim istraživanjima, uslovljen je maksimalno dozvoljenom greškom od pet procenata. Minimalni nivo značajnosti definisan je, prema tome, odnosom vjerovatnoće sigurnosti od 0,95 (95%) i vjerovatnoće greške tj. rizika od 0,05 (5%). Minimalni nivo značajnosti obezbjeđuje značajnost statističkog zaključka. "Maksimalni nivo značajnosti": Drugi, konvencijom utvrđen granični nivo značajnosti definisan je odnosom vjerovatnoće sigurnosti od 0,99 (99%) i vjerovatnoće greške odnosno rizika od 0,01 (1%). Ovaj granični nivo značajnosti obezbjeđuje visoku značajnost statističkog zaključka. 94

95 95 Statistički zaključak odnosi se na uzorke osnovnog skupa, jednake veličine, ispitivane pod istim uslovima i na isti način. Ako se neki statistički zaključak donese sa vjerovatnoćom sigurnosti od 0,95 to znači da će se ispitivana karakteristika ili pojava sigurno ostvariti u 95 od 100 takvih uzoraka, a da u 5 od 100 uzoraka ovaj zaključak, može ali ne mora važiti. Stepen slobode: Pored navedenih pojmova još se definiše i stepen slobode kao statistički parametar od opšteg značaja. DF = r - s gdje je DF - stepen slobode (Degree of Fredom), r - broj članova posmatranog niza (broj podataka), s - broj statističkih parametara potrebnih za izvođenje konkretnog analitičkog metoda. U odnosu na cilj i način odlučivanja (zaključivanja) razlikuju se dvije vrste statističke analize: - ocjenjivanje karakteristika (parametara) osnovnog skupa i - ispitivanje statističkih hipoteza. U prvom slučaju procjenjuju (ocjenjuju) se kvantitativne karakteristike odnosno vrijednosti parametara osnovnog skupa. Nepoznata vrijednost parametara osnovnog skupa procjenjuje se metodom intervala povjerenja (pouzdanosti), a na osnovu ocjene tog parametra izračunatog iz uzorka. U drugom slučaju ispituje se neka naučna pretpostavka (hipoteza) o uočenoj pojavi. Pod ispitivanjem postavljene hipoteze podrazumijeva se postupak provjere njene istinitosti (ispravnosti), odnosno postupak procjene značajnosti ispitivane pojave. Postupkom provjere ispravnosti hipoteze može se procjenjivati: - značajnost sličnosti oblika raspodjela, - značajnost razlike i - značajnost paralelizma (povezanosti, zavisnosti). Značajnost sličnosti oblika raspodjela Značajnost sličnosti oblika raspodjela izvodi se složenim postupkom od više faza koji u sebe, između ostalog uključuje i testiranje hipoteze. Analitički statistički metodi dijele se na parametarske, ako se pretpostavlja poznavanje oblika raspodjele i neparametraske koji ne traže da se poznaje oblik raspodjele. Značajnost razlike Značajnost razlike procjenjuje se metodima testiranja hipoteza. Značajnost paralelizma

96 Značajnost paralelizma ispituje se metodima regresije i korelacije Ispitivanje hipoteze Ispitivanje hipoteze predstvalja postupak provjere istinotosti naučne pretpostavke o pojavi koja se ispitje. Ispitivanje hipoteze, odnosno procjena značajnosti sve tri ispitivane pojave (sličnosti oblika raspodjele, razlike i paralelizma tj. povezanosti) ima istovjetnu logičku proceduru odnosno faze postupka. Postoji šest faza ispitivnja hipoteze: formulisanje statističkih hipoteza; izbor nivoa značajnosti; izbor analitičkog metoda; izračunavanje empirijske vrijednosti metoda; određivanje teorijske vrijednosti metoda; podeđenje empiriske i teorijske vrijednosti metoda - donošenje statističkog zaključka; donošenje medicinskog zaključka Formulacija statističkih hipoteza: Ispitivanje statističkih hipoteza podrazumijeva obavezno postojanje dvije, jasno definisane, po zvom značenju suprotne hipoteze. Statističke hipoteze obilježavaju se velikim latiničnim slovom ha (H). Prva tzv. radna hipoteza, koja se obilježava sa H 1, postavlja se sa ciljem da bude prihvaćena, jer sadrži pretpostavku koja je po mišljenju istraživača tačna. Druga tzv. nulta hipoteza, koja se obilježava sa H 0, postavlja se sa ciljem da bude odbačena jer sadrži pretpostavku koja je po mišljenju istraživača pogrešna. Postupkom ispitivanja hipoteza provjerava se ispravnost (istinitost) nulte hipoteze a indirektno, preko ispravnosti nulte, ispravnost radne hipoteze. Dakle, nulta hipoteza je pretpostavka koja se u toku analize smatra tačnom i cjelokupno ispitivanje hipoteza počiva na pretpostavci da je H 0 istinita. Prihvatanjem nulte odbacuje se radna hipoteza i donosi statistički zaključak koji je uslovljen značenjem nulte hipoteze. Obrnuto, odbacivanjem nulte automatski se prihvata radna hipoteza i donosi zaključak uslovljen radnom hipotezom. Radna (alternativna) hipoteza: Naučna pretpostavka pomoću koje se dovodi u vezu ispitivana pojava i cilj istraživanja naziva se radna ili alternativna hipoteza H 1. Ova hipoteza objašnjava nastanak ispitivane pojave pod 96

97 97 uticajem konkretnog organizavanog faktora djelovanja pa se on smatra uzrokom njenog nastanka. S obzirom na mnogobrojnost i raznovrsnost radnih hipoteza, njihova objektivna prihvatljivost, najjednostavnije se verifikuje njenom konfrontacijom sa, njoj suprotnom, nultom hipotezom. Nulta hipoteza: Indirektna provjera validnosti radne preko nulte hipoteze moguća je zahvaljujući specifičnom značenju nulte hipoteze. Za razliku od radne, nulta hipoteza ne ispoljava ni brojnost ni raznovrsnost, već naprotiv, istovjetnost odnosno uniformnost tvrđenja. Nulta hipoteza tvrdi da je proučavana pojava rezultat slučajnih zbivanja pa se zbog toga ne može smatrati značajnom. Prema tome, nulta hipoteza je teorijska hipoteza, odnosno standard za procjenu validnosti radne hipoteze. Zavisno od ispitivane pojave i cilja istraživanja statističke hipoteze mogu se formulisati na dva načina odnosno mogu imati dvije forme, dva oblika: jednosmjerni i dvosmjerni. Hipoteza je dvosmjerna ako se formuliše tako da zanemaruje mogući smjer variranja pojave. Na primjer: pojava A se razlikuje od pojave B ili pojava A je povezana sa pojavom D. Ako se statističke hipoteze formulišu tako da uzimaju u obzir i mogući smjer variranja pojave radi se o jednosmjernom tipu hipoteze. Na primjer: pojava A je češća, veća od pojave B, pojava C je rijeđa, manja od pojave D; pojava A je povezana sa pojavom D u pozitivnom smislu; pojava B povezana je sa pojavom C u negativnom smislu; itd. Hipoteze se obavezno formulišu prije početka istraživanja, jer se time izbjegava subjektivnost istraživača. Izbor nivoa značajnosti: Izbor nivoa značajnosti donošenja statističkih zaključaka vrši se prije početka istraživanja. Nivoom značajnosti direktno se bira i kontroliše vjerovatnoća odbacivanja istinite (tačne) nulte hipoteze. Na izbor nivoa značajnosti utiče više faktora a najbitniji je svakako značaj problema koji se razmatra, odnosno moguće posljedice odluke zasnovane na zaključku ispitivanja statističkih hipoteza. Izbor analitičkog metoda: U okviru izbora odgovarajućeg analitičkog metoda vrši se izbor vrste, tipa i konkretne formule metoda. Izbor vrste metoda direktno je uslovljen ciljem ispitivanja hipoteze. Tako se za procjenu značajnosti razlike koristi odgovarajući statistički test a za procjenu

98 povezanosti odgovarajući metodi regresije i korelacije. Izbor tipa (parametarski i neparametarski metod) te formule metoda zavisi od uslova primjene i konkretne situacije. Izračunavanje empirijske vrijednosti metoda: Empirijska vrijednost metoda uslovljena je informacijom (podacima) iz uzorka. Računa se tako da se raspoloživi podaci dobijeni istraživanjem uvrste u formulu analitičkog metoda. Od iznosa empirijske vrijednosti metoda direktno zavisi zaključak ispitivanja hipoteza. Određivanje teorijske vrijednosti metoda: Teorijska vrijednost metoda bazirana je na tzv. nultoj (hipotetičkoj) raspodjeli. Nulta raspodjela predstavlja raspodjelu vjerovatnoća analitičkog metoda pod uslovom da je nulta hipoteza istinita. Nulta (hipotetička) raspodjela obuhvata one vrijednosti analitičkog metoda koje se mogu izračunati na osnovu svih uzoraka koji potiču iz osnovnog skupa kada je stvarna vrijednost parametara skupa jednaka njegovoj hipotetičkoj vrijednosti. Postoje dvije grupe vrijednosti analitičkog metoda, one koje su vjerovatne i one koje su malo vjerovatne. Skup malo vjerovatnih vrijednosti izabranog analitičkog metoda naziva se oblast odbacivanja nulte hipoteze. Skup svih preostalih vrijednosti analitičkog metoda naziva se oblast prihvatanja nulte hipoteze. Da bi se razgraničila oblast prihvatanja od oblasti odbacivanja nulte hipoteze potrebno je precizirati vrijednost male vjerovatnoće javljanja vrijednosti primjenjenog analitičkog metoda odnosno, treba odrediti koliko treba biti mala vjerovatnoća javljanja vrijednosti analitičkog metoda da bi se odbacila nulta hipoteza. Izborom nivoa značajnosti upravo se određuje prihvatljivo mali nivo vjerovatnoće odbacivanja istinite nulte hipoteze. Položaj odbacivanja nulte hipoteze određen je formulacijom radne hipoteze. Ako se radi o ispitivanju pojave koja varira u oba smjera, tj. ukoliko se radi o dvosmjernom načinu ispitivanja hipoteza, oblast odbacivanja simetrično je raspoređena na oba kraja teorijske (hipotetičke distribucije); vidi slike ! 98

99 Slika : Koncept dvosmjernog testiranja: p=0,05 Slika : Koncept dvosmjernog testiranja: p=0,01 Ako se radi o jednosmjernom načinu ispitivanja hipoteza, oblast odbacivanja nulte hipoteze (vjerovatnoća greške) nalazi se samo na jednoj strani nulte distribucije. Ako pojava varira ulijevo oblast odbacivanja nulte hipoteze nalazi se na lijevoj strani distribucije (slike ), a ako pojava varira udesno oblast odbacivanja nulte hipoteze nalazi se na desnoj strani nulte distribucije. Slika : Koncept jednosmjernog testiranja ulijevo: p=0,05 99

100 Slika : Koncept jednosmjernog testiranja ulijevo: p=0,01 Slika : Koncept jednosmjernog testiranja udesno: p=0,05 Slika : Koncept jednosmjernog testiranja udesno: p=0,01 Vrijednosti primjenjenog analitičkog metoda koje razdvajaju oblast prihvatanja od oblasti odbacivanja nulte hipoteze nazivaju se granične odnosno teorijske vrijednosti i određuju se primjenom odabranog nivoa vjerovatnoće greške prve vrste (α) (nivo značajnosti) na formiranu hipotetičku raspodjelu vjerovatnoća vrijednosti analitičkog metoda. Za svaki analitički metod izračunati su i svrstani u tablice svi numerički iznosi teorijskih vrijednosti. 100

101 Poređenje empiriske i teorijske vrijednosti metoda - donošenje statističkog zaključka: Statistički zaključak donosi se poređenjem izračunate (empirijske) i određene (teorijske) tj. granične vrijednosti izabranog analitičkog metoda. Ukoliko empirijska vrijednot ima veliku vjerovatnoću javljanja kada je nulta hipoteza istinita ona potvrđuje (podržava) istinitost nulte hipoteze. I obrnuto, ako je empirijska vrijednost malo vjerovatna kad je nulta hipoteza istinita ona diskvalifikuje nultu a potvrđuje radnu hipotezu. Imajući u vidu značenje teorijskih vrijednosti analitičkog metoda razlikuju se dva principa donošenja statističkog zaključka. Prvi princip Kada je teorijska vrijednost metoda maksimalna vrijednost analitičkog metoda za koju još uvijek važi nulta hipoteza: a) ako je empirijska vrijednost metoda manja od teorijske određene za vjerovatnoću rizika od 0,05 prihvata se nulta a odbacuje radna hipoteza i donosi se zaključak da ispitivana pojava nije statistički značajna (p> 0.05); b) ako je empirijska vrijednost metoda veća od teorijske odbacuje se nulta a prihvata radna hipoteza i zaključuje da je ispitivana pojava statistički značajna (p < 0,05) odnosno visoko značajna (p < 0,01) u zavisnosti od nivoa značajnosti odabranog za procjenu hipoteza. Drugi princip Kada je teorijska vrijednost metoda maksimalna vrijednost za koju je pojava (u ovom slučaju razlika) još uvijek značajna: a) ako je empirijska vrijednost manja od granične odbacuje se nulta a prihvata radna hipoteza i zaključuje se da je razlika još uvijek značajna (p<0,05) odnosno, visoko značajna (p<0,01) u zavisnosti od izabranog nivoa značajnosti; b) ako je empirijska vrijednost veća od granične prihvata se nulta a odbacuje radna hipoteza i zaključuje da razlika više nije statistički visoko značajna (p > 0,01) odnosno značajna (p > 0,05). Ovdje ćemo prihvatiti i koristiti prvi princip, odnosno, kada je teorijska vrijednost metoda maksimalna vrijednost analitičkog metoda za koju još uvijek važi nulta hipoteza: a) ako je empirijska vrijednost metoda manja od teorijske određene za vjerovatnoću rizika od 0,05 prihvata se nulta a odbacuje radna hipoteza i donosi se zaključak da ispitivana pojava nije statistički značajna (p> 0.05); b) ako je empirijska vrijednost metoda veća od teorijske odbacuje se nulta a prihvata radna hipoteza i zaključuje da je ispitivana pojava statistički značajna (p < 0,05) odnosno visoko značajna (p < 0,01) u zavisnosti od nivoa značajnosti odabranog za procjenu hipoteza. 101

102 3.1.. Greške u zaključivanju Kako se statistički zaključci baziraju na informaciji dobijenoj iz uzorka pri ispitivanju statističkih hipoteza uvijek je prisutan izvjesan stepen rizika tj. mogućnost greške. Postupak procjene ispravnosti hipoteze ima, zbog toga, četiri moguća ishoda. Stvarnost Nulta hipoteza tačna Nulta hipoteza pogrešna Testiranje nulte hipoteze Odluka Nulta hipoteza se prihvata Nulta hipoteza se odbacuje Pravilna odluka (1-α) Greška II vrste (β) Greška I vrste (α) Pravilna odluka (1-β) Ispravan zaključak donosi se u slučaju da se prihvati tačna ili da se odbaci pogrešna nulta hipoteza. Pogrešan zaključak donosi se u slučaju da se odbaci tačna ili da se prihvati pogrešna hipoteza. Odbacivanjem tačne nulte hipoteze čini se greška prve vrste. Prihvatanjem pogrešne nulte hipoteze čini se greška druge vrste. (Napomena: Pri zaključivanju može se načiniti samo jedna greška, a nikako obe istovremeno). Šanse javljanja grešaka (vjerovatnoće njihovog pojavljivanja) u zaključivanju moguće je određivati i kontrolisati. Greška I vrste ():Vjerovatnoća odbacivanja tačne nulte hipoteze tj. vjerovatnoća javljanja greške I vrste obilježava se sa alfa (α). Vjerovatnoća greške prve vrste, koja se još naziva i rizik α, predstavlja uslovnu vjerovatnoću = P (greška I vrste) = P (H 0 odbačena/ H 0 je tačna) S obzirom da je vjerovatnoća greške I vrste (), maksimalna vjerovatnoća dopustive greške koju istraživač unaprijed zadaje imajući u vidu problem istraživanja, ona uslovljava nivo značajnosti donošenja zaključka. Komplementarna greški I vrste je vjerovatnoća nivoa značajnosti, odnosno vjerovatnoća sigurnosti donesenog zaključka koja iznosi 1 - To znači, ako je zadana greška =0,05 (5%), da će vjerovatnoća sigurnosti iznositi 0,95 (95%). Smanjenje rizika povećava granične vrijednosti metoda a time proširuje oblast prihvatanja nulte hipoteze koji iznosi 1 -. Greška II vrste () 10

103 Vjerovatnoća prihvatanja pogrešne nulte hipoteze tj. vjerovatnoća javljanja greške II vrste obilježava se sa Rizik predstavlja uslovnu vjerovatnoću = P (greška II vrste) = P (H 0 prihvaćena / H 0 je pogrešna) Vjerovatnoća koja je komplementarna vjerovatnoći greške druge vrste (1 predstavlja vjerovatnoću da će se primjenom konkretnog metoda odbaciti pogrešna nulta hipoteza. Dok je vjerovatnoća greške prve vrste (rizik pod direktnom kontrolom istraživača, vjerovatnoća greške druge vrste (rizik indirektno je pod njegovom kontrolom. Nivo vjerovatnoće greške druge vrste uslovljavaju četiri faktora: stvarna vrijednost parametra ispitivanog problema, nivo vjerovatnoće greške prve vrste veličina uzorka i smjer procjene ispravnosti hipoteza. Što je stvarna vrijednost ispitivanog parametra bliža njegovoj hipotetičkoj vrijednosti to je rizik prihvatanja pogrešne nulte hipoteze veći. I obrnuto, što je ova razlika veća rizik je manji. Razlika stvarne i hipotetičke vrijednosti nominirana je odgovorajućom standardnom greškom SE (Standard Error). Jedini način da se vjerovatnoća jedne greške smanji, a da se pri tome automatski ne poveća rizik javljanja druge greške je obezbjeđivanje bolje informacione osnove za procjenu ispravnosti hipoteza tj. povećanje veličine uzorka (n). Porast veličine uzorka smanjuje vjerovatnoću javljanja greške sd druge vrste tako što smanjuje standardnu grešku ocjene SE od koje n proporcionalno zavisi vjerovatnoća rizika Jačina, efikasnost i osjetljivost metoda Jačina metoda: Jačina, snaga, odnosno moć metoda je maksimalna mogućnost metoda da garantuje ispravnost (tačnost) zaključka, odnosno sposobnost metoda da otkrije pogrešnu hipotezu. Jačina metoda najčešće se označava sa. Mjeri se nivoom vjerovatnoće odbacivanja neistinite (pogrešne) nulte hipoteze. Prema tome ona predstavlja komplementarnu vjerovatnoću vjerovantnoće greške II vrste pa je njihov zbir jednak jedinici. Jačina metoda takođe je uslovna vjerovatnoća. = 1 = P (H 0 odbačena / H 0 je pogrešna) 103

104 Nivo vjerovatnoće odbacivanja pogrešne nulte hipoteze određuju isti faktori kao i rizik II vrste ali dejstvo ovih faktora ima suprotno djelovanje na njih. Jačina metoda je obrnuto proporcionalna riziku druge vrste. Jačina metoda utoliko je veća ukoliko je hipotetička vrijednost parametra ispitivanog problema bliža njegovoj stvarnoj vrijednosti. Promjene rizika prve vrste i jačine metoda odvijaju se u istom smislu, odnosno sa porastom vjerovatnoće greške I vrste raste i jačina metoda i obrnuto. Porast veličine uzorka utiče na porast jačine metoda, odnosno veći uzorak obezbjeđuje veću vjerovatnoću odbacivanja pogrešne nulte hipoteze. Efikasnost metoda: Efikasnost metoda je relativna jačina metoda. Dobija se poređenjem jačine jednog metoda sa jačinom drugog metoda, tj. standardnog metoda. Standardni metod je, obično, najjači metod za uslove pod kojima se poređenje može vršiti. Postizanje željenog nivoa efikasnosti zasniva se na određivanju veličine uzorka neophodnog za obezbjeđivanje određene jačine metoda. Relativna efikasnost metoda koja se najčešće obilježava sa e(a,b) procjenjuje se na osnovu recipročnog odnosa veličina uzoraka bilo koja dva upoređena metoda (n A /n B ). Sa n A označava se broj opservacija koje zahtijeva metod A da bi postigao istu jačinu koa i metod B zasnovan na broju opservacija n B. Podrazumijeva se da oba metoda ispituju istu nultu hipotezu (H 0 ) u odnosu na istu radnu hipotezu (H 1 ) i na istom nivou značajnosti, tj. sa istom vjerovatnoćom greške prve vrst (). Na osnovu definicije slijedi da je metod A efikasniji od metoda B ako je efikasnost veća od jedinice (e(a,b) > 1) jer mu je potrebno manje opservacija da bi postigao istu jačinu kao i metod sa kojim je upoređivan. I obratno, ako je efikasnost manja od jedan znači da je metodu A, da bi imao istu jačinu kao i metod sa kojim se upoređuje, potrebno onoliko više opservacija koliko je vrijednost efikasnosti manja od jedinice. (Primjer: e(a,b) = 0,90; 1-0,9 = 0,1 = 10%). Kada je vrijednost efikasnosti bliska jedinici u najvećem broju slučajeva oba metoda davaće iste zaključke. U praktičnoj primjeni relativne efikasnosti metoda dolazi do teškoća jer ona zavisi od radne hipoteze (a broj radnih hipoteza može biti beskonačan), oblika raspodjele osnovnog skupa kome pripada uzorak i veličine uzorka. Osjetljivost metoda: Osjetljivost ili robusnost metoda pokazuje ponašanje metoda u uslovima različitog stepena narušenosti pretpostavki (npr. normalnosti, homogenosti, simetričnosti itd.) o osnovnom skupu iz koga potiču uzorci. 104

105 Analitički metodi Prema cilju primjene, analitički metodi razvrstavaju se u četiri grupe: analitički metodi za procjenu parametara osnovnog skupa; analitički metodi za procjenu sličnosti oblika raspodjela; analitički metodi za procjenu razlike i analitički metodi za procjenu paralelizma (povezanosti, zavisnosti). Prema uslovima primjene razlikuju se dvije osnovne grupe analitičkih metoda: parametarski analitički metodi i neparametarski analitički metodi. Parametarski analitički metodi: Primjena parametarskih metoda uslovljena je poznavanjem raspodjele frekvencija statističkog skupa (osnovnog ili uzorka) i mogućnošću izračunavanja deskriptivnih statističkih parametara. Ako je normalnost raspodjele osnovnog skupa samo pretpostavka, a normalnost uzorka nije moguće provjeriti (zbog malog broja jedinica posmatranja) za primjenu parametaraskog metoda mora se obezbjediti makar minimum zahtjeva, a to znači homogenost vrijednosti obilježja posmatranja. Neparametarski analitički metodi: Za razliku od parametarskih metoda koji zahtijevaju cijeli niz striktnih preduslova primjene, neparametarski metodi najčešće zahtijevaju samo neprekidnost (kontinuiranost) raspodjele osnovnog skupa. Čak i kada je pretpostavka o neprekinutosti narušena ststistički zaključak u velikoj mjeri ostaje na snazi. Neparametarski metodi mogu se primjenjivati uvijek, tj. u svim empirijskim situacijama. Njihova primjena je obavezna u onim empirijskim situacijama koje isključuju primjenu parametarskih analitičkih metoda. Dakle, moraju se upotrebljavati ako su empirijski podaci: atributivnog karaktera ili ako su nejasno mjerno-numerički definisani i parametarskog ali heterogenog karaktera (CV > 30%). Ovim analitičkim metodima, za razliku od parametarskih, procjenjuje se značajnost ispitivanja pojave na osnovu medijane, empirijskih (apsolutnih) frekvencija ili na osnovu rangiranih vrijednosti empirijskih podataka. U idealnim uslovima primjene (ispunjeni svi uslovi za primjenu) parametarski metodi jači su od neparametarskih. Od analitičkih metoda na raspolaganju je: metod intervala povjerenja; deskriptivni parametri teorijskih modela raspodjela - parametarski; Hi kvadrat ( ) test kao neparametarski metodi za procjenu oblika raspodjela; 105

106 za procjenu značajnosti razlike: zed (Z) i te (t) test kao parametarski, a, Fišerov, Mek Nemarov test, test predznaka, test ekvivalentnih parova i test sume rangova kao neparametarski; za procjenu oblika paralelizma (povezanosti i zavisnosti): metod linearne regresije za procjenu jačine paralelizma: metod jednostruke korelacije (parametarski) i Spirmanova korelacija ranga (neparametarski) 3.. Teorijska statistika Vjerovatnoća Nastanak i razvoj vjerovatnoće Teorija vjerovatnoće je matematička disciplina koja daje okvir za ispitivanje slučajnih pojava, tj. takvih empirijskih fenomena i situacija čiji ishodi nisu uvijek definisani, ali za njih postoji neka statistička regularnost. Razjasnićemo ovo na jednostavnom primjeru bacanja novčića. Pravilan (ispravan u fizičkom smislu) novčić bacamo u vis iznad ravne površine i pri njegovom padu na tu površinu moguća su dva ishoda: na gornjoj strani je pismo ili glava. Iz iskustva nam je poznato da je mogućnost da novčić ostane uspravan praktično nemoguć događaj. Takođe, ne možemo unaprijed znati da li će pasti pismo ili glava, što znači ishod nije definisan. Ako novčić bacamo mnogo puta, glava će pasti u približno polovini slučajeva i to je statistička regularnost koja odlikuje ovu slučajnu pojavu. U svakodvnevnom govoru opisujemo ovu pojavu rečenicom: "Vjerovatnoća da će pasti glava je 50%" i svima nam je intuitivno jasno šta ta rečenica znači. Početak razvoja teorije vjerovatnoće vezuje se za 17. vijek i za imena francuskih matematičara Paskala i Fermaa (Blaise Pascal, , Pierre de Fermat, ). Godine Paskalu je jedan prijatelj kockar postavio sljedeći problem: Dva igrača se dogovore da ulog u igri dobije onaj koji prvi odnese tri pobjede. Poslije dvije pobjede prvog i jedne pobjede drugog igrača, igra je sticajem okolnosti morala biti prekinuta. Na koji način treba pošteno podijeliti ulog a da to odražava realne šanse za pobjedu koje ima svaki od igrača? Paskal je našao da su šanse za pobjedu 3:1 u korist prvog igrača i predložio je podjelu uloga u tom odnosu. Često se uzima da je tada počeo teorijski razvoj vjerovatnoće. Ona je dugo bila usko povezana sa problemima hazardnih igara. Razvoju teorije vjerovatnoće značajno su doprinijeli: Abraham de Moavr (Abraham de Moivre, ), Žak Bernuli (Jacques Bernoulli,

107 ) Pjer Laplas (Pierre Laplace, ), Simeon Poason (Simeon Poisson, ), Karl Fridrih Gaus (Carl Friedrich Gauss, ), Pafnutij Ljvovič Čebišjev ( ), Andrej Andrejevič Markov ( ). Poseban doprinos dao je A.N. Kolmogorov, ruski matematičar koji je najviše zaslužan za aksiomatizaciju vjerovatnoće (1933. godine) i njen dalji razvoj kao moderne matematičke discipline. Elementi teorije vjerovatnoće Kako je već rečeno vjerovatnoća se bavi slučajnim događajima. Slučajni događaj se definiše kao događaj koji se u datim uslovima i u datom momentu može očekivati ali se ne mora nužno i ostvariti. Nasuprot slučajnim događajima postoje nužni, odnosno sigurni događaji. Primjer nužnog događaja je posljedica bacanja metalnog novčića u vazduh, koji zbog sile teže mora pasti na tlo. Dakle, padanje novčića na tlo je siguran događaj. Međutim, novčić može pasti tako da je na gornjoj strani grb a na donjoj pismo ili obratno. Pojava pisma ili grba je slučajna. Mjera očekivanja događaja, odnosno mjera slučajnosti događaja naziva se vjerovatnoća. Vjerovatnoća događaja može se izračunati na više načina. Osnovna su dva načina odnosno koncepta vjerovatnoće: objektivna (teorijska i statistička) i subjektivna vjerovatnoća. Teorijska vjerovatnoća: Teorijska vjerovatnoća naziva se još matematička ili a priori vjerovatnoća. Ona se računa unaprijed i nije zavisna od eksperimenta. Klasičnu definiciju matematičke vjerovatnoće dao je Laplas (181), a savremenu definiciju dao je Kolmogorov (1933). Definicija (Laplas): Vjerovatnoća a priori jednog događaja je odnos broja za njega očekivanih ishoda prema broju svih jednako mogućih ishoda. Definicija (Kolmogorov): Vjerovatnoća nekog događaja je samo broj pridružen tom događaju. Statistička vjerovatnoća: Statistička (frekvencijska, empirijska) ili vjerovatnoća a posteriori određuje se nakon ostvarivanja posmatranog događaja a na osnovu rezultata istraživanja. Definicija: Vjerovatnoća a posteriori je odnos broja ostvarenih (očekivanih) ishoda prema ukupnom broju mogućih ishoda. Iznosi vjerovatnoća a priori i a posteriori često se međusobno razlikuju, međutim vjerovatnoća a posteriori sve više se približava vjerovatnoći a priori što je veći broj eksperimenata. Ovaj odnos između vjerovatnoća a priori i a posteriori naziva se zakon velikih brojeva. Definisao ga je Bernuli, a poopštio Poason. Ovo je osnovni zakon u teoriji vjerovatnoće i statistici i on

108 108 glasi: Kada broj eksperimenata raste, apsolutna razlika između relativne frekvencije i vjerovatnoće se smanjuje. To znači da ono što pojedinačno moramo smatrati slučajnim, u velikoj masi gubi karakter slučajnosti i ponaša se zakonomjerno. Ako na primjer, procjenimo vjerovatnoću povoljnog ishoda liječenja neke bolesti na malom broju bolesnika, ne znači da je to ujedno i stvarna vjerovatnoća izlječenja od te bolesti. Međutim, kada se radi o iskustvu na velikom broju ispitanika tada je takva procjena vjerovatnoće daleko bliža stvarnoj vjerovatnoći izlječenja. m( D) P( D) lim n n Subjektivna vjerovatnoća: Subjektivna vjerovatnoća predstavlja stepen uvjerenja o realizaciji očekivanog događaja koji ima logički dosljedna osoba, odnosno ekspert ili stručnjak. Pridruživanjem nekog broja između 1 i 0 ekspert time izražava svoje uvjerenje u mogućnost ostvarenja datog događaja. Najčešće se subjektivna vjerovatnoća formira za događaje koji se javljaju samo jedanput, ili se ponavljaju ali u tako različitim uslovima da se mogu posmatrati kao jedinstveni događaj. Način računanja vjerovatnoće: Bez obzira na definiciju sve vjerovatnoće izračunavaju se kao odnos dijela prema cjelini tj.: m f p n n gdje je: p - vjerovatnoća m - broj očekivanih (poželjnih) ishoda n - ukupan broj slučajeva f - broj opserviranih slučajeva Karakteristike vjerovatnoće Nenegativnost: Vjerovatnoća svakog događaja je nenegativan broj P D 0. Kada je vjerovatnoća jednaka nuli događaj se ne može realizovati kao ishod određenog eksperimenta - nemoguć događaj. Normiranost: Normiranost pokazuje da je vjerovatnoća ukupnog broja mogućih događaja jednaka jedinici, odnosno da maksimalna vjerovatnoća slučajnog događaja iznosi jedan P D 1. Vjerovatnoća sigurnog događaja uvijek je jednaka jedinici. Aditivnost: Aditivnost pokazuje da je ukupna vjerovatnoća događaja jednaka sumi vjerovatnoća mogućih odnosno ostvarenih događaja tj.:

109 P D PD Osnovni pojmovi Za razumjevanje i lakši rad sa vjerovatnoćama potrebno je definisati neke osnovne pojmove u radu sa njima. Vjerovatnoća događaja koji je predmet istraživanja naziva se vjerovatnoćom očekivanog događaja i označava se sa p. p - vjerovatnoća događaja koji je predmet istraživanja Vjerovatnoća događaja koji nije predmet istraživanja naziva se suprotnom vjerovatnoćom i obilježava se sa q. q - vjerovatnoća događaja koji nije predmet istraživanja (vjerovatnoća suprotnog događaja) Obe vjerovatnoće, očekivanog i suprotnog dogaćaja jesu tzv. komplementarne parcijalne vjerovatnoće, odnosno komplementarni dijelovi ukupne, totalne vjerovatnoće i za njih važi da je: p + q = 1 =100% Parcijalna vjerovatnoća predstavlja vjerovatnoću svakog pojedinačnog ishoda. Ukupna vjerovatnoća koja predstavlja zbir svih parcijalnih vjerovatnoća istovremeno je i vjerovatnoća sigurnog događaja i iznosi 1 ili 100%. Vjerovatnoća nemogućeg događaja jednaka je nuli. Dakle, vjerovatnoća se kreće u intervalu od 0, kada je očekivani događaj nemoguć do 1, odnosno do 100% kada je očekivani događaj siguran (0 p 1). Prema broju i načinu nastupanja događaja razlikuju se vjerovatnoće prostih i složenih događaja. Vjerovatnoćom prostog događaja naziva se vjerovatnoća samo jednog očekivanog događaja, tj. elementarnog događaja. Prema odnosu događaja razlikuju se vjerovatnoće nezavisnih i zavisnih događaja, odnosno isključivih i neisključivih događaja. Ako se vjerovatnoća izračunava za događaj čije nastajenje ne zavisi od nastupanja ili nenastupanja nekog drugog događaja, radi se o vjerovatnoći nezavisnog događaja. Vjerovatnoće nezavisnih događaja često se nazivaju i apsolutne vjerovatnoće. Ako se vjerovatnoća izračunava za događaj čije nastupanje zavisi od prethodnog nastupanja ili nenastupanja nekog drugog događaja, radi se o vjerovatnoći zavisnog događaja. 109

110 110 U odnosu na isključivost događaja razlikuju se vjerovatnoće isključivih i neisključivih događaja. Ako se izračunava vjerovatnoća događaja koji se ne mogu desiti istovremeno radi se o vjerovatnoći isključivih događaja. Ako se izračunava vjerovatnoća događaja koji se mogu desiti istovremeno radi se o vjerovatnoći neisključivih događaja. Pojam slučajnog događaja Slučajni događaj se smatra osnovnim pojmom i može se opisno shvatiti kao događaj koji se pod određenim uslovima može a ne mora realizovati. Za slučajni događaj bitno je da li se on pod određenim uslovima realizovao ili ne. Svaka pojava, prirodna ili društvena, je skup događaja. Tako shvaćena, svaka pojava se sastoji od dva skupa. Jedan je skup uslova pod kojima se određena pojava odvija, a drugi je skup rezultata - ishoda posmatrane pojave. Razumjeti neku pojavu znači shvatiti kako pojedini događaji koji predstavljaju uslove djeluju na rezultate. Događaje koje nazivamo uslovima dijelimo na dvije grupe. Prvu grupu čine događaji za koje znamo kako djeluju na rezultete. To su faktori određene pojave, faktori prve vrste. Drugu grupu predstavljaju faktori za koje ne znamo kako djeluju na rezultate. To su statistički faktori ili faktori druge vrste. Njih ispituje matematička statistika sa teorijom vjerovatnoće. Ako je moguće fiksiranjem (zamrzavanjem) faktora prve vrste otkloniti djelovanje, tada fluktuacije u djelovanju, ukoliko postoje, potiču od faktora druge vrste. Na ovaj način (fiksiranjem faktora) došlo se do važnih rezultata u prirodnim naukama, međutim u nekim naučnim oblastima nije moguće razdvojiti faktore. Razvojem određene nauke broj faktora obe vrste se povećava. Pojedini faktori druge vrste prelaze u faktore prve vrste kada se dovoljno upozna njihovo djelovanje na rezultate, a broj faktora druge vrste se povećava jer se zapažaju i ono faktori koji se nisu mogli zapaziti na nižem stepenu razvoja nauke. Osnovni model (koncept) u teoriji vjerovatnoće je eksperiment kod koga ostvarivanje određenih uslova ne dovodi do jednoznačnog rezultata, odnosno ishod eksperimenta nije moguće predvidjeti na osnovu poznavanja uslova pod kojima se on izvodi. Ovo je najbitnija razlika između determinističkog (klasičnog) eksperimenta i eksperimenta u teoriji vjerovatnoće i statistici. Kod klasičnog eksperimenta određeni uslovi eksperimenta jednoznačno određuju njegov ishod. Nasuprot klasičnom, bacanje homogene kocke je jednostavan eksperiment u teoriji vjerovatnoće kod koga se vidi da se radi o drugoj vrsti eksperimenta. To je eksperiment u teoriji vjerovatnoće ili stohastički eksperiment. Kod bacanja kocke realizovaće se jedan od šest mogućih ishoda. Uslovi eksperimenta su: baca se kocka, a rezultat ili ishod eksperimenta je: broj

111 111 koji se nalazi na gornjoj strani kocke kada je kocka pala. Za eksperiment se kaže da je dobro definisan ako su navedeni uslovi eksperimenta i ako je navedeno šta se registruje kao njegov ishod. Zamislimo eksperiment koji se završava sa jednim od n ishoda. Svaki ishod se naziva elementarni događaj (elementarni rezultat). Elementarni događaj može se realizovati na samo jedan način. Skup svih elementarnih događaja, svih logički mogućih ishoda nekog eksperimenta naziva se prostor elementarnih događaja (prostor ishoda) i obilježava se sa Za svaki eksperiment vezuje se skup elementarnih događaja, ali i različiti događaji koji su od interesa u datom eksperimentu. Njih nazivamo složenim događajima, a označavaju se velikim latiničnim slovima A, B,.... Složeni događaj A se u datom opitu realizuje ako se realizuje jedan elementarni događaj što znači da se složeni događaj može realizovati na više načina. Na primjer, posmatrajmo eksperiment bacanja kocke. Neka je složeni događaj A - realizacija parnog broja, odnosno A=,4.6. Ako pri bacanju kocke padne broj A, tada se realizovao složeni događaj A. Zato se događaj A može opisati pomoću elementarnih događaja koji su za njega vezani. Pojam elementarnog i složenog događaja omogućuje da se uspostavi veza između teorije skupova i teorije vjerovatnoće, tako da mnogi pojmovi iz teorije vjerovatnoće postaju očigledniji. Mnoge realacije među događajima tumače se u terminima poznatim iz teorije skupova. Vjerovatnoća prostog događaja Vjerovatnoća prostog događaja, da se desi bilo koji (ili ovaj ili onaj) od prostih nezavisnih događaja koji se međusobno isključuju (ne mogu se desiti istovjetno), jednaka je zbiru konkretnih parcijalnih vjerovatnoća. p P iliailib P A; B P A P B Vjerovatnoća složenog događaja (nezavisnost) Vjerovatnoća složenog događaja, da se istovremeno ili sukcesivno dese dva (ili više) nezavisnih prostih događaja, jednaka je produktu vjerovatnoća (i ovog i onog) događaja. p P iaib P A, B P A P B Vjerovatnoća prostog događaja (događaji se ne isključuju) Vjerovatnoća prostog događaja, da se desi bilo koji (ili ovaj ili onaj) od prostih dogaćaja koji se međusobno ne isključuju (mogu se desiti istovremeno), jednaka je razlici zbira parcijalnih vjerovatnoća događaja i produkta vjerovatnoća događaja (zbir vjerovatnoća umanjen za vjerovatnoću da se dese istovremeno).

112 iliailibbeziaib PA; B; A B p P, odnosno p P( A) P( B) P( A) P( B) Vjerovatnoća složenog događaja (zavisni događaji) Vjerovatnoća složenog događaja da se istovremeno ili sukcesivno dese dva (ili više) međusobno zavisna događaja jednaka je produktu vjerovatnoća svakog (i ovog i onog) događaja. Vjerovatnoća zavisnog događaja P(AB) dobija se kao produkt apsolutne vjerovatnoće hronološki prvog događaja (P(A); P(B)) i relativne vjerovatnoće hronološki drugog događaja (P(B/A); PA/B)). B p PiAiBposlijeA PAB PAP A A p PiBiAposlijeB PBA PBP B Relativna vjerovatnoća (uslovna) Relativna vjerovatnoća P(A/B) ili P(B/A) naziva se još i uslovna ili kondicionalna vjerovatnoća. Uslovna vjerovatnoća je vjerovatnoća stohastički zavisnog događaja jer je P(B/A) P(A), za razliku od nezavisnih događaja kod kojih je P(B/A)=P(B). Ona ustvari predstavlja vjerovatnoću uslovljenog događaja, događaja koji je uslovljen prethodnom pojavom nekog drugog događaja. Uslovna vjerovatnoća dobija se kao kao količnik zavisne vjerovatnoće i apsolutne vjerovatnoće uzročnog događaja. B PAB P A PBA ili P A PA B PB Uslovna vjerovatnoća je osnovni tip vjerovatnoće u prirodnim naukama, jer se događaji karakterišu uzročno posljedičnim odnosima. Totalna (ukupna) vjerovatnoća Na osnovu zavisne, odnosno uslovne vjerovatnoće može se izračunati totalna (ukupna) vjerovatnoća dva ili više prostih događaja koji nisu nezavisni. Ona se dobija kao razlika zbira parcijalnih vjerovatnoća i zavisne vjerovatnoće tih događaja. Tako je za dva zavisna događaja A i B, od kojih događaj A prethodi događaju B, totalna vjerovatnoća: p = P(ili A ili B ili B poslije A) = P(A;B;AB) odnosno B p P( A) P( B) P( A) P A I obrnuto, za iste događaje, kad događaj B prethodi događaju A slijedi: 11

113 p = P(ili A ili B ili A poslije B) = P(A;B;AB) A p P( A) P( B) P( B) P B Na osnovu vjerovatnoće zavisnih događaja može se izračunati i takozvana potpuna (totalna) vjerovatnoća događaja. To je vjerovatnoća događaja koji može nastati samo pod uslovom prethodne pojave potpunog sistema nekog drugog događaja (ukupan broj događaja pod uslovom da se međusobno isključuju). Ona se dobija kao suma produkata vjerovatnoća svakog uzročnog događaja i uslovnog događaja. B PA B PA B PA B PA B p P... 1 p P B PA i P Ai 3 B Na osnovu uslovne vjerovatnoće događaja Tomas Bajes (Thomas Bayes) je godine formulisao teorem po kojem se može odrediti uzročna vjerovatnoća nekog događaja. Polazeći od pretpostavke da neki događaj, kao posljedica jednog ili više drugih događaja, može biti istovremeno i uzrok nastanka tog ili nekog drugog događaja, vjerovatnoća uzroka očekivanog događaja izračunava se obradom bazičnih i novih informacija pomoću Bajesovog izraza: P A k P B P BA A k k P A k / B, k = 1,,...,n PB PA i P B Ai Primjer 1. Patronažna sestra brine o 5 porodica. Distribucija frekvencija ovih porodica (f) po broju djece (x) prikazana je tabelarno. Tabela : Distribucija frekvencija porodica po broju djece r x f PX x PX x 1 0 /5 / /5 10/ /5 0/ /5 4/ /5 5/5 Ukupno / 5 5/5 / n 113

114 114 a) Kolika je vjerovatnoća da će porodica koju treba posjetiti patronažna sestra imati jedno dijete? p 8 1 P X 1 0,3 3% 5 Slučajan događaj koji je predmet posmatranja je broj djece u porodici. Očekivani događaj, tj. poželjan ishod je da sestra posjeti porodicu sa jednim djetetom, pa vjerovatnoća od 0,3, odnosno 3% predstavlja vjerovatnoću očekivanog događaja. Istovremeno izračunata vjerovatnoća je parcijalna vjerovatnoća jer predstavlja mjeru ostvarivanja samo jednog ishoda, tj. jedne vrijednosti varijable. b) Koliko iznosi zbir parcijalnih vjerovatnoća svih mogućih očekivanih događaja? Broj mogućih očekivanih događaja je pet (da patronažna sestra posjeti porodicu: bez djece, sa jednim, sa dva, sa tri, sa četiri djeteta) a odgovarajuće parcijalne vjerovatnoće iznose: p 1 P X 0 0,08 8% 5 p p X 1 8 0,3 3% P 5 X 10 0,40 40% 3 P p 5 X 3 4 0,16 16% 4 P 5 X 4 1 0,04 4% p 5 P 5 Sabiranjem parcijalnih vjerovatnoća dobija se ukupna vjerovatnoća od 1 odnosno 100% P X x p p p p p 0,08 0,3 0,40 0,16 0,04 1, c) Kolika je vjerovatnoća da sestra posjeti bilo koju od 5 porodica? P 0 X U pitanju je vjerovatnoća sigurnog događaja (jer je m=n) pa tražena vjerovatnoća u ovom slučaju iznosi 1 ili 100%. d) Kolika je vjerovatnoća da će porodica koju posjeti patronažna sestra imati petoro djece? P X

115 Očekivani događaj da sestra posjeti porodicu sa petoro djece nije moguć jer ni jedna porodica u primjeru nema petoro djece. Vjerovatnoća nemogućeg događaja jednaka je nuli. e) Kolika je vjerovatnoća da sestra neće posjetiti porodicu sa troje djece? Vjerovatnoća da se jedan događaj neće ostvariti može se izračunati iz vjerovatnoće suprotnog događaja koja je u ovom slučaju 16%. Izračunava se na jedan od ova dva načina: q 4 0,16 5 ili p p X 3 1 px 3 1 0,16 0, 84 X 3 px 1 px px 4 0, 84 f) Kolika je vjerovatnoća da će porodica koju posjeti patronažna sestra imati ili dvoje ili četvoro djece? Ovdje se primjenjuje zakon adicije (sabiranja) na odbovarajuće parcijalne vjerovatnoće isključivih događaja. p px PX ,40 0,04 0, g) Ako patronažna sestra treba posjetiti dvije porodice, kolika je vjerovatnoća da će posjetiti porodicu sa jednim i sa tri djeteta? Ovdje se primjenjuje zakon multiplikacije (množenja) na odgovarajuće parcijalne vjerovatnoće. p p X 1P X ,3 0,16 0, 05 5 h) Ako patronažna sestra treba posjetiti jednu porodicu, kolika je vjerovatnoća da će porodica imati: 1) manje od četvoro djece, ) dvoje i više djece, 3) između jednog i tri djeteta? Odgovor na ovo pitanje može se dobiti na osnovu kumulativnih vjerovatnoća koje se dobijaju sukcesivnim sabiranjem parcijalnih vjerovatnoća. p X x 0,08 0,3 0,40 0,40 0,80 0,16 0,96 0,04 1,00 Prema tome tražene vjerovatnoće iznosiće 96%, 60% i 88% p 4 1 p X 4 0,

116 p p 10 5 X 0, p X 3 0, 88 3 p 5 i) Kolika je vjerovatnoća da će patronažna sestra istog dana tri puta posjetiti porodicu za četvoro djece? Kako je u pitanju složeni događaj, rješenje se dobija primjenom zakona multiplikacije. p P X 4 P X 4 P X 4 p p ,043 0, j) Kolika je vjerovatnoća da patronažna sestra posjeti porodicu sa parnim brojem djece ili porodicu sa troje i više djece? Rješenje se dobija primjenom zakona adicije na proste nezavisne događaje koji se međusobno ne isključuju. Primjer. p P p P A PX PX 4 0,4 0,04 0, 44 B PX 3 PX ,04 0, A, B PAPB , 04 p P A 5 5 p P A; B; A, B P A P B P A P B p 0,44 0,0 0,04 0,60 Utvrđeno je da 500 od muškaraca i 5 od žena ima daltonizam, sljepilo za boje (frekvencija daltonizma prema polu je različita, jer se radi o X hromozomskoj nasljednoj anomaliji). Kolika je vjerovatnoća da će neka osoba sa daltonizmom biti muškog pola u ovom osnovnom skupu? Rješenje Ispituje se vjerovatnoća istovremenog javljanja dvije karakteristike kod iste osobe. Rješenje se dobije primjenom zakona multiplikacije na zavisne događaje jer se ispituje istovremena pojava dva događaja, sljepila za boje i muškog pola. Apsolutna vjerovatnoća pojave daltonizma: p PA ,

117 Relativna vjerovatnoća uslovnog događaja pojave osobe muškog pola među daltonistima A 500 0, 95 p P 55 Vjerovatnoća zavisnih događaja, odnosno vjerovatnoća pojave daltonizma kod osobe muškog pola iznosi: p P AB PAPB 0,06 0,95 0, 05 A Dakle, vjerovatnoća da će osoba sa daltonizmom biti muškog pola iznosi,5%, a na sličan način dobije se vjerovatnoća da će osoba sa daltonizmom biti ženskog pola (0,14%). Do ovog rezultata moglo se doći i direktno iz empirijskih podataka: Primjer 3. p P AB 500 0, Istraživanja pokazuju da 6% trudnica koje dolaze u savjetovalište za trudnice ima bakteriuriju (infekciju urinarnog trakta). Kod 30% trudnica sa bakteriurijom i kod 1% trudnica bez bakteriurije dolazi do razvoja pijelonefritisa (akutna infekcija gornjeg dijela urinarnog trakta). Analiziranjem ove empirijske situacije uočava se vmogućnost pojave dva događaja. Osnovni događaj je pojava bakteriurije (događaj A). On ima dva moguća ishoda: trudnica ima (A 1 ) ili nema (A ) bakteriuriju. Ishodi ovih događaja su isključivi i komplementarni pa je: A PA 1 0,06 0, 94 P 1 1 Drugi događaj (B) je pojava pijelonefritisa. On se kod trudnica sa bakteriurijom javlja sa vjerovatnoćom od 0,3 (P(B/A 1 )=0,3), a kod trudnica bez bakteriurije sa vjerovatnoćom od 0,01 (P(B/A )=0,01). Kakve se informacije mogu dobiti analiziranjem empirijske situacije? a) Kolika je vjerovatnoća da trudnica ima i bakteriuriju i pijelonefritis i kolika je vjerovatnoća da trudnica nema bakteriuriju a ima pijelonefritis? Radi se o istovremenoj pojavi dva događaja koji nisu nezavisni, pa će se odgovor na postavljena pitanja dobiti primjenom zakona multiplikacije, odnosno izračunavanjem vjerovatnoća zavisnih događaja p 1 PiA1 ibposlijea1 PA1 B PA1 P B 0,06 0,3 0, 018 A1 p ia ibposlijea PA B PA P B 0,94 0,01 0, 0094 P A 117

118 Vjerovatnoća javljanja oba događaja istovremeno (p=1,8%) je skoro dva puta veća od vjerovatnoće javljanja samo pijelonefritisa (p=0,94%) b) Kolika je vjerovatnoća da trudnica dobije pijelonefritis? Računa se totalna (potpuna) vejrovatnoća događaja B primjenom zakona adicije na dva vezana događaja. p PB PiA1iBposlijeA 1 PiAiBposlijeA p P B 0,018 0,0094 0, 074 Vjerovatnoća da se kod trudnice razvije pijelonefritis iznosi,74% c) Kolika je vjerovatnoća da kod trudnica kod kojih se razvio pijelonefritis već postoji bakteriurija? Primjenjuje se Bajesov teorem. Poznavanje vjerovatnoće za nastanak pijelonefritisa i zavisnih vjerovatnoća prisustva bakteriurije dozvoljava izračunavanje uslovne vjerovatnoće novog događaja: da kod trudnica sa pijelonefritisom postoji i bakteriurija. Primjer 4. A p P B A1 B B P P 0,0180 0, ,6569 Date su tri kutije. U prvoj su dvije bijele i dvije crne kuglice, u drugoj je jedna bijela i četiri crne kuglice i u trećoj kutiji su tri bijele i dvije crne kuglice. Naći vjerovatnoću da se izvuče bijela kuglica iz slučajno odabrane kutije. Dakle traži se vjerovatnoća događaja A (izvučena bijela kuglica), da je izvučena bijela kuglica ili iz prve ili iz druge ili iz treće kutije. Rješenje: Događaji: A - izvučena bijela kuglica; A 1 - izvlačenje iz prve kutije; A - izvlačenje iz druge kutije; A 3 - izvlačenje iz treće kutije. 1. Vjerovatnoća događaja A i - izvlačenje iz jedna od razpoloživih kutija P(A 1 ) = P(A ) = P(A 3 ) = 1/3. Vjerovatnoća uslovnog događaja da je bijela kuglica izvučena iz neke od kutija - P(A/A 1 ) = /4 118

119 - P(A/A ) = 1/5 - P(A/A 3 ) = 3/5 3. Ukupna vjerovatnoća da se desi izvlačenje bijele kuglice ili iz prve ili iz druge ili iz treće kutije (P(A) = P(A 1 )P(A/A 1 ) + P(A )P(A/A ) + P(A 3 )P(A/A 3 ) = = 1/3*/3 + 1/3*1/5 + 1/3*3/5 = 13/30 = 0,17 Vjerovatnoća da se bijela kuglica izvuče iz slučajno odabrane kutije iznosi P(A) = 0, Slučajna varijabla i distribucija vjerovatnoće Slučajna varijabla Posmatra se statistički eksperiment koji se sastoji u bacanju dva novčića. Prostor uzorka - skup svih elementarnih događaja S sastoji se od 4 elementarna ishoda: S = [(P,P), (P,G), (G,P), (G,G)] gdje je: P - pad pisma, G - pad grba. Posmatrajmo slučaj pojavljivanja grba. Vidi se da se u četiri podjednako moguća slučaja u jednom slučaju ne pojavljuje nijedanput grb, u dva slučaja jedanput i u jednom slučaju dva puta. Ukoliko nas zanima pojavljivanje grba, možemo uvesti promjenjivu veličinu (varijablu) X koja će pokazivati koliko puta se grb pojavio u eksperimentu. U tabeli dat je prikaz odnosa varijable X i bacanja novčića. Tabela : Varijabla X = broj grbova pri bacanju dva novčića Prostor uzorka eksperimenta Broj grbova X P,P 0 P,G 1 G,P 1 G,G Ako smo u eksperimentu koristili pravilne novčiće rezultat bacanja ne može se predvidjeti, jer zavisi od niza faktora koje ne možemo kontrolisati - početni položaj novčića u ruci, brzina bacanja, ravnina podloge, itd. Zbog toga se nikad unaprijed ne mogu predvidjeti vrijednosti koje će poprimiti varijabla X. Ona te vrijednosti uzima na slučaj pa se zbog toga naziva slučajna varijabla i definiše se na sljedeći način: 119

120 Slučajna varijabla je numerička funkcija koja svakom ishodu statističkog eksperimenta pridružuje jedan realan broj. Važno je napomenuti da elementarni ishodi koji sačinjavaju prostor uzorka ne moraju imati numeričke vrijednosti. Da bi se jasnije sagledalo značenje slučajne varijable i potreba njenog uvođenja na slici predstaviće se eksperiment sa bacanjem dva novčića. GG PG PP GP 0 1 Prostor uzorka Slika Slučajna varijabla kao funkcija definisana na prostoru uzorka Sa slike se vidi da slučajna varijabla svaki od ishoda eksperimenta transformiše u jedna realan broj. Istovremeno se vidi da jedna vrijednost slučajne varijable može biti povezana sa više elementarinh ishoda, ali da svakom elementarnom ishodu odgovara samo jedna vrijednost slučajne varijable. Uobičajeno je da se slučajna varijabla označava sa velikim latiničnim slovima (npr. X, Y, Z,...). Jedan ishod slučajne varijable, odnosno realizovana vrijednost slučajne varijable, označava se sa malim slovima x,y,z,... ili sa x 1, x, x 3... Uzmimo dalje za eksperiment primjer bacanja homogene kocke čije su strane označene sa brojevima od jedan do šest. Ako broj koji se pojavi na gornjoj strani kocke nakon bacanja predstavlja slučajnu varijablu X, tada se kao njena realizovana vrijednost može pojaviti bilo koji broj od 1 do 6, nrp. x=4. Ako se strane kocke obilježe sa brojevima od do 7 umjesto od 1 do 6, opet bi svaka strana kocke imala jednaku vjerovatnoću javljanja, a broj koji bi se realizovao ne bi se mogao unaprijed predvidjeti. To znači da bi i u ovom eksperimentu (kocka -7) broj koji se pojavljuje kao ishod eksperimenta ponovo bio slučajna varijabla. Označimo novu slučajnu varijablu sa Y i uočimo da je nastala transformacijom slučajne varijable X, tj. Y=X+1. Za opšti slučaj može se zaključiti da svaka transformacija slučajne varijable, tj. funkcija slučajne varijable i sama predstavlja slučajnu varijablu. 10

121 Slučajne varijable se mogu podijeliti na osnovu toga da li uzimaju sve moguće vrijednosti u nekom intervalu ili uzimaju samo izolovane vrijednosti. Za slučajnu varijablu se kaže da je prekidna (diskretna) ako može uzeti konačan broja izolovanih vrijednosti ili prebrojivo mnogo vrijednosti (vrijednosti koje se mogu prebrojati skupom cijelih nenegativnih brojeva: 0, 1,, 3,...itd). Broj poziva na nekoj telefonskoj centrali u određenom vremenskom intervalu, broj saobraćajnih nezgoda u mjesecu junu, broj pacijenata koji čekaju na pregled, broj televizora prodatih u nekoj robnoj kući, broj defektnih proizvoda u toku jednog radnog dana, jesu prekidne slučajne varijable. Za potpunije razumijevanje smisla prekidne slučajne varijable i broja koga ona može uzeti u tabeli daju se primjeri nekoliko slučajnih varijabli Tabela : Primjeri prekidne slučajne varijable Rd.br. Oznaka slučajne varijable 1 X Y 3 Z Definicija slučajne varijable Broj tačnih odgovora koje je student dao na testu od 10 pitanja Broj neispravnih računara u uzorku od 3 elementa Broj zastoja u proizvodnji artikla A Vrijednosti slučajne varijable Broj vrijednosti slučajne varijable 0, 1,, 3,..., 10 Konačan 0, 1,, 3,..., 3 Konačan 0, 1,, 3,... Prebrojivo mnogo Slučajna varijabla je neprekidna (kontinuirana) ako može uzeti bilo koju vrijednost na nekom intervalu. Naime, između bilo koje dvije vrijednosti x 1 i x slučajne varijable postoji slijedeća moguća vrijednost x 3 koja je različita od x 1 i x. Broj vrijednosti koje može uzeti slučajna varijabla je beskonačan. Primjeri neprekidnih slučajnih varijabli su: visina i težina studenata, vrijeme potrebno da se obavi neka proizvodna operacija, prečnik kugličnog ležaja, itd. Po istom kriterijumu izvršena je podjela numeričkih obilježja na prekidna i neprekidna. U vezi sa prirodom slučajne varijable javlja se još jedan problem, problem mjerenja zbog nepreciznosti mjernih uređaja. U stvarnosti se nikada neće moći tačno izmjeriti npr. visina i težina neke osobe, jer će se uvijek uzimati približne vrijednosti zbog nepostojanja savršenog mjernog instrumenta. 11

122 3... Distribucija vjerovatnoće prekidne slučajne varijable Kad se analizira neka slučajna varijabla najčešće je od interesa koje vrijednosti ona može uzeti i sa kojim vjerovatnoćama. Svakom elementarnom događaju (ishodu) u prostoru uzorka može se pripisati odgovarajuća vjerovatnoća u uidu numeričke vrijednosti. Kako prekidna slučajna varijabla svakom elementu iz prostora uzorka pridružuje jedan broj, slijedi da se svakoj vrijednosti slučajne varijeble može pripisati odgovarajuća vjerovatnoća. Dakle, prekidna slučajna varijabla može se opisati kao varijabla koja uzima određene izolovane vrijednosti sa odgovarajućim vjerovatnoćama. U primjeru eksperimenta sa dva novčića svaki od 4 elementau prostoru uzorka ima podjednaku vjerovatnoću javljanja -1/4, ako su novčići ispravni. Na osnovu tabele vidi se da slučajna varijabla X može uzeti vrijednosti 0, 1,. Vjerovatnoću da slučajna varijabla X uzme neku od navedenih vrijednosti označimo sa P(X=x i )=p i. Dakle, 1 P ( X x1) P( X 0) p1 4 P ( X x ) P( X 1) p P ( X x3) P( X ) p3 4 Vjerovatnoća da slučajna varijabla X uzme vrijednosti 1 iznosi 1/ jer se odnosi na dva elementarna ishoda (P,G) i (G,P), od kojih svaki ima vjerovatnoću javljanja 1/4. Skup parova vrijednosti koje može uzeti slučajna varijabla X i odgovarajućih vjerovatnoća naziva se distribucija vjerovatnoće (raspored vjerovatnoće, raspodjela vjerovatnoće, fujkcija vjerovatnoće ili zakon vjerovatnoće) prekidne slučajne varijable. Distribucija vjerovatnoće u eksperimentu sa dva novčića data je tabelom Tabela : Distribucija vjerovatnoća za broj grbova u eksperimentu sa dva novčića Broj grbova Vjerovatnoća x p 0 1/4 1 1/ 1/4 Ukupno 1 1 1

123 Ova tabela omogućava da se formulišu dva zaključka o opštim karakteristikama svih prekidnih slučajnih varijabli: 1. Niti jedna vjerovatnoća u distribuciji vjerovatnoća ne može biti negativna, tj. P ( X x ) 0 za svako i; i. Suma vjerovatnoća koje odgovaraju svim vrijednostima slučajne varijable X mora biti jednaka jedan, tj. p 1 i i Prva osobina distribucije vjerovatnoće proističe iz aksioma I (aksiom nenegativnosti vjerovatnoće), a druga slijedi iz aksioma II (aksiom unije vjerovatnoće) budući da slučajna varijabla transformiše sve elementarne ishode koji formiraju prostor uzorka u brojeve. Dakle, jedna od vrijednosti slučajne varijable u konkretnom eksperimentu mora se realizovati ali je nikada ne možemo unaprijed predvidjeti zbog mnogostrukog uticaja slučajnih faktora. Distribucija vjerovatnoće daje najpotpuniju informaciju o karakteristikama slučajne varijable. Zahvaljujući njoj mogu se donositi razni probabilistički stavovi o bilo kojoj vrijednosti slučajne varijable. Tako se na osnovu mogu odrediti vjerovatnoće 1 1 P ( X 1) P( X 1) P( X ) 4 P ( 0 X 1) P( X 0) P( X 1) 1 P ( 0 X 1) P( X 0) 4 Primjetimo da se kod prekidne slučajne varijable razlikuje vjerovatnoća P(x 1 X x ) od vjerovatnoće P(x 1 X<x ) jer prva uključuje u sebe i vjerovatnoću da je X jednako x. U opštem slučaju distribucija vjerovatnoće prekidne slučajne varijable može se prikazati tabelom 3... koja sadrži dva niza informacija: vrijednosti slučajne varijable i njihove vjerovatnoće, uz uslov da suma vjerovatnoća bude jadanaka 1. Tabela 3...: Distribucija vjerovatnoće sličajne varijable X Različite vrijednosti x x 1 x...x i... x n Vjerovatnoća p p 1 p... p i...p n Distribucija vjerovatnoće ne smije se poistovjećivati sa distribucijom frekvencija. Distrubucija vjerovatnoće je teorijski model koji pridružuje vjerovatnoće pojedinim vrijednostima slučajne varijable; distribucija frekvencija može se formirati tek nakon prikupljanja podataka na osnovu

124 višestrukog ponavljanja opita u okviru statističkog eksperimenta. U principu, eksperiment će od slučaja do slučaja davati različite distribucije frekvencija. Tako, na primjer, ako se posmatra eksperiment u kome se baca pravilna homogena kocka i broj koji se pojavljuje na kocki tretiramo kao slučajnu varijablu X, njena se distribucija frekvencija može predstaviti kao u tabeli Tabela : Distribucija vjerovatnoće za pravilnu kocku x p = P (X = x i ) 1/6 1/6 1/6 1/6 1/6 1/6 Međutim, ako u konkretnom eksperimentu kocku bacimo 300 puta dobiće se distribucija frekvencija kao u tabeli Tabela : Distribucija frekvencija dobijena na snovu 300 bacanja kocke x Ukupno Apsolutne frekvenvije Relativne frekvencije 0,0 0,1 0,10 0,1 0,17 0,0 1,00 Iz tabela i primjećuje se razlika između distribucije vjerovatnoće kao teorijskog koncepta i distribucije relativne frekvencije kao empirijske vjerovatnoće. Na osnovu koncepta relativne frekvencije poznato nam je da se one stabilizuju sa povećavanjem broja opita i da se granična vrijednost relativne frekvencije (vrijednost pri beskonačnom broju opita) izjednačava sa vjerovatnoćom. Zbog toga će i distribucija relativne frekvencije sa povećanjem broja opita težiti da se izjednači sa distribucijom vjerovatnoće. Ove dvije tabele služe za još jedno objašnjenje, razlike izmeću osnovnog skupa - populacije i uzorka - reprezentativnog dijela osnovnog skupa. Statistička populacija ili osnovni skup sastoji se od svih elemenata koje može uzeti slučavja varijabla a distribucija populacije određena je vjerovatnoćama koje se javljaju u distribuciji vjerovatnoće. Na žalost, u praksi nam te teorijske vjerovatnoće najčešće nisu poznate. Kao njihove najbolje ocjene mogu poslužiti realtivne frekcencije, odnosno empirijsske vjerovatnoće dobijena na osnovu uzorka. Uspoređivanjem gornje dvije tabele zaključuje se da vrijednosti obilježja u distriduciji frekvencija ustvari predstavljaju vrijednosti slučajne varijable u distribuciji vjerovatnoća. Tako na primjer, ako posmatramo skup svih studenata jednog univerziteta i interesuju nas njihove karakteristike - obilježja, kao visina, prosječna ocjena, visina stipendije itd., tada sva ta obilježja možemo analizirati (modelirati) kao slučajne varijable, od kojih svaka ima svoju distribuciju vjerovatnoće. Ako bi nam te distribucije bile 14

125 dostupne, tada bi sve karakteristike populacije (osnovnog skupa) mogli jednostavno ispitati i ne bi postojala potreba za statističkom analizom i zaključivanjem. S obzirom na to da su u praksi najčešće dostupni samo podaci o dijelu statističkog skupa, odnosno uzorka, koristimo teoriju vjerovatnoće i na osnovu uzorka, odnosno empirijskog rasporeda frekvencija, donosimo zaključke o distribuciji vjerovatnoće osnovnog skupa. Na osnovu ovog rezonovanja može se grafički prikazati postupak statističke analize i zaključivanja. Takav grafički oblikovan algoritam dat je na slici f(x) PLANIRAWE UZORKA UZIMAWE UZORKA OBIQE@JE X ODRE]IVAWE FREKVENCIJA ZA SVAKU VRIJEDNOST X DISTRIBUCIJA FREKVENCIJA X UZORAK ZAKQU^IVAWE PLANIRAWE EKSPERIMENTA ODRE\IVAWE SVIH ISHODA FORMIRAWE PROSTORA UZORKA PRIDRU@IVAWE BROJA SVAKOM ISHODU FORMIRAWE PROSTORA UZORKA ODRE]IVAWE VJEROVATNO]E ZA SVAKU VRIJEDNOST X P(X=x) DISTRIBUCIJA VJEROVATNO]E X POPULACIJA Slika : Veza između distribucije frekvencija (empirija), distribucije vjerovatnoće (teorija) i statističkog zaključivanja Kao i neprekidne distribucije frekvencija, tako i distribucije frekvencija prekidnih slučajnih varijabli možemo predstaviti pomoću dijagrama vjerovatnoće kao na slici 3... P (X = x(i)) 1 0,5 0,5 X 0 1 Slika 3... Grafički prikaz distribucije vjerovatnoće iz tabele Na apscisu se nanose moguće vrijednosti slučajne varijable a na ordinatu odgovarajuće vjerovatnoće. 15

126 Funkcija distribucije prekidne slučajne varijable Kao što smo vidjeli distribucija vjerovatnoće prekidne slučajne varijable koja ima konačan broj vrijednosti može se predstaviti kao lista pojedinih vrijednosti slučajne varijable sa odgovarajućim vjerovatnoćama. Međutim, postavlja se pitanje kako opisati prekidnu slučajnu varijablu koja ima prebrojivo mnogo, tj. beskonačno mnogo vrijednosti. Trebalo bi formirati listu, odnosno skup od beskonačno mnogo parova vrijednosti slučajne varijable i njihovih vjerovatnoća, što bi bilo praktično neizvodljivo. Isti problem se javlja i prilikom predstavljanja neprekidne slučajne varijable koja tekođer može uzeti jednu od beskonačno mnogo vrijednosti. Zbog ovih ograničenja potrebno je pronaći takav način predstavljanja koji bi važio za bilo koju slučajnu varijablu. To se postiže funkcijom distribucije; svaka slučajna varijabla ima svoju funkciju distribucije. Funkcija distribucije (naziva se još i kumulativna funkcija distribucije) prekidne slučajne varijable pokazuje vjerovatnoću da slučajna varijabla X uzme vrijednost koja je manja ili jednaka bilo kojoj proizvoljnoj vrijednosti x. Funkcija distribucije slučajne varijable X označava se sa F(x) i data je vjerovatnoćom. F ( x) P( X x) gdje x može biti bilo koji realan broj. Neka je X prekidna slučajna varijabla koja može uzeti vrijednosti x 1, x,..., x r,...,x n, gdje su x 1 < x <... < x n. Neka P(X=x i ) označava vjerovatnoću da X uzme vrijednost x i. Tada F(x r ) predstavlja vjerovatnoću da slučajna varijabla X uzme vrijednost koja će biti manja ili jednaka x r i dobija se sabiranjem (kumuliranjem) vjerovatnoća za sve vrijednosti slučajne varijable koje su manje ili jednake x r, tj. r F( xr ) P( X xr ) P( X x ) P( X x )... P( X x i1 1 r Svaka funkcija distribucije mora zadovoljiti sljedeće matematičke karakteristike: a) Za bilo koju vrijednost a vrijedi: 0 F ( a) 1, što je i razumljivo jer je funkcija distribucije vjerovatnoća; b) F(-)=0 i F(+)=1, jer se F(- )=F(X - ) odnosi na nemoguć događaj, a F(+ )=F(X + ) na siguran događaj; c) ako je a<b, tada je F(a) F(b), odnosno funkcija distribucije bilo koje slučajne varijable je neopadajuća funkcija. ) 16

127 Funkcija distribucije za prekidnu slučajnu varijablu dobija se kumuliranjem vjerovatnoća na sličan način kao šro se dobija i kumulativna frekvencija. Pogledajmo vrijednosti funkcije distribucije vjerovatnoća kod eksperimenta sa dva novčića. Vjerovatnoća realizacije nula grbova ili manje jednaka je 1 F ( 0) P( X ) ; 4 vjerovatnoća da u eksperimentu bude jedan grb ili manje jednaka je F ( 1) P( X 1) P( X 0) P( X 1) ; 4 4 i vjerovatnoća dobijanja dva grba ili manje je F ( 1) P( X 1) P( X 0) P( X 1) P( X ) Dobijene vrijednosti omogućuju da se funkcija distribucije vjerovatnoće za eksperiment bacanja dva novčića, zajedno sa distribucijom vjerovatnoće prikaže u obliku tabele Tabela : Distribucija vjerovatnoće i funkcija distribucije u primjeru dva novčića x i p i =P(X=x i ) F(x)=P(X x) 0 1/4 1/4 1 1/ 3/4 1/4 1 Funkcija distribucije može se prikazati i grafički pomoću stepenaste funkcije kao na slici F(x) 1 3/4 /4 1/4 0 1 X Slika Funkcija distribucije za broj grbova u eksperimentu sa bacanjem dva novčića 17

128 Grafikon funkcije distribucije sastoji se samo od horizontalnih linija. Vertikalne linije nisu dio funkcije distribucije, ali se obično uključuju da bi grafikon bio pregledniji. Sa slike je vidljivo da funkcija distribucije za sve vrijednosti X manje od nula ima vrijednost nula, a da za sve vrijednosti X koje su veće od dva ima vrijednost 1. Funkcija distribucije skokovito se mijenja za cjelobrojne vrijednosti slučajne varijable pa se na osnovu samog izgleda grafikona lako može uočiti diskretna priroda slučajne varijable. (Kolika je vjerovatnoća da X uzme vrijednost manju ili jednaku 0,5?) Očekivana vrijednost i varijansa prekidne slučajne varijable Raspored vjerovatnoće i funkcija distribucije sadrže sve relevantne informacije o statističkim karakteristikama neke prekidne slučajne varijable. Međutim, u velikom broju slučajeva nije moguće (ni potrebne) obezbjediti kompletnu informaciju o distribuciji, nego je dovoljno odrediti samo neke osnovne karakteristire (parametre) distribucije. One služe da se na sintetički način sagledaju različiti aspekti distribucije. U deskriptivnoj statistici aritmetička sredina i standardna devijacija bili su sumarni pokazatelji lokacije i varijabiliteta distribucije frekvencija. Analogno, će se formulisati mjere lokacije i varijabiliteta prekidne slučajne varijable. To se može uraditi pomoću: 1. očekivane vrijednosti slučajne varijable i. varijanse slučajne varijable. a) Očekivana vrijednost slučajne varijable Vratimo se eksperimentu sa bacanjem homogene kocke gdje je dobijena distribucija frekvencija prikazana tabelom Aritmetička sredina ove distribucije dobija se korištenjem formule za ponderisanu aritmetičku sredinu, gdje ulogu pondera igraju apsolutne frekvencije: k xi f i i x [1* 600 *36 3*30 4*63 5*51 6*60 3,63 n Do istog rezultata došlo bi se korištenjem relativnih frekvencija kao pondera: 6 xi f i 6 6 i1 x1 f1 x f... x6 f 6 f1 f f 6 f i x x1 x... x6 xi n n n n n i1 n i gdje su sa p i označene relativne frekvencije. 1 x p i i 3,63 18

129 Dakle, aritmetička sredina može se odrediti i kao ponderisani prosjek vrijednosti obilježja, sa relativnim frekvencijama kao ponderima. Posmatrajmo sada prekidnu slučajnu varijablu X sa slijedećom distribucijom vjerovatnoća: x i p i =P(X=x i ) x 1 p 1 =P(X=x 1 ) x p =P(X=x )... x n p n =P(X=x n ) Očekivana vrijednost slučajne varijable X označava se sa E(X) i jednaka je zbiru proizvoda slučajne varijable i odgovarajućih vjerovatnoća. E( X ) x1 p1 x p... x p x p (3..4.1) n n Očekivana vrijednost naziva se još matematičko očekivanje ili jednostavno očekivanje od X. Vidimo da E(X) predstavlja ponderisanu sredinu svih mogućih vrijednosti slučajne varijable X, pri čemu su ponderi odgovarajuće vjerovatnoće koje figurišu u rasporedu vjerovatnoće slučajne varijable X. Ako se vratimo na eksperiment sa bacanjem homogene kocke i na distribuciju vjerovatnoće koja je data u tabeli , očekivanu vrijednost slučajne varijable X možemo izračunati primjenom izraza : E ( X ) x i p i 1* * 3* 4* 5* 6* 3,5 i Na isti način može se odrediti očekivana vrijednost u primjeru sa bacanjem dva novčića čija je distribucija vjerovatnoće data sa tabelom : E ( X ) x i p i 0* 1* * i1 Očekivana vrijednost može se intuitivno shvatiti i kao težište (centar gravitacije) distribucije vjerovatnoće, odnosno svih vrijednosti koje uzima slučajna varijabla. Grafički to izgleda kao na slici : n i1 i i 19

130 P 1 /4 1/4 0 1 X Slika Očekivana vrijednost kao centar gravitacije distribucije vjerovatnoće Da bi se jasnije sagledao smisao očekivane vrijednosti usporedimo izračunatu vrijednost aritmetičke sredine i očekivanu vrinednost u primjeru sa bacanjem kocke. Vidimo da se dobijene vrijednosti razlikuju jer je x 3, 63 a E(X)=3,5. Razlika priističe zbog toga što u izrazu za aritmetičku sredinu ulogu pondera imaju relativne frekvencije, dok u formuli za očekivanu vrijednost ulogu pondera imaju vjerovatnoće. U prvom slučaju radili smo sa uzorkom od 300 elemenata, odnosno sa 300 opita. Po teoriji relativne frekcencije, ako bi izvršili beskonačno mnogo opita, relativne frekvencije bi postale vjerovatnoće (sve bi bile jednake 1/6) i u tom slučaju dobili bi ustvari očekivanu vrijednost 3,5. Zaključujemo da: a) aritmetička sredina predstavlja pokazatelj centralne tendencije vrijednosti obilježja u uzorku; b) očekivana vrijednost predstavlja pokazatelj centralne tendencije vrijednosti slučajne varijable, odnosno vrijednosti elemenata u osnovnom skupu. Međutim, u praktičnim istraživanjima pojam očekivana vrijednost slučajne varijable X najčešće se poistovvjećuje sa aritmetičkom sredinom osnovnog skupa. Zbog toga se može napisati slijedeća jednakost: E ( X ) x odnosno očekivana vrijednost slučajne varijable jednaka je aritmetičkoj sredini populacije. E(x) 130

131 131 Dok se pojam očekivana vrijednost u početku vezivao za hazardne igre, danas predstavlja osnovno sredstvo u analizi slučajeih varijabli. Na osnovu navedenih primjera može se sagledati da se: - očekivana vrijednost E(X) nalazi između minimalne i maksimalne vrijednosti slučajne varijable, i - očekivana vrijednost E(X) ne mora se poklapati sa nekom vrijednosti slučajne varijable. Očekivana vrijednost se ne može tumačiti kao vrijednost koja se očekuje u statističkom eksperimentu, nego kao prosječan očekivani ishod svih mogućih opita u eksperimentu. b) Kakteristike očekivane vrijednosti slučajne varijable Posmatrajmo neku slučajnu varijablu X. Ako se definiše naka funkcija od X, Y = g(x), npr. Y = 3 X +, ili Y = (X-4) itd., na osnovu dosadašnjih izlaganja može se zaključiti da će i Y biti slučajna varijabla. Najprije se postavlja pitanje da li znajući distribuciju vjerovatnoće slučajne varijable možemo odrediti distribuciju nove slučajne varijable Y? Ako pođemo od primjera bacanja novčića i distribucije vjerovatnoće date tabelom , odredimo distribuciju vjerovatnoće nove varijable Y = 3 X +. Potrebno je formirati listu vrijednosti transformisane slučajne varijable i njenih vjerovatnoća. Do vrijednosti slučajne varijable dolazi se jednostavno zamjenom odgovarajućih vrijednosti originalne slučajne varijable X koje iznose 0, 1 i, odnosno Y može slučajno uzeti vrijednosti, 5 i 8. Potrebno je još odrediti sa kojom vjerovatnoćom Y može uzeti ove vrijednosti: 1 P ( Y ) P(3X ) P(3X 0) P( X 0) 4 P ( Y 5) P(3X 5) P(3X 3) P( X 1) 1 P ( Y 8) P(3X 8) P(3X 6) P( X ) 4 Distribucija vjerovatnoće slučajne varijable Y kao i distribucija originalne slučajne varijable X prikazane su tabelom Tabela : Distribucija vjerovatnoće slučajne varijable X i Y=3X+ u eksperimentu sa dva novčića X 0 1 Y 5 8 p 1/4 1/ 1/4 p 1/4 1/ 1/4 Iz tabele se vidi da su vjerovatnoće u distribuciji vjerovatnoće nove slučajne varijable Y jednake vjerovatnoćama u distribuciji vjerovatnoće slučajne varijable X. 1

132 Ovaj rezultat važi i u opštem slučaju, odnosno ako izvršimo bilo kakvu transformaciju slučajne varijable X, distribucija vjerovatnoće nove skučajne varijable Y=g(X) imaće idnetične vjerovatnoće kao i distribucija X. Zbog toga se očekivana vrijednost bilo koje funkcije slučajne varijable X date sa Y=g(X) može izračunati kao: E ( Y ) E[ g( X )] g( x ) p y p (3..4.) i i i i i gdje y i predstavlja vrijednosti nove slučajne varijable Y, a p i vjerovatnoće koje se nalaze u distribuciji vjerovatnoće prvobitne slučajne varijable X (ili vjerovatnoće u distribuciji slučajne varijable Y, što je isto). Ako se ovo primjeni na distribuciju slučajne varijable Y u tabeli očekivana vrijednost iznosiće: E ( Y ) y i p i 3 i1 i 1 * 4 5* 1 8* Kod računanja očekivane vrijednosti bilo koje slučajne varijable mogu se koristiti određene osobine koje znatno olakšavaju analizu. Ako se sa a, b, c označe konstante a sa X i Y slučajne varijable tada su osnovne karakteristike očekivane vrijednosti: a) E(c)=c Očekivana vrijednost konstante jednaka je konstanti samoj. b) E(aX)=aE(X) Očekivana vrijednost produkta konstante i slučajne varijable jednaka je produktu konstante i očekivane vrijednosti slučajne varijable. Na osnovu ove osobine konstanta se može izvući ispred očekivane vrijednosti, što direktno slijedi iz poznatog pravila vazanog za operator Σ, da se konstanta može izvući ispred znaka Σ. c) E(X+b)=E(X)+b Očekivanje zbira slučajne varijable i konstante jednako je zbiru očekivanja slučajne varijable i očekivanja konstante. Kako je očekivanje konstante jednako konstanti tada je očekivanje zbira slučajne varijable i konstante jednako zbiru: očekivanje slučajne varijable i konstanta. d) E(a+bX)=E(a)+E(bX)=a+bE(X) Očekivanje zbira konstante i produkta konstante i slučajne varijable jednako je zbiru očekivanja konstante i očekivanju produkta konstante i slučajne varijable. Kako je očekivanje konstante jednako konstanti a očekivanje produkta konstante i slučajne varijable jednako produktu očekivanja konstanne i sluučajne varijable, tada je očekivanje zbira konstante i produkta konstante i slučajne varijable jednako zbiru: konstanta i produkt konstante i očekivanja slučajne varijable. e) E(X±Y)=E(X)±E(Y) 13

133 Očekivanje zbira (ili razlike) dvije slučajne varijable jednako je zbiru (razlici) očekivanja svake pojedinačno uzete slučajne varijable. f) E(aX+bY+c)=E(aX)+E(bY)+E(c)=aE(X)+bE(Y)+c Očekivanje zbira produkata dvije slučajne varijable i konstante jednako je zbiru: produkt konstanta i očekivanje prve slučajne varijable, produkt konstanta i očekivanje druge slučajne varijable i konstante. Korištenjem ovih osobina može se jednostavnije izračunati očekivana vrijednost slučajne varijable Y sa distribucijom vjerovatnoće datoj u tabeli E(Y)=E(X+3)=E(X)+E(3)=E(X)+3=*1+3=5 jer je E(X)=1. c) Varijansa prekidne slučajne varijable Očekivana vrijednost predstavlja centar ili sredinu distribucije vjerovatnoće neke slučajne varijable. Postavlja se pitanje u kojoj su mjeri ostale vrijednosti slučajne varijable disperzirane u odnosu na očekivanu vrijednost, tj. kolika su njihova odstupanja od očekivane vrijednosti. Kao mjeru disperzije ne možemo uzeti očekivanu vrijednost odstupanja jer je ona jednaka nuli E [ X E( X )] 0 Ovo se lako provjerava na primjeru slučajne varijable X koja pokazuje broj grbova u eksperimentu sa dva novčića: E[ X E( X )] E[ g( X )] g( X ) pi [ xi E( X )] pi 3 i (0 1)* (1 1)* ( 1) Podsjetimo se da smo analogan rezultat imali i kod aritmetičke sredine, jer je suma odstupanja obilježja od aritmetičke sredine jednaka nuli. Prateći istu logiku kao i kod formulacije varijanse distribucija frekvencija, potrebno je kvadrirati odstupanja pojedinih vrijednosti slučajne varijable od njene očekivane vrijednosti. Naime, kad je neka vrijednost slučajne varijable veća od očekivane vrijednosti odstupanje je pozitivno, i suprotno, za manje vrijednosti slučajnve varijable od očekivane vrrijednosti odstupanja su negativna, pa je zuma odstupanja jednaka nuli. Kvadriranjem odstupanja eliminišu se negativni predznaci i dobija se mjera odstupanja koja se razlikuje od nule. Tako se dolazi do mjere disperzije distribucije vjerovatnoće slučajne varijable koja se naziva varijansa slučajne varijable. Varijansa se označava sa Var X, ili ili i dobija se na osnovu: x 133

134 x i i i VarX E[ X E( X )] [ x E( X )] p (3..4.3) Uočljivo je da varijansa predstavlja očekivanu vrijednost kvadrata odstupanja slučajne varijable od njene očekivane vrijednosti. Ako očekivanu vrijednost slučajne varijable E(X) označimo sa x i shvatimo je kao aritmetičku sredinu osnovnog skupa (odnosno populacije), zaključujemo da se formula za varijansu može napisati u obliku ( x x) p. x i i i Usporedbom ovog izraza i izraza za varijansu (standardnu devijaciju) distribucije frekvencija vidi se da je razlika u ponderu, odnosno kod distribucije frekvencija ponderi su frekvencije dok su kod varijanse slučajne varijable ponderi vjerovatnoće. Varijansa slučajne varijable može se jednostavnije izračunati pomoću akternativna formule, na analogan način kao i varijansa (standardna devijacija) distribucije frekvencija VarX E[ X E( X )] E( X ) [ E( X )] x p x (3..4.4) x odnosno kao očekivanje kvadrata slučajne varijable minus kvadrat njenog očekivanja. Posmatrajmo ponovo distribuciju vjerovatnoće slučajne varijable X u primjeru sa dva novčića. Da se izračuna varijansa na osnovu formule (3..4.4) potrebno je izračunati produkte x i p i i x i p i što je i dato u tabeli Primjetimo da se E(X ) = x i p i razlikuje od [E(X)] =(x i p i ). Tabela : Izračunavanje varijanse slučajne varijable - primjer sa dva novčića x p xp xp 0 1/ / 1/ 1/ 1/4 1/ 1 Σ 1 1=E(X)= x 3/=E(X ) i i E X ) x i p 1 E ( X E( X x ( i 3 ) x i p i ) x 3 (1) 1 134

135 135 Do istog rezultata bi se došlo direktnom primjenom definicione formule : x [ xi E( X )] pi (0 1) * (1 1) * ( 1) * i1 4 4 S obzirom na to da je [x i -E(X)] uvijek nenegativno, ni varijansa slučajne varijable ne može biti negativna, tj. Var X 0. Ukoliko je VarX = 0, odnosno ne postoje nikakva odstupanja, X nije slučajna varijable nego konstanta. Važi i obratno, varijansa konstante jednaka je nuli. Varijansa slučajne varijable ima isto ograničenje kao i varijansa distribucije frekcancija - iskazana je kvadratnim mjernim jedinicama. Da bi se disperzija mjerila u istim mjernim jedinicama kao i X potrebno je uzeti pozitivnu vrijednost kvadratnog korjena varijanse. Na taj način dobija se standardna devijacija slučajne varijable X koja se označava sa SD, σ ili σ x. Osnovne karakteristike varijanse su: a) Var X > 0 b) Var a = 0 v) Var (X+a)=VarX g) Var bx = b Var X d) Var (a+bx) = b Var X Jedna od važnih primjena navedenih karakteristika je u transformaciji slučajne varijable X sa očekivanom vrijednosti E(X) i standardnom devijacijom SD u slučajnu varijablu Z sa očekivanom vrijednosti 0 i standardnom devijacijom 1. Ova nova slučajna varijabla Z naziva se standardizovana slučajna varijabla. Bilo koja slučajna varijabla može se standardizovati ako se od nje oduzme njena očekivana vrijednost a zatim se podijeli sa standardnom devijacijom (čime se eliminiše jedinica mjere). Standardizovana slučajna varijabla računa se kao: X E( X ) Z ; E ( Z) 0; VarZ 1 (3..4.5) x Modeli prekidnih distribucija vjerovatnoće Vidjeli smo da je kod izračunavanja očekivane vrijednosti i varijanse slučajne varijable X potrebna informacija o svim vrijednostima koje figurišu u distribuciji vjerovatnoće, bilo da je ona dostupna u obliku liste X: x 1, x,...,x n p: p 1, p,...,p n ili u obliku dijagrama vjerovatnoće.

136 Do potrebne informacije može se doći ako se distribucija vjerovatnoće može formulisati u obliku opšteg algebarskog izraza, tj. formule koja bi davala vezu između pojedinih vrijednosti koje uzima slučajna varijabla i odgovarajućih vjerovatnoća. Takva funkcionalna veza p i = f (x i ); i = 1,,..., n (3..4.6) na kondezovan način sadrži cijelu distribuciju vjerovatnoće i naziva se model distribucije. Ako je poznat model distribucije f tada se jednostavno mogu određivati pojedine vjerovatnoće tako što se indeksu i daju odgovarajuće vrijednost od 1 do n. Osnovni značaj modela distribucije je u tome što se na njima bazira cjelokupno statističko zaključivanje. Bez poznavanja pojedinih distribucija ne bi bilo moguće ocijeniti parametre populacije, formirati intervale pouzdanosti, niti testirati određenu statističku hipotezu. Tokom razvoja statističke teorije formulisan je i detaljno istražen veliki broj modela distribucije vjerovatnoće, za koje su izrađene odgovarajuće tablice vjerovatnoće. U praktičnim istraživanjima najširu primjenu su našle samo one distribucije koje najbolje reprezentuju ponašanje većeg broja prirodnih i društvenih fenomena. Najpoznatiji modeli prekidnih distribucija vjerovatnoće su: binomni, hipergeometrijski, Poasonov (Poisson) i uniformni. U okviru modela neprekidnih distribucija vjerovatnoće u statističkoj praksi najčešće se koriste: normalna, Studentova, (hi-kvadrat) i Snedekorova (Snedecor) - Fišerova (Fisher) distribucija. Ako se kod izvođenja konkretnog eksperimenta tačno zna distribucija vjerovatnoće slučajne varijable X, tada se na jednostavan način može odrediti vjerovatnoća javljanja bilo kog slučajnog događaja unutar prostora uzorka. Nažalost, u praksi je takva informacija izuzetno rijetko dostupna i najčešće se ne zna koju distribuciju vjerovatnoće ima slučajna varijabla u nekom eksperimentu, jer su poznate samo pojedine njene vrijednosti, odnosno raspolaže se empirijskom distribucijom frekvencija. Međutim, na osnovu velikog broja sprovedenih istraživanja i rezultata statističke teorije došlo se do spoznaje koji modeli distribucija najviše odgovaraju pojedinim eksperimentalnim situacijama. Dakle, bez obzira što je neka distribucija nepoznata ona se može aproksimirati, tj. modelirati, pomoću neke poznate distribucije za koju je već ranije utvrđeno da najbolje odgovara sličnim situacijama, i čije su karakteristike u statističkoj teoriji već ispitane. Tako, na primjer, ako se ispituje visina, težina ili inteligencija pojedinih grupa, statistička praksa sugeriše da je najbolje koristiti normalnu distribuciju. Ako se ispituje vrijednost aritmetičke sredine ili proporcije u skupu na osnovu uzorka koji 136

137 ima više od 30 elemenata, statistička teorija, na osnovu tzv. centralnog graničnog teorema, upućuje na korištenje normalne distribucije, itd. Binomna distribucija Najčešće korištena prekidna distribucija u primijenjenoj statistici je binomna distribucija. Da bi se potpunije sagledala objasnićemo prethodno pojam tzv. Bernulijevog (Bernoulli) procesa. Posmatrajmo sukcesivno izvođenje nekog eksperimenta u kome se jedno izvođenje naziva opit. Pretpostavimo da su u svakom pojedinom opitu moguća samo dva, uzajamno isključiva, ishoda koje ćemo arbitrarno nazvati uspjeh i neuspjeh. Veliki broj eksperimenata može se statistički klasifikovati na ovaj način. Na primjer, pri bacanju novčića moguća su samo dva ishoda (događaja) pad pisma ili grba; proizvedeni artikal može biti ispravan ili neispravan; ispit se pože položiti ili pasti, itd. U svakom od ovih primjera, zavisno od istraživanja, jedna događaj se označava kao uspjeh a drugi kao neuspjeh. Na primjer, pad pisma možemo označiti kao uspjeh, ali i neispravan priizvod može se označiti kao uspjeh. Ovakav opit koji može produkovati samo dva ishoda naziva se Bernulijev opit. Nas, međutim, neće interesovati samo jedan Bernulijev opit, nego niz nezavisnih, ponovljenih Bernulijevih opita. Takav niz opita naziva se Bernulijev proces ako su ispunjeni slijedeći uslovi: a) Svaki opit rezultira u jednom od dva moguća ishoda koji se tehnički klasifikuju kao uspjeh (U) i neuspjeh (N); b) Vjerovatnoća uspjeha, p = P(U), konstantna je od opita do opita. c) Vjerovatnoća neuspjeha P(N) = 1-p označava se se sa q, tako da je p+q=1. d) Opiti su nezavisni, odnosno bilo koji ishod da se realizuje u nekom opitu neće imati uticaja na vjerovatnoću ishoda u bilo kom drugom opitu. Vjerovatno je jajjednostavniji primjer Bernulijevog procesa eksperiment sa bacanjem pravilnog novčića, gdje se pojavljivanje pisma ili grba može klasifikovati kao uspjeh i neuspjeh, respektivno, tako da je p+q=1. Ukoliko se izvrši n ponovljenih Bernulijevih opita tada broj uspjeha može iznositi 0, 1,,..., n. Cilj je odrediti formulu za izračunavanje vjerovatnoće ostvarivanja svakog mogućeg broja uspjeha unutar n nezavisnih, uzastopno ponovljenih opita koji formiraju Bernulijev proces. Distribucija do koje se dolazi na ovaj način i koja daje željene vjerovatnoće naziva se binomna distribucija. Radi potpunijeg sagledavanja logike izvođenja binomne distribucije naprije će se uzeti primjer određivanja vjerovatnoće dobijanja tačno dva pisma u eksperimentu sa bacanjem novčića pet puta, a zatim će se dobijeni izraz generalizovati. 137

138 138 Svako pojedinačno bacanje može se tretirati kao Bernulijev opit odnosno kao jedan opit unutar Bernulijevog procesa. Označimo pojavljivanje pisma kao uspjeh. Pretpostavlja se da je u konkretnom eksperimentu prilikom pet uzastopnih bacanja dobijen sljedeći niz ishoda: G P G G P gdje su sa G i P označeni grb i pismo, respektivno. Da bi se pojednostavila analiza transformisaće se oznake ishoda tako što će se pojava uspjeha označiti sa brojem 1, a neuspjeha sa 0. Kako je u eksperimentu pismo označeno kao uspjeh, gornji niz izhoda može se napisati kao Vjerovatnoća uspjeha i neuspjeha u pojedinačnom opitu iznose p i lj, respektivno. Podsjetimo se da je, na osnovu definicije nezavisnih događaja, vjerovatnoća njihovog zajedničkog javljanja jednaka produktu pojedinačnih vjerovatnoća. Stoga je vjerovatnoća ostvarivanja konkretnog niza jednaka P(P, G, G, G, P) = P(0, 1, 0, 0, 1) = q*p*q*q*p = p q 3 Dobijena vjerovatnoća ukazuje na mogućnost dobijanja realizacije navedenog niza uspjeha i neuspjeha po redoslijedu kako je dat. Ali nas ne interesuje niti jedan pojedinačni redoslijed rezultata, nego vjerovatnoća dobijanja tačno dva uspjeha (pisma) prilikom izvođenja 5 opita, bez obzira na poredak. Da bi se izračunala ta vjerovatnoća pored osim posmatranog niza potrebno je uzeti i sljedećih devet nizova, od kojih svaki sadrži tačno dva uspjeha i tri neuspneha u pet uzastopnih opita: Koristeći isti način razmišljanja kao i kod prvog niza, zaključujemo da bilo koji od navedenih nizova ima istu vjerovatnoću pojavljivanja p q 3. Broj različitih nizova u našem primjeru jednak je broju kombinacija p q 10 p q (3..4.7) Ukoliko je novčić pravilan, vjerovatnoće pojave pisma i grba su jednake, tj. p = q = 0,5, pa zamjenom u izraz dobije se vrijednost 0,315. Navedeni rezultat može se sada poopštiti da bi se utvrdilo koliko iznosi vjerovatnoća dobijanja tačno x uspjeha pri izvođenju n opita Bernulijevoh procesa. Potrebno je najprije odrediti vjerovatnoću dobijanja bilo kog mogućeg niza koji sadrži x uspjeha, a zatim tu vjerovatnoću pomnožiti sa

139 brojem mogućih nizova. Pošto nije bitno kojim se redoslijedom pojavljuje uspjeh i neuspjeh, odaberimo onaj niz u kojem se najprije realizuje x uspjeha a zatim n-x neuspjeha. Ovaj niz može se predstaviti u obliku: x uspjeha n-x neuspjeha Ukupan broj nizova koji u sebi sadrži x uspjeha i (n-x) neuspjeha jednak je broju kombinacija x elemenata izabranih iz skupa od n elemenata n n! x x!( n x)! Uslijed toga vjerovatnoća dobijanja tačno x uspjeha u n opita iznosi n x nx n x nx P( x) p q p (1 p) za x = 0, 1,,..., n (3..4.8) x x Dobijeni izraz predstavlja binomnu distribuciju vjerovatnoće u slučaju n opita. Ako sada sa X označimo slučajnu varijablu koja pokazuje broj uspjeha u n opita vidimo da je P( x) P( X x) odnosno da binomna slučajna varijabla može uzeti jednu od vrijednosti 0, 1,,..., n sa odgovarajućim vjerovatnoćama koje su date izrazom Binomna distribucija: n x nx n x nx P( x) p q p (1 p) za x = 0, 1,,..., n x x n = broj opita; p = vjerovatnoća uspjeha u svakom opitu Moguće vrijednosti binomne slučajne varijable i odgovarajuće vjerovatnoće prakazane su tabelom

140 140 Tabela : Binomna distribucija vjerovatnoće Broj uspjeha Vjerovatnoća P(x) x.. n Podsjetimo da je binomna distribucija prekidna distribucija, jer slučajna varijabla može uzeti samo jednu vrijednost iz skupa izolovanih konačnih brojeva n. Ona zadovaljava oba uslova za distribuciju vjerovatnoće - svaka vjerovatnoća koja figuriše u distribuciji vjerovatnoća je nenegativna i suma svih vjerovatnoća jednaka je 1. Prvi uslov je ispuljen jer su p i (1-p) nenegativni brojevi, pa P(x) ne može biti negativno. Radi sagledavanja drugog uslova podsjetimo se jednog matematičkog izraza, tzv. binomne formule: n x n x n n n n b n n a b x n a b n ba n a n b a ) ( 1 U našem slučaju ako uvrstimo da je a=lj i b=p ovaj izraz daje n x n x n n n n p q p x n q p n pq n q p q ) ( 1 (3..4.9) S obzirom da je lj=1-p, usporedbom u tabeli vidi se da sukcesivni članovi na desnoj strani izraza predstavljaju binomne vjerovatnoće P(0), P(1),..., P(n): n n q p P ) (1 0) ( ) (1 (1) n n pq n p np P... n p n P ) ( n n p p p n ) (1 ) ( ) (1 ) (1 1 n n p np p p n ) ( 1 n p p n x n x p p x n 1 n n n n p p p n n ) (1

141 Zaključujemo da se sa desne strane izraza nalaze sve vjerovatnoće koje figurišu u binomnoj distribuciji vjerovatnoće. Kako se na lijevoj strani tog izraza nalazi (p+q) n, a poznato je da je (p+q)=1, vidi se da je suma svih binomnih vjerovatnoća jednaka 1 n =1, čime je ispunjen i drugi uslov. Binomna distribucija ima dva parametra, n i p. Mijenjanjem njihovih vrijednosti dobijaju se rezličite binomne distribucije, što znači da se termin binomna distribucija odnosi na cijelu familiju binomnih distribucija od kojih svaka zavisi od konkretnih vrijednosti parametara n i p. Da se sagleda kako vrijednosti parametara utiču na oblik binomne distribucije, na slici dat je grafički prikaz nekoliko različitih binomnih distribucija. Na osnovu slike zaključuje se da je binomna distribucija simetrična kad je p=0,5 bez obzira na vrijednost n. Kad je p<0,5 distribucija je asimetrična udesno, a u slučaju kad je p>0,5 distribucija je asimetrična ulijevo. Izuzetno važna osobina binomne dostribucije može se uočiti sa slika c, d, e: ukoliko se parametar p ne razlikuje mnogo od 0,5 sa povećanjem broja opita (n) distribucija postaje sve simetričnija (dobija zvonasti oblik). Međutim, kada se p znatno razlikuje od 0,5 ta tendencija se ne može uočiti (slike f i g). Slika a. Binomna distribucija za n=5 i p=0,5 141

142 Slika b. Binomna distribucija za n=10 i p=0,5 Slika c. Binomna distribucija za n=5 i p=0,3 Slika d. Binomna distribucija za n=10 i p=0,3 14

143 Slika e. Binomna distribucija za n=5 i p=0,3 Slika f. Binomna distribucija za n=5 i p=0,9 Slika g. Binomna distribucija za n=10 i p=0,9 143

144 Sa povećanjem vrijednosti n izračunavanje binomnih vjerovatnoća na osnovu izraza postaje zamorno. Zbog toga su napravljene tablice koje daju pregled izračunatih vrijednosti n, p i x. Tako na primjer, za n=5, p=0,5 i x= u tablici benomne distribucije vjerovatnoće može se pronaći vrijednost.315, tj. 0,315, što predstavlja vjerovatnoću realizacije dva uspjeha u eksperimentu koji se sastoji od pet uzastopnih opita sa vjerovatnoćom uspjeha u svakom opitu od 0,5. Da bi se na sintetički način sagledali najvažniji aspekti binomne distribucije potrebno je odrediti srednju vrijednost i mjeru disperzije binomne slučajne varijable. Aritmetička sredina (očekivana vrijednost), varijansa i standardna devijacija vinomne distribucije dobijaju se na osnovu izraza: Aritmetička sredina x E( X ) np Varijansa x np(1 p) npq ( ) Standardna devijacija x npq Kao primjer korištenja navedenih izraza posmatraće se najjednostavniji slučaj kada je n=1. Distribucija vjerovatnoće slučajne varijable X = broj uspjeha u jednom Bernulijevom opitu dat je sa x 0 1 vjerovatnoća lj p Očekivana vrijednost i varijansa izračuna se pomoću formula i respektivno: E( X ) x xi pi x1 p1 x p E( X i1 i i1 ) x p i x 1 p 1 x p 0 0q 1p q 1 p VarX E[ X E( X )] E( X ) [ E( X )] p p p(1 p) pq Imajući u vidu da je n=1, očigledno je da izrazi važe u ovom slučaju. Primjer 1: Realizuje se eksperiment bacanja novčića jedanput (n=1). U ovom eksperimentu imamo samo dvije mogućnosti: A i A C. Ova binomna slučajna varijabla može se šematski predstaviti kao: 1;0 X :, p q 1 p; q p p 144

145 Za svaki događaj je izvjesno da će se realizovati ili se neće realizovati pa je P(A)+P(A)=p+q=1. Primjer : Eskperiment bacanja novčića realizuje se dva puta (n=). U ovom eksperimentu imamo četiri moguće realizacije: AA, A C A, AA C, A C A C. Slučajna varijabla se može predstaviti u obliku: C C C C C C C AA; AA ilia A; A A AA; AA ; A A n, X : p ; pq qp; q p ; pq; q pri čemu je suma vjerovatnoća i p p i pq q p q 1 Primjer 3: Eskperiment bacanja novčića realizuje se tri puta (n=3). C C C C C C AAA;3AAA ;3AA A ; A A A 3 n 3, X :, pi p q p ;3 p q;3 pq ; q i Nastavimo li sa ovim eksperimentom dalje dobija se: kn knn k nk n n n n1 n n n n P xk p q q pq p q... p k0 k0k 0 1 n q n npq n1 n n 1 n p q... p n n p q 1 Primjer 4: Kolika je vjerovatnoća da porodica sa sedmoro djece ima dva dječaka? Ovdje se mora najprije uočiti da se radi o binomnoj raspodjeli jer postoje samo dva ishoda: dječak ili djevojčica. Nadalje, važno je uočiti da je vjerovatnoća pojavljivanja nekog od ovih događaja konstantna. Vjerovatnoća da se rodi dječak nešto je veća (0,51) od 1/ ali zbog jednostavnijeg računa uzimamo da je jednaka 1/ P () 1/ 1/ 1/ jer je: n n! 7! 7 *6*5* 4*3* *1 7 *6 1 k n k! k! 7!! 5* 4*3* *1* *1 *1 145

146 Hipergeometijska distribucija Vidjeli smo da binomni model zahtijeva da vjerovatnoća uspjeha p mora ostati konstantno iz opita u opit, odnosno da opiti moraju biti međusobno nezavisni. Posebnu primjenu binomna distribucija ima u problemima vezanim za izbor uzorka. Strogo uzevši, elementi uzorka biće međusobno nezavisni (tj. vjerovatnoća p biće konstantna) samo u slučajevima kada se uzorak veličine n uzima iz beskonačnog osnovnog skupa ili ako se iz konačnog skupa uzima uzorak sa ponavljanjem. U ovom drugom slučaju svaki elemet uzorka nakon izpitivanja vraća se u osnovni skup i pruža mu se mogućnost da ponovo bude izabran u uzorak. Ukoliko iz konačnog skupa uzimamo uzorak bez ponavljanja uzastopna izvlačenja biće zavisna i vjerovatnoća p mijenjaće se nakon izbora svakog novog elementa jer se broj i struktura preostalih elemenata u osnovnom skupu mijenja. U praksi se najveći broj istraživanja sprovodi korištenjem uzorka bez ponavljanja, pa na prvi pogled ne bi se smjela koristiti binomna distribucija kada je posmatrana populacija konačna. Međutim, ako veličina uzorka n nije suviše velika u odnosu na veličinu populacije N, binomna distribucija se ipak može koristiti jer predstavlja dobru aproksimaciju stvarne distribucije rezultata uzorka. Smatra se da će aproksimacija biti zadovoljavajuća ako je odnos n/n manji od 5%. Ali u slučaju da se primjenjuje uzorak bez ponavljanja koji sadrži 5% ili više elemenata koračne populacije mora se koristiti hipergeometrijska distribucija. Upotreba binomne i hiprgeometrijske distribucije prikazaće se tabelom Tabela : Upotreba distribucija (binomna i hipergeometrijska) u zavisnosti od izbora i veličine uzorka Uzorak Beskonačno velika populacija Veoma velika konačna populacija ili n/n<5% 146 Konačna populacija n/n>5% Bez ponavljanja Binomna Binomna Hipergeometrijska Sa ponavljanjem Binomna Binomna Binomna Pretpostavimo da uzimamo uzorak bez ponavljanja od n elementata iz konačne populacije od N elemenata, pri čemu se svi elementi populacije mogu klasifikovati u dvije grupe u zavisnosti od toga da li pokazuju ili ne određenu karakteristiku. Te grupe mogu biti zaposleni-nezaposleni radnici, ispravni-neispravni proizvodi, studenti koji su položili-pali na ispitu, itd. Označimo kao kod binomne distribucije elemente jedne grupe kao uspjeh, a druge kao neuspjeh. Neka ukupan broj elemenata u populaciji koji posjeduju ispitivanu karakteristiku (uspjeh) iznosi N 1 a broj elemenata koji je ne sadrže

147 (neuspjeh) N. Dakle N=N 1 +N. Potrebno je odrediti distribuciju vjerovatnoće za slučajnu varijablu X koja pokazuje koliko elemenata u uzorku ima posmatranu karakteristiku. Ova šema uzimanja uzorka može se prikazati grafički (slika ) Populacija Uzorak N 1 =broj uspjeha N =broj neuspjeha N=veličina populacije Uzima se uzorak veličine n x=broj uspjeha n-x=broj neuspjeha n=veličina uzorka Slika Uzimanje uzorka bez ponavljanja iz skupa čiji su elementi klasifikovani u dvije grupe Izraz za distribuciju hipergeometrijske slučajne varijable X dobije se na osnovu pravila kombinatorike, vodeći računa da x elemenata u uzorku mora doći iz podgrupe N 1 i da n-x elemenata koji ne posjeduju posmatranu karakteristiku dolazi iz podgrupe od N elemenata. Hipergeometrijska distribucija N1 N x n x P( X x) N n x = 0, 1,..., min(n, N 1 ) gdje su: N = veličina populacije N 1 = broj "uspjeha" u populaciji n = veličina uzorka (bez ponavljanja) N = broj "neuspjeha" u populaciji x = broj "uspjeha" u uzorku min(n, N 1 ) = minimum od n i N 1 n-x = broj "neuspjeha" u uzorku Kao i binomna i hipergeometrijska distribucija je prekidna i predstavlja čitavu familiju distribucija. Svaki član familije određen je sa tri parametra: N, N 1 i n. Aritmetička sredina i standardna devijacija hipergeometrijske distribucije mogu se izračunati na osnovu slijedećih formula, u kojima je radi N1 jednostavnosti sa p označen udio uspjeha u populaciji: N x x E( x) np ( ) 147

148 N n SD x np(1 p) * N 1 Vidimo da hipergeometrijska distribucija ima istu aritmetičku sredinu kao i binomna. Standardna devijacija hipergeometrijske distribucije se, međutim, ( N n) razlikuje jer se množi sa izrazom koji se naziva popravni faktor za N 1 konačnu populaciju. Standardne devijacije binomne i hipergeometrijske distribucije neće se mnogo razlikovati kad je popravni faktor blizak jedinici, odnosno kad uzorak sadrži mali broj elemenata skupa (podsjetimo da se najčešće uzima vrijednost n/n<5% kao mogućnost dobre aproksimacije hipergeometrijske distribucije binomnom. Kako je izračunavanje hipergeometrijske distribucije veoma komplikovano preporučljivo je tako planirati eksperiment uzimanja uzorka da se može koristiti binomna distribucija. To znači da ili se eksperiment mora odnositi na beskonačan skup, ili je potrebno uzimati uzorak sa ponavljanjem, ili broj elemenata u uzorku mora biti manji od 5% veličine populacije. U ovom posljednjem slučaju mala je razlika između binomnih i hipergeometrijskih vjerovatnoća, iako naravno hiperbeometrijske daju egzaktan odgovor. Da bi se ilustrovala primjena hipergeometrijske distribucije posmatra se proizvodni proces u kome se za sat vremena proizvede 50 diskova za računar. Neka se, zbog smanjenja troškova, proces prati sa uzorkom od 5 elemenata. Pretpostavimo da su u jednom odabranom satu 4 proizvedena diska bila neispravna. Kolika je vjerovatnoća da će uzorak od 5 elemenata sadržavati tačno 1 neispravan i 4 ispravna diska? Ova vjerovatnoća dobija se korištenjem hipergeometrijske distribucije, jer je populacija konačna a veličina uzorka prema veličini populacije iznosi 10%; 446 4! 46! 1 4 P ( X 1) P(1_ neispravan _ i _ 4 _ ispravna) 1!3! 4!4! 0, ! 5 5!45! Poasonova (Poisson) distribucija Kako smo do sada vidjeli binomna distribucija pokazuje vjerovatnoće dobijanja x uspjeha prilikom n opita nekog eksperimenta, tj. Bernulijevog procesa, pod uslovom da je vjerovatnoće uspjeha p konstantna iz opita u opit. Ako je broj opita velik tada je direktno računanje vjerovatnoće za odgovarajuće vrijednosti slučajne varijable postaje komplikovano. Ukoliko je vjerovatnoća uspjeha p veoma mala (najčešće se uzima da je p 0, 05 ) i kada je n 0, umjesto binomnog modela može se koristiti Poasonov model kao zadovoljavajući način aproksimacije vjerovatnoća. 148

149 Zapazimo da kada je p blisko nuli ustvari ispitujemo događaje čija je vjerovatnoća pojavljivanja veoma mala, pa ih možemo označiti kao rijetke događajae. Poasonova distribucija ne služi samo za aproksimaciju binomnih vjerovatnoća. Pomoću nje moguće je opisivati veliki brij pojava bilo u vremenu ili prostoru: broj klijenata koji se nalaze u redu i čekaju neku uslugu, broj saobraćajnih nezgoda u toku nedjelje, broj štamparskih grešaka po stranici u nekoj knjizi, broj čestica emitovanih od neke radioaktivne supstance, broj zastoja u radu mašine u preduzeću,broj telefonskih poziva na centrali, broj defekata na kvadratnom metru tkanine, godišnji broj umrlih u nekom gradu od neke rijetke bolesti, itd. U navedenim primjerima Poasonova distribucija može se koristiti da bi se odredila vjerovatnoća broja javljanja nekog događaja u jedinici vremena ili prostora uz uslov da je ispunjeno slijedeće: 1. Broj javljanja događaja nezavisan je od jedne do druge jedinice vremena ili prostora.. Vjerovatnoća javljanja nekog događaja proporcionalna je dužini određene jedinice vremena ili prostora. 3. Vjerovatnoća istovremenog javljanja dva ili više događaja u sasvim maloj jedinici vremena ili prostora zanemarivo je mala. Pod ovim uslovima distribucija slučajne varijable X, koja pokazuje koliko se puta javio neki događaj u jedinici vremena ili prostora, ima oblik Poasonove distribucije (francuski matematičar S.D. Poisson koji je godine objavio članak u kome se prvi put opisuje ova distribucija). Poasonova distribucija: x e P( X x) x! x = 0, 1,,... λ>0 Ovaj izraz predstavlja vjerovatnoću da prekidna slučajna varijabla X uzme neku proizvoljnu vrijednost x. Broj e je baza prirodnog logaritma i iznosi,7188. Kako se vidi Poasonova distribucija ima samo jedan parametar, koji predstavlja prosječan broj javljanja nekog događaja u jedinici vremena ili prostora. Parametar λ istovremeno predstavlja aritmetičku sredinu i varijansu Poasonove distribucije, tj. E X ) x (3..4.1) ( x Poasonova distribucija predstavlja čitavu familiju distribucija u zavisnosti od vrijednosti parametra λ, što je prikazano na slici

150 Slika a: Poasonova distribucija λ=0,10 Slika b: Poasonova distribucija λ=0,5 Slika c: Poasonova distribucija λ=1,0 150

151 Slika d: Poasonova distribucija λ=5,0 Sa slika se vidi da je Poasonova distribucija asimetrična udesno i da sa povećanjem vrijednosti λ distribucija teži da zauzme simetričan oblik. Za razliku od binomne i hipergeometijske slučajne varijable, Poasonova slučajna varijabla, iako prekidna, može uzeti beskonačno mnogo izolovanih vrijednosti. Da bi se sagledalo kako se pomoću Poasonove distribucije aproksimiraju binomne vjerovatnoće (kada je p blisko nuli a n 0) posmatrajmo proizvodni proces nekih električnih komponenti i pretpostavimo da je % proizvoda neispravno. Ako se uzme uzorak od n=100 elemenata, kolika je vjerovatnoća da će on sadržavati 3 neispravna proizvoda? Da bi došli do rješenja uspostavimo najprije vezu između binomnih i Poasonovih vjerovatnoća sa: np x n x nx e ( np) p (1 p) x x! Poasonova distribucija uzeta je u ovom izrazu kao aproksimacija binomne sa =np. Kako je u našem primjeru n=100, p=0,0 slijedi da je =np=, pa Poasonova vjerovatnoća za X=3 iznosi: 3 e P ( X 3) 0,1804 3! Da je binomna distribucija korištena direktno dobilo bi se: P ( X 3) 0,0 0,98 0,183 3 što je veoma blisko aproksimativnoj vrijednosti, a znatno teže se izračunava. 151

152 Uniformna distribucija Jedna od najjednostavnijih prekidnih distribucija je uniformna distribucija. Posebnu primjenu je našla u računarskim simulacijama i igrama na sreću. Njena osnovna osobina je da svaka vrijednost slučajne varijable ima jednaku vjerovatnoću pojavljivanja. Pretpostavimo da slučajna varijabla X može uzeti jednu od vrijednosti 1,,..., n. Ako je vjerovatnoća da X uzme bilo koju od ovih vrijednosti jednaka, i iznosi 1/n, i ako se ove vjerovatnoće ne mijenjaju od opita do opita, za X se kaže da ima prekidnu uniformnu distribuciju. Uniformna distribucija: 1 P( X x) x = 1,,..., n n n = broj različitih vrijednosti koje X može uzeti Aritmetička sredina i varijansa uniformne distribucije date su sa: n 1 E ( X ) x ( ) n 1 VarX x 1 Kao primjer uniformne distribucije uzećemo primjer bacanja pravilne kocke. Kako svaka strana kocke ima podjednaku mogućnost pojavljivanja, slučajna varijabla koja pokazuje broj tačaka na kocki ima uniformnu distribuciju. 1 P ( X x) x = 1,,..., 6 6 Grafički se to može predstaviti kao na slici Slika : Uniformna distribucija u eksperimentu bacanja pravilne šestostrane kocke (n=6) 15

153 Distribucija vjerovatnoće neprekidne slučajne varijable Prekidna slučajna varijabla može u jednom opitu uzeti neku vrijednost iz konačnog skupa brojeva ili iz skupa koji sadrži prebrojivo mnogo brojeva. Modeli distribucija zasnovani na pojedinim prekidnim slučajnim varijablama imaju značajnu ulogu u velikom broju eksperimentalnih situacija. Međutim, postavlja se pitanje kako primjeniti binomne ili Poasonove tablice vjerovatnoće kad se parametri distribucija nalaze izvan opsega tablica. Već je pokazano da se, za vrijednosti p bliske nuli i n 0, binomne vjerovatnoće mogu zadovoljavajuće aproksimirati Poasonovim. Ali šta uraditi u situaciji kada se p znatno razlikuje od nule (npr. p = 0,6) ili ako parametar λ kod Poasonove distribucije iznosi 30. Tada modeli neprekidnih distribucije vjerovatnoće mogu pružiti odgovarajuću aproksimaciju traženih vjerovatnoća. Osim toga, veliki broj i društvenih i prirodnih pojava može uzeti bilo koju vrijednost iz nekog konačnog ili beskonačnog intervala, odnosno po svojoj po svojoj prirodi moraju se tretirati kao neprekidne slučajne varijable. Najčešće kada je neka pojava podložna mjerenju, kao na primjer, visina, težina, veijednost hemoglobina, potrošnja per capita, tjelesna temperatura, temperatura vazduha, potrebno vrijeme da se usluži klijent u servisu, i slično, tada se ona može smatrati neprekidnom slučajnom varijablom. Uočimo da navedene varijable teorijski mogu uzeti bilo koju vrijednost u nekom intervalu, iako je u praksi broj tih vrijednosti konačan zbog nesavršenih mjernih instrumenata. Kao kod prekidne slučajne varijable do distribucije vjerovatnoće dolazi se tako što se formira lista pojedinih vrijednosti slučajne varijable i odgovarajućih vjerovatnoća. Međutim, kod neprekidne slučajne varijable nemoguće je sastaviti takvu listu jer je broj njenih vrijednosti beskonačan. Zbog toga nema ni smisla govoriti o vjerovatnoći da slučajna varijabla X uzme jednu određenu vrijednost P(X=x) jer takvih vrijednosti ima beskonačno mnogo, pa je ta verovatnoća jednaka nuli za svako x. Radi jasnijeg sagledavanja koncepta neprekidne distribucije vjerovatnoće posmatrajmo distribuciju 100 studenata prema vremenu potrebnom da se uradi jedan zadatak na ispitu iz statistike prikazan tabelom

154 Tablela : Distribucija 100 studenata prema vremenu potrebnom za izradu jednog zadatka Red. br. Vrijeme Relativna Frekvencija (min) frekvancija , , , , , , ,03 Prema tabeli dobije se grafički prikaz na slici Slika : Distribucija frekvencije studenata prema vremenu izrade ispitnog zadatka, širina intervala 5 min Na osnovu date tabele i dijagrama može se zaključiti da histogram relativnih frekvencija ima slijedeće dvije karakteristike: - Ukupna površina ispod histograma jednaka je 1. jer je suma relativnih frekvencija jednaka 1, - Relativna frekvencija za bilo koje dvije granične vrijednosti grupnih intervala (npr. 4 i 40) može se dobiti kao površina ispod histograma koja odgovara datom intervalu. U našem primjeru širina grupnog intervala je 4 a broj grupa 7. Ispitajmo sada šta će se desiti sa histogramom relativnih frekvencija kada se povećava broj obuhvaćenih jedinica posmatranja. Pretpostavimo da imamo takve mjerne instrumente koji nam omogućuju izbor proizvoljno male širine vremenskog intervala. Ukoliko se širina intervala smanjuje, a broj intervala i broj jedinica posmatranja raste, histogram relativnih frekvencija težiće da obrazuje glatku neprekidnu krivu pa se na isti način kao i kod prikaza 154

155 prekidnih mogu prikazati i distribucije frekvencija neprekidnih slučajnih varijabli. Slika 3..5.: Distribucija frekvencije studenata prema vremenu izrade ispitnog zadatka: n= 841 student, širina intervala 0,5 min Slika : Distribucija frekvencije studenata prema vremenu izrade ispitnog zadatka: n= studentata, širina intervala 0,1 min. Na slikama i ilustrirano je smanjenje širine grupnog intervala a povećanje broja intervala i broja jedinica posmatranja. Sa daljim povećavanjem broja jedinica posmatranja, povaćavanjem broja intervala i smanjenjem širine intervala dolazi se do graničnog slučaja u kojem imamo beskonačno male (infonitezimalne) intervale. Dakle, kada bi broj podataka težio beskonačnosti imali bi beskonačno mnogo intervala čija bi širina težila nuli, pa bi se histogram potpuno transformisao u neprekidnu krivu. Kako su na osnovu koncepta relativne frekvencije, vjerovatnoće ustvari granične relativne frekvancije, zaključujemo da bi dobijena kriva predstavljala distribuciju vjerovatnoće. Ona pokazuje kako je ukupna vjerovatnoća distribuirana s obzirom na sve moguće vrijednosti slučajne 155

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan.

SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan. SIMPLE PAST TENSE (prosto prošlo vreme) Građenje prostog prošlog vremena zavisi od toga da li je glagol koji ga gradi pravilan ili nepravilan. 1) Kod pravilnih glagola, prosto prošlo vreme se gradi tako

More information

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije

Biznis scenario: sekcije pk * id_sekcije * naziv. projekti pk * id_projekta * naziv ꓳ profesor fk * id_sekcije Biznis scenario: U školi postoje četiri sekcije sportska, dramska, likovna i novinarska. Svaka sekcija ima nekoliko aktuelnih projekata. Likovna ima četiri projekta. Za projekte Pikaso, Rubens i Rembrant

More information

Pojam i razvoj statistike. Statistika trostruki sadržaj. Skup se određuje: Vrste obilježja. Predmet i način statističkog istraživanja

Pojam i razvoj statistike. Statistika trostruki sadržaj. Skup se određuje: Vrste obilježja. Predmet i način statističkog istraživanja Pojam i razvoj statistike Skup numeričkih podataka (status stanje) Prvi začeci statistike datiraju nekoliko vjekova prije nove ere (Kina 4 g.p.n.e) Razvoj statistike razvoj informatičkog društva Statistika

More information

BENCHMARKING HOSTELA

BENCHMARKING HOSTELA BENCHMARKING HOSTELA IZVJEŠTAJ ZA SVIBANJ. BENCHMARKING HOSTELA 1. DEFINIRANJE UZORKA Tablica 1. Struktura uzorka 1 BROJ HOSTELA BROJ KREVETA Ukupno 1016 643 1971 Regije Istra 2 227 Kvarner 4 5 245 991

More information

SAS On Demand. Video: Upute za registraciju:

SAS On Demand. Video:  Upute za registraciju: SAS On Demand Video: http://www.sas.com/apps/webnet/video-sharing.html?bcid=3794695462001 Upute za registraciju: 1. Registracija na stranici: https://odamid.oda.sas.com/sasodaregistration/index.html U

More information

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB.

KAPACITET USB GB. Laserska gravura. po jednoj strani. Digitalna štampa, pun kolor, po jednoj strani USB GB 8 GB 16 GB. 9.72 8.24 6.75 6.55 6.13 po 9.30 7.89 5.86 10.48 8.89 7.30 7.06 6.61 11.51 9.75 8.00 7.75 7.25 po 0.38 10.21 8.66 7.11 6.89 6.44 11.40 9.66 9.73 7.69 7.19 12.43 1 8.38 7.83 po 0.55 0.48 0.37 11.76 9.98

More information

STRUČNA PRAKSA B-PRO TEMA 13

STRUČNA PRAKSA B-PRO TEMA 13 MAŠINSKI FAKULTET U BEOGRADU Katedra za proizvodno mašinstvo STRUČNA PRAKSA B-PRO TEMA 13 MONTAŽA I SISTEM KVALITETA MONTAŽA Kratak opis montže i ispitivanja gotovog proizvoda. Dati izgled i sadržaj tehnološkog

More information

Uvod u relacione baze podataka

Uvod u relacione baze podataka Uvod u relacione baze podataka 25. novembar 2011. godine 7. čas SQL skalarne funkcije, operatori ANY (SOME) i ALL 1. Za svakog studenta izdvojiti ime i prezime i broj različitih ispita koje je pao (ako

More information

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA

CJENIK APLIKACIJE CERAMIC PRO PROIZVODA STAKLO PLASTIKA AUTO LAK KOŽA I TEKSTIL ALU FELGE SVJETLA KOŽA I TEKSTIL ALU FELGE CJENIK APLIKACIJE CERAMIC PRO PROIZVODA Radovi prije aplikacije: Prije nanošenja Ceramic Pro premaza površina vozila na koju se nanosi mora bi dovedena u korektno stanje. Proces

More information

Podešavanje za eduroam ios

Podešavanje za eduroam ios Copyright by AMRES Ovo uputstvo se odnosi na Apple mobilne uređaje: ipad, iphone, ipod Touch. Konfiguracija podrazumeva podešavanja koja se vrše na računaru i podešavanja na mobilnom uređaju. Podešavanja

More information

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević

GUI Layout Manager-i. Bojan Tomić Branislav Vidojević GUI Layout Manager-i Bojan Tomić Branislav Vidojević Layout Manager-i ContentPane Centralni deo prozora Na njega se dodaju ostale komponente (dugmići, polja za unos...) To je objekat klase javax.swing.jpanel

More information

Port Community System

Port Community System Port Community System Konferencija o jedinstvenom pomorskom sučelju i digitalizaciji u pomorskom prometu 17. Siječanj 2018. godine, Zagreb Darko Plećaš Voditelj Odsjeka IS-a 1 Sadržaj Razvoj lokalnog PCS

More information

Nejednakosti s faktorijelima

Nejednakosti s faktorijelima Osječki matematički list 7007, 8 87 8 Nejedakosti s faktorijelima Ilija Ilišević Sažetak Opisae su tehike kako se mogu dokazati ejedakosti koje sadrže faktorijele Spomeute tehike su ilustrirae a izu zaimljivih

More information

PROJEKTNI PRORAČUN 1

PROJEKTNI PRORAČUN 1 PROJEKTNI PRORAČUN 1 Programski period 2014. 2020. Kategorije troškova Pojednostavlj ene opcije troškova (flat rate, lump sum) Radni paketi Pripremni troškovi, troškovi zatvaranja projekta Stope financiranja

More information

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ

TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ TRENING I RAZVOJ VEŽBE 4 JELENA ANĐELKOVIĆ LABROVIĆ DIZAJN TRENINGA Model trening procesa FAZA DIZAJNA CILJEVI TRENINGA Vrste ciljeva treninga 1. Ciljevi učesnika u treningu 2. Ciljevi učenja Opisuju željene

More information

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd,

AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje. Marko Eremija Sastanak administratora, Beograd, AMRES eduroam update, CAT alat za kreiranje instalera za korisničke uređaje Marko Eremija Sastanak administratora, Beograd, 12.12.2013. Sadržaj eduroam - uvod AMRES eduroam statistika Novine u okviru eduroam

More information

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings

Eduroam O Eduroam servisu edu roam Uputstvo za podešavanje Eduroam konekcije NAPOMENA: Microsoft Windows XP Change advanced settings Eduroam O Eduroam servisu Eduroam - educational roaming je besplatan servis za pristup Internetu. Svojim korisnicima omogućava bezbedan, brz i jednostavan pristup Internetu širom sveta, bez potrebe za

More information

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri.

Ulazne promenljive se nazivaju argumenti ili fiktivni parametri. Potprogram se poziva u okviru programa, kada se pri pozivu navode stvarni parametri. Potprogrami su delovi programa. Često se delovi koda ponavljaju u okviru nekog programa. Logično je da se ta grupa komandi izdvoji u potprogram, i da se po želji poziva u okviru programa tamo gde je potrebno.

More information

DEFINISANJE TURISTIČKE TRAŽNJE

DEFINISANJE TURISTIČKE TRAŽNJE DEFINISANJE TURISTIČKE TRAŽNJE Tražnja se može definisati kao spremnost kupaca da pri različitom nivou cena kupuju različite količine jedne robe na određenom tržištu i u određenom vremenu (Veselinović

More information

STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI

STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI Bosna i Hercegovina Agencija za statistiku Bosne i Hercegovine Bosnia and Herzegovina Agency for Statistics of Bosnia and Herzegovina STATISTIKA U OBLASTI KULTURE U BOSNI I HERCEGOVINI Jahorina, 05.07.2011

More information

Struktura indeksa: B-stablo. ls/swd/btree/btree.html

Struktura indeksa: B-stablo.   ls/swd/btree/btree.html Struktura indeksa: B-stablo http://cis.stvincent.edu/html/tutoria ls/swd/btree/btree.html Uvod ISAM (Index-Sequential Access Method, IBM sredina 60-tih godina 20. veka) Nedostaci: sekvencijalno pretraživanje

More information

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE

CJENOVNIK KABLOVSKA TV DIGITALNA TV INTERNET USLUGE CJENOVNIK KABLOVSKA TV Za zasnivanje pretplatničkog odnosa za korištenje usluga kablovske televizije potrebno je da je tehnički izvodljivo (mogude) priključenje na mrežu Kablovskih televizija HS i HKBnet

More information

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020.

Idejno rješenje: Dubrovnik Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020. Idejno rješenje: Dubrovnik 2020. Vizualni identitet kandidature Dubrovnika za Europsku prijestolnicu kulture 2020. vizualni identitet kandidature dubrovnika za europsku prijestolnicu kulture 2020. visual

More information

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI

IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI IZDAVANJE SERTIFIKATA NA WINDOWS 10 PLATFORMI Za pomoć oko izdavanja sertifikata na Windows 10 operativnom sistemu možete se obratiti na e-mejl adresu esupport@eurobank.rs ili pozivom na telefonski broj

More information

Klasterizacija. NIKOLA MILIKIĆ URL:

Klasterizacija. NIKOLA MILIKIĆ   URL: Klasterizacija NIKOLA MILIKIĆ EMAIL: nikola.milikic@fon.bg.ac.rs URL: http://nikola.milikic.info Klasterizacija Klasterizacija (eng. Clustering) spada u grupu tehnika nenadgledanog učenja i omogućava grupisanje

More information

Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE)

Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE) Tema 2: Uvod u sisteme za podršku odlučivanju (VEŽBE) SISTEMI ZA PODRŠKU ODLUČIVANJU dr Vladislav Miškovic vmiskovic@singidunum.ac.rs Fakultet za računarstvo i informatiku 2013/2014 Tema 2: Uvod u sisteme

More information

ANALIZA PRIKUPLJENIH PODATAKA O KVALITETU ZRAKA NA PODRUČJU OPĆINE LUKAVAC ( ZA PERIOD OD DO GOD.)

ANALIZA PRIKUPLJENIH PODATAKA O KVALITETU ZRAKA NA PODRUČJU OPĆINE LUKAVAC ( ZA PERIOD OD DO GOD.) Bosna i Hercegovina Federacija Bosne i Hercegovine Tuzlanski kanton Ministarstvo prostornog uređenja i zaštite okolice ANALIZA PRIKUPLJENIH PODATAKA O KVALITETU ZRAKA NA PODRUČJU OPĆINE LUKAVAC ( ZA PERIOD

More information

RANI BOOKING TURSKA LJETO 2017

RANI BOOKING TURSKA LJETO 2017 PUTNIČKA AGENCIJA FIBULA AIR TRAVEL AGENCY D.O.O. UL. FERHADIJA 24; 71000 SARAJEVO; BIH TEL:033/232523; 033/570700; E-MAIL: INFO@FIBULA.BA; FIBULA@BIH.NET.BA; WEB: WWW.FIBULA.BA SUDSKI REGISTAR: UF/I-1769/02,

More information

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT

TRAJANJE AKCIJE ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT TRAJANJE AKCIJE 16.01.2019-28.02.2019 ILI PRETHODNOG ISTEKA ZALIHA ZELENI ALAT Akcija sa poklonima Digitally signed by pki, pki, BOSCH, EMEA, BOSCH, EMEA, R, A, radivoje.stevanovic R, A, 2019.01.15 11:41:02

More information

ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA

ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA ANALIZA PRIMJENE KOGENERACIJE SA ORGANSKIM RANKINOVIM CIKLUSOM NA BIOMASU U BOLNICAMA Nihad HARBAŠ Samra PRAŠOVIĆ Azrudin HUSIKA Sadržaj ENERGIJSKI BILANSI DIMENZIONISANJE POSTROJENJA (ORC + VRŠNI KOTLOVI)

More information

Advertising on the Web

Advertising on the Web Advertising on the Web On-line algoritmi Off-line algoritam: ulazni podaci su dostupni na početku, algoritam može pristupati podacima u bilo kom redosljedu, na kraju se saopštava rezultat obrade On-line

More information

Mogudnosti za prilagođavanje

Mogudnosti za prilagođavanje Mogudnosti za prilagođavanje Shaun Martin World Wildlife Fund, Inc. 2012 All rights reserved. Mogudnosti za prilagođavanje Za koje ste primere aktivnosti prilagođavanja čuli, pročitali, ili iskusili? Mogudnosti

More information

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine

UNIVERZITET U BEOGRADU RUDARSKO GEOLOŠKI FAKULTET DEPARTMAN ZA HIDROGEOLOGIJU ZBORNIK RADOVA. ZLATIBOR maj godine UNIVERZITETUBEOGRADU RUDARSKOGEOLOŠKIFAKULTET DEPARTMANZAHIDROGEOLOGIJU ZBORNIKRADOVA ZLATIBOR 1720.maj2012.godine XIVSRPSKISIMPOZIJUMOHIDROGEOLOGIJI ZBORNIKRADOVA IZDAVA: ZAIZDAVAA: TEHNIKIUREDNICI: TIRAŽ:

More information

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze

Trening: Obzor financijsko izvještavanje i osnovne ugovorne obveze Trening: Obzor 2020. - financijsko izvještavanje i osnovne ugovorne obveze Ana Ključarić, Obzor 2020. nacionalna osoba za kontakt za financijska pitanja PROGRAM DOGAĐANJA (9:30-15:00) 9:30 10:00 Registracija

More information

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION

ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION VFR AIP Srbija / Crna Gora ENR 1.4 1 ENR 1.4 OPIS I KLASIFIKACIJA VAZDUŠNOG PROSTORA U KOME SE PRUŽAJU ATS USLUGE ENR 1.4 ATS AIRSPACE CLASSIFICATION AND DESCRIPTION 1. KLASIFIKACIJA VAZDUŠNOG PROSTORA

More information

DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta. Hotel ODISEJ, POMENA, otok Mljet, listopad 2010.

DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta. Hotel ODISEJ, POMENA, otok Mljet, listopad 2010. DANI BRANIMIRA GUŠICA - novi prilozi poznavanju prirodoslovlja otoka Mljeta Hotel ODISEJ, POMENA, otok Mljet, 03. - 07. listopad 2010. ZBORNIK SAŽETAKA Geološki lokalitet i poucne staze u Nacionalnom parku

More information

1.7 Predstavljanje negativnih brojeva u binarnom sistemu

1.7 Predstavljanje negativnih brojeva u binarnom sistemu .7 Predstavljanje negativnih brojeva u binarnom sistemu U decimalnom brojnom sistemu pozitivni brojevi se predstavljaju znakom + napisanim ispred cifara koje definišu apsolutnu vrednost broja, odnosno

More information

Otpremanje video snimka na YouTube

Otpremanje video snimka na YouTube Otpremanje video snimka na YouTube Korak br. 1 priprema snimka za otpremanje Da biste mogli da otpremite video snimak na YouTube, potrebno je da imate kreiran nalog na gmailu i da video snimak bude u nekom

More information

WWF. Jahorina

WWF. Jahorina WWF For an introduction Jahorina 23.2.2009 What WWF is World Wide Fund for Nature (formerly World Wildlife Fund) In the US still World Wildlife Fund The World s leading independent conservation organisation

More information

STABLA ODLUČIVANJA. Jelena Jovanovic. Web:

STABLA ODLUČIVANJA. Jelena Jovanovic.   Web: STABLA ODLUČIVANJA Jelena Jovanovic Email: jeljov@gmail.com Web: http://jelenajovanovic.net 2 Zahvalnica: Ovi slajdovi su bazirani na materijalima pripremljenim za kurs Applied Modern Statistical Learning

More information

LLL Seminari u okviru TEMPUS projekta

LLL Seminari u okviru TEMPUS projekta LLL Seminari u okviru TEMPUS projekta Naziv projekta: 511140 TEMPUS JPCR MAS Master programe in Applied Statistics - Broj projekta: 511140 Nosilac projekta: Departman za matematiku i informatiku, PMF Novi

More information

Priprema podataka. NIKOLA MILIKIĆ URL:

Priprema podataka. NIKOLA MILIKIĆ   URL: Priprema podataka NIKOLA MILIKIĆ EMAIL: nikola.milikic@fon.bg.ac.rs URL: http://nikola.milikic.info Normalizacija Normalizacija je svođenje vrednosti na neki opseg (obično 0-1) FishersIrisDataset.arff

More information

Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu

Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu Modelling Transport Demands in Maritime Passenger Traffic Modeliranje potražnje prijevoza u putničkom pomorskom prometu Drago Pupavac Polytehnic of Rijeka Rijeka e-mail: drago.pupavac@veleri.hr Veljko

More information

CRNA GORA / MONTENEGRO ZAVOD ZA STATISTIKU / STATISTICAL OFFICE S A O P Š T E NJ E / STATEMENT Broj / No 76 Podgorica, god.

CRNA GORA / MONTENEGRO ZAVOD ZA STATISTIKU / STATISTICAL OFFICE S A O P Š T E NJ E / STATEMENT Broj / No 76 Podgorica, god. CRNA GORA / MONTENEGRO ZAOD ZA STATISTIKU / STATISTICAL OFFICE S A O P Š T E NJ E / STATEMENT Broj / No 76 Podgorica, 23.6.211.god. Prilikom korišćenja ovih podataka navestii zvor Name the source when

More information

3D GRAFIKA I ANIMACIJA

3D GRAFIKA I ANIMACIJA 1 3D GRAFIKA I ANIMACIJA Uvod u Flash CS3 Šta će se raditi? 2 Upoznavanje interfejsa Osnovne osobine Definisanje osnovnih entiteta Rad sa bojama Rad sa linijama Definisanje i podešavanje ispuna Pregled

More information

Tutorijal za Štefice za upload slika na forum.

Tutorijal za Štefice za upload slika na forum. Tutorijal za Štefice za upload slika na forum. Postoje dvije jednostavne metode za upload slika na forum. Prva metoda: Otvoriti nova tema ili odgovori ili citiraj već prema želji. U donjem dijelu obrasca

More information

1. Instalacija programske podrške

1. Instalacija programske podrške U ovom dokumentu opisana je instalacija PBZ USB PKI uređaja na računala korisnika PBZCOM@NET internetskog bankarstva. Uputa je podijeljena na sljedeće cjeline: 1. Instalacija programske podrške 2. Promjena

More information

POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU

POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU POSTUPAK IZRADE DIPLOMSKOG RADA NA OSNOVNIM AKADEMSKIM STUDIJAMA FAKULTETA ZA MENADŽMENT U ZAJEČARU (Usaglašeno sa procedurom S.3.04 sistema kvaliteta Megatrend univerziteta u Beogradu) Uvodne napomene

More information

WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET!

WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET! WELLNESS & SPA YOUR SERENITY IS OUR PRIORITY. VAŠ MIR JE NAŠ PRIORITET! WELLNESS & SPA DNEVNA KARTA DAILY TICKET 35 BAM / 3h / person RADNO VRIJEME OPENING HOURS 08:00-21:00 Besplatno za djecu do 6 godina

More information

Possibility of Increasing Volume, Structure of Production and use of Domestic Wheat Seed in Agriculture of the Republic of Srpska

Possibility of Increasing Volume, Structure of Production and use of Domestic Wheat Seed in Agriculture of the Republic of Srpska Original scientific paper Originalan naučni rad UDK: 633.11:572.21/.22(497.6RS) DOI: 10.7251/AGREN1204645M Possibility of Increasing Volume, Structure of Production and use of Domestic Wheat Seed in Agriculture

More information

Windows Easy Transfer

Windows Easy Transfer čet, 2014-04-17 12:21 - Goran Šljivić U članku o skorom isteku Windows XP podrške [1] koja prestaje 8. travnja 2014. spomenuli smo PCmover Express i PCmover Professional kao rješenja za preseljenje korisničkih

More information

MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE

MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE MINISTRY OF THE SEA, TRANSPORT AND INFRASTRUCTURE 3309 Pursuant to Article 1021 paragraph 3 subparagraph 5 of the Maritime Code ("Official Gazette" No. 181/04 and 76/07) the Minister of the Sea, Transport

More information

СТРУКТУРА СТАНДАРДА СИСТЕМАМЕНАЏМЕНТАКВАЛИТЕТОМ

СТРУКТУРА СТАНДАРДА СИСТЕМАМЕНАЏМЕНТАКВАЛИТЕТОМ 1 СТРУКТУРА СТАНДАРДА СИСТЕМАМЕНАЏМЕНТАКВАЛИТЕТОМ 2 ПРИНЦИПИ МЕНАЏМЕНТА КВАЛИТЕТОМ 3 ПРИНЦИПИ МЕНАЏМЕНТА КВАЛИТЕТОМ 4 ПРИНЦИПИ МЕНАЏМЕНТА КВАЛИТЕТОМ Edwards Deming Не морате то чинити, преживљавање фирми

More information

Engineering Design Center LECAD Group Engineering Design Laboratory LECAD II Zenica

Engineering Design Center LECAD Group Engineering Design Laboratory LECAD II Zenica Engineering Design Center Engineering Design Laboratory Mašinski fakultet Univerziteta u Tuzli Dizajn sa mehatroničkom podrškom mentor prof.dr. Jože Duhovnik doc.dr. Senad Balić Tuzla, decembar 2006. god.

More information

Opis podataka. Katedra za istraživanja u biomedicini i zdravstvu

Opis podataka. Katedra za istraživanja u biomedicini i zdravstvu Opis podataka Katedra za istraživanja u biomedicini i zdravstvu Opis kvantitativnih (brojčanih) podataka? Mjere srednje vrijednosti (centralne tendencije) Mjere raspršenja Mjere srednje vrijednosti (centralne

More information

ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP

ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP ECONOMIC EVALUATION OF TOBACCO VARIETIES OF TOBACCO TYPE PRILEP EKONOMSKO OCJENIVANJE SORTE DUHANA TIPA PRILEP M. Mitreski, A. Korubin-Aleksoska, J. Trajkoski, R. Mavroski ABSTRACT In general every agricultural

More information

IZDAVAČ / Publisher Sveučilište u Zadru / University of Zadar Mihovila Pavlinovića 1, Zadar, Hrvatska

IZDAVAČ / Publisher Sveučilište u Zadru / University of Zadar Mihovila Pavlinovića 1, Zadar, Hrvatska IZDAVAČ / Publisher Sveučilište u Zadru / University of Zadar Mihovila Pavlinovića 1, 23000 Zadar, Hrvatska POVJERENSTVO ZA IZDAVAČKU DJELATNOST / Publishing Committee Josip Faričić (predsjednik) GLAVNA

More information

Analiza rada medicinske opreme i djelatnosti (kolovoz srpanj 2015.) doc. dr. sc. Dragan Korolija-Marinić, prof. v.š. dr. med.

Analiza rada medicinske opreme i djelatnosti (kolovoz srpanj 2015.) doc. dr. sc. Dragan Korolija-Marinić, prof. v.š. dr. med. Analiza rada medicinske opreme i djelatnosti (kolovoz 2014. srpanj 2015.) doc. dr. sc. Dragan Korolija-Marinić, prof. v.š. dr. med. pomoćnik ministra Sadržaj Ciljevi, način provedbe i teme analize Primjeri

More information

Katedra za istraživanja u biomedicini i zdravstvu

Katedra za istraživanja u biomedicini i zdravstvu Katedra za istraživanja u biomedicini i zdravstvu Kvantitativne koeficijent korelacije Kvalitativne χ2 test (hi-kvadrat test), McNemarov test omjer izgleda (OR), apsolutni rizik (AR), relativni rizik (RR)

More information

Upute za korištenje makronaredbi gml2dwg i gml2dgn

Upute za korištenje makronaredbi gml2dwg i gml2dgn SVEUČILIŠTE U ZAGREBU - GEODETSKI FAKULTET UNIVERSITY OF ZAGREB - FACULTY OF GEODESY Zavod za primijenjenu geodeziju; Katedra za upravljanje prostornim informacijama Institute of Applied Geodesy; Chair

More information

IZVEDBENI NASTAVNI PLAN

IZVEDBENI NASTAVNI PLAN Fakultet zdravstvenih studija Sveučilišta u Rijeci Kolegij: Napredna statistika u biomedicini i zdravstvu Voditelj: Prof. dr. sc. Gordana Brumini i Dr. sc. Andrica Lekić, Katedra: Katedra za temeljne medicinske

More information

int[] brojilo; // polje cjelih brojeva double[] vrijednosti; // polje realnih brojeva

int[] brojilo; // polje cjelih brojeva double[] vrijednosti; // polje realnih brojeva Polja Polje (eng. array) Polje je imenovani uređeni skup indeksiranih vrijednosti istog tipa (niz, lista, matrica, tablica) Kod deklaracije, iza naziva tipa dolaze uglate zagrade: int[] brojilo; // polje

More information

IZVEDBENI PLAN NASTAVE OPIS KOLEGIJA

IZVEDBENI PLAN NASTAVE OPIS KOLEGIJA VELEUČILIŠTE U ŠIBENIKU IZVEDBENI PLAN NASTAVE Oznaka: PK-10 Datum: 22.01.2014. Stranica: 1 od 4 Revizija: 01 Studij: Spec.dipl.str.stu.Menadžment Studijska godina: 2 Akad. godina: 2013/2014 Smjer: Semestar:

More information

Korak X1 X2 X3 F O U R T W START {0,1}

Korak X1 X2 X3 F O U R T W START {0,1} 1) (8) Formulisati Traveling Salesman Problem (TSP) kao problem traženja. 2) (23) Dato je prostor stanja sa slike, sa početnim stanjem A i završnim stanjem Q. Broj na grani označava cijenu operatora, a

More information

Automatske Maske za zavarivanje. Stella, black carbon. chain and skull. clown. blue carbon

Automatske Maske za zavarivanje. Stella, black carbon. chain and skull. clown. blue carbon Automatske Maske za zavarivanje Stella Podešavanje DIN: 9-13 Brzina senzora: 1/30.000s Vidno polje : 98x55mm Četiri optička senzora Napajanje : Solarne ćelije + dve litijumske neizmenjive baterije. Vek

More information

Bear management in Croatia

Bear management in Croatia Bear management in Croatia Djuro Huber Josip Kusak Aleksandra Majić-Skrbinšek Improving coexistence of large carnivores and agriculture in S. Europe Gorski kotar Slavonija Lika Dalmatia Land & islands

More information

Iskustva video konferencija u školskim projektima

Iskustva video konferencija u školskim projektima Medicinska škola Ante Kuzmanića Zadar www.medskolazd.hr Iskustva video konferencija u školskim projektima Edin Kadić, profesor mentor Ante-Kuzmanic@medskolazd.hr Kreiranje ideje 2003. Administracija Učionice

More information

Uvod. Metod. J. Anthr. Sport Phys. Educ. 2 (2018) 2: Original scientific paper DOI: /jaspe

Uvod. Metod. J. Anthr. Sport Phys. Educ. 2 (2018) 2: Original scientific paper DOI: /jaspe J. Anthr. Sport Phys. Educ. 2 (2018) 2: 43 47 Original scientific paper DOI: 10.26773/jaspe.180408 Attitudes of Consumers from the Sarajevo Canton in Bosnia and Herzegovina toward Advertising through Sport

More information

Ciljevi. Poslije kompletiranja ove lekcije trebalo bi se moći:

Ciljevi. Poslije kompletiranja ove lekcije trebalo bi se moći: Pogledi Ciljevi Poslije kompletiranja ove lekcije trebalo bi se moći: Opisati pogled Formirati novi pogled Vratiti podatke putem pogleda Izmijeniti postojeći pogled Insertovani, ažurirati i brisati podatke

More information

En-route procedures VFR

En-route procedures VFR anoeuvres/procedures Section 1 1.1 Pre-flight including: Documentation, mass and balance, weather briefing, NOTA FTD FFS A Instructor initials when training 1.2 Pre-start checks 1.2.1 External P# P 1.2.2

More information

TEHNIĈKO VELEUĈILIŠTE U ZAGREBU ELEKTROTEHNIĈKI ODJEL Prof.dr.sc.KREŠIMIR MEŠTROVIĆ POUZDANOST VISOKONAPONSKIH PREKIDAĈA

TEHNIĈKO VELEUĈILIŠTE U ZAGREBU ELEKTROTEHNIĈKI ODJEL Prof.dr.sc.KREŠIMIR MEŠTROVIĆ POUZDANOST VISOKONAPONSKIH PREKIDAĈA TEHNIĈKO VELEUĈILIŠTE U ZAGREBU ELEKTROTEHNIĈKI ODJEL Prof.dr.sc.KREŠIMIR MEŠTROVIĆ POUZDANOST VISOKONAPONSKIH PREKIDAĈA SF6 PREKIDAĈ 420 kv PREKIDNA KOMORA POTPORNI IZOLATORI POGONSKI MEHANIZAM UPRAVLJAĈKI

More information

Upravljanje kvalitetom usluga. doc.dr.sc. Ines Dužević

Upravljanje kvalitetom usluga. doc.dr.sc. Ines Dužević Upravljanje kvalitetom usluga doc.dr.sc. Ines Dužević Specifičnosti usluga Odnos prema korisnicima U prosjeku, lojalan korisnik vrijedi deset puta više nego što je vrijedio u trenutku prve kupnje. Koncept

More information

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA

POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA Master akademske studije Modul za logistiku 1 (MLO1) POSEBNA POGLAVLJA INDUSTRIJSKOG TRANSPORTA I SKLADIŠNIH SISTEMA angažovani su: 1. Prof. dr Momčilo Miljuš, dipl.inž., kab 303, mmiljus@sf.bg.ac.rs,

More information

Metode opisivanja skupa podataka

Metode opisivanja skupa podataka Statistika, Prehrambeno-tehnološki fakultet 1 Metode opisivanja skupa podataka Metode opisivanja kvalitativnih podataka Kvalitativne varijable primaju vrijednosti koje su razvrstane u kategorije. Mjere

More information

Da bi se napravio izvještaj u Accessu potrebno je na izborniku Create odabrati karticu naredbi Reports.

Da bi se napravio izvještaj u Accessu potrebno je na izborniku Create odabrati karticu naredbi Reports. IZVJEŠTAJI U MICROSOFT ACCESS-u (eng. reports) su dijelovi baze podataka koji omogućavaju definiranje i opisivanje načina ispisa podataka iz baze podataka na papir (ili PDF dokument). Način izrade identičan

More information

DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO DOO PODGORICA

DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO DOO PODGORICA CRNA GORA (1}(02.17&r/4 Ver. O;:, fjr}/ ~ AGENCUA ZA ELEKTRONSKE KOM~~IKACUE J.O.O "\\ L\lax Montenegro" BrOJ o/-lj Podoor'ca.d:ioL 20/1g0d I POSTANSKU DEJATELNOST DOSTAVUANJE PONUDA ZA WIMAX MONTENEGRO

More information

IZRADA TEHNIČKE DOKUMENTACIJE

IZRADA TEHNIČKE DOKUMENTACIJE 1 Zaglavlje (JUS M.A0.040) Šta je zaglavlje? - Posebno uokvireni deo koji služi za upisivanje podataka potrebnih za označavanje, razvrstavanje i upotrebu crteža Mesto zaglavlja: donji desni ugao raspoložive

More information

Practical training. Flight manoeuvres and procedures

Practical training. Flight manoeuvres and procedures ATL/type rating skill test and proficiency - helicopter anoeuvres/rocedures Section 1 elicopter exterior visual inspection; 1.1 location of each item and purpose of inspection FTD ractical training ATL//Type

More information

STRUKTURNO KABLIRANJE

STRUKTURNO KABLIRANJE STRUKTURNO KABLIRANJE Sistematski pristup kabliranju Kreiranje hijerarhijski organizirane kabelske infrastrukture Za strukturno kabliranje potrebno je ispuniti: Generalnost ožičenja Zasidenost radnog područja

More information

Bušilice nove generacije. ImpactDrill

Bušilice nove generacije. ImpactDrill NOVITET Bušilice nove generacije ImpactDrill Nove udarne bušilice od Bosch-a EasyImpact 550 EasyImpact 570 UniversalImpact 700 UniversalImpact 800 AdvancedImpact 900 Dostupna od 01.05.2017 2 Logika iza

More information

Mindomo online aplikacija za izradu umnih mapa

Mindomo online aplikacija za izradu umnih mapa Mindomo online aplikacija za izradu umnih mapa Mindomo je online aplikacija za izradu umnih mapa (vrsta dijagrama specifične forme koji prikazuje ideje ili razmišljanja na svojevrstan način) koja omogućuje

More information

Attitudes of Consumers from University of Novi Sad toward Advertising through Sport among the Frequency of Watching Sports Events

Attitudes of Consumers from University of Novi Sad toward Advertising through Sport among the Frequency of Watching Sports Events DOI 10.26773/jaspe.180702 ORIGINAL SCIENTIFIC PAPER Attitudes of Consumers from University of Novi Sad toward Advertising through Sport among the Frequency of Watching Sports Events Slavko Molnar 1, Bojan

More information

KOMPARATIVNA ANALIZA PREDIKTIVNIH TEHNIKA RUDARENJA PODATAKA

KOMPARATIVNA ANALIZA PREDIKTIVNIH TEHNIKA RUDARENJA PODATAKA SVEUČILIŠTE U SPLITU EKONOMSKI FAKULTET DIPLOMSKI RAD KOMPARATIVNA ANALIZA PREDIKTIVNIH TEHNIKA RUDARENJA PODATAKA MENTOR: STUDENT: izv.prof.dr.sc. Mario Jadrić Frane Ivanišević Split, rujan 2016 2 SAŽETAK

More information

Prosječna mjesečna isplaćena neto plaća po zaposlenome u pravnim osobama Republike Hrvatske za srpanj iznosila je kuna.

Prosječna mjesečna isplaćena neto plaća po zaposlenome u pravnim osobama Republike Hrvatske za srpanj iznosila je kuna. Poglavlje 1 Uvod Korištenje riječi statistika u svakodnevnom životu najčešće je povezano s brojčanim vrijednostima kojima pokušavamo opisati bitne karakteristike nekog skupa podataka. Na službenim web

More information

CILJ UEFA PRO EDUKACIJE

CILJ UEFA PRO EDUKACIJE CILJ UEFA PRO EDUKACIJE Ciljevi programa UEFA PRO M s - Omogućiti trenerima potrebnu edukaciju, kako bi mogli uspešno raditi na PRO nivou. - Utvrdjenim programskim sadržajem, omogućiti im kredibilitet.

More information

KONTROLA KVALITETE. Doc.dr.sc. Damir Markučič. Zavod za kvalitetu Fakultet strojarstva i brodogradnje Sveučilišta u Zagrebu

KONTROLA KVALITETE. Doc.dr.sc. Damir Markučič. Zavod za kvalitetu Fakultet strojarstva i brodogradnje Sveučilišta u Zagrebu KONTROLA KVALITETE - S P RAVOM JAVNO VISOKA ŠKOLA ZA SIGURNOST NA RADU ST I - Doc.dr.sc. Damir Markučič Zavod za kvalitetu Fakultet strojarstva i brodogradnje Sveučilišta u Zagrebu 1-1 Literatura F. Dusman,

More information

Struktura i organizacija baza podataka

Struktura i organizacija baza podataka Fakultet tehničkih nauka, DRA, Novi Sad Predmet: Struktura i organizacija baza podataka Dr Slavica Aleksić, Milanka Bjelica, Nikola Obrenović Primer radnik({mbr, Ime, Prz, Sef, Plt, God, Pre}, {Mbr}),

More information

PREDAVANJE 4: SADRŽAJ, PROCES i VRSTE ISTRAŽIVANJA

PREDAVANJE 4: SADRŽAJ, PROCES i VRSTE ISTRAŽIVANJA Sveučilište u Rijeci Fakultet za menadžment u turizmu i ugostiteljstvu PREDDIPLOMSKI SVEUČILIŠNI STUDIJ Izborni predmet MJERENJE KVALITETE USLUGA PREDAVANJE 4: SADRŽAJ, PROCES i VRSTE ISTRAŽIVANJA Ciljevi

More information

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA:

KAKO GA TVORIMO? Tvorimo ga tako, da glagol postavimo v preteklik (past simple): 1. GLAGOL BITI - WAS / WERE TRDILNA OBLIKA: Past simple uporabljamo, ko želimo opisati dogodke, ki so se zgodili v preteklosti. Dogodki so se zaključili v preteklosti in nič več ne trajajo. Dogodki so se zgodili enkrat in se ne ponavljajo, čas dogodkov

More information

Analiza berzanskog poslovanja

Analiza berzanskog poslovanja Ekonomski fakultet u Podgorici Analiza berzanskog poslovanja P8: Fundamentalna analiza cijena akcija Dr Saša Popovic Fundamentalna analiza Fundamentalna analiza predstavlja metod koji se koristi za odredivanje

More information

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU

KONFIGURACIJA MODEMA. ZyXEL Prestige 660RU KONFIGURACIJA MODEMA ZyXEL Prestige 660RU Sadržaj Funkcionalnost lampica... 3 Priključci na stražnjoj strani modema... 4 Proces konfiguracije... 5 Vraćanje modema na tvorničke postavke... 5 Konfiguracija

More information

24th International FIG Congress

24th International FIG Congress Conferences and Exhibitions KiG 2010, 13 24th International FIG Congress Sydney, April 11 16, 2010 116 The largest congress of the International Federation of Surveyors (FIG) was held in Sydney, Australia,

More information

2. Osnove proizvodnih mjerenja 21. proizvodnih mjerenja

2. Osnove proizvodnih mjerenja 21. proizvodnih mjerenja 2. Osnove proizvodnih mjerenja 21 2 Osnove proizvodnih mjerenja 1. Uvod 2. SI jedinice u proizvodnim mjerenjima 3. Definicije i pojmovi u proizvodnim mjerenjima 4. Ispitivanje, mjerenje i kontrola 1. Uvod

More information

Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora regionalne konkurentnosti: Primer Republike Srbije (2013)

Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora regionalne konkurentnosti: Primer Republike Srbije (2013) Gledišta 167 Odziv Darka B. Vukovića* na komentar članka: Korelaciona analiza indikatora lne konkurentnosti: Primer Republike Srbije (2013) doi: 10.5937/ekonhor1402167V Nakon upućenih kritika na rad Korelaciona

More information

LabVIEW-ZADACI. 1. Napisati program u LabVIEW-u koji računa zbir dva broja.

LabVIEW-ZADACI. 1. Napisati program u LabVIEW-u koji računa zbir dva broja. LabVIEW-ZADACI 1. Napisati program u LabVIEW-u koji računa zbir dva broja. Startovati LabVIEW Birati New VI U okviru Controls Pallete birati numerički kontroler tipa Numerical Control, i postaviti ga na

More information

MODEL ZA SELEKCIJU POSLOVNIH PROCESA I METODOLOGIJA NJIHOVOG POBOLJŠANJA

MODEL ZA SELEKCIJU POSLOVNIH PROCESA I METODOLOGIJA NJIHOVOG POBOLJŠANJA UNIVERZITET U BEOGRADU FAKULTET ORGANIZACIONIH NAUKA Dragana D. Stojanović MODEL ZA SELEKCIJU POSLOVNIH PROCESA I METODOLOGIJA NJIHOVOG POBOLJŠANJA doktorska disertacija Beograd, 2015 UNIVERSITY OF BELGRADE

More information

Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi

Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi Pristup rizicima u sistemu menadžmenta kvaliteta zasnovan na FMEA metodi Ana Čobrenović, MPC Holding doc. dr Mladen Đurić, Fakultet organizacionih nauka 1 Uvod i definicije Rizik Organizacije se konstantno

More information

FAKULTET TEHNIČKIH NAUKA

FAKULTET TEHNIČKIH NAUKA UNIVERZITET U NOVOM SADU FAKULTET TEHNIČKIH NAUKA Nastavni predmet: Vežba br 6: Automatizacija projektovanja tehnoloških procesa izrade alata za brizganje plastike primenom ekspertnih sistema Doc. dr Dejan

More information

OBAVJESTENJE 0 NABAVCI /18 KP "VODOVOD I KANALIZACIJA" A.O. BROD. Nikole Tesle Brod (sp bl) (053)

OBAVJESTENJE 0 NABAVCI /18 KP VODOVOD I KANALIZACIJA A.O. BROD. Nikole Tesle Brod (sp bl) (053) " Adresa: Mar~la T1ta 9a/I Telefon: (033) 251-590 Faks: (033) 251-595 E-mail: ejn@javnenabavke.gov.ba Web: https://www ejn.gov.ba Datum I vrl1eme slan]a bav]ehen]a na 061avu:25 5 2018. u 11 :13 OBAVJESTENJE

More information

GLEDANOST TELEVIZIJSKIH PROGRAMA PROSINAC Konzumacija TV-a u prosincu godine

GLEDANOST TELEVIZIJSKIH PROGRAMA PROSINAC Konzumacija TV-a u prosincu godine GLEDANOST TELEVIZIJSKIH PROGRAMA PROSINAC 2016. Agencija za elektroničke medije u suradnji s AGB Nielsenom, specijaliziranom agencijom za istraživanje gledanosti televizije, mjesečno će donositi analize

More information