Statistika: razlika između inačica

Izbrisani sadržaj Dodani sadržaj
Nema sažetka uređivanja
Flopy (razgovor | doprinosi)
m Uklonjena promjena suradnika 62.113.17.252, vraćeno na zadnju inačicu suradnika EmausBot
Redak 1:
'''Statistika''' - je grana primijenjene [[Matematika|matematike]] koja se bavi analizom podataka.
Uvod
Razvoj moderne matematičke statistike počinje relativno kasno u odnosu na ostale društvene i prirodne znanosti. Sama riječ statistika potječe od latinske riječi status, što znači stanje. Prema prvobitnome značenju riječi, statistika je prikupljala podatke koji karakteriziraju stanje u državi kao što su broj i status stanovništva, mortalitet i natalitet stanovništva, njeni uzroci, veličina i struktura obradivih površina, način i količina proizvodnje svih grana poljoprivrede.
Sama matematička statistika je dio teorije vjerojatnoće, jer statističke metode daju zaključke s nekom vjerojatnošću, te se s toga statistika temelji na teoriji vjerojatnoće. Statistika je znanstvena metoda kojom se prikupljaju, uređuju, analiziraju i tumače brojčani podaci različitih vrsta. Pri tome se polazi od opaženih, stvarnih podataka o pojavama ili od podataka dobivenih statističkim pokusom. Bitna je za suvremenu znanost jer je statistika prisutna pri većini istraživačkih radova. Statistika se kao znanstvena metoda služi brojčanim načinom izražavanja, pa se ubraja u numeričke analitičke metode.
Početci razvoja teorije vjerojatnoće vezani su za 1654. godinu i francuske matematičare Pascala1 i Fermata2, kada su pokušali riješiti probleme u vezi sa igrama na sreću. Prva knjiga za koju se zna iz ove oblasti je De Ludo Aleae (O igri kockom), a štampana je tek 1663, oko 100 godina nakon što je napisana. Njen autor je Girolamo Cardano3, poznat po svojim formulama za rješavanje jednadžbi trećeg stupnja.
I danas su mnogima najinteresantniji kockarski aspekti primjene teorije vjerojatnoće. Često se čuje kako je neki „genijalni matematičar“ doveo kockarnicu na rub propasti, jer je pronašao sistem koji sigurno dobiva. S druge strane, mnogi veoma ozbiljni i važni pronalasci zasnovani su na primjeni vjerojatnoće, odnosno statistike.
Statistika zajedno sa teorijom vjerojatnoće, sastavni je dio nekoliko važnih oblasti znanosti: statističke teorije telekomunikacija, teorije pouzdanosti, teorije sustava, teorije automatskoga upravljanja, itd.
Sama razlika između teorije vjerojatnoće i matematičke statistike je u tome što u teoriji vjerojatnoće istražuju se matematički modeli stvarnih pojava, dok se u statistici, metodom uzimanja podataka, uspostavlja veza između stvarnih pojava i odgovarajućih modela. Matematička statistika je, prema tome, bliža realnosti od vjerojatnoće, što je i sam razlog opredjeljenja za matematičku statistiku od teorije vjerojatnoće u ovome maturalnom radu.
 
== Statistika kao primjenjena znanost ==
 
Neki primjeri korištenja statistike:
 
* ispitivanja glasača prije/u tijeku izbora
* ispitivanje ljudi općenito o bilo kojoj temi
* vođenje statistike u proizvodnji procesora, utvrđivanje postotka ispravnih procesora (''yield'')
* vođenje statistike u proizvodnji, prije i poslije svake kontrole
* primjenjena statistika na području biomedicinskih znanosti (biostatistika)
* primjenjena statistika u području geoznanosti, odn. prostorna statistika ili [[Geostatistika|geostatistika]]
 
=== Logičke greške pri uporabi statistike ===
 
Najčešća [[Logika|logička]] greška je '''nereprezentativan uzorak''' pri ispitivanju. Samo ispitivanje može biti [[Sociologija|sociološki]] izvedeno savršeno (ispitanici popunjavaju uputnik neometani i anonimno), matematička analiza je izvedena bez grešaka (zbroj svih izbora daje 100%, ne manje ili više, što se također može dogoditi), no rezultati ipak nemaju previše veze s realnošću.
 
Uzorak može biti nereprezentativan iz više razloga:
____________________
(1)- Pascal - Blaise Pascal (19. lipnja 1623. - 19. Kolovoza 1662.), francuski filozof, matematičar i fizičar
(2)- Fermat - Pierre de Fermat, (17. kolovoza 1601. – 12. siječnja 1665.) bio je francuski matematičar i pravnik
(3)- Girolamo Cardano – (24 Rujna 1501. – 21. Rujna 1576.) je bio talijanski renesansni matematičar, fizičar, astrolog i kockar. Njegovo kockanje dovelo ga je do osnivanja elementarnih pravila u vjerojatnosti, čineći ga jednim od osnivača polja.
1. Elementi matematičke statistike
Danas postoji preko stotinu definicija matematičke statistike, no dovoljno je reći da se matematička statistika bavi izučavanjem masovnih pojava na temelju uzoraka pomoću matematičkih metoda koje se baziraju na teoriji vjerojatnosti i teoretskih distribucija.
Matematička statistika predstavlja granu primijenjene matematike koja se bavi prikupljanjem, obradom, interpretacijom i prezentacijom podataka. Matematička statistika kao takva primjenjiva je u širokom rasponu znanosti kako prirodnih (biologija, kemija, fizika…), tako i društvenih poput psihologije. Osim toga statistika se koristi kao pomoć pri donošenju poslovnih, selekcijskih pa i državnih odluka.
Statistika može služiti za opisivanje prikupljenih podataka te se takva statistika naziva deskriptivna(1)(opisna). Deskriptivna statistika može se koristiti kako bismo sumirali prikupljene podatke, numerički ili grafički ili kako bismo opisali uzorak koji je dio jedinica statističkog skupa ili podaci za dio jedinice statističkog skupa. Deskriptivna statistika bavi se opisom podataka, te u tu svrhu koristimo parametre kao što su aritmetička sredina i standardna devijacija, a može se govoriti i o medijanu, dominantnoj vrijednosti ili pak varijaciji.
Statistika može modelirati obrasce unutar podataka na način da se u obzir uzmu sva svojstva prikupljenih podataka te se temeljem izračuna izvode zaključci o populaciji koju proučavamo. Takva statistika naziva se inferencijalna(2) (analitička) statistika. Tu se može uključivati testiranje hipoteza, otkrivanje veza između varijabla, modeliranje odnosa ili sličnih postupaka poput analize varijance, faktorske analize, itd. Deskriptivna statistika i inferencijalna statistika svrstavaju se u kategoriju primijenjene statistike.
Poznata je i matematička statistika koja se primarno bavi teorijskim postavkama na kojima počiva statistika kao znanost.
Predmet ispitivanja matematičke statistike su skupovi (populacije, mase) čiji su elementi objekti i pojave različitoga karaktera. Skup elemenata koji posmatramo zove se populacija(3).
 
* premali broj ispitanika
* ispitanici samo jednog spola
* ispitanici samo određene dobi
 
Rezultati dobiveni valjanom analizom nereprezentativnog uzorka su nevaljani, kao i oni dobiveni nevaljanom analizom reprezentativnog uzorka.
 
'''Reprezentativan uzorak''' je onaj koji dobro reprezentira populaciju kojoj pripada, a najbolje se postiže slučajnim odabirom članova.
 
'''Mali uzorak''' je najčešće onaj koji je manji od N=30, a neki smatraju i od N=50. Za male uzorke vrijede ponešto modificirana pravila i statistički računi.
 
== Statistički pojmovi i metode ==
 
* [[aritmetička sredina]]
* [[geometrijska sredina]]
* [[mediana]]
* [[standardna devijacija]]
* [[brojač ljudi]]
* [[teorija malih uzoraka]]
 
== Vidi ==
* [[kvantitativna istraživanja]]
 
[[Kategorija:Matematika]]
[[Kategorija:Statistika| ]]
 
<!-- interwiki -->
____________________
(1)- Deskripcija - opis
(2)- Inferencija – zaključivanje metodom indukcije ili dedukcije
(3)- populacija (lat. Populus – narod) – uobičajno se rabi za stanovništvo. U statistici označava skup svih jedinica koje se odnose na pojavu ili skup podataka u nekom svojstvu za svaku jedinicu.
2. Populacija
Pojava koja obuhvaća veliki broj elemenata sa zajedničkim obilježjem naziva se populacija. Zadatak matematičke statistike je da niz statističkih podataka jedne populacije izrazi u odgovarajućim brojevima i da pomoću matematičkih metoda utvrdi datom obilježju zakonitost s kojom se to obilježje javlja u posmatranom mnoštvu. U ogromnoj većini slučajeva s kojima se susrećemo u primjeni nije moguće dobiti kompletnu informaciju o raspodijeli obilježja u cijeloj populaciji. Razlog može da leži u brojnosti populacije, u velikim troškovima vezanim za registriranje obilježja kod svakoga elementa, velikome gubitku vremena, uništavanju populacije itd. Zbog navedenih teškoća, po pravilu se uzima samo jedan dio, te se on obrađuje. Taj dio se zove uzorak. Na izabranom uzorku registrira se obilježje kod svakog elementa, a zatim se vrši ekstrapolacija na cijelu populaciju, tj. dobivena raspodjela obilježja proširuje se sa uzorka na cijeli skup. Odmah se nameće pitanje tzv. reprezentativnosti takvog uzorka. Bez matematičke rigoroznosti možemo reći da je neka metoda uzimanja uzorka reprezentativna, ako je kriterijem po kome se uzima taj dio neovisan od obilježja koje se promatra. Jedan od načina postizanja reprezentativnosti jest da taj uzorak izaberemo slučajno.
Primjer jednog ispitivanja populacije jest ispitivanje stanovništva nekoga grada o nekoj temi putem ankete. Način na koji se tada izražava reprezentativnost jeste ispitivanje jednakog broja osoba različite starosti, npr. 10 osoba između 18 i 30 godina, 10 osoba između 30 i 40 godina, te jednaka spolna zastupljenost, odnosno jednak broj muških i ženskih osoba.
2.2. Načini prikazivanja uzoraka populacije
Eksperimentalni podatci se, radi statističke obrade, predstavljaju na dva osnovna načina: tablično i grafički.
 
[[af:Statistiek]]
2.2.1. Tablični prikaz
[[am:የዝርዝር ሂሳብ (እስታቲስቲክስ)]]
 
[[an:Estatistica]]
Tabelisanje je postupak svrstavanja podataka u šeme, redove i stupce – tabele, prema određenom pravilu. Tablična metoda daje podatke u obliku tabele, često poredane u rastućem poretku dajući tzv. varijacijski niz obilježja. On pruža osnovu za dalja razmatranja u vezi sa raspodjelom. Podatci u tabeli 1. su poredani u klasama.
[[ar:إحصاء]]
 
[[az:Statistika]]
 
[[ba:Статистика]]
 
[[bat-smg:Statėstėka]]
 
[[be:Статыстыка]]
 
[[be-x-old:Статыстыка]]
 
[[bg:Статистика]]
 
[[bn:পরিসংখ্যান]]
 
[[br:Stadegoù]]
 
[[bs:Statistika]]
 
[[ca:Estadística]]
 
[[ckb:ئامار]]
 
[[cs:Statistika]]
Primjer 1. : Podaci visine učenika u cm s točnošću do 1 cm
[[cy:Ystadegaeth]]
 
[[da:Statistik]]
162 165 165 162 170 172 175 162 168 162 168 168 170 162 162
[[de:Statistik]]
162 165 162 162 170 170 175 165 165 162 165 165 165 170 172
[[dv:ތަފާސް ހިސާބު]]
 
[[el:Στατιστική]]
Skup od 30 učenika je statistički skup, visina učenika je obilježje skupa, a dobivenih 30 brojeva podaci skupa.
[[en:Statistics]]
 
[[eo:Statistiko]]
Tabela 1.
[[es:Estadística]]
 
[[et:Statistika]]
INTERVAL
[[eu:Estatistika]]
 
[[fa:آمار]]
X = X¡ APSOLUTNA
[[fi:Tilastotiede]]
FREKVENCIJA
[[fiu-vro:Statistiga]]
f=f¡ KUMULATIVNA FREKVENCIJA STATISTIČKA VJEROJATNO
[[fo:Hagfrøði]]
 
[[fr:Statistiques]]
162
[[fur:Statistiche]]
165
[[fy:Statistyk]]
168
[[ga:Staidreamh]]
170
[[gan:統計學]]
172
[[gd:Staitistearachd]]
175
[[gl:Estatística]]
[[gv:Staydraa]]
10
[[he:סטטיסטיקה]]
8
[[hi:सांख्यिकी]]
3
[[hu:Statisztika]]
5
[[ia:Statistica]]
2
[[id:Statistika]]
2
[[io:Statistiko]]
10
[[is:Tölfræði]]
18
[[it:Statistica]]
21
[[iu:ᑭᓯᑦᓯᓯᖕᖑᕐᓗᒋᑦ ᐹᓯᔅᓱᑎᔅᓴᑦ]]
26
[[ja:統計学]]
28
[[jv:Statistika]]
30
[[ka:სტატისტიკა (მეცნიერება)]]
10/30
[[kk:Статистика]]
8/30
[[kn:ಸಂಖ್ಯಾಶಾಸ್ತ್ರ]]
3/30
[[ko:통계학]]
5/30
[[ku:Amar]]
2/30
[[ky:Статистика]]
2/30
[[la:Statistica]]
30
[[lad:Estadistika]]
 
[[lb:Statistik]]
2.2.2. Grafički prikaz
[[li:Sjtatistiek]]
Raspodjela obilježja grafički se prikazuje preko učestalosti, zbrojnih učestalosti ili zbirnih relativnih učestalosti, tj. emprijiske funkcije raspodijele. Grafički metodi prikaza su najčešće poligon, kumulativna kriva, razni dijagrami, histogram (isključivo za obilježje apsolutno neprekidnog tipa) i slično.
[[lo:ສະຖິຕິສາດ]]
 
[[lt:Statistika (mokslas)]]
 
[[lv:Statistika]]
 
[[mg:Statistika]]
 
[[ml:സ്ഥിതിഗണിതം]]
 
[[mr:संख्याशास्त्र]]
 
[[ms:Statistik]]
 
[[my:စာရင်းအင်း ပညာ]]
 
[[new:तथ्यांक]]
 
[[nl:Statistiek]]
Histogramski prikaz 1. Primjera 1.
[[nn:Statistikk]]
[[no:Statistikk]]
 
[[oc:Estatistica]]
Poligonski prikaz 1. Primjera 1.
[[pl:Statystyka]]
[[pms:Statìstica]]
 
[[pnb:سٹیٹ]]
 
[[pt:Estatística]]
 
[[ro:Statistică]]
3. Statistički skup, prosta raspodjela
[[ru:Статистика]]
3.1. Statistički skup
[[rue:Штатістіка]]
Primjer 2.: Podatci broja učenika u odjelima osnovne škole
[[scn:Statìstica]]
21 15 19 21 27 30 20 21
[[sco:Stateestics]]
20 15 15 27 30 15 20 28
[[sh:Statistika]]
19 30 28 15 20 19 21 20 15
[[simple:Statistics]]
Skup od 25 odijela je statistički skup, broj učenika u odjelu predstavlja obilježje skupa, a dobivenih 25 brojeva su podatci skupa. Varijacijski niz statističkog skupa je:
[[sk:Štatistika]]
15, 15, 15, 15, 15, 15, 19, 19, 19, 20, 20, 20, 20, 20, 21, 21, 21 , 21, 27, 27, 28, 28, 30, 30, 30
[[sl:Statistika]]
Statistički skup predstavlja cjelinu sastavljenu od istih međusobno usporedivih elemenata u odnosu na zajedničko obilježje, što je ustvari tekuća varijabla (x¡) slučajne promjenjive (x). Statistički skup mora biti homogen. Što znači da mora biti sastavljen od istih elemenata koji su međusobno usporedivi jedni s drugim u odnosu na tekuću varijablu (x¡) slučajne promjenjive (x) (broj odijela u odnosu na broj učenika).
[[sq:Statistika]]
Statistički skup mora biti varijabilan, što znači da elementi skupa moraju biti istovrsni, ali nikada istovjetni u odnosu na zajedničko obilježje (odjeli sa različitim brojem učenika, jer kada bi svi odjeli imali isti broj učenika bilo bi tada dovoljno uzeti jedan odjel u razmatranje).
[[sr:Статистика]]
Interval (raspon) statističkog skupa nazivamo razliku
[[stq:Statistik]]
I = R = XMAX – XMIN = M – m,
[[su:Statistik]]
gdje je I interval, R razlika, XMAX maksimalna vrijednost tekuće varijable (x¡) i XMIN minimalna vrijednost tekuće varijable (x¡).
[[sv:Statistik]]
I = XMAX – XMIN
[[ta:புள்ளியியல்]]
I = 30 – 15
[[te:సంఖ్యా శాస్త్రం]]
I = 15
[[tg:Омор]]
Raspon statističkoga skupa iz primjera je 15.
[[th:สถิติศาสตร์]]
 
[[tk:Statistika]]
 
[[tl:Estadistika]]
 
[[tr:İstatistik]]
 
[[uk:Статистика]]
Dobiveni podatci grupiraju se u razrede (klase). Razredi (klase) sadrže grupirane podatke koji se odnose na jednake vrijednosti tekuće varijable.
[[ur:احصاء]]
Tabela 2.
[[vec:Statìstega]]
 
[[vi:Khoa học Thống kê]]
INTERVAL
[[war:Estadistiká]]
 
[[yi:סטאטיסטיק]]
X = X¡
[[yo:Ìsirò Statistiki]]
[[zh:统计学]]
APSOLUTNA
[[zh-min-nan:Thóng-kè-ha̍k]]
FREKVENCIJA
[[zh-yue:統計學]]
f=f¡
KUMULATIVNA FREKVENCIJA
STATISTIČKA VJEROJATNO
 
15
19
20
21
27
28
30
6
3
4
5
2
2
3
6
9
13
18
20
22
25
6/25
3/25
4/25
5/25
2/25
2/25
3/25
 
25
 
3.2. Prosta raspodjela
Apsolutna frekvencija ( f = f¡ ) predstavlja učestalost iste vrijednosti tekuće varijable ( X = Xi ) jednoga razreda (klase). U primjeru to je broj odjela sa istim brojem učenika, npr. 5 je odijela u razredu koji su označeni simbolom 15.
Prosta distribucija (raspored, podjela) frekvencija je predstavljena u tabeli 3.
Tabela 3.
OBILJEŽJE
(X) X₁
15 X₂
19 X₃
20 X₄
21 X₅
27 X₆
28 X₇
30
APSOLUTNA FREKVENCIJA 6 3 4 5 2 2 3
 
Kumulativna frekvencija dobiva se zbrajanjem apsolutnih frekvencija redom po razredima (klasama), te one daju odgovor koliko ima elemenata skupa koji imaju tekuću veličinu manju od neke zadane vrijednosti
Primjer 3.: Koliko ima odijela koji imaju manje učenika od 27? Odgovor je 3 + 4 + 5 + 6 = 18 odijela.
Relativna frekvencija se dobije zbrajanjem apsolutnih frekvencija, koja se zatim podijeli sa brojem elemenata skupa ( N ).
p_i=f_i/N
Primjer 4.: Kolika je vjerojatnoća da slučajno izabran odjel ima 27 učenika?
p_i = 2/25 = 0,08
Relativna frekvencija je statistička vjerojatnoća i s njom se određuje značenje statističke vjerojatnoće p_i da slučajna promjenjiva poprimi tekuću vrijednost iz jednoga razreda. Na taj se način formira zakon vjerojatnoće slučajne promjenjive za statistički skup.
Kumulativna (p_i = 〖 p〗_i) vjerojatnoća se dobiva postupnim zbrajanjem relativnih frekvencija redom po razredima
fr₁, fr₁ + fr₂, fr₁ + fr₂ + fr₃, …
Kumulativna vjerojatnoća je statistička vjerojatnoća da tekuća vrijednost (x¡) bude manja ili jednaka granici posljednjeg razreda čija je relativna frekvencija ušla u zbroj na osnovu teoreme zbrajanja vjerojatnoća događaja koji se međusobno isključuju.
Primjer 5.: Kolika je vjerojatnoća da se slučajnim izborom izabere odijel sa manje od 20 učenika?
P(X < 20) = P(19) + P(15) = p₂ + p₁ = 3/25+ 6/25 = 0,36
 
 
 
 
 
 
 
 
 
 
 
4. Statistička raspodjela frekvencija
Ako se radi o velikom broju podataka jednoga statističkoga skupa, onda grupirane podatke uvrštavamo u razrede (klase), te na taj način i razredi imaju relativne frekvencije.
Primjer 6: Skupu od stotinu učenika jedne škole kojima je mjerena visina s točnošću do 1 cm (obilježje). Podatci su svrstani u tabelu na sljedeći način:
Dobiveni podatci svrstani su u razrede (klase) koji su označeni simbolima npr. 163 – 165 itd. Kako je mjerenje učenika izvršeno uz točnost od 1 cm, sve visine učenika nalaze se između 159,5 cm i 174,5 cm. Interval statističkoga skupa dobije se razlikom visine najvišeg i najnižeg učenika:
I = XMAX – XMIN = 174,5 – 159,5 = 15
Razlika je podijeljena u 5 dijelova pa su stoga svi podatci svrstani u 5 razreda (klasa) označenim simbolima, npr. 160-162, 163-165 …. Predstavljeno na tabeli 4.
Tabela 4.
 
VISINA UČENIKA IZRAŽENA U CENTIMETRIMA
BROJ UČENIKA
160 – 162 6
163 – 165 17
166 – 168 42
169 – 171 26
172 – 174 9
UKUPNO 100
 
Broj učenika u jednom razredu predstavlja frekvenciju toga razreda, a relativna frekvencija razreda se dobije formulom:
fr_i= f_i/N , gdje je: N – broj elemenata skupa, u ovom primjeru N = 100
r_i – predstavlja redni broj razreda (1., 2., 3., 4., 5.)
 
 
Drugi razred, koji je označen simbolom 163 – 165, ima frekvenciju 17, a njegova relativna frekvencija iznosi:
f_2= 17/100=0,17
Na taj način se dobiju i relativne frekvencije ostalih razreda:
f_1=0,06 ,f_2=0,17 ,f_3=0,42 ,f_4=0,26 ,f_5=0,09
Kod svakoga razreda (klase) postoji gornja i donja granica toga razreda. Npr. 5. razred označen sa simbolima 172 – 174 ima gornju granicu od 174, a donju granicu od 172.
Aritmetička sredina gornje i donje granice nekog razreda naziva se obilježjem ili sredinom razreda. Na osnovu definicije obilježja razreda, aritmetičke sredine razreda iz zadanog primjera su:
x₁ = 161, x₂ = 164, x₃ = 167, x₄ = 170, x₅ = 173
Određivanjem obilježja razreda (xi), te relativne frekvencije (fi) svakoga razreda, svakome razredu je pridružen uređeni par (xi, fi), što se može predstaviti tabelom 5.
Tabela 5.
OBILJEŽJE 161 164 167 170 173
RELATIVNA FREKVENCIJA RAZREDA
0,06
0,17
0,42
0,26
0,09
 
Tabela 5. predstavlja raspodjelu (distribuciju) frekvencije iz primjera 6. Iz tabele 5. se pregledno vidi raspored te učestalost vrijednosti promatranih obilježja.
U koordinatnoj ravnini x0y, ovakva raspodjela relativne frekvencije može se predstaviti:
-poligonskom linijom – točke određene uređenim parovima (xi, fi) spajaju se pravcima.
-histogramom - crtajući pravokutnik kojima su strane jednake ordinati fi, te jediničnome intervalu [xi, xi+1].
-krivuljom frekvencije – spajanjem točki (xi, yi) krivom linijom.
 
 
 
 
Histogramski 2. prikaz raspodjele frekvencija primjera 6.
 
Uopće, neka je sa slučajnom veličinom x - obilježjem koje nas interesira izvršeno n neovisnih eksperimenata. Ako su x1, x2, … xn varijante obilježja (varijante – karakteristike obilježja) x, a f1, f2, … fn, njihove odgovarajuće relativne frekvencije, statistička distribucija (raspodjela) obilježja x i relativne frekvencije dana je tabelom 6.
Tabela 6.
OBILJEŽJE
X X1 X2 … Xn
RELATIVNA FREKVENCIJA f1 f2 … fn
 
Geometrijski statističku distribuciju predstavljaju izolirane točke određene uređenim parovima (xi, fi) (i = 1, 2, … n). Te točke najčešće se spajaju poligonalnom linijom (ili histogramom). Ako ordinate svakog tjemena poligona uvećamo 10 puta dobit ćemo poligon apsolutne frekvencije : jedinica na x osi smanjena je 10 puta.
 
 
 
 
5. Neke karakteristike statističkog skupa (disperzija, varijansa, standardna devijacija)
5.1. Pokazatelji disperzije
Srednja vrijednost često ne može biti dovoljan predstavnik statističkoga skupa sama po sebi. Vrijednosti obilježja jednoga statističkoga skupa mogu biti raspoređene u manjim, odnosno širim intervalima.
Primjer 7: Usporedba dva statistička skupa dana tabelama
OBILJEŽJE X X1 X2 X3
FREKVENCIJA 17 20 23
 
OBILJEŽJE Y Y1 Y2 Y3
FREKVENCIJA 2 20 38
 
Dva navedena statistička skupa imaju istu srednju vrijednost:
x ̅= 60/3=20= y ̅
Međutim razlike su velike. Članovi kod statističkoga skupa sa obilježjem X ne odstupaju mnogo od srednje vrijednosti za razliku od statističkoga skupa Y gdje članovi odstupaju mnogo od njihove srednje vrijednosti.
X1 - x ̅ = 17 – 20 = -3 Y1 - y ̅ = 2 – 20 = -18
X3 - x ̅ = 23 – 20 = 3 Y3 - y ̅ = 38 – 20 = 18
Zbog toga razloga može se reći da aritmetička sredina sa većom preciznošću predstavlja prvi skup od dva navedena, gdje je to odstupanje manje od srednje vrijednosti statističkoga skupa. Iz navedenih razloga može se ustanoviti da dva navedena statistička skupa imaju disperziju (rasijavanje).
Postoje tzv. pokazatelji disperzije koji služe da bi se pojava vrijednosti obilježja i brojčano iskazala. Postoji više pokazatelja disperzije, no neki od njih su:
1. srednje apsolutno odstupanje
2. dispersija (varijansa)
3. standardna devijacija
Navedeni pokazatelji od 1. – 3. imaju za cilj da ocijene disperziju obilježja, tj. da predstave u kojoj mjeri je moguće da obilježje jednog statističkoga skupa odstupi od svoje srednje vrijednosti.
5.2. Srednje apsolutno odstupanje
Ako je X obilježje jednoga statističkoga skupa sa promjenjivim x1, x2, … xn, i statističkom vjerojatnoćom:
p_i=f_i/N N=∑_(i=1)^n▒fi
 
Srednje apsolutno odstupanje obilježja X u oznaci A (x ̅) ili M (x- x ̅) zadano je formulom:
A (□(x ̅ )) = M (x- □(x ̅ )) = 1/N •∑_(i=1)^n▒fi |x_i- x ̅ |
U napisanoj formuli uzeta je apsolutna, a ne obična vrijednost x- x ̅, jer bi u tom slučaju, da su uzete obične vrijednosti, bilo da je M(x- x ̅) = 0. Formula se može interpretirati da predstavlja srednje apsolutno odstupanje proste distribucije frekvencija. Ako se radi o intervalnoj distribuciji frekvencija onda se u formuli umjesto x_i uvrštava xsi, koje predstavlja srednje apsolutno odstupanje intervalne distribucije frekvencije, pa se dobije formula:
A (x ̅)= 1/N • ∑_(i=1)^n▒fi |x_si- x ̅ |
Primjer 8: Izračunati srednje apsolutno odstupanje dviju distribucija plaća u bodovima, koje je zadano tabelom:
PLAĆA
Xi fi fi xi di=x_i- x ̅ fi ∙ |di|
18 1 18 -2 2
19 3 57 -1 3
20 5 100 0 0
21 3 63 +1 1
22 1 22 +2 2
13 260 10
PLAĆA
Yi fi fi yi di=y_i- y ̅ f_i ∙ |di|
10 1 10 -10 10
15 10 150 -5 50
20 20 400 0 0
25 10 250 +5 50
30 1 30 +10 10
42 840 120
Zaključak: Aritmetička sredina x ̅ = 20 bolje predstavlja prvi statistički skup jer je manja vrijednost srednjega apsolutnoga odstupanja. Ukoliko podatci jednog statističkoga skupa nisu grupirani u razredima (klasama), tj. ukoliko je
fi=1,∑_(i=1)^n▒fi=n
Tada je srednje apsolutno odstupanje za negrupirane podatke dato formulom:
A(X)=1/n ∑_(i=1)^n▒|x_i- □(x ̅ )|
5.3. Varijansa i standardna devijacija
Varijansa (disperzija) daje pouzdaniju procjenu odstupanja obilježja (X) nekoga statističkog skupa. Neka je X obilježje nekog statističkog skupa, sa promjenjivim x1, x2, …, xn i statističkom vjerojatnoćom pi=fi/N. Oblik varijanse jednostavne disribucije frekvencija predstavlja se formulom:
D(X) = σ²=1/N ∑_(i=1)^n▒fi(xi-□(□(x ̅ )) )²
Ako se radi o intervalnoj distribuciji frekvencija, tada se u formulu umjesto xi uvrštava xsi, pa se dobije formula:
D(X) = σ²=1/N ∑_(i=1)^n▒fi(x_si-□(□(x ̅ )) )²
Standardna devijacija je pozitivan drugi korijen varijanse, koja se najčešće upotrebljava kao osnovna mjera disperzije. σ = + √(D (X))
NAGRADA
Xi fi fi xi di=x_i- x ̅ fi ∙ d_i^2
18 1 18 -2 4
19 3 57 -1 3
20 5 100 0 0
21 3 63 +1 3
22 1 22 +2 4
13 260 14
NAGRADA
YI fi fi yi di=yi-y ̅ fi ∙ d_i^2
10 1 10 -10 100
15 10 150 -5 250
20 20 400 0 0
25 10 250 +5 250
30 1 30 +10 100
42 840 700
Primjer 9: Izračunati varijanse i vrijednosti standardne devijacije dviju distribucija nagrada u bodovima
 
Aritmetička sredina □(□(x ̅ )) = 20 bolje predstavlja prvi skup gdje je manja standardna devijacija, jer je tada manje rasipanje oko aritmetičke sredine.
 
 
 
 
____________________
σ- sigma (grčko slovo)
Ako se radi o statističkome skupu kod kojega su podatci negrupirani, tada varijansa ima oblik:
 
D(X) = σ²=1/N ∑_(i=1)^n▒fi(x_si-□(□(x ̅ )) )²
A standardna devijacija:
σ = + √(D (X))
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
Zaključak
Danas se matematička statistika, kao relativno mlada matematička grana, koristi u skoro svim aspektima društva. Jedan od primjera gdje matematička statistika predstavlja bazu rada su osiguravajuća društva, čije police osiguranja ovise potpuno od matematičke statistike. Sama politička djelatnost stranaka svih država u veliko se bazira na statističkim podatcima građana društva te države.
Ovaj maturski rad predstavio je najjednostavniji oblik matematičke statistike, te njen način uporabe. Dakle elemente matematičke statistike čine: populacija koja predstavlja predmet ispitivanja matematičke statistike, statistički skup i frekvencija koja predstavlja način obrade i način prikazivanja obrađenih prikupljenih i obrađenih podataka.
U današnjem značenju matematička statistika, zasebna grana matematike kao dio teorije vjerojatnoće, predstavlja granu primijenjene matematike koja se bavi prikupljanjem, obradom, interpretacijom i prezentacijom podataka širokoga raspona.
No kao što je H.G. Wells1 rekao: „Statistički način mišljenja jednoga će dana za svakodnevni život građana postati jednako neophodan kao znanje čitanja i pisanja“.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
____________________
(1)- H. G. Wells - Herbert George Wells (21. Rujna 1866. – 13. Kolovoza 1946.) bio je engleski pisac, danas poznat najviše po znanstveno fantastičnom radu.
Literatura
Džubur N., (1998), Matematika sa Zbirkom Zadataka za IV razred srednje škole, Sarajevo
Merkle M., (2002), Vjerovatnoća i Statistika za inžinjere i studente tehnike, Beograd
Semendjajev i dr., (2004), Matematički Priručnik, Beograd
Vasić P. M., (2000), Vjerovatnoća i statistika sa primenama i primerima, Beograd
Šošić I., (2002), Statistika (udžbenik za srednje škole), Školska knjiga Zagreb.