Rudarenje podataka: razlika između inačica

Izbrisani sadržaj Dodani sadržaj
Sombrero (razgovor | doprinosi)
Sombrero (razgovor | doprinosi)
prebaceno
Redak 1:
{{Wikipedizirati}}
'''Rudarenje podataka''' (engl. ''Data mining'') predstavlja proces pretraživanje podataka i otkrivanje znanja u bazama podataka.
'''Rudarenje podataka''' ili podatkovno rudarenje (engl. ''Data mining'') sortiranja, organiziranja ili grupiranja velikog broja podataka i izvlačenje relevantnih informacija.
 
Sam termin mogli bismo objasniti kao proces pronalaženja korisnog znanja ili informacija, odnosno otkrivanje znanja iz velike količine podataka.
Rudarenjem se poboljšava proces donošenja odluka na strateško-poslovnoj razini pružajući uvid u «skrivene» podatke business intelligence (BI) metodologijom. Rudarenjem se također otkrivaju odnosi, logičnost, pravilnost te općenito bilo kakve strukture među podacima.
Rudarenje podrazumijeva organiziranje baza čišćenjem podataka kako bi se pristupilo znanju i stjecanju istog na temelju postojećih podataka u bazama.
Razvoj tehnologije, računala, interneta bitno doprinosi lakšem organiziranju podataka, no da bi oni postali korisni, potrebno je njihovo pretvaranje u informacije i znanje.
 
Termin rudarenja često se poistovjećuje sa 2 različita procesa: otkrivanje i predviđanje znanja.
Proces otkrivanja znanja implicira korisnikovo razumijevanje eksplicitnih informacija za koje je bitno da su u čitljivom obliku.
Predviđanje se odnosi na buduće događaje i u nekim pristupima moze biti čitljivo i prozirno dok u drugim neprovidno.
 
Korištenje:
 
'''Politika''': rudarenje je metoda kojom je U.S. Army uspjela identificirati vođu napada na Twin Towers, 11.9.2001.; a tom se metodom također koriste CIA i Canadian Security Intelligence Service
 
'''Igre''': već od 60-ih godina u nekim kombinatornim igrama poput šaha
 
'''Poslovanje''': znatno pomaže u bržem donošenju poslovnih odluka zbog kontaktiranja samo onih prospekata ili klijenata za koje postoji visoka vjerojatnost da će odgovoriti, odnosno vjerojatnost uspjeha.
Još jedan primjer primjene rudarenja podataka jest analiza košarice kupaca odnosno otkrivanje proizvoda čija je potražnja veća.
 
Kako bi bolje shvatili pojam rudarenja možemo ukratko reći da je rudarenje «prirodna evolucija tehnologije, a koja upotrebljava koncepte, metode i tehnike različitih disciplina kao što su baze podataka, [[statistika]] i [[umjetna inteligencija]].»
Potreba da se podaci obrade i analiziraju kako bi se došlo do korisnih informacija i znanja rezultat je razvoja sustava baza podataka.
Informacijska tehnologija kakvu je poznajemo danas, omogućuje nam bilježenje svake aktivnosti u digitalnom obliku, a količina tih podataka mjeri se u gigabajtima i terabajtima.
 
Ogromne [[baze podataka]] bogate su podacima, ali i siromašne informacijama koje su skrivene u pohranjenim podacima. Upravo je rudarenje podataka to koje pomaže otkriti važne informacije i znanje utkano u podatke, uvelike pridonoseći donošenju odluka, poslovanju i znanosti.»
Proces rudarenja ne može izvršiti samo 1 osoba jer se on sastoji od više faza, točnije 3.
'''1. tzv. Problemska faza''' odnosno odabir i definiranje problema, procjena zadnjeg te primjena znanja. Te zadatke obavlja korisnik.
'''2. Podatkovna faza''': sve vezano uz pripremu podataka za rudarenje; obavlja ju informatičar
'''3. Metodološka faza''' : sve od [[analize]], [[selekcije]], prezentacije do interpretacije rezultata.
Stručnjak za rudarenje podataka (eng.data miner) je osoba zadužena za zadatke koji obuhvaćaju treću i zadnju fazu procesa rudarenja.
 
== Reference ==
1. Han, J., Kamber, M. Data Mining: Concepts and Techniques. Morgan Kaufmann Publishers, San Francisco, 2001.
2. Pyle, D. Business Modelling and Data Mining. Morgan Kaufmann Publishers, San Francisco, 2003.
http://www.skladistenje.com/jedan.asp?ID=433
http://en.wikipedia.org/wiki/Sorting
http://en.wikipedia.org/wiki/Data_mining
http://en.wikipedia.org/wiki/Business_intelligence
 
{{mrva-rač}}