Rudarenje podataka: razlika između inačica

Izbrisani sadržaj Dodani sadržaj
Nema sažetka uređivanja
Redak 75:
[[zh:数据挖掘]]
===== DATA MINING/PRETRAŽIVANJE PODATAKA =====
Data mining ili pretraživanje podataka je relativno novo polje računalne znanosti koje se bavi procesiranjem i izdvajanjem šablona (uzoraka) u velikim kompletima (setovima) podataka kombinirajući metode statistike, metode umjetne inteligencije i metode upravljanja bazama podataka. Što se samog naziva tiče, data mining, postoji još nekoliko naziva, KDD (Knowledge Development in a Database), CRM ([[http://en.wikipedia.org/wiki/Customer_relationship_management|Customer Relationship Management]]) ili Database Intelligence. Međutim, svi ti nazivi opisuju jednu stvar – korištenje svih mogućih alata kako bi se informacije dovele do najviše točke i iskoristile na najbolji način.
Zahvaljujući nedavnim tehničkim napretcima u procesiranju podataka, povećanom kapacitetu memorija (više spremljenih podataka) i boljoj povezivosti računala, pretraživanje je podataka je postalo veoma važno.
 
===== METODE PRETRAŽIVANJA PODATAKA =====
Data mining je proces u kojem se koriste sljedeće metode kako bi se otkrili skriveni uzorci, šablone podataka: neuronske mreže (virtualne mreže uređene po uzoru na ljudski mozak, u kojima različiti dijelovi mreže istovremeno procesuiraju informacije, te „proučavaju i pamte“ prošle šablone, uzorke podataka), grupiranje podataka, genetski algoritmi (kombiniranje određenih podataka kako bi se pronašlo rješenje za neki problem)iz 1950-ih, stablo odluke (grafikoni koji prikazuju niz odluka i njihove moguće posljedice) iz 1960-ih te potporni vektorski stroj (svrštava unesene podatke u različite grupe, klase, onosno klasificira podatke) iz 1990-ih. Pretraživanje podataka bazirano na subjektu je metoda u kojoj se traže asocijacije između pojedinih podataka.