Rudarenje podataka: razlika između inačica

Izbrisani sadržaj Dodani sadržaj
Redak 120:
 
=== (3) ===
'''Potvrda rezultata'''- konačni korak uključuje provjeru i potvrdu uzoraka proizašlih iz algoritama pretrage podataka u većem setu podataka. Nisu svi uzorci nađeni algoritmima pretrage podataka nužno dobri. Naime, često algoritmi pretrage podataka pronađu uzorke prisutne u probnom setu podataka, koji nisu prisutni u općem setu podataka. Kako bi se ovaj problem riješio, koristi se [http://en.wikipedia.org/wiki/Test_set ''test kompleta (seta)''] podataka algoritmu nepoznatih od ranije pretrage podataka. Tako se naučeni uzorci primjenjuju u ovom testu a dobiveni rezultat se uspređuje sa željenim rezultatom. Na primjer, algoritam pretrage podataka koji pokušava prepoznati spam (neželjene sadržaje) od legitimne elektroničke pošte će se testirati na probnom setu elektroničke pošte. Naučeni uzorci će se primjeniti na testni set elektroničke pošte, koji nije algoritmu od ranije poznat. Preciznost tih uzoraka se tada može vidjeti po broju točno klasificirane elektroničke pošte.
Ako naučeni uzorci ne zadovoljavaju željene standarde, tada je nužno napraviti ponovnu procjenu i promjeniti pred-proces te pretragu podataka. Ukoliko naučeni uzorci zadovoljavaju željene standarde, tada je zadnji korak interpretacija naučenih uzoraka i njihova pretvorba u znanje.