Rudarenje podataka: razlika između inačica

Izbrisani sadržaj Dodani sadržaj
Redak 83:
 
===== MODELIRANJE I SEGMENTACIJA =====
Ukoliko su svi podaci jasni i razumljivi, i postoji stabilan i dovoljno velik broj varijabli, sljedeći korak bi trebalo biti modeliranje (logistička regresija ili neki drugi model), rangirajući podatke na osnovu sličnosti u kategoriji „odgovor“„''odgovor''“ ili pripisujući im doživotnu vrijednost ili „loyalty“„''loyalty''“ rezulat. Modeliranje može biti: model „odgovora“ (odaziva), model profit, loyalty model ili model doživotne vrijednosti. Segmentacija baze podataka (rastavljanje na dijelove) može biti veoma jednostavna, ali može biti o veoma kompleksna, bazirana na mnogo varijabli i optimizirana za pojedine segmente[http://en.wikipedia.org/wiki/Segment segmente].
 
===== PRETRAŽIVANJE UZORAKA =====
[http://en.wikipedia.org/wiki/Pattern_mining#Pattern_mining „Pretraživanje uzoraka“] je metoda pretrage podataka koja se koristi za pronalaženje uzoraka podatka. U ovome kontekstu riječ „''uzorci''“ često znači „''pravila asocijacije''“. Prvotni motivi za traženje pravila asocijacija su proizašli iz želje da se analiziraju podaci o ponašanju kupaca iz jednog supermarketa kada je riječ o kupovanju njihovih proizvoda. Na primjer, jedno pravilo asocijacije „pivo⇒ čips (80%)“ govori da su 4 od 5 kupaca koji su kupili pivo također kupili i čips.