Dolovanie údajov – Data Mining
Dolovanie údajov – Data Mining
Definícia: Dolovanie údajov – Data mining je netriviálny proces zisťovania platných, neznámych, potenciálne

užitočných a ľahko pochopiteľných závislostí v údajoch.
Dolovanie údajov je špecifický proces získavania údajov pre rozhodovanie z veľmi rozsiahlych údajových skladov, a to extrakciou relevantných, vopred neznámych informácií. Je to proces objavovania znalostí, pomocou získavania predtým neznámych akčných informácií z veľmi rozsiahlych databáz.

Metódy dolovania údajov
Podľa vyhľadávanej znalosti rozdeľujeme metódy na:
  • sumarizáciu a generalizáciu,
  • hľadanie závislostí,
  • klasifikáciu a zhlukovanie,
  • štatistickú analýzu (predovšetkým regresiu),
  • detekcia zmien a odchýlok,
  • vyhľadávanie podobností v časových, resp. časopriestorových databázach…


Údaje sú rozdelené do dvoch tried:
  • X – reprezentuje klientov, ktorí si neplnia záväzky voči banke,
  • O – reprezentuje tých klientov, ktorí splácajú pôžičku.
Hľadisko banky: akú zvoliť bankovú stratégiu poskytovania úverov.