Čo je dolovanie dát?
Dolovanie dát (Data Mining) je analýza veľkého množstva údajov, ktorá slúži na zadefinovanie vzorcov správania a ďalších poznatkov. V skutočnosti ide o vyhľadávanie údajov, sledovanie údajov, alebo zisťovanie informácií. Data mining využíva štatistiky, princípy strojového učenia (ML), umelú inteligenciu (AI), a obrovské množstvo údajov (často z databáz) na identifikáciu modelov fungovania, či správania sa užívateľa spôsobom, ktorý je čo najužitočnejší.
(pozn. : Hĺbková analýza dát – iné názvy: vyťažovanie dát, vyťažovanie údajov, dolovanie údajov, dolovanie dát – angl. data mining)
Čo je dolovanie dát?
Výskum dát má dve základné ciele: popis a predikciu. Prvá časť – popis, opisuje poznatky získané z analýz modelov v údajoch. Druhá časť – predikcia, využíva popis rozpoznaných údajov, na predpovedanie budúcich javov.
Napríklad: Ak ste často hľadali na web stránkach knihy o rastlinách, atlas rastlín, bylinkové čaje a pod. Data mining pracuje na pozadí webovej lokality a zaznamenáva popis vášho vyhľadávania v súvislosti s vaším profilom. Keď sa prihlásite znova o dva týždne neskôr, popis ktorý vypracoval data mining, sa premení na predpovedanie vašich záujmov a ponúkne vám nové personalizované odporúčania.
Ako pracuje dolovanie dát
Dolovanie dát funguje pomocou algoritmov, súborov inštrukcií, ktoré informujú počítač, alebo proces, ako vykonať úlohu a objavovať rôzne typy vzorcov správania vrámci dát. Používa sa niekoľko rôznych metód rozpoznávania vzorcov správania, napríklad:
- združená analýza,
- detekcia anomálií,
- asociácie,
- závislosť dát,
- rozhodovacie procesy,
- regresné modely,
- klasifikácia poznatkov,
- miera opustenia,
- neurónové siete.
Dolovanie dát môže byť použité na popísanie a predikciu modelov všetkých rôznych druhov údajov. Ľudia si to bežne neuvedomujú, ale je možné predvídať napríklad vzorce správania pri nakupovaní, a predpovedať budúce nákupy.
Možno ste niekedy premýšľali nad tým ako Facebook vie, čo ste pozerali na internete. Dá vám to najavo napríklad tým, že vám zobrazuje reklamy na produkty ktoré ste si pozerali na iných stránkach. Facebook využíva informácie uložené vo vašom prehliadači, sleduje vašu aktivitu a spolu s vlastnými informáciami a poznatkami o modeloch vášho správania predvída váš záujem.
Aký druh údajov je možné získať?
V závislosti na službe, alebo obchode je možné vyťažiť prekvapujúce množstvo údajov o vás a vašich vzorcoch správania. Zozbierané údaje o vás môžu obsahovať; aký máte typ vozidla, kam cestujete, kde žijete, miesta ktoré ste navštívili, aké čítate časopisy a noviny, a či ste alebo nie ste zadaný. Môžete tiež určiť, či máte, alebo nemáte deti, aké sú vaše koníčky, aká hudba sa vám páči, k akej politickej strane inklinujete, čo nakupujete online a čo nakupujete v kamenných predajniach (často prostredníctvom vernostných zákazníckych kariet) a akékoľvek podrobnosti, ktoré zdieľate o svojom živote na sociálnych sieťach a internete.
Napríklad, predajcovia oblečenia zameraný na teenagerov využívajú poznatky dolovania dát z fotografií na sociálnych sieťach ako je Instagram či Facebook. Predpovedajú tak módne trendy, ktoré upútajú zákazníkov. Analýza je niekedy tak presná, že niekedy dokážu predpovedať, či je žena tehotná, na základe veľmi špecifických zmien v jej rozhodovacom procese pri nakupovaní.
Špecializuje na sa to aj napríklad predajca Target, a dokáže vypracovať tak presné predpovede, z modelov nakupovania, že rozosiela zľavové kupóny na detské oblečenie tehotným ženám skôr, než to stihnú povedať svojej rodine.
Data mining je všade, informácie zaznamenané a analyzované o našich nákupných návykoch, preferenciách, financiách používajú predajcovia s dôvodu zvyšovania spokojnosti zákazníkov.
Komentáre