Data mining / Adatbányászat

Az adatbányászat nagy mennyiségű adathalmaz elemzésének folyamatát jelöli, melynek célja új információk kinyerése, trendek és mintázatok észlelése. Az elemzés közben nyers adatokból hasznos tudás jöhet létre, ezáltal a vállalatok, szervezetek sokkal jobban megismerhetik ügyfeleiket és környezetüket.

Az adatbányászat alapja a hatékony adatgyűjtés, a beszerzett adatok tárolása és rendszerezése, illetve ezek feldolgozása és a következtetések levonása. A folyamatot öt lépésre szokás bontani. Az első, hogy a szervezet – illendő módon betartva az adatvédelmi szabályokat – adatokat gyűjt (pl. a felhasználókról), majd ezeket adatközpontokba töltik és helyi vagy felhős szerveren keresztül elérhetővé, kutathatóvá válik az adattömeg. 

Miután egy központi adattárházba vagy egy felhőtárhelyre, „adattóba” kerülnek az adatok, a vizsgálatokat végző programok, algoritmusok összefüggéseket, mintázatokat, logikai kapcsolatokat keresnek és egészen új következtetéseket, asszociációkat képesek létrehozni.

A digitális világban minden tevékenységünk naplózható, összegyűjthető és így elemezhető nyomokat hagy. Minden egyes kattintás, weboldal-látogatás, konverzió, tranzakció, lekérés, de akár demográfiai, viselkedési adatok, a felhasználó eszközeinek vagy környezetének paraméterei elmenthetők, egymással összehasonlíthatók, kombinálhatók. 

Mindez tömeges mértékben is végezhető, így egyidejűleg akár több millió-milliárd felhasználó tevékenységeinek lenyomata is egymás mellé tehető – ez már a Big Data terepe. Ezáltal a vállalatok és szervezetek egy adott felhasználó igényeiről, személyiségéről, várható döntéseiről alaposabb és pontosabb képpel tudnak rendelkezni, mint a felhasználó önmagáról.

A statisztikai elemzéssel szemben, ahol szúrópróbaszerű mintavételről és valószínűség alapú becslésről van szó, az adatbányászat képes arra, hogy a teljes sokaság minden egyes pontján valódi és pontos képet fessen. 

Míg a reprezentatív paneles kutatások például Magyarországon 1100 ember megkérdezésével a teljes lakosságra tudnak becslést adni, hogy egy adott kérdésben mit gondolnak, vagy hogy mennyien néztek egy tévéműsort, addig a közösségi oldalak látogatása során a több millió felhasználó mindegyikéről egyedi adatsorok állnak rendelkezésre, és azt vizsgálva kideríthető, hogyan befolyásolják egymást látszólag független események.

Az adatbányászat természetesen történhet nem vállalati, hanem tudományos céllal is. Az online szolgáltatások fejlesztése mellett tipikus felhasználási területek a marketing, egészségügy, kibervédelem, genetika, alkalmazott matematika, közgazdasági elemzések, várostervezés (okosváros) is. Minden esetben az a végső cél, hogy a fogyasztó alaposabb megismerésével hatékonyabb stratégiákat, funkciókat, okosmegoldásokat és döntéseket lehessen megvalósítani, optimálisan, értelmesen lehessen a rendelkezésre álló erőforrássokat felhasználni.

Utoljára szerkesztve: 2021. október 23.

Kapcsolódó témák






Utoljára megtekintett fogalmak

A Start Up Guide Galaxis támogatója a Magyar Fejlesztési Bank.
Ez a SUG Galaxis 1.0 nyilvános tesztüzeme. Az oldallal kapcsolatos észrevételeidet, javaslataidat örömmel fogadjuk a hibabejelentes@startupguide.hu címen!

Oldalunk célja a tájékoztatás. Minden tartalmat a legnagyobb gondossággal állítottunk össze és rendszeresen ellenőrzünk, az itt szereplő információk azonban nem tekintendők konkrét helyzetekre vonatkozó üzleti, jogi tanácsadásnak, az információk alkalmazásából fakadó bármilyen jogi következményért a kiadó felelősséget nem vállal.
Hivatalos állásfoglalásért mindig forduljon az illetékes hivatalhoz, ha tanácsadásra van szüksége a megfelelő szakértőhöz! Ha az oldalunk aktualitását vesztett hibás információval találkozna, kérjük jelezze nekünk: hibabejelentes@startupguide.hu!