Čo sú to tzv. veľké dáta?
Veľké dáta
Zdroj: https://stories.freepik.com/illustration/server/pana
Úvod do pojmu veľké dáta
Začnime pochopením toho, čo sú to tzv. veľké dáta. Veľké dáta, resp. big dáta, predstavujú kombináciu obrovského množstva údajov, ktoré organizácie zhromažďujú, ukladajú a analyzujú. Na základe týchto údajov sa dajú získavať informácie, ktoré sa ďalej môžu využiť v projektoch strojového učenia a pokročilých analýzach, a poskytnúť tak nový a efektívny spôsob podpory pri rozhodovaní o spravovaní údajov.[1]
Inak povedané, veľké dáta sú informácie, ktoré podniky a organizácie zhromažďujú z údajov, ktoré sa neustále generujú zakaždým, keď otvoríme nejakú aplikáciu, čokoľvek vyhľadávame na Google alebo jednoducho cestujeme z miesta na miesto spolu so svojimi mobilnými zariadeniami. Znie to jednoducho, však? Ale ako tieto údaje využiť?
5V
Ak chcete efektívne využiť toto prevratné množstvo údajov, je nevyhnutné, aby ste najskôr pochopili rôzne parametre, resp. charakteristiky veľkých dát.
Tradične sa veľké dáta definujú a zakladajú na troch dimenziách: objem (angl. volume), rôznorodosť (angl. variety) a rýchlosť (angl. velocity). To sú už 3V. Nedávno však boli pridané ďalšie dve dimenzie, aby sa používateľom umožnilo vytvárať znalosti prostredníctvom týchto big dát, a to sú pravdivosť (angl. veracity) a hodnota (angl. value). Spolu 5V.
Príliš veľa V? Pozrime sa na nich postupne!
Zdroj: Upravené zo stories.freepik.com
- Objem: Začnime objemom, ktorý sa vzťahuje na veľkosť súborov údajov, ktoré je potrebné analyzovať a spracovať. Tieto súbory údajov sú často väčšie ako je možné vyjadriť v terabajtoch a petabajtoch. Údaje možno na základe ich objemu považovať za tzv. veľké dáta alebo nie.
- Rýchlosť: Rýchlosť sa vzťahuje na tempo, akým sa údaje generujú, zhromažďujú a analyzujú. Tieto údaje nepretržite prúdia prostredníctvom “internetu vecí”, mobilných údajov alebo sociálnych médií. Zatiaľ to znie všetko zrozumiteľne?
- Rôznorodosť: Treťou charakteristikou je rôznorodosť a táto sa týka rôznych zdrojov dát vytváraných buď ľuďmi alebo strojmi. Vieme identifikovať tri typy dát: štruktúrované, čiastočne štruktúrované a neštruktúrované.
- Štruktúrované údaje sú často čísla alebo štítky uložené v štruktúrovanom rámci stĺpcov a riadkov, ktoré sa vzťahujú na vopred nastavené parametre. Napríklad hviezdičkové hodnotenia, ktoré udeľujeme spoločnostiam v recenziách Google.
- Čiastočne štruktúrované údaje sú voľne usporiadané do kategórií pomocou metaznačiek. Napríklad tweety, ktoré organizujeme podľa hashtagov.
- Neštruktúrované údaje môžu byť informácie s veľkým objemom textu, ktoré nie sú organizované v jasne definovanom rámci alebo modeli. Napríklad videá a obrázky.
- Pravdivosť: Táto dimenzia sa týka zabezpečenia kvality, integrity, dôveryhodnosti a presnosti údajov. Inými slovami, môžete dôverovať údajom, ktoré ste zhromaždili? Sú tieto údaje dostatočne dôveryhodné na to, aby ste z nich mohli získať poznatky? Na všetky tieto a ďalšie otázky možno odpovedať, ak je známa pravdivosť údajov.
- Hodnota: Poslednou charakteristikou je hodnota, ktorá sa vzťahuje na mieru, akou môžu údaje pozitívne ovplyvniť podnikanie spoločnosti. Hodnota predstavuje hlavnú tému tohto modulu, pretože tu prichádza na rad analýza tzv. veľkých dát. Čo je analýza a ako funguje, si ukážeme v ďalšej kapitole.
Zdroje veľkých dát
Teraz, keď už viete, čo sú to tzv. veľké alebo big dáta, je čas dozvedieť sa, čo sú ich zdroje. Denne sa generuje obrovské množstvo dát, ktoré existujú v rôznych formách. Ak chcete uspieť pri používaní veľkých dát, je dôležité, aby ste vedeli rozlišovať medzi rôznymi dostupnými zdrojmi údajov a pochopili, aké užitočné a relevantné môžu byť pre vašu spoločnosť.
Editované zo zdroja: https://storyset.com/illustration/open-source/bro
Databázy
Pojem databáza Vám znie povedome, však? V súčasnosti spoločnosti využívajú na získavanie príslušných veľkých dát hybridný model, ktorý integruje tradičné a moderné databázy. Prečo? Tieto si jednoducho vyžadujú nízke investície a náklady na IT infraštruktúru. Tieto databázy sa zvyčajne využívajú na viaceré účely získavania obchodných informácií, pretože dokážu poskytnúť aj poznatky, ktoré sa využívajú na zvyšovanie ziskov podniku. Najobľúbenejšie databázy sú okrem iného MS Access, Oracle a SQL a môžu obsahovať všetky druhy obsahu, ako sú zákazníci alebo články.
Médiá
Médiá sú najpopulárnejším zdrojom veľkých dát. Všetci poznáme platformy ako Google, Facebook, Twitter, YouTube a Instagram. Prečo sú teda médiá dôležité? Nuž, je to najrýchlejší spôsob, ako môžu podniky získať prehľad o svojom publiku, vyvodiť z neho isté vzorce a pomôcť si tak pri rozhodovaní, pretože médiá ľahko prekonávajú všetky fyzické a demografické bariéry. Poskytujú preto cenné informácie o preferenciách spotrebiteľov a meniacich sa trendoch.
Cloud
Cloud predstavuje efektívny a ekonomicky výhodný zdroj údajov, keďže veľké dáta možno ukladať a získavať z verejných alebo súkromných cloudov. Z tohto dôvodu spoločnosti presunom svojich údajov prešli z tradičných zdrojov údajov na cloud. Dobrými príkladmi údajov z cloud computingu sú Salesforce, Dropbox alebo IBM.
Pamätáte si čo sú štruktúrované a neštruktúrované dáta? Cloudové úložisko dokáže pojať oba typy údajov a poskytuje podnikom informácie v reálnom čase a prehľady dát na vyžiadanie.
“Internet vecí” (angl. IoT)
Počuli ste už niekedy o internete vecí? Ak ešte nie, máte možnosť sa o ňom dozvedieť v Module 4! Internet vecí sa rýchlo rozvíja a zahŕňa veľké množstvo údajov generovaných nielen z počítačov a smartfónov, ale možno aj z každého zariadenia, ktoré dokáže vysielať údaje. Vďaka internetu vecí môžu údaje pochádzať z rôznych zariadení, ako sú videohry, kamery, domáce spotrebiče a podobne.
Web
Prečo sú webové údaje prospešné pre začínajúcich podnikateľov? Verejný web predstavuje veľké množstvo údajov, ktoré sú rozšírené a ľahko dostupné. Údaje na webe sú dostupné jednotlivcom aj spoločnostiam, takže vy ako začínajúci podnikatelia, nemusíte čakať na spracovanie vlastnej infraštruktúry veľkých dát, aby ste z nich mohli vyťažiť.
Analýzy
Čo sú to analýzy resp. analytiky?
Zdroj: https://storyset.com/illustration/site-stats/amico
Teraz, keď už vieme čo sú to tzv. veľké, resp. big dáta, je čas sa dozvedieť, čo sú analýzy alebo analytiky. Doslovne, analýzy alebo tzv. analytiky sú “informácie, ktoré sú výsledkom systematickej analýzy údajov alebo štatistiky”[1]. Znie to príliš zložito? Zrejme áno, ale ide vlastne o využitie údajov, ktoré môžete zhromaždiť z webových stránok alebo platforiem sociálnych médií, aby ste získali prehľad o svojom podnikaní.
Existujú rôzne druhy analýz, z ktorých je možné získavať rôzne poznatky. Keďže práve začíname, zameriame sa na základy a povieme si, ako vám môžu tieto analýzy pomôcť. Analýzy, resp. analytiky vám môžu pomôcť poskytnutím údajov, bez ohľadu na to, aký nástroj používate. Najprv sa však pozrime na ich rôzne typy.
Rôzne druhy analýz
Je užitočné rozlišovať medzi tromi druhmi analytiky, ktoré vám povedia čo sa stalo, čo sa stane a čo máte urobiť.[2]
- Deskriptívna analýza odhalí, čo sa stalo. Pomocou deskriptívnej analýzy môžete vyhľadávať a sumarizovať historické údaje s cieľom identifikovať isté vzory, vzorce alebo význam. Ako môžete používať deskriptívnu analytiku? Dobrým príkladom je zhrnutie minulých udalostí, napríklad marketingových kampaní alebo údajov o používaní sociálnych médií a zapojení používateľov, napríklad počty lajkov na Instagrame.
- Prediktívna analýza naznačí, čo nastane v budúcnosti. Keďže prediktívna analytika dokáže vášmu startupu napovedať, čo by sa v budúcnosti mohlo stať, umožní vám proaktívnejší, na údajoch založený prístup k vašej obchodnej stratégii a rozhodovaniu. Tento typ analytiky je založený na pravdepodobnostiach a využíva rôzne metódy, ako je dolovanie údajov alebo algoritmy strojového učenia. Dobrým príkladom prediktívnej analýzy bude prognóza pravdepodobnosti, že si zákazníci kúpia ďalší váš výrobok alebo obchod opustia.
- Preskriptívna analýza navrhuje čo robiť, keďže dokáže určovať optimálne riešenia tým, že predvída, čo, kedy a prečo sa môže stať. Ide o najkomplexnejšiu, avšak najužitočnejšiu analytiku, ktorá umožňuje prijímať najlepšie možné rozhodnutia, založené na údajoch, s cieľom optimalizovať výkonnosť vášho startupu. Dobrým príkladom preskriptívnej analytiky je hodnotenie rizík, ktoré robia poisťovne pri určovaní cien pre klientov.
Význam analýzy veľkých dát pre začínajúcich podnikateľov
Prečo je analýza veľkých dát tak dôležitá pre začínajúci podnik? Analýza veľkých objemov dát vám v zásade môže ukázať nové vlny inovácií a rastu produktivity. Zároveň vám pomôže spoznať vaše odvetvie, konkurenciu a zákazníkov. Poďme sa podrobne pozrieť na výhody veľkých dát pre váš začínajúci podnik.
Zdroj: https://stories.freepik.com/illustration/startup-life/cuate
- Rozhodovanie a zlepšovanie výkonnosti: Analýzy veľkých dát môžu zlepšiť vaše rozhodovanie. Na druhej strane, keďže používanie analytík umožňuje vytvárať a uchovávať viac údajov v digitálnej forme, môžete získať podrobné informácie o výkonnosti všetkého, čo súvisí s vaším začínajúcim podnikom, ako sú zásoby výrobkov, faktúry alebo pracovný čas zamestnancov.
- Poznanie a zacielenie na vašich zákazníkov: Prostredníctvom segmentácie zákazníkov umožňujú veľké dáta presnejšie prispôsobiť produkty alebo služby zákazníkom. Okrem toho, umožňujú aj lepšie pochopiť správanie vašich zákazníkov, a to sledovaním ich nákupného správania a monitorovaním sociálnych médií.
- Hľadanie inovatívnych obchodných modelov, produktov a služieb a objavovanie nových trendov:
- Veľké objemy dát sa dajú využiť aj na zlepšenie vývoja ďalšej, novej generácie produktov a služieb, monitorovaním toho, čo zákazník hľadá, napríklad pomocou nástrojov ako Google Trends.
[2] https://www.lexico.com/definition/analytics
[3] https://www.researchgate.net/publication/276001104_All_About_Analytics