Kas yra didieji duomenys (Big Data)?
Didieji duomenys (Big Data)
Šaltinis: https://stories.freepik.com/illustration/server/pana
Didžiųjų duomenų pristatymas
Pradėkime nuo to, ką vadiname didžiaisiais duomenimis – tai milžiniška duomenų kiekio kombinacija, kuria renka, saugoja ir analizuoja organizacijos. Šie duomenys gali būti išgaunami dėl informacijos, skirtos besimokančių kompiuterinių sistemų projektų ir pažangios analitikos panaudojimui, kurie pateikia naują ir veiksmingą duomenų valdymo sprendimų palaikymo būdą.[1]
Kitais žodžiais tariant, didieji duomenys yra informacija, kurią įmonės ir organizacijos renka iš nuolat generuojamų duomenų kiekvieną kartą, kai tik atidarome programą, ieškome „Google“ ar tiesiog keliaujame iš vienos vietos į kitą su mobiliaisiais įrenginiais. Skamba lengvai, tiesa? Bet kaip panaudoti šiuos duomenis?
5 didžiųjų duomenų parametrai (angl. The 5Vs)
Jei norite veiksmingai panaudoti šį revoliucinį duomenų kiekį, pirmiausia turite suprasti įvairias didžiųjų duomenų ypatybes.
Tradiciškai didieji duomenys buvo apibrėžti ir charakterizuojami trimis parametrais: Apimtimi, Įvairove ir Greičiu. Vis dėlto, neseniai jie dar buvo papildyti Teisingumu (kiek tikslūs ar teisingi duomenys) ir Verte, kad naudodami didžiuosius duomenis vartotojai galėtų įgyti žinių. Per daug parametrų? Peržiūrėkime juos paeiliui!
Šaltinis: parengta pagal stories.freepik.com
- Apimtis: ji nurodo į rinkinį patenkančių duomenų, kuriuos reikia analizuoti ir apdoroti, dydį. Šie duomenų rinkiniai dažnai būna didesni nei terabaitai ir petabaitai. Duomenys gali būti laikomi didžiaisiais duomenimis arba ne, atsižvelgiant į jų apimtį.
- Greitis: nurodo, kokiu greičiu nauji duomenys generuojami, renkami ir analizuojami. Šie duomenys nuolat plūsta per daiktų internetą (angl. Internet of things), mobiliuosius duomenis ar socialinę žiniasklaidą. Kol kas viskas aišku?
- Įvairovė – trečiasis parametras, nurodo skirtingus duomenų, kuriuos generuoja žmonės arba mašinos, šaltinius. Galime nustatyti trijų tipų duomenis: struktūrizuotus, pusiau struktūrizuotus ir nestruktūrizuotus.
- Struktūrizuoti duomenys dažnai yra skaičiai arba etiketės, saugomi struktūrinėje stulpelių ir eilučių sistemoje, susijusioje su iš anksto nustatytais parametrais. Pavyzdžiui, įvertinimai žvaigždutėmis, kuriuos įmonėms suteikiame „Google“ apžvalgose.
- Pusiau struktūrizuoti duomenys yra laisvai suskirstyti į kategorijas, naudojant meta žymas (angl. meta tags). Pavyzdžiui, žinutės, kurias sugrupuojame pagal žymas su grotelėmis (#).
- Nestruktūrizuotais duomenimis gali būti vadinami dideli kiekiai informacijos, kuri nėra sutvarkyta pagal aiškiai apibrėžtą sistemą ar modelį. Pavyzdžiui, vaizdo įrašai ir vaizdai.
- Teisingumas reiškia duomenų kokybės, vientisumo, patikimumo ir tikslumo užtikrinimą. Kitaip tariant, ar galite pasitikėti savo surinktais duomenimis? Ar jie yra pakankamai patikimi, kad būtų galima įgyti įžvalgų? Į visus šiuos ir dar daugiau klausimų galima atsakyti, kai žinomas duomenų teisingumas.
- Vertė – tai paskutinis didžiųjų duomenų parametras, nurodantis, kiek naudos duomenys suteikia įmonei. Vertė pristato pagrindinę šio modulio temą, nes būtent šioje dalyje atsiranda didžiųjų duomenų analitika (Big Data analytics), tačiau kas yra analitika ir kaip ji veikia sužinosime dar kitame skyriuje.
Didžiųjų duomenų šaltiniai
Dabar, kai žinote, kas yra didieji duomenys, laikas susipažinti su jų šaltiniais. Kiekvieną dieną sukuriamų duomenų kiekis yra ne tik milžiniškas, bet egzistuoja įvairios jo formos. Norint sėkmingai naudotis didžiaisiais duomenimis, svarbu mokėti atskirti įvairius turimus duomenų šaltinius ir suprasti, kurie jų gali būti naudingi ir aktualūs jūsų įmonei.
Parengta remiantis šaltiniu: https://storyset.com/illustration/open-source/bro
Duomenų bazės
Terminas duomenų bazė skamba pažįstamai, ar ne taip? Siekdamos įgyti reikalingus didžiuosius duomenis įmonės šiuo metu naudoja hibridinį modelį, kuris apjungia tradicines ir šiuolaikines duomenų bazes. Kodėl? Šis modelis tiesiog reikalauja mažų investicijų ir IT infrastruktūros sąnaudų. Paprastai šios duomenų bazės naudojamos keliems verslo žvalgybos tikslams, nes iš jų gaunamos įžvalgos padidina įmonių pelną. Populiariausios duomenų bazės yra „MS Access“, „Oracle“ ir SQL (liet. struktūrizuota užklausų kalba) ir kt. Be kita ko, jose galima rasti visų rūšių turinį, tarkime, klientus ar straipsnius.
Žiniasklaida
Žiniasklaida yra populiariausias didžiųjų duomenų šaltinis. Mes visi žinome tokias platformas kaip „Google“, „Facebook“, „Twitter“, „YouTube“ ir „Instagram“. Taigi kodėl žiniasklaida yra aktuali? Nes verslui, tai greičiausias būdas, peržengiant fizinius ir demografinius barjerus, apžvelgti savo auditoriją, susidaryti modelį bei priimti sprendimus. Žiniasklaida gali pateikti vertingų įžvalgų apie klientų pasirinkimus ir besikeičiančias tendencijas.
Debesija
Debesija yra efektyvus ir ekonomiškas duomenų šaltinis, nes didieji duomenys gali būti saugomi ir gaunami viešosiose arba privačiosiose debesų saugojimo platformose. Dėl šios priežasties įmonės atsisakė tradicinių duomenų šaltinių ir perkėlė savo duomenis į debesiją. Geri debesų kompiuterijos (ang. Cloud Computing) duomenų pavyzdžiai yra „Salesforce“, „Dropbox“ arba „IBM“.
Prisimenate, kokie yra struktūrizuoti ir nestruktūrizuoti duomenys? Debesijos duomenų saugykloje galima talpinti abi rūšis ir teikti verslui informaciją realiuoju laiku bei gauti tuo metu reikalingas įžvalgas.
Daiktų internetas
Ar kada girdėjote apie daiktų internetą (angl. trumpinama IoT)? Jeigu ne, turite galimybę apie jį sužinoti 4 modulyje! Daiktų internetas sparčiai vystosi ir apima didelius duomenis, kuriuos sugeneruoja ne tik kompiuteriai ar išmanieji telefonai bet ir kiekvienas, galintis siųsti duomenis, prietaisas. Naudojant daiktų internetą, duomenis galima gauti iš įvairių elektroninių prietaisų, tokių kaip vaizdo žaidimai, fotoaparatai, buitinė technika ir panašiai..
Žiniatinklis
Kodėl startuolių steigėjams naudingi žiniatinklio duomenys? Viešasis internetas sudarytas iš plačiai paplitusių ir lengvai pasiekiamų didžiųjų duomenų. Duomenys žiniatinklyje yra prieinami tiek asmenims, tiek įmonėms, todėl Jums, startuoliams, nereikia gaišti laiko ir kurti savo didžiųjų duomenų infrastruktūros tam, kad galėtumėte ja pasinaudoti.
Analitika
Kas yra analitika?
Šaltinis: https://storyset.com/illustration/site-stats/amico
Dabar, kai susipažinote su didžiausiais duomenimis, laikas išsiaiškinti, kas yra analitika. Pažodžiui, analitika yra „informacija, gaunama sistemingai analizuojant duomenis ar statistiką”[1]. Ar tai skamba per daug sudėtingai? Žinoma, kad taip, bet visa tai reiškia duomenų, teikiančių įžvalgas apie jūsų verslą, naudojimą, kuriuos galite rinkti iš savo svetainės ar socialinės žiniasklaidos platformų.
Egzistuoja skirtingų rūšių analitikos, kurios suteikia įvairias įžvalgas. Kadangi dar tik įžanga, daugiausia dėmesio skirsime pagrindams , o vėliau aptarsime kaip analitika gali Jums padėti. Nesvarbu, kokį analitikos įrankį naudojate, ji aprūpins Jus duomenimis. Bet pirmiausia pažvelkime į skirtingus tipus.
Skirtingos analitikos rūšys
Naudinga išskirti tris analitikos rūšis, kurios atskleis, kas įvyko, kas dar įvyks, ir pasiūlys, ką daryti.[2]
- Aprašomoji analitika atskleidžia, kas įvyko. Naudodami aprašomąją analitiką, galite ieškoti ir apibendrinti istorinius duomenis, kad nustatytumėte modelius ar reikšmę. Kaip galite naudoti aprašomąją analitiką? Geri pavyzdžiai yra praeities įvykių, tokių kaip rinkodaros kampanijos arba socialinės žiniasklaidos naudojimo bei įsitraukimo duomenų, pavyzdžiui, „Instagram“ patiktukų, (angl. likes), apžvalga.
- Nuspėjamoji analitika padeda projektuoti būsimus rezultatus. Kadangi nuspėjamoji analitika startuoliams teikia būsimų įvykių prognozes, tai leidžia laikytis produktyvesnės, duomenimis pagrįstos verslo strategijos ir sprendimo priėmimo Šio tipo analitika pagrįsta tikimybėmis, pasitelkiant įvairius metodus kaip duomenų gavyba ar besimokančių mašinų algoritmai. Puikus nuspėjamosios analitikos pavyzdys – numatyti, kokia yra tikimybė, kad klientai įsigys kitą produktą ar paliks parduotuvę.
- Nurodančioji analitika pasiūlo, ką daryti, nes numatydama, kas, kada ir kodėl įvyktų, gali nustatyti palankiausius sprendimus. Tai yra sudėtingiausia, tačiau pati naudingiausia analitika, leidžianti priimti kiek įmanoma tinkamesnius, duomenimis pagrįstus sprendimus, siekiant optimizuoti jūsų startuolio našumą. Geras nurodančiosios analitikos pavyzdys yra rizikos vertinimas, kurį draudimo bendrovės atlieka atsižvelgdamos į klientų kainodarą.
Didžiųjų duomenų analitikos svarba startuoliams
Kodėl jūsų startuoliui naudinga didžiųjų duomenų analitika? Iš esmės, ji gali atskleisti naujus inovacijų ir produktyvumo augimo pakilimus bei nusileidimus, tuo pačiu padėdama pažinti savo pramonę, konkurentus ir klientus. Pažvelkime iš arčiau, kokius pranašumus jūsų startuoliui suteikia didieji duomenys.
Šaltinis: https://stories.freepik.com/illustration/startup-life/cuate
- Sprendimų priėmimo ir veiksmingumo tobulinimas: pasitelkiant analitiką, didieji duomenys gali pagerinti sprendimų priėmimo procesą. Kita vertus, kadangi analitika leidžia sukurti ir saugoti daugiau duomenų skaitmeninėje formoje, galite gauti išsamią informaciją, kuri parodo viską, kas susiję su jūsų pradiniu verslu, tarkime, produktų atsargas, sąskaitų faktūras ar darbuotojų tvarkaraščius.
- Žinojimas ir orientacija į klientus: naudojant klientų segmentavimą, didieji duomenys leidžia tiksliau atlikti produktų ar paslaugų užsakymus. Be to, sekant klientų pirkimo įpročius ir stebint socialinę žiniasklaidą, didieji duomenys gali padėti geriau suprasti klientų elgseną.
- Pažangių verslo modelių, produktų ir paslaugų paieška bei tendencijų tyrinėjimai: didieji duomenys gali būti naudojami naujos kartos produktų ir paslaugų plėtros gerinimui, sekant tai, ko klientas ieško arba kuo domisi, pavyzdžiui, naudojant tokius įrankius kaip „Google Trends“.
- Didžiųjų duomenų analitikos panaudojimas siekiant suprasti savo pramonę ir klientus: daugelis įmonių skelbia metines ataskaitas su aktualiausiomis įžvalgomis. Be to, galite pasinaudoti kartu su jų parduodamais produktais pateikiamais duomenimis, tokiais kaip kainos ir funkcijos.
[1] https://www.researchgate.net/publication/265775800
[2] https://www.lexico.com/definition/analytics
[3] https://www.researchgate.net/publication/276001104_All_About_Analytics