Τι είναι τα Μεγάλα Δεδομένα;
Μεγάλα Δεδομένα
Πηγή: https://stories.freepik.com/illustration/server/pana
Εισαγωγή στα Μεγάλα Δεδομένα
Ας αρχίσουμε με την κατανόηση του τι είναι τα Μεγάλα Δεδομένα. Τα Μεγάλα Δεδομένα είναι ο συνδυασμός τεράστιων ποσοστών συγκεντρωμένων δεδομένων που αποθηκεύονται και αναλύονται από οργανισμούς. Αυτά τα δεδομένα μπορούν να εξορυχθούν για απόσπαση πληροφοριών που θα χρησιμοποιηθούν σε έργα μηχανικής μάθησης και προηγμένα αναλυτικά στοιχεία για να παράξουν έναν νέο και αποτελεσματικό τρόπο υποστήριξης αποφάσεων στη διαχείριση δεδομένων[1].
Με άλλα λόγια, τα Μεγάλα Δεδομένα είναι οι πληροφορίες που οι εταιρείες και οι οργανισμοί μαζεύουν από τα δεδομένα που δημιουργούνται συνεχώς κάθε φορά που ανοίγουμε μια εφαρμογή, κάνουμε αναζήτηση στο Google ή απλά ταξιδεύουμε από μέρος σε μέρος με το κινητό μας. Ακούγεται εύκολο σωστά; Αλλά πώς μπορούμε να κάνουμε χρήση αυτών των δεδομένων;
Τα 5V
Αν θέλετε να βρείτε μια αποτελεσματική χρήση αυτού του επαναστατικού όγκου δεδομένων, είναι σημαντικό να κατανοήσετε τα διάφορα χαρακτηριστικά των Μεγάλων Δεδομένων πρώτα.
Παραδοσιακά τα Μεγάλα Δεδομένα έχουν οριστεί και βασίζονται σε τρεις διαστάσεις: Όγκος (Volume), Ποικιλία (Variety) και Ταχύτητα (Velocity). Όμως, δύο διαστάσεις έχουν πρόσφατα προστεθεί για να παρέχουν τη δυνατότητα στους χρήστες να δημιουργήσουν γνώση διαμέσου των Μεγάλων Δεδομένων, αυτές είναι η Εγκυρότητα (Veracity) και η Αξία (Value). Οι διαστάσεις είναι πολλές; Ας τις δούμε μία προς μία!
Πηγή: Επεξεργασμένο από stories.freepik.com
- Όγκος: Ας ξεκινήσουμε με τον Όγκο, αναφέρεται στο μέγεθος των σετ των δεδομένων που χρειάζεται να αναλυθούν και να τύχουν επεξεργασίας. Αυτά τα σετ δεδομένων συχνά είναι μεγαλύτερα από τα terabytes και τα petabytes. Τα δεδομένα μπορούν να θεωρηθούν ως Μεγάλα Δεδομένα ή όχι, βασισμένοι στον όγκο τους.
- Ταχύτητα: Η Ταχύτητα αναφέρεται στην ταχύτητα με την οποία τα δεδομένα παράγονται, συλλέγονται και αναλύονται. Αυτά τα δεδομένα συνεχώς ρέουν διαμέσου του «Διαδικτύου των Πραγμάτων», τα δεδομένα των κινητών ή τα μέσα κοινωνικής δικτύωσης. Μέχρι τώρα όλα καλά;
- Ποικιλία: Το τρίτο V είναι η Ποικιλία (Variety) και αναφέρεται σε διαφορετικές πηγές δεδομένων που παράγονται είτε από ανθρώπους ή από μηχανές. Μπορούμε να αναγνωρίσουμε τρεις τύπους δεδομένων: Δομημένων, Ημι-δομημένων και Μη-δομημένων.
-Δομημένα δεδομένα είναι συχνά αριθμοί ή ετικέτες, που αποθηκεύονται σε δομημένα πλαίσια στηλών και γραμμών που σχετίζονται σε δοσμένες παραμέτρους. Για παράδειγμα η βαθμολόγηση που δίνουμε σε εταιρείες μέσω κριτικών Google.
-Ημί-δομημένα δεδομένα, είναι πρόχειρα οργανωμένα σε κατηγορίες χρησιμοποιώντας μεταετικέττες (meta tags). Για παράδειγμα τουίτς (tweets) που οργανώνουμε βάσει των διέσεων (hashtags).
-Μη δομημένα δεδομένα μπορεί να είναι πυκνές πληροφορίες που δεν είναι οργανωμένες μέσα σε ένα ξεκάθαρα καθορισμένο πλαίσιο ή μοντέλο. Για παράδειγμα βίντεο και εικόνες.
- Εγκυρότητα: Αναφέρεται στη διασφάλιση της ποιότητας, ακεραιότητας, αξιοπιστίας και ακρίβειας των δεδομένων. Με άλλα λόγια, μπορείτε να εμπιστευτείτε τα δεδομένα που έχετε συλλέξει; Είναι αυτά τα δεδομένα αρκετά αξιόπιστα για να αλιεύσετε γνώση από αυτά; Όλες αυτές οι ερωτήσεις και περισσότερες μπορούν να απαντηθούν όταν η εγκυρότητα των δεδομένων είναι γνωστή.
- Αξία: Το τελευταίο V, είναι η Αξία (Value), η οποία αναφέρεται στο πόσο πολύτιμα είναι τα δεδομένα για να επιδράσουν θετικά στις εργασίες μιας εταιρείας. Η Αξία εισάγει το κύριο θέμα αυτής της ενότητας αφού εδώ είναι που τα Αναλυτικά Στοιχεία των Μεγάλων Δεδομένων μπαίνουν στην εικόνα, αλλά θα δούμε τι είναι τα αναλυτικά στοιχεία και πώς δουλεύουν στο επόμενο κεφάλαιο.
Πηγές Μεγάλων Δεδομένων
Τώρα που γνωρίζετε τι είναι τα Μεγάλα Δεδομένα, ήρθε η ώρα να μάθετε ποιες είναι οι πηγές. Το ποσοστό των δεδομένων που παράγεται κάθε μέρα είναι τεράστιο και υπάρχει σε διάφορες μορφές. Αν θέλετε να είστε επιτυχημένοι με Μεγάλα Δεδομένα, είναι σημαντικό να γνωρίζετε πώς να διακρίνετε μεταξύ των διαφόρων διαθέσιμων πηγών δεδομένων και να κατανοείτε πόσο χρήσιμες και σχετικές με την εταιρεία σας μπορεί να είναι.
Επεξεργασμένο από την πηγή: https://storyset.com/illustration/open-source/bro
Βάσεις δεδομένων
Ο όρος βάση δεδομένων ακούγεται οικείος σωστά; Στις μέρες μας οι εταιρείες χρησιμοποιούν ένα υβριδικό μοντέλο που ενσωματώνει παραδοσιακές και σύγχρονες βάσεις δεδομένων για να αποκτήσουν τα σχετικά μεγάλα δεδομένα. Γιατί; Απλά απαιτούν μικρή επένδυση και κόστη πληροφοριακής υποδομής. Συνήθως αυτές οι βάσεις δεδομένων χρησιμοποιούνται επίσης για αρκετούς σκοπούς απόκτησης πληροφοριών από τις επιχειρήσεις καθώς μπορούν να παρέχουν την απόκτηση γνώση που χρησιμοποιείται για να καθοδηγήσει τα κέρδη των επιχειρήσεων. Οι περισσότερο δημοφιλείς βάσεις δεδομένων είναι η MS Access, Oracle και SQL μεταξύ άλλων καθώς μπορούν να συμπεριλαμβάνουν όλα τα είδη περιεχομένου όπως πελάτες και αντικείμενα.
Μίντια
Τα Μίντια είναι η πιο δημοφιλής πηγή Μεγάλων Δεδομένων, όλοι γνωρίζουμε πλατφόρμες όπως η Google, το Facebook, το Twitter, το YouTube, το Instagram. Γιατί λοιπόν τα Μέντια είναι σχετικά; Λοιπόν, είναι ο ταχύτερος τρόπος για τις επιχειρήσεις να αποκτήσουν μια εικόνα του κοινού τους, να σχεδιάσουν μοτίβα και να βοηθηθούν στη διαδικασία αποφάσεων καθώς μπορεί εύκολα να διαγράψει όλα τα φυσικά και δημογραφικά εμπόδια. Τα Μίντια λοιπόν παρέχουν πολύτιμες πληροφορίες για τις προτιμήσεις των καταναλωτών και των μεταβαλλόμενων τάσεων.
Υπολογιστικό Νέφος
Το υπολογιστικό νέφος αποτελεί μια αποτελεσματική και οικονομική βάση δεδομένων καθώς τα μεγάλα δεδομένα μπορούν να αποθηκευτούν και να μεταφερθούν σε ανοικτά ή ιδιωτικά υπολογιστικά νέφη. Για τον λόγο αυτό, οι εταιρείες έχουν στραφεί από τις παραδοσιακές πηγές δεδομένων στα υπολογιστικά νέφη με τη μετατόπιση των δεδομένων τους. Μερικά καλά παραδείγματα Υπολογιστικών Νεφών για δεδομένα είναι η Salesforce, Dropbox ή IBM.
Θυμάστε τι είναι τα δομημένα και μη-δομημένα δεδομένα; Η αποθήκευση σε υπολογιστικά νέφη μπορεί να φιλοξενήσει και τους δύο τύπους δεδομένων και προμηθεύει τις επιχειρήσεις με πληροφορίες σε πραγματικό χρόνο και κατ’ αίτηση πληροφορίες.
Το «Διαδίκτυο των Πραγμάτων»
Έχετε ακούσει για το Διαδίκτυο των Πραγμάτων; Αν όχι, έχετε την ευκαιρία να μάθετε για αυτό στην Ενότητα 4! Το ΙοΤ αναπτύσσεται με γοργούς ρυθμούς και περιλαμβάνει μεγάλα δεδομένα που παράγονται όχι μόνο από ηλεκτρονικούς υπολογιστές και κινητά τηλέφωνα αλλά επίσης πιθανώς και από κάθε συσκευή που μπορεί να εκπέμπει δεδομένα. Με το ΙοΤ τα δεδομένα μπορούν να απορρέουν από διαφορετικές συσκευές όπως βιντεοπαιχνίδια, κάμερες, οικιακές συσκευές και παρόμοια.
Το διαδίκτυο
Γιατί είναι τα δεδομένα του διαδικτύου ευεργετικά για τους ιδιοκτήτες νεοφυών επιχειρήσεων; Οι δημόσιοι ιστοχώροι συνιστούν Μεγάλα Δεδομένα που είναι ευρέως διαδεδομένα και εύκολα προσβάσιμα. Τα δεδομένα στο Διαδίκτυο είναι διαθέσιμα παρόμοια προς ιδιώτες και εταιρείες έτσι που εσείς, οι ιδιοκτήτες νεοφυών επιχειρήσεων δεν θα πρέπει να περιμένετε για να αναπτύξετε τη δική σας υποδομή Μεγάλων Δεδομένων για να μπορείτε να τα εκμεταλλευτείτε.
Αναλυτική
Τι είναι η αναλυτική;
Πηγή: https://storyset.com/illustration/site-stats/amico
Τώρα που κατανοείτε τι είναι τα Μεγάλα Δεδομένα, ήρθε η ώρα να γνωρίσετε τι είναι η αναλυτική. Κυριολεκτικά η αναλυτική είναι «οι πληροφορίες που απορρέουν από τη συστηματική ανάλυση δεδομένων ή στατιστικών»[1]. Ακούγεται πολύ περίπλοκο; Ναι προφανώς, αλλά αφορά τη χρήση δεδομένων τα οποία μπορείτε να συλλέξετε από την ιστοσελίδα σας ή πλατφόρμες κοινωνικής δικτύωσης για να σας δώσουν εικόνα για την επιχείρηση σας.
Υπάρχουν διαφορετικά είδη αναλυτικής που μπορούν να παρέχουν μια ποικιλία πληροφοριών. Και αφού τώρα ξεκινάμε, θα επικεντρωθούμε στα βασικά και θα μιλήσουμε για τους τρόπους με τους οποίους η αναλυτική μπορεί να σας βοηθήσει Η αναλυτική μπορεί να σας βοηθήσει παρέχοντας σας δεδομένα, παρά τα όποια εργαλεία χρησιμοποιείτε. Αλλά πρώτα, ας δούμε τους διάφορους τύπους.
Διάφοροι τύποι αναλυτικής
Είναι χρήσιμο να διακρίνουμε μεταξύ τριών ειδών αναλυτικής τα οποία θα σας πουν τι συνέβηκε, τι θα συμβεί και τι σας εισηγούνται να κάνετε.[2]
-Περιγραφική αναλυτική αναλύει τι έχει συμβεί Με την περιγραφική αναλυτική μπορείτε να αναζητήσετε και να συνοψίσετε ιστορικά δεδομένα για να ταυτοποιήσετε μοτίβα ή νόημα. Πώς μπορείτε να χρησιμοποιήσετε την περιγραφική αναλυτική; Καλά παραδείγματα είναι η σύνοψη περασμένων γεγονότων όπως εκστρατείες μάρκετινγκ, ή χρήση Μέσων Κοινωνικής Δικτύωσης και δεδομένα εμπλοκής (engagement data) όπως likes στο Instagram.
-Προγνωστική αναλυτική εισηγείται τι θα συμβεί στο μέλλον. Αφού η προγνωστική αναλυτική μπορεί να πει στη νεοφυή σας επιχείρηση τι μπορεί να συμβεί στο μέλλον, θα σας επιτρέψει να έχετε μια περισσότερο προληπτική, καθοδηγούμενη από δεδομένα, προσέγγιση στην επιχειρηματική στρατηγική σας και στη λήψη αποφάσεων. Αυτός ο τύπος αναλυτικής βασίζεται στις πιθανότητες χρησιμοποιώντας μια ποικιλία από τεχνικές όπως άντληση δεδομένων ή αλγόριθμους μηχανικής μάθησης. Ένα καλό παράδειγμα προγνωστικής αναλυτικής θα είναι η πρόβλεψη της πιθανότητας οι πελάτες να αγοράσουν ένα άλλο προϊόν ή να εγκαταλείψουν το κατάστημα.
-Καθοδηγητική αναλυτική θα εισηγηθεί τι να κάνετε καθώς μπορεί να ταυτοποιήσει βέλτιστες λύσεις προβλέποντας τι, πότε και γιατί κάτι μπορεί να συμβεί. Είναι ο πιο πολύπλοκος τύπος αναλυτικής και συνάμα ο πιο χρήσιμος για να λάβετε τις καλύτερες πιθανές, βασισμένες σε δεδομένα, αποφάσεις για να βελτιστοποιήσετε την απόδοση της νεοφυούς επιχείρησης σας. Ένα καλό παράδειγμα της καθοδηγητικής αναλυτικής είναι η αξιολόγηση κινδύνων στην οποία προβαίνουν οι ασφαλιστικές εταιρείες όσον αφορά την τιμολόγηση των πελατών.
Η σημασία της Αναλυτικής Μεγάλων Δεδομένων για ιδιοκτήτες νεοφυών επιχειρήσεων.
Γιατί η αναλυτική Μεγάλων Δεδομένων είναι χρήσιμη για τη νεοφυή επιχείρηση σας; Βασικά η αναλυτική Μεγάλων Δεδομένων μπορεί να σας υποδείξει τα νέα ρεύματα καινοτομίας και ανάπτυξης παραγωγικότητας ενώ την ίδια ώρα σας βοηθά να γνωρίσετε τον κλάδο σας, τους ανταγωνιστές και τους πελάτες σας. Ας δούμε τα πλεονεκτήματα των Μεγάλων Δεδομένων για τη νεοφυή σας επιχείρηση σε βάθος.
Πηγή: https://stories.freepik.com/illustration/startup-life/cuate
- Λήψη αποφάσεων και βελτίωση απόδοσης: μέσα από τη χρήση της αναλυτικής τα Μεγάλα Δεδομένα μπορούν να βελτιώσουν τη λήψη αποφάσεων. Από την άλλη, καθώς σας επιτρέπει να δημιουργήσετε και να αποθηκεύσετε περισσότερα δεδομένα σε ψηφιακή μορφή μπορείτε να έχετε λεπτομερή πληροφόρηση της απόδοσης των πάντων που σχετίζονται με τη νεοφυή επιχείρηση σας όπως αποθεματικά προϊόντων, τιμολόγια ή προγράμματα του προσωπικού.
- Γνωριμία και στόχευση των πελατών σας: Μέσα από την κατηγοριοποίηση των πελατών, τα Μεγάλα Δεδομένα επιτρέπουν προϊόντα ή υπηρεσίες περισσότερο εξατομικευμένα. Επιπλέον τα μεγάλα δεδομένα μπορούν να σας βοηθήσουν να κατανοήσετε περισσότερο τη συμπεριφορά των πελατών σας διαμέσου της ιχνηλάτησης της αγοραστικής τους ρουτίνας και ελέγχου των Μέσων Κοινωνικής Δικτύωσης τους.
- Εύρεση καινοτόμων επιχειρηματικών μοντέλων, προϊόντων και υπηρεσιών και εξερεύνηση τάσεων: Τα Μεγάλα Δεδομένα μπορούν να χρησιμοποιηθούν για να βελτιωθεί η ανάπτυξη της επόμενης γενιάς προϊόντων και υπηρεσιών ιχνηλατώντας τι αναζητούν ή ψάχνουν οι πελάτες, για παράδειγμα με εργαλεία όπως το Google Trends.
- Χρήση Αναλυτικής Μεγάλων Δεδομένων για να γνωρίσετε τον βιομηχανικό σας κλάδο και τους ανταγωνιστές σας: Πολλές εταιρείες εκδίδουν ετήσιες εκθέσεις με τις περισσότερο σχετικές πληροφορίες. Επιπλέον μπορείτε να εκμεταλλευτείτε τα δεδομένα που περιλαμβάνονται στα προϊόντα που πωλούν, όπως οι τιμές και τα χαρακτηριστικά.
[1] https://www.researchgate.net/publication/265775800
[2] https://www.lexico.com/definition/analytics
[3] https://www.researchgate.net/publication/276001104_All_About_Analytics