¿Qué es el Big Data?
Big data
Fuente: https://stories.freepik.com/illustration/server/pana
Introducción al Big Data
Comencemos por entender qué es el Big Data. Big Data es la combinación de cantidades masivas de datos recopilados, almacenados y analizados por las organizaciones. Estos datos se pueden extraer para obtener información que se usará en proyectos de aprendizaje automático y análisis avanzados para proporcionar una forma nueva y eficaz de tomar decisiones para el negocio.[1]
En otras palabras, big data es la información que las empresas y organizaciones recopilan de los datos que se generan constantemente cada vez que abrimos una aplicación, buscamos en Google o simplemente viajamos de un lugar a otro con nuestros dispositivos móviles. Suena fácil ¿verdad? Pero, ¿cómo hacer uso de estos datos?
Las 5V
Si deseas hacer un uso efectivo de esta revolucionaria cantidad de datos, es esencial que primero comprendas las diversas características del Big Data.
Tradicionalmente, el Big Data se ha definido y basado en tres dimensiones: Volumen, Variedad y Velocidad. Sin embargo, recientemente se han añadido dos dimensiones más para permitir a los usuarios crear conocimiento a través del Big Data, estas son la Veracidad y el Valor. ¿Demasiados Vs? ¡Veámoslas una a una!
Fuente: Editado desde stories.freepik.com
- Volumen: comencemos con el Volumen, se refiere al tamaño de los conjuntos de datos que necesitan ser analizados y procesados. Estos conjuntos de datos suelen ser mayores que los terabytes y petabytes. Los datos pueden ser considerados como Big Data o no, en función de su volumen.
- Velocidad: La velocidad se refiere a la rapidez a la que se generan, recopilan y analizan los datos. Estos datos fluyen continuamente a través del “Internet de las cosas”, los datos móviles o las redes sociales. ¿Hasta aquí todo bien?
- Variedad: La tercera V es la Variedad y se refiere a las diferentes fuentes de datos generadas ya sea por humanos o por máquinas. Podemos identificar tres tipos de datos: Estructurados, Semiestructurados y No estructurados.
- Los datos estructurados suelen ser números o etiquetas, almacenados en un marco estructurado de columnas y filas relacionadas con parámetros preestablecidos. Por ejemplo, las calificaciones por estrellas que damos a las empresas en las reseñas de Google.
- Los datos semiestructurados, se organizan vagamente en categorías utilizando metaetiquetas. Por ejemplo, Tweets que organizamos por hashtags.
- Los datos no estructurados pueden ser información con mucho texto que no está organizado en un marco o modelo claramente definido. Por ejemplo, vídeos e imágenes.
- Veracidad: Se refiere a la garantía de calidad, integridad, credibilidad y exactitud de los datos. En otras palabras ¿Puedes confiar en los datos que has recopilado? ¿Son estos datos lo suficientemente creíbles como para obtener información? Todas estas preguntas y más, pueden ser respondidas cuando se conoce la veracidad de los datos.
- Valor: La última V es el Valor, que se refiere a lo valiosos que son los datos cuando impactan positivamente en el negocio de una empresa. El Valor introduce el tema principal de este módulo, ya que es donde el análissi de Big Data entran en escena, pero veremos qué es este análisis y cómo funciona en el siguiente capítulo.
Fuentes de Big Data
Ahora que ya sabes lo que es el Big Data, es el momento de aprender cuáles son las fuentes. La cantidad de datos generados cada día es enorme y existen en varias formas. Si quieres tener éxito con el Big Data, es importante que sepas diferenciar entre las distintas fuentes de datos disponibles y entiendas lo útiles y relevantes que pueden ser para tu empresa.
Editado desde Fuente: https://storyset.com/illustration/open-source/bro
Bases de datos
El término base de datos suena familiar, ¿no es así? Hoy en día, las empresas están utilizando un modelo híbrido que integra bases de datos tradicionales y modernas para adquirir big data relevante. ¿Por qué? Simplemente se requieren bajas inversiones y costes de infraestructura de TICs. Normalmente, estas bases de datos también se utilizan para varios fines de inteligencia empresarial, ya que pueden proporcionar la extracción de información que se utiliza para impulsar los beneficios empresariales. Las bases de datos más populares son MS Access, Oracle y SQL entre otras, y pueden incluir todo tipo de contenido, como clientes o artículos.
Medios de Comunicación
Los medios de comunicación es la fuente más popular de Big Data, todos conocemos plataformas como Google, Facebook, Twitter, YouTube e Instagram. Entonces, ¿por qué son tan relevantes los medios de comunicación? Bueno, es la forma más rápida para que las empresas obtengan una visión general de su audiencia, dibujen patrones y ayuden a su toma de decisiones, ya que pueden cruzar fácilmente todas las barreras físicas y demográficas. Los medios de comunicación, por lo tanto, proporcionan información valiosa sobre las preferencias de los consumidores y las tendencias cambiantes.
La nube (cloud computing)
Los datos almacenados en la nube son una fuente eficiente y económica, ya que los grandes datos se pueden almacenar y obtener en nubes públicas o privadas. Por esa razón, las empresas han pasado de las fuentes de datos tradicionales a la nube al cambiar sus datos. Buenos ejemplos de datos de Cloud Computing son Salesforce, Dropbox o IBM.
¿Recuerdas qué son los datos estructurados y no estructurados? El almacenamiento en la nube puede adaptarse a ambos tipos de datos y proporciona a las empresas información en tiempo real e información bajo demanda.
El “Internet de las cosas” (IoT)
¿Alguna vez has oído hablar del Internet de las cosas? Si no, ¡tienes la oportunidad de aprender acerca de ello en el Módulo 4! IoT se está desarrollando rápidamente e incluye big data generado, no solo desde ordenadores y teléfonos inteligentes, sino también posiblemente desde todos los dispositivos que pueden emitir datos. Con el IoT, los datos se pueden obtener desde diferentes dispositivos, como videojuegos, cámaras, electrodomésticos y similares.
La web
¿Por qué los datos web son beneficiosos para los start-uppers? La web pública que constituye el Big Data está muy extendida y es de fácil acceso. Los datos en la Web están disponibles tanto para individuos como para empresas, por lo que tú, start-upper, no tienes por qué esperar para desarrollar tu propia infraestructura Big Data para aprovecharla.
La analítica de datos
Fuente: https://storyset.com/illustration/site-stats/amico
Ahora que entiendes lo que es el big data, es hora de saber qué es la analítica de datos. Literalmente, la analítica es la”información resultante del análisis sistemático de datos o estadísticas”. ¿Suena demasiado complicado [1]? Aparentemente sí, pero se trata de usar los datos que se pueden recopilar de tu sitio web o plataformas de redes sociales para brindarte información sobre tu negocio.
Hay diferentes tipos de análisis que pueden proporcionar una variedad de información. Dado que recién estamos comenzando, nos centraremos en los conceptos básicos y hablaremos sobre las formas en que el análisis de datos puede ayudarte. La analítica puede ayudarte al proporcionar datos, independientemente de la herramienta que estés utilizando. Pero primero, echemos un vistazo a los diferentes tipos.
Diferentes tipos de análítica
Es útil distinguir entre tres tipos de analítica que te dirán lo que ha ocurrido, lo que va apasar, o te sugerirán que hagas.[2]
- La analítica descriptiva revela lo que ha ocurrido. Con la analítica descriptiva puedes buscar y resumir datos históricos para identificar patrones o significados. ¿Cómo se puede utilizar la analítica descriptiva? Buenos ejemplos son el resumen de eventos pasados, como campañas de marketing, o datos de uso y participación en redes sociales, como los me gusta de Instagram.
- La analítica descriptiva sugiere lo que ocurrirá en el futuro. Dado que el análisis predictivo puede decirle a tu start-up lo que podría suceder en el futuro, te permitirá adoptar un enfoque más proactivo y basado en datos para tu estrategia de negocio y la toma de decisiones. Este tipo de análisis se basa en probabilidades mediante el uso de una variedad de técnicas como la minería de datos o algoritmos de aprendizaje automático. Un buen ejemplo de análisis predictivo será predecir la probabilidad de que los clientes compren otro producto o abandonen la tienda.
- La analitica prespricptiva sugerirá qué hacer, ya que puede identificar soluciones óptimas anticipando qué, cuándo y por qué podría suceder algo. Es el análisis más complejo pero el más útil para tomar las mejores decisiones posibles basadas en datos para optimizar el rendimiento de tu start-up. Un buen ejemplo de análisis prescriptivo es la evaluación de riesgos que hacen las compañías de seguros con respecto a los precios para los clientes.
La importancia del análisis de big data para tu start-up
¿Por qué el análisis de Big Data es útil para tu Start-up? Básicamente, porque el Big Data Analytics puede mostrarte nuevas olas de innovación y crecimiento de la productividad mientras te ayuda a conocer tu industria, competidores y clientes. Veamos las ventajas del Big Data para tu start-up en profundidad.
Fuente: https://stories.freepik.com/illustration/startup-life/cuate
- Toma de decisiones y mejora del rendimiento: a través del uso de la analítica Big Data puedes mejorar tu toma de decisiones. Por otro lado, como permite crear y almacenar más datos en formato digital, puedes obtener una información detallada de rendimiento de todo lo relacionado con tu start-up como inventarios de productos, facturas o horarios de personal.
- Conocer y dirigirse a tus clientes: La segmentación de clientes Big Data permite tener productos o servicios más precisos. Además, el big data puede ayudarte a comprender mejor el comportamiento de tus clientes a través del seguimiento de tu rutina de compra y el seguimiento de las redes sociales.
- Encontrar modelos de negocio, productos y servicios innovadores y explorar tendencias: El Big Data se puede utilizar para mejorar el desarrollo de la próxima generación de productos y servicios mediante el seguimiento de lo que el cliente está buscando, por ejemplo, con herramientas como Google Trends. Uso de Big Data Analytics para conocer tu industria y tus competidores: Muchas empresas publican informes anuales con los conocimientos más relevantes. Además, puede aprovechar los datos proporcionados en los productos que están vendiendo como precios y características.
[1] https://www.researchgate.net/publication/265775800
[2] https://www.lexico.com/definition/analytics
[3] https://www.researchgate.net/publication/276001104_All_About_Analytics