Nociones básicas sobre Big Data
20 abril, 2022

Las palabras “Big Data” llevan tiempo formando parte de las tendencias dentro de lo que se ha dado en llamar transformación digital. Junto con el Cloud Computing y Blockchain, constituye una de las tecnologías más prometedoras, y es ya una realidad en multitud de servicios, públicos y privados, a lo largo de todo el mundo.

¿Qué es Big Data?

En primer lugar, hablamos de Big Data cuando una empresa o institución pretenda emplear un enfoque data-driven (impulsado por datos) de modo que se plantee como objetivo extraer el máximo valor de la información, sea propia, de fuentes externas accesibles, o una combinación de ambas.

Fijada la primera premisa, conceder y valorar el potencial que los datos tienen en una organización, la atención debe fijarse en el volumen, la naturaleza, almacenamiento y fuentes de dichos datos.

Volumen de datos

Una de las características de Big Data, y que la diferencian de las arquitecturas de datos tradicionales, es que es capaz de tratar grandes volúmenes de datos. Es en lo que la mayoría de la gente piensa cuando escucha Big Data, y aquí surge la primera cuestión ¿Cuál es la cantidad a partir de la cual se considera que es un gran volumen?

No hay un criterio concreto. Una opinión extendida durante algún tiempo la fijaba en la escala del Terabyte (1024 GB), probablemente porque entonces se consideraba un volumen lo suficientemente grande como para conllevar largos tiempos de procesamiento y hardware más complejo del habitual.

Pero dada la velocidad de avance de los procesadores, y el descenso de coste de la memoria RAM, fijar una cifra basada estos parámetros conduciría a tener que elevarla al alza, al cabo de pocos meses. Lo que hace medio año se consideraba “gran volumen”, es posible que hoy ya no lo sea tanto, en términos de esfuerzo para una máquina.

Dejemos por un momento la cuestión del volumen de información. Volveremos después sobre ello, visto el resto de factores que hacen al Big Data distinto.

Fuentes de datos y velocidad de procesamiento

El siguiente elemento diferenciador frente a las soluciones tradicionales de tratamiento de datos es la diversidad de información. Frente al clásico Business Intelligence, con cuadros de mando que trabaja a partir de datos estructurados (típicamente en bases de datos SQL), Big Data da solución cuando las fuentes de información son variadas. Esto significa capacidad de procesar, desde documentos de texto o archivos de sonido, hasta ficheros en formatos como XML o JSON, o de registro de operaciones, por poner unos cuantos ejemplos. Además de datos estructurados, por supuesto. Cualquier formato, en el cual puede haber información susceptible de ser útil se puede procesar mediante la arquitectura de Big Data.

Y un tercer criterio es la necesidad de procesamiento en casi tiempo real. Frente al ya mencionado Business Intelligence, que requiere consolidar datos agregados, transcurriendo así días o semanas, ahora es posible reaccionar en segundos según la información entrante, una rápida toma de decisiones, e incluso automatizar estas.

Volviendo a la cuestión del volumen de datos.

Cuando, por volumen, junto con los condicionantes de variedad y velocidad, el volumen de datos no pueda ser procesado por una sola máquina, o el coste de esta no sea operativo, entonces será necesaria una plataforma Big Data.

Hay otras variables, que algunos autores añaden, como el valor del dato y su variabilidad de flujo en el tiempo. En todo caso, Big Data siempre estará ahí donde confluyan volumen, variedad y velocidad.

Juan Escamilla

Director de Imagen y Comunicación

Comparte este artículo

Publicaciones Relacionadas

¿Es tu empresa Data Driven?

¿Es tu empresa Data Driven?

El análisis de datos se ha convertido en una pieza fundamental en el proceso de toma de decisiones empresarial. No obstante, el análisis de datos no es una labor sencilla, y requiere de un conjunto de profesionales cualificados con un conjunto de skills muy específicas, además de una serie de herramientas muy potentes.

Ejemplos de usos y aplicaciones de Big Data

Ejemplos de usos y aplicaciones de Big Data

Durante los últimos años, Big Data se ha consolidado como una pieza fundamental en los procesos de negocio (empresas) o servicios a la ciudadanía (administración pública).

Analítica Avanzada y Big Data: guía para obtener valor de los datos

Analítica Avanzada y Big Data: guía para obtener valor de los datos

Los datos cuentan una historia, y los expertos deben ser capaces de crear la arquitectura necesaria para almacenar y tratar correctamente esos datos, de manera que sea posible visualizar el conocimiento que se esconde tras la información y obtener valor.Nada mejor que comenzar con un claro ejemplo de cómo a través de la utilización de los datos que tienen en su poder las organizaciones, estas pueden llegar a conseguir resultados. Este ejemplo en concreto se basa en el análisis de electrocardiogramas y, para llegar a la solución del problema, se ha utilizado un histórico de 1,7 millones de cardiogramas. A partir de ese histórico, se lleva a cabo un análisis de los datos y, posteriormente, basta con hacer uso de la Inteligencia Artificial para poder realizar predicciones.

La polémica de FaceApp y el riesgo que suponen estas aplicaciones para la privacidad

La polémica de FaceApp y el riesgo que suponen estas aplicaciones para la privacidad

Hace apenas tres semanas llegó a nuestros smarthphones el nuevo fenómeno viral de la mano de FaceApp. Aunque el lanzamiento de esta aplicación tuvo lugar en 2017, el nuevo filtro de edad que integra desde hace unos pocos días ha marcado un nuevo hito en todas las redes sociales, y es que esta novedosa funcionalidad permite a los usuarios hacer una especie de simulación para comprobar el aspecto que tendrán dentro de varias décadas (tomando como referencia una fotografía actual).

Nueva aplicación de Facebook para extraer los datos de los usuarios a cambio de dinero

Nueva aplicación de Facebook para extraer los datos de los usuarios a cambio de dinero

Paulatinamente, las empresas se han ido percatando de la importancia de los datos y de cómo su correcto tratamiento y explotación pueden traducirse en una fuente de ventaja competitiva. En resumen, se podría decir que los datos son el petróleo del siglo XXI, y una clara evidencia de ello es el hecho de que el perfil de experto en Big Data es uno de los más demandados por las empresas en la actualidad.

Llega Textract, la nueva herramienta de Amazon Web Services

Llega Textract, la nueva herramienta de Amazon Web Services

En la actualidad, organizaciones de todo el mundo manejan cantidades ingentes de datos, archivos, ficheros y otro tipo de documentos, y tanto su almacenaje como su tratamiento se están convirtiendo en una tarea cada vez más compleja. Afortunadamente, con el paso del tiempo se han desarrollado algunas herramientas que permiten simplificar la gestión y el tratamiento de estos datos, además de mejorar la eficiencia de los tediosos procesos administrativos que forman parte del día a día de las empresas.

¿Quieres estar al día de nuestras publicaciones?

    Buscar

    Categorías

    Ir al contenido