Big Data

El concepto de Big Data hace referencia al almacenamiento, procesamiento y gestión de un conjunto de datos o combinaciones de conjuntos de datos, que pueden ser tanto estructurados (aquellos que tienen un formato y una disposición definida, como por ejemplo las tradicionales bases de datos SQL) como no estructurados (aquellos que no presentan ninguna ordenación de la información, como un texto de opinión o una imagen). Puedes ver aquí la diferencia entre estos dos tipos de datos. Y todo esto, en una velocidad prácticamente en tiempo real o streaming.

Con todo, la definición de big data tiene numerosas acepciones, dependiendo de dónde se ponga el acento: en la velocidad, en la variedad, en el volumen… (de ahí las famosas V del Big Data), o en las tecnologías desarrolladas para almacenar, procesar y gestionar estas grandes cantidades de datos (por ejemplo, el Ecosistema Hadoop o el framework Apache Spark).

Aunque tampoco hay una definición única para determinar si un conjunto de datos concreto es o no es Big Data, se suele considerar Big Data, en términos de volumen, a conjuntos de datos a partir de varios Terabytes.

Sin embargo, la funcionalidad práctica de toda esta cantidad de datos se obtiene al extraer valor de los mismos, explorándolos y analizándolos para obtener ventajas competitivas.

Piperlab

Autor: Piperlab