El concepto de Big Data hace referencia al almacenamiento, procesamiento y gestión de un conjunto de datos o combinaciones de conjuntos de datos, que pueden ser tanto estructurados (aquellos que tienen un formato y una disposición definida, como por ejemplo las tradicionales bases de datos SQL) como no estructurados (aquellos que no presentan ninguna ordenación de la información, como un texto de opinión o una imagen). Puedes ver aquí la diferencia entre estos dos tipos de datos. Y todo esto, en una velocidad prácticamente en tiempo real o streaming.
Con todo, la definición de big data tiene numerosas acepciones, dependiendo de dónde se ponga el acento: en la velocidad, en la variedad, en el volumen… (de ahí las famosas V del Big Data), o en las tecnologías desarrolladas para almacenar, procesar y gestionar estas grandes cantidades de datos (por ejemplo, el Ecosistema Hadoop o el framework Apache Spark).
Aunque tampoco hay una definición única para determinar si un conjunto de datos concreto es o no es Big Data, se suele considerar Big Data, en términos de volumen, a conjuntos de datos a partir de varios Terabytes.
Sin embargo, la funcionalidad práctica de toda esta cantidad de datos se obtiene al extraer valor de los mismos, explorándolos y analizándolos para obtener ventajas competitivas.
Mucha gente se pregunta la diferencia entre el Big Data y el Data Science, hicimos un artículo explicando las diferencias.