Spark

Spark es un motor analítico de código abierto para procesamiento de datos a gran escala de manera eficiente. Originalmente nace en el ecosistema Hadoop y se ejecuta sobre dicha instalación, pero hoy en día puede correr “en todas partes”, desde un solo ordenados hasta cualquier cluster de la nube. Asimismo, permite establecer la conexión con cientos de tipos de fuentes de datos diferentes. Cuenta con bibliotecas para el uso de lenguaje SQL (Spark SQL) o algoritmos de machine learning (MLlib), entre otras.

Piperlab

Autor: Piperlab