Esta semana vamos a explicar que es el Data Science y cómo se originó esta nueva disciplina que tanta repercusión esta teniendo recientemente. El Data Science lo definió William S. Cleveland en 2001 en su artículo: Data Science: An Action Plan for Expanding the Technical Areas of the Field of Statistics. En él presenta un plan de acción para ampliar las áreas de trabajo de la estadística, definiendo un nuevo campo, el del Data Science. Con este plan abogaba por la unión entre las matemáticas y la informática, con el fin de desarrollar un campo multidisciplinar destinado a la resolución de problemas de cualquier tipo en base a los datos.
Pero no fue hasta 2010 cuando realmente empezó la popularidad y expansión del Data Science, estando hoy, junto con el Big Data, en boca de todos. Ese mismo año se fundó la que posiblemente sea una de las principales empresas dedicadas exclusivamente al Data Science: Kaggle, la cual es posiblemente una clara representación del boom que ha vivido esta nueva área durante los últimos años.
Kaggle es una plataforma que pone datos reales a disposición de la mayor comunidad de data scientists en el mundo mediante la organización de competiciones. En dichas competiciones a los participantes se les presentan unos datos históricos de entrenamiento junto con una medida de evaluación de los resultados. El objetivo es crear un modelo predictivo mediante técnicas de aprendizaje automático que provea los mejores resultados sobre un conjunto de test.
Kaggle ha democratizado el acceso al modelado de datos, poniendo a disposición de las empresas una plataforma en la que obtener y/o mejorar sus procesos predictivos. Pero, cómo definió William S. Cleveland en 2001, el Data Science no sólo consiste en aplicar modelos predictivos a los datos, también conlleva la obtención y almacenamiento de los datos, el entendimiento de negocio al que pertenecen, la definición de la métrica adecuada, la comunicación de los resultados para que tengan un impacto en la organización, así cómo el seguimiento y mejora de la solución implantada ante posibles cambios en la lógica del negocio.
En resumen, el Data Science es crear soluciones de negocio basadas en los datos, y esto es algo en lo que desde PiperLab te podemos ayudar. ¿Te animas a incluir el Data Science en tus procesos de negocio? ¡Contáctanos!
Referencias adicionales:
[1] http://www.forbes.com/sites/gilpress/2013/05/28/a-very-short-history-of-data-science/ [2] https://en.wikibooks.org/wiki/Data_Science:_An_Introduction/A_History_of_Data_Science[/vc_column_text][/vc_column][/vc_row]