Seguro que más de una vez te has planteado cuál es el lugar idóneo para abrir un negocio, especialmente si te has dedicado a este campo alguna vez. O has ido caminado por la calle y te has preguntado por qué abundan tanto un tipo de comercio en una zona mientras que es más raro de ver en otra. O, cómo no, si una zona no está ya sobrecargada de tiendas de un tipo y hay demasiada competencia.

Pues bien, este problema está íntimamente relacionado con el análisis de White space. Este análisis se refiere al proceso utilizado por las compañías (sin importar su escala) para identificar posibles puntos de crecimiento o mejora de sus servicios. El llamado White space hace referencia al espacio en blanco que está aún por aprovechar y puede ser desde un sector que está poco explotado y tiene un gran volumen de posibles clientes hasta, como decíamos, rellenar un espacio físico o área geográfica donde es posible expandir un negocio por haber falta de competidores.

White space hace referencia al espacio en blanco que está aún por aprovechar y puede ser desde un sector que está poco explotado y tiene un gran volumen de posibles clientes hasta,  rellenar un espacio físico donde es posible expandir un negocio por haber falta de competidores

En este post, nos vamos a centrar en el segundo caso y cómo puede utilizarse la Ciencia de Datos para detectar estos White spaces.

Un poco de historia

Esto de representar datos en mapas para tratar de encontrar patrones que expliquen la realidad y tomar decisiones no es que sea nada nuevo. Lleva haciéndose desde que existe la cartografía, con mayor o menor sofisticación. Un ejemplo curioso de caso de éxito que llama mucho la atención es el del Doctor John Snow (no el de Juego de Tronos) en el siglo XIX.

En 1854 se dio en Londres uno de los mayores brotes de Cólera de la historia de Inglaterra. En aquella época, se pensaba que esta enfermedad se contagiaba por el aire, algo que no convencía al Doctor Snow, que decidió investigar el origen de este brote. Para ello, representó con puntos en un mapa las casas de la gente que se había contagiado del Cólera, mostrando zonas de acumulación claras. Después, y tras sospechar que el origen de esta epidemia podía estar en el agua, representó con cruces sobre el mismo mapa las bombas de agua de la zona. El resultado fue el que se ve en el siguiente mapa:

Con esto quedó claro, no solo que el origen de la epidemia se encontraba en la bomba de agua de la calle Broad Street, sino que esta enfermedad no se transmitía por el aire sino por el agua. Además, se consiguió parar la epidemia.

Data Science y White Space

Las herramientas con las que contamos hoy en día, además de la potencia de cálculo que nos proporcionan los ordenadores actuales, nos facilitan agilizar y automatizar este tipo de análisis. Esto hace posible que, en lugar de utilizar únicamente nuestro conocimiento del negocio para estudiar, por ejemplo, dónde abrir un comercio, podamos utilizar el análisis de datos para dar un enfoque más cuantitativo a nuestra búsqueda, filtrando y ponderando todas las posibilidades de forma mucho más rápida y escalable.

Tras este filtrado, será mucho más fácil aplicar nuestro conocimiento de negocio sobre un grupo más reducido de opciones para saber dónde debemos posicionarnos para expandir nuestra marca.
Esto es posible gracias al uso de forma inteligente de datos de todo tipo de índole. Algunos ejemplos son:

  • Datos demográficos
  • Socioeconómicos
  • Ventas
  • Movilidad
  • Geográficos
  • Etnográficos

 

Existen empresas que proporcionan acceso a algunos de estos tipos de datos, en la mayoría de los casos pagando, como puede ser el caso de Google o de algunas empresas de telecomunicaciones, para los datos geográficos y de movilidad, respectivamente. No obstante, si uno cuenta con las habilidades necesarias (y el tiempo suficiente), es posible llevar a cabo un proyecto de análisis de White space únicamente con datos abiertos, solo es necesario un poco de ingenio.

A continuación, vamos a desglosar las distintas partes que puede tener un proyecto de este tipo.

1. Obtención de datos demográficos y socioeconómicos

Sin ir más lejos, el INE publica de forma desglosada a distintos niveles de precisión (provincial, municipal, por código postal, por sección censal…) datos económicos (renta media, tasa de paro, gasto en vivienda, etc.) y demográficos (distribución por edad, sexo y nacionalidad), además de muchos otros. Esto permite caracterizar a cada zona con el perfil de las personas que viven allí y localizar zonas similares en tipo de población, pero no necesariamente próximas o con la misma saturación de mercado.

2. Obtención de datos geográficos

Para poder encontrar zonas con baja saturación del mercado es necesario, lógicamente, conocer dónde se encuentran los comercios que nos interesan. Esto se puede obtener, cómo decíamos antes, de empresas que facilitan catálogos con este tipo de datos, o de páginas especializadas que ofrecen este tipo de catálogos de forma gratuita.

Con frecuencia, es necesario localizar también las coordenadas de estos comercios para poder cruzar los datos geográficos con los demográficos. Esto se puede hacer, por ejemplo, con la API que ofrece Google Maps o con librerías gratuitas como Open Street Map, dependiendo de la magnitud y presupuesto de nuestro proyecto.

Para cruzar estas localizaciones con los datos demográficos se pueden utilizar librerías especializadas en análisis espacial, como Geopandas, y un fichero de tipo shapefile con información sobre los límites de cada unidad territorial, también disponible de forma gratuita.

3. Cálculo de una métrica de potencial

Una vez tenemos caracterizada cada zona por sus variables geográficas y sabemos dónde están los comercios ya existentes, podemos definir un KPI que indique la saturación del mercado de cada zona. Por ejemplo, el número de comercios del tipo que nos interesa a menos de 1 km de cada código postal. Esto nos permite hacer un análisis espacial de los datos para extraer conclusiones que ya aporten bastante información a nuestro negocio.

Pero, si queremos dar un paso más, podemos utilizar también los datos sociodemográficos para entrenar un modelo con alguna variable objetivo, ya sea la que hemos definido antes en nuestro KPI o cualquier otra. Al analizar cómo se comporta nuestro modelo y contrastar, por ejemplo, aquellas zonas en las que el modelo considera que debería haber mayor saturación por sus variables socioeconómicas frente al valor real, podemos establecer una métrica que mida el potencial de cada zona.

Todo esto podríamos representarlo en un mapa que se consuma desde un dashboard, fácilmente explotable por nuestro equipo de desarrollo de negocio.

 

 

4. Ampliación con datos adicionales

Por último, aunque ya con toda esta información podríamos tomar decisiones estratégicas mucho más objetivas, podríamos ir un paso más allá y añadir alguna otra fuente de datos que nos dé una visión más profunda de la situación.

Por ejemplo, en el caso de tener acceso a ellos, podríamos añadir datos históricos de ventas de nuestros comercios para tratar de ver patrones de tendencias o si es necesario reajustar algo en ellos. También podríamos añadir datos de los locales de la ciudad para obtener una mejor estimación de la influencia que tiene cada tienda en su zona o para encontrar el mejor ubicado para expandir nuestra marca.

Conclusión

Como en muchos otros campos la Ciencia de Datos es una herramienta muy útil para obtener una visión objetiva, rápida y global de cómo es la situación del mercado, así como de cuáles son las mejores zonas de expansión y por qué. Esto nos aporta una ventaja competitiva, siendo capaces de entender mejor cómo es nuestro público objetivo y cómo se comporta, pudiendo no solo expandirnos mejor sino afianzar nuestra marca más en lugares donde ya estamos presentes.