Innova Challenge BBVA: BBVAPlaces
Predicción de consumos a partir de datos de Google Places

Análisis estadístico

En este apartado se introducen los modelos que se han usado para estudiar la estimación de densidad de pagos (número de pagos por kilómetro cuadrado) en función de la valoración media y la densidad de 'places' (provinientes del API de Google Places) para cada código postal

Como se verá en el análisis, la varianza de la densidad de pagos se debe en un factor de 0.82 en el caso de Madrid a la densidad de Places; y en el de Barcelona en torno al 0.87. El resto de la varianza de la densidad de pagos se puede explicar en algunos casos con la de la valoración media, llegando a un ajuste muy significativo en el caso de la categoría 'food', debido al alto número de valoraciones en este tipo de categoría. La conclusión es que, a partir de un umbral mínimo de número de valoraciones, éstas empiezan a explicar la varianza restante de la densidad de pagos, con un p-value muy ajustado para su coeficiente(~= 0.01); y por lo tanto, la regresión es estadísticamente significativa. Es decir: Se puede modelar la densidad de pagos, a partir únicamente de la densidad de "Places" y de sus valoraciones

El texto del estudio es de Alberto González Paje, y se aloja aquí y aquí; aunque se reproducen debajo para mayor comodidad

Estudio de modelado estadístico para Madrid

Estudio de modelado estadístico para Barcelona