jueves, 2 de noviembre de 2017

Estadísticas post viaje 1

Bueno,
Como prometido, ahora vienen las entradas científicas. Digo "entradas" porque sacar gráficas decentes me está costando bastante más de lo que pensaba. Si a eso le agrego que tengo que escribir con teclados "no muy preparados" para el español y que estoy aprendiendo a hacerlo en python en vez de en R: se acumulan los retos.
Primero, tenemos el mapa con la ruta casi completa. Tuve que reconstruir partes de registros que teníamos entre Alfonso y yo y aún así no llegamos a tener el recorrido al 100%. He añadido los lugares donde nos quedamos también. Haciendo click en la ruta creo que se puede ver la cantidad de kilómetros, la altura subida, etc.
Hubo varios inconvenientes para hacer este mapa, que probablemente a nadie más que a mi le interesan: teníamos más de una ruta por día y había que juntarlas, google no permite subir muchos ficheros al mismo tiempo con las rutas, y pone un límite al tamaño de ficheros que se suben... es decir: bastantes problemas.
No poder ver las teclas que uso me está volviendo loco. ¿Dónde está la "M"?
Un enlace directo al mapa acá.
Segundo, estoy haciendo gráficas con los datos crudos de la ruta. Strava ya te da algunas gráficas bonitas pero lo malo es que lo hace para las rutas que hemos guardado (que, como ya dije, están incompletas y partidas). Además, quería ver estadísticas de todo el viaje juntas y no estar buscando día por día.
Por ahora no he logrado mucho. Es aquí donde culpo a la librería pandas de python y a la implementación que tienen de ggplot: todo parece "casi igual" a R excepto en millones de casos. Y eso me ha hecho tener 30 pestañas abiertas para poder entender cómo demonios se convierte de formato una columna en una tabla. En serio. Lo único bueno fue encontrar un tema de xkcd.
Cada color más o menos es un día distinto, están ordenados y medidos en distancia. En el eje "y" se tienen los metros "subidos". Es decir, cuando bajamos no cuento nada y cuando subimos cuento lo que subimos. He suavizado un poco las curvas
También tengo una tabla bastante sencilla que resume algunas estadísticas diarias:
dateuphill (m)time (s)distance (km)time (h)dist_cum (m)
2017-08-30504.43680796.0410.2296.04
2017-08-31315.42325354.406.46150.45
2017-09-01419.11757471.914.88222.36
2017-09-021211.036973112.3510.27334.72
2017-09-031128.93266299.729.07434.44
2017-09-04407.61598463.374.44497.82
2017-09-05328.61676458.824.66556.64
2017-09-06508.73410787.569.47644.21
2017-09-07451.21018249.112.83693.33
2017-09-091017.232074130.598.91823.92
2017-09-10824.329768111.798.27935.72
2017-09-111156.731356110.678.711046.39
2017-09-12348.81167027.253.241073.65
2017-09-13662.531994110.998.891184.64
2017-09-14657.836910109.9210.251294.56
2017-09-1531.411242.700.311297.27
Tanto en la gráfica como en la tabla se pueden ver como alguns días fueron bastante violentos. De hecho hubieron dos "legendarios" de alrededor de 110 km con más de 1 kilómetro de subidas.
Y eso es todo por ahora. Cuando se me ocurra alguna otra gráfica interesante (y encuentre otras millones de horas para pelearme con los lenguajes de programación correspondientes), subiré otro post.

1 comentario:

  1. Franco, me tienes que dar todo lo que quieres poner de una vez porque ya están calculando las páginas para imprimir el blog.

    ResponderEliminar