Alternativas sin cookies a Google Analytics

Alternativas sin cookies a Google Analytics

Digo Google Analytics porque es sin duda una de las formas más comunes de medir el tráfico que hay en la web, pero podríamos haber dicho cualquier otro sistema de medición que utilice cookies para diferenciar una sesión de un usuario de otra.

No voy a explicar lo que son las cookies, a estas alturas de la vida, raro es entrar en una web y que no te salga un aviso sobre ellas y tengas que decidir qué cookies quieres y cuáles no. Esto, unido a si aceptas o no que la web te mande notificaciones, los anuncios, la extensión adecuada y precisa para salir bien en el SEO (y que hace que mucha gente alargue sin necesidad cosas que podrían explicarse en un párrafo), está convirtiendo la web en algo difícil de navegar.

💡
Habrás visto que en esta web no hay aviso de cookies.

Eso, ahí, bien resaltado. No es que no haya cookies, ojo, que al final cookie técnica de sesión casi cualquier servidor web te pondrá, pero no hay ninguna cookie que tenga relación con datos personales, marketing, publicidad, etc, que al final son las que el usuario tiene que poder bloquear.

Nos preocupamos por tu privacidad

Habrás visto esto en muchos sitios con el aviso de las cookies. Quizá hayas pensado que, hombre, que si tanto se preocupan podrían quitarlas y listo, pero en realidad no es tan sencillo y es lo que venimos un poco a explicar hoy aquí, junto con el caso en que sí lo es (este blog por ejemplo) y cómo hacerlo.

Digamos que grosso modo, aparte de las técnicas, hay dos tipos de cookies: las que tienen que ver con analítica pura y dura, queremos saber cuánta gente visita nuestra web, desde dónde, con qué tipo de dispositivos, y las que están asociadas a marketing publicitario, normalmente porque estamos pagando anuncios en distintas redes para atraer tráfico a nuestra web y necesitamos saber qué anuncio ha funcionado mejor, cuál de esas redes publicitarias me trae más tráfico, el coste de conversión entre lo que pagamos por usuario que viene a nuestra web y lo que ese usuario se gasta, etc.

Son estas últimas, las publicitarias, las que son más problemáticas de cara a dejar de tener cookies en nuestro sistema, ya que dependemos de redes de terceros en los que ponemos publicidad, y estos terceros van a poner cookies sí o sí. Es decir, en caso de pagar por tráfico dirigido a nuestra web, es casi inevitable necesitar cookies a día de hoy (hay cierto movimiento en la línea de dejar de tener esto también, con server-side tagging, pero esto da para otro artículo otro día).

Soluciones sin cookies para analítica

Como decía antes, en el caso de necesitar solo saber cuánta gente visita nuestra web, el tiempo que pasa haciéndolo, qué páginas son las más vistas, desde qué dispositivos (si tablet, móvil o desktop), etc, hay bastantes soluciones en el mercado ya que funcionan sin Cookies, por dar un par, Matomo o Plausible.

Todas estas soluciones funcionan de forma similar: generan una huella del dispositivo que está accediendo, basada en tipo de dispositivo, tamaño de pantalla, versión del navegador y otro montón de parámetros, que, combinados, determinan con bastante exactitud que ese dispositivo es "único". Esto lo hace sin necesidad de ponerte una cookie para acordarse de que tú eres tú, ya que la huella la genera en base a parámetros que tu propio navegador le pasa en la petición y que, en el caso de mantenerse iguales, generarán siempre la misma huella. Puedes ver una prueba de tecnologías similares para ver lo único que eres en esta web: AmIunique Si te interesan los temas de javascript fingerprinting, puedes echar un ojo a esta librería.

Soluciones como Plausible, que es lo que usamos nosotros, lo que hacen es mostrar luego información agregada, en ningún caso se guarda información privada relativa al usuario ni que permita identificarlo. Esto hace que Plausible sea compatible con las leyes GDPR, CCPA y PECR. Por otro lado, Plausible es open-source, puedes ver el código fuente completo de la solución aquí.

Cómo puedes usar Plausible en tu web

Básicamente hay dos formas, pagando a Plausible en planes que empiezan en 9$ al mes o, al ser Plausible open-source, instalando Plausible en tu propia infraestructura. A casi todas luces, merece la pena lo primero, en un servicio auto-gestionado, te olvidas de todo. Es un servicio de pago porque jamás van a vender ni usar tus datos y claro, tienen que vivir de algo. En las alternativas gratuitas, como se suele decir, si no pagas por el producto es que el producto eres tú.

En nuestro caso lo hemos montado en nuestra infraestructura, no por un tema económico porque, como decía al final a 9$ al mes a poco que tardes en montarlo ya costaría mucho tiempo amortizar el tiempo dedicado, pero nos gusta más cacharrear que a un niño un caramelo y ese aprendizaje que nos llevamos. Hay un tutorial muy bueno en la propia documentación de Plausible sobre self-hosting. Necesitas una máquina con docker o puedes montarlo en un Cloud Run pero para esto último necesitarías contenedores distintos para las tres piezas que componen Plausible. Para una máquina, Plausible recomienda 4Gb de ram, pero esto son casos de webs con bastante tráfico, nosotros hemos probado incluso con la máquina más pequeña que puedes montar en Google Cloud y funciona correctamente.

Un punto importante, que en la documentación se comenta como opcional pero no nos lo parece, es montar el acceso por https y hacerlo exclusivamente por ahí. Aparte de la seguridad, si la URL de tu analítica es por http y la de tu web por https, los navegadores más modernos van a marcar la página como no segura por estar sirviendo contenido mixto (mixed-content en inglés). Básicamente, lo que quiere decir esto es que estás pidiendo acceso a una web segura, por https, pero esa web está devolviendo parte de su contenido (en este caso los enlaces a los scripts que miden la analítica) por un acceso no seguro. En resumen, si tu web tiene acceso seguro tienes que asegurarte de que todo, imágenes, css's, javascripts, etc, se devuelvan por https.

En la doc tienes las dos opciones para montar el acceso seguro, bien a través de CloudFlare, o bien sumando un nuevo contenedor que haga de proxy inverso a los que utiliza Plausible, en este caso Caddy Gen. Luego lo siguiente sería apuntar un subdominio por ejemplo a la máquina de analítica, cambiar las configuraciones en los scripts de Plausible con el nombre del subdominio y estaría funcionando.

Una instalación para todas tus webs

En el caso de meterlo en tu propia infraestructura, la misma instalación de Plausible te sirve para múltiples webs, tan solo hay que entrar al panel de Administración, dar una nueva web de alta y Plausible te da el código que hay que añadir en el encabezado de dicha web.

Ya estaría, tengo que decir que nosotros en 2-3 horas lo teníamos funcionando y usándolo en este blog como conejillo de indias. Como siempre, cualquier duda, sugerencia o comentario, por hola@softspring.es o por alguna de nuestras redes sociales. Gracias por leernos hasta aquí!