Esta entrada pretende ser solo un pequeño apunte para resolver las dudas en un punto donde la gente suele confundirse a la hora de crear sus informes personalizados y segmentaciones varias. Esto sucede sobretodo cuando pasamos a usar la descarga de datos mediante la API de Google Analytics para crear informes más ricos y enfocados a negocio, aunque al tratarse de un error de concepto puede sucederle a cualquiera.
Y es que estas dos herramientas parecen lo mismo a simple vista, pero en la práctica, al usarlas, la información que extraemos de Google Analytics puede ser totalmente falsa si no tenemos en cuenta sus peculiaridades y podemos acabar presentando informes que poco tienen que ver con la realidad de nuestro tráfico.
Partamos desde el principio: ¿que son los filtros y que son los segmentos avanzados?
Google Analytics es un sistema que se basa en dimensiones (formas de clasificar los datos por distintos criterios en grupos) y métricas (datos numéricos que realmente se miden, suman, etc.). Cuando nosotros vemos un informe o extraemos datos de Google Analytics siempre lo hacemos bajo este orden: dividimos los datos en las dimensiones demandadas y por lo tanto acabamos viendo una tabla con dos ejes: las dimensiones y las métricas seleccionadas.
En nuestra selección de datos de nuestro perfil podemos decidir, además, que no queremos ver todos los datos de tráfico acumulados, sino solo una porción de los mismos. Para esto existen los filtros y los segmentos que nos van a permitir escoger solo una porción del tráfico deseado.
El sistema en un principio es simple: utilizamos reglas condicionales sobre las propias dimensiones y métricas para seleccionar o desechar una parte del tráfico.
Así podemos por ejemplo escoger ver solo el tráfico orgánico, solo las revisitas, solo el tráfico con más de 2 páginas vistas, etc. Puedes encontrar muchisima documentación e ideas sobre distintas formas de filtrar el tu tráfico para descubrir patrones en el comportamiento de tus usuarios. Y no nos engañemos, realmente la diferenciar entre saber sacarle partido a Google Analytics y ser un mero observador radica fundamentalmente en saber lo que hacemos cuando usamos estas herramientas.
El problema con los filtros y los segmentos
Si todo es tan sencillo y obvio, ¿Donde está el problema?. Pues básicamente en que podría parecer que ambas acciones hacer exactamente lo mimso y cuando trabajamos con nuestros informes muchas veces la gente se decanta por la herramienta que más a mano tiene. Así pues, muchas veces se usan filtros y segmentos creyendo que van al filtrar el tráfico de una forma específica cuando en realidad estan realizando el corte en un lugar que no sospechamos.
El problema está en los filtros por métricas, no en las dimensiones
Cuando creamos un filtro o una segmentación en base a una serie de dimensiones no existe demasiado problema. Al final las propias dimensiones son microsegmentaciones del tráfico por lo que simplemente escogemos algunas de estas microsegmentaciones y las añadimos o desechamos según nuestras necesidades. Esto resulta bastante fácil.
Por ejemplo podemos decidir que queremos solo el tráfico con medio = organic y sabemos que tanto si usamos un filtro como un segmento vamos a ver sólo el tráfico SEO.
Pero cuando la selección tiene que ver con las métricas nos dejamos llevar por el sentido común o por nuestros deseos de lo que queremos que haga la herramienta y esto no siempre es lo más acertado. La herramienta se comporta como ha sido programada y no como nosotros desearíamos que lo estuviese.
Pongamos un caso clásico: Queremos obtener solo el tráfico que ha realizado alguna conversión.
La configuración parece fácil:
- Crearemos una regla por la que
- [Incluir] solo el tráfico con
- [Cumplimiento de Objetivo 1]
- Mayor que [0].
Pero cuando realizamos este filtro nos vienen las sorpresas. No tenemos tantas conversiones… ¿por qué aparece tanto tráfico en nuestros informes? Es decir, podemos ver como muchos de nuestros datos del informe ni siquiera han cambiado y tan solo han desparecido algunos datos del mismo… ¿que falla?
La clave: Las Diferencias entre el filtrado con métricas en filtros y en segmentos
El motivo por el que las cosas no funcionan como queremos es que Google Analytics necesita realizar agrupaciones del tráfico para poder dar respuesta a nuestro filtro. Con las dimensiones lo tenía fácil pues estas agrupaciones o microsegmentaciones ya estaba hechas. Pero con las métricas debe decidir como hacerlo.
Piensa por ejemplo en un filtro sobre la métrica «páginas vistas > 5»: ¿que debe ser filtrado? ¿Las visitas con más de 5 paginas visitas? ¿Los usuarios únicos con más de 5 páginas visitas? ¿Las dimensiones con más de 5 páginas visitas?
Google Analytics necesita realizar estas agrupaciones antes de nada y luego filtra sobre los valores de la métrica en estas para eliminar partes del tráfico. Al final el proceso es el mismo que con las dimensiones, salvo porque esta agrupación debe hacerse antes.
Cuando nosotros creamos un filtro sobre un informe estas agrupaciones quedan marcadas por el propio informe y ahí suele estar el error de comprensión. Si por ejemplo nuestro informe desglosaba todo nuestro tráfico por medios (una de las variables de campaña), y le pedimos que las conversiones del objetivo 1 sean mayores que 1, el informe final nos mosrtará cualquier medio que tenga más de una conversión y no solo el tráfico con conversiones. Esto suele llevarnos a ver casi el mismo informe que si no hubiésemos creado ningún filtro.
En cambio cuando creamos un segmento, la agrupación que se crea es por visitas. Cada visita es evaluada según las normas que indiquemos para ver si se contabiliza en el total de tráfico presentado en el informe o no. Por lo tanto si en lugar de un filtro para incluir el tráfico con conversiones hubiesemos usado un segmento con «objetivos 1 > 0» el resultado si que sería el esperado: El segmento contemplaría solo aquellas visitas con más de 0 conversiones y por lo tanto si que veremos los datos que queremos.
Por lo tanto, la conclusión es que cuando deseamos filtrar el tráfico para generar un informe siempre debemos tener en cuenta, aparte de las propias reglas de filtrado, que si estas usan métricas debemos saber si estas van contemplarse agrupando los datos por visitas o por las propias dimensiones del informe:
- Si queremos eliminar las dimensiones del informe que no cumplen ciertos criterios en sus valores totales usaremos filtros
- Si por el contrario queremos eliminar visitas completas por no cumplir criterios durante su navegación usaremos segmentos
Ejemplo: Aplicando todo esto a las extracciones mediante la API de Google Analytics
Llegados a la API, esto se vuelve una herramienta realmente interesante pues esta nos permite usar segmentos dinámicos. Los segmentos dinámicos son segmentos avanzados declarados en la propia solicitud. Así, para consultas concretas puedo declarar las reglas para filtrar o no el tráfico de la web en el mismo momento que lanzo las consultas y sin necesidad de crear nuevos segmentos avanzados en la herramienta de Google Analytics. Estos datos tendrán menos fiabilidad que los segmentos reales pero por otro lado nos permitirán extracciones a nuestra medida en cualquier momento.
Veamos un caso sencillo:
Quiero extraer a una tabla el tráfico con conversiones provocado por los medios que me traen un minimo de 1000 visitas al mes. No voy a poner el código exacto de como se realizaría la consulta pues cada uno usa su propio sistema pero vendría a ser algo asi:
- Seleccionamos un mes en el rango de fechas
- Escogemos como dimensión ga:medium
- Escogemos como métricas ga:visits y ga:goal1Completions
- Como segmento solicitamos el segmento dinámico donde ga:goal10Completions > 0
- Como filtro solicitamos que ga:visits sea mayor que 1000
Ya tenemos nuestra consulta perfectamente preparada.
– Como hemos puesto la comprobación de objetivos como segmento, esta se hará sobre las visitas y por lo tanto solo contemplará visitas con al menos una conversión.
– Y como hemos puesto la comprobación como filtro esta se hará sobre las dimensiones seleccionadas en el informe, así que tendrá en cuenta aquellos medios con más de 1000 visitas.
¿Y los filtros de perfil?
Los filtros de perfil son una historia distinta. Yo creo que se prestan mucho menos a confusión.
Aparte de que no pueden crearse retroactivamente (si no los creaste con antelación no funcionan) estos actuan sobre la captación de cada dato de Analytics. Es decir, cada página vista que se realiza se evalua con los criterios de los filtros y si pasa los filtros esta información termina formando parte de los informes y si no no. Este es el motivo por el que muchas veces no encontramos la opción que deseamos a la hora de usar filtros: hay criterios que simplemente no son posibles.
Cuenta tu caso o tu problema
Para terminar el post simplemente pediros a los que hayais vivido o estéis viviendo experiencias relacionadas con este tema que paseis por los comentarios. Los post siempre se quedan en lo genérico y siempre es bueno saber de casos reales.
7 respuestas a “Google Analytics: Diferencias entre filtros y segmentos avanzados”
Hola
Creo que el principal problema de la analytica web, es pensar que la herramienta es inteligente. Pasa como en la programación… esa inteligencia se la tenemos que dotar, y varia en función de los objetivos de cada web.
Y por eso es importante segmentar, evitar mostrar ‘solo’ datos sin ninguna inteligencia sino ‘tendencias’ que nos hagan reflexionar, y si le damos valor es mucho más fácil de ver su utilidad, y convencer a los que solo ven € / $.
Y para «programar» google analytics pasa por comprender no solo el funcionamiento de la herramienta y sus particularidades, sino por comprender los objetivos de la web y cuales son los objetivos reales, y no perdernos en un mar de datos que no llevan a ningún sitio.
Gracias por el artículo.
Saludos
¡Muy grande! 😉
Hola Iñaki, verdaderamente impecable!!!
Me he topado por casualidad con este post y no he podido dejar de leerlo, incluso, más de una vez…:P
Lo cierto es que conceptualmente, a veces nos olvidamos que tanto la analítica web como sus propias herramientas, sólo sirven para obtener comportamientos, ya sea de usuarios, fuentes, medios, contenido, etc.
Vivimos pendientes de la «cantidad» y dejamos de lado la «tendencia», creo que allí es dónde muchas veces nos perdemos…
Un saludo!
Iñaki, sabes si los filtros de IP son retroactivos? Es decir, si lo puse hace un mes a mi pagina me arregla los filtros años atras?
No Juan, en google analytics nada es retroactivo. Lo que se capturó ahí se queda… 🙁
Buenas Inaki,
He llegado a tu post, ya que estoy en una casuistica parecida y como comentas de que si hemos vivido situaciones parecidas, pues alla voy
Intentare explicarme bien 🙂
Cuando se llama a la API a traves de query explorer o supermetrics (en mi caso es este), si tu utilizas la dimension ga:channelGrouping ves lo mismo que si te vas a la interfaz de GA Adquision–>Todo Trafico–>Canales, hasta ahi todo bien
Siguiente paso que di. Ahora imagenimos que quiere hacer un canal personalizado, pues voy a la parte de administracion y a a seccion de canales personalizados y lo creo. Pero cual fue la sorpresa que tanto de query explorer como supermetrics la api de Google no te permite acceder a este nueva canal personalizado, solo te deja acceder al predefinido mediante la dimension ga:channelGrouping (Yo no lo conseguido)
Siguiente cosa que pense. Pienso, modifico el predefinido como quiero y ya esta. Pues esas modificaciones las puedes ver desde la interfaz pero no desde la llamadas api
Siguiente cosa que pense. Pues ya esta hago un segmento por canal que sea exactamente igual que cada uno uno de los canales del Informe canal predeterminado de la parte de Administracion
Aqui viene mi duda existencial, si miro en GA por canales y comparo con la llamada a API que como filtro que he puesto el segmento (uno por canal) siempre me encuentro con diferencias en los datos y no se porque es, ya que se supone debería ser lo mismo
Como segmentos, entra en juego el muestreo? O que puede estar pasando?
Gracias
Buenas Manuel, lo que te pasa es normal. A ver si te aclaró cada caso.
1- los canales personalizados no son parte de la bbdd normal de ga, sino de la de embudos multicanal. Así que tendrías que consultarlo con la API mcf y ahí verás sólo las métricas y dimensiones de mcf.
2- los canales por defecto no son retroactivos por lo que al cambiarlos afectas a los datos pero sólo a los que capturas a partir del día siguiente que los cambias. Por eso nada mas cambiarlos no ves nada.
3 – con segmentos sacas prácticamente lo que quieres pero con algunas diferencias…
– por un lado necesitas uma consulta para cada dato a extraer. Eso veo que ya lo sabias.
– por otro tienes el muestreo que en los canales casi no te afectará pero en segmentos si te afectará mucho más por lo que los datos no coincidirán al 100%
– por último los canales son excluyentes y los segmentos no. Es decir si alguna visita podría caer por la definición realizada en 2 canales en los canales se la quedará el que estuviese definido antes y en el segundo no aparecerá. En cambio en segmentos verás esa visita en ambas consultas contemplada.
Con eso creó que se explica lo que te esta pasando.
Yo de ti me quedaba con los segmentos y asumía la desviación que seguro que estadísticamente no tiene importancia.
Suerte!