Do not speak Spanish? Read this post in English.

Martes, 14 d junio d 2016.

Analisis de desviación de los datos de sesión ¿Necesito analizar a nivel de usuario?

Empezamos con el primer post de la serie dedicada a metodologías de análisis del usuario. Empezamos por el principio y en este caso nuestro objetivo será el de responder a un pregunta simple: ¿Merece la pena que realice en mis negocios este tipo de análisis? ¿realmente no me basta con los informes que ya tengo? La respuesta a esta pregunta como siempre es: "Depende", hay muchos negocios y generalizar en analítica es pecado, tabú, estúpido y además está mal.

Lo que vamos a hacer es decribir una metodología sencilla con la que realizar un primer acercamiento a los datos de una web para decidir si tiene sentido o no sentido que nos preocupemos de la parte de los datos que perdemos por analizar a la vieja usanza (a nivel de sesiones). Para ello miraremos varios detalles sobre nuestros datos y conversiones y estimaremos una desviación de la credibildiad de los datos de sesión. Con ella será con la que decidamos que hacer.

En el complejo mundo del usuario solos los frikis quieren meterse

Partamos de una realidad: a nadie le gusta trabajar por que si. Te sientes muy tonto cuando terminas un análisis al detalle cuyas conclusiones no te aportan absolutamente nada que no supieses. Por ese motivo conviene perder un poco de tiempo garantizando que no vamos a perder muchísimo más. Al final probar cosas nuevas mola -al menos a los analistas nos suele molar- y es altamente recomendable hacer un ejercicio de análisis de este tipo solo para interiorizar y saber lo que te puede ofrecer, pero lo dicho, cuando no va a aportarnos nada debemos saberlo de antemano.

Así que vamos a ver una serie de indicadores que nos hablarán de la necesidad real que tiene nuestro negocio de trabajar en este mundo de usuarios. Si vemos que estos indicadores no son favorables tenemos que asumirlo y olvidarnos del análisis de usuarios en nuestro negocio.

Entendiendo la métrica de usuario en Google Analytics

Un detalle que tenemos que entender es cómo se hace el calculo de la métrica de usarios en GA (y en muchos otros sistemas). Estamos acostumbrados a que todas nuestras métricas y mediciones sean absolutas y por lo tanto nos sorprendemos cuando nos encontramos una métrica que dependiendo de cómo la consultemos pueda tener un valor u otro... y este es justo el caso de los usuarios.

¿Por qué pueden variar su valor?

Básicamente porque es una métrica que se calcula en función del periodo de tiempo que seleccionemos. Imaginemos el siguiente caso:

- Un usuario realiza una sesión el día 1 del mes.
- Realiza una segunda sesión el día 3.
- Y una tercera sesión el día 6 en la cual compra.

Tenemos muy claro que se trata de 3 sesiones y una conversión. Pero, ¿cuantos usuarios son? La lógica nos dice que se trata de un solo usuario pero como os decía analítics nos lo presentará según las fechas que le consultemos. ALgunos ejemplos:

  • Si le pido a GA, cuantos usuarios hay desde el día 1 hasta el 6 del mes me dirá que solo hay 1. Genial.
  • Si le pido cuantos había del 1 al 3. Me dirá que también hay solo 1, lo cual tambiés es cierto, pero se trata ahora de un usuario con solo 2 sesiones en vez de tres.
  • Ahora si le pido cuantos usuarios hubo del dia 1 al 5 y cuantos del 6 al 10 para sumarlos, me dirá que hay 1 con 2 sesiones del 1 al 5. Y 1 con 1 sesión del 6 al 10. Cuando yo lo sume veré que son 2 usuarios lo cual no es cierto... Aqui mucha gente comete errores al sacar datos parciales y sumarlos.
  • También si le pido los datos por una dimensión basada en fechas me devolverá por ese criterio cada. Dato. Es decir, si le pido a analytics que me diga los usuarios por día. Me dirá:
    >> Día 1: 1
    >> Día 2: 0
    >> Día 3: 1
    >> Día 4: 0
    >> Día 5: 0
    >> Día 6: 1
    >> Día 7: 0
    >> Total usuarios: 1

Es raro, ¿verdad? Pero es que es cierto, tenemos 1 usuario para esos días pero el total de usuarios suma 1 :)

En consecuencia cuando yo veo gráficas de evolución por días o por semanas en Analytics los datos no coincidirán con los totales que veo al unificar usuarios que aparecen en varios días por separado. y a mayor diferencia entre el tamaño de los grupos de fechas mayor será esta diferencia.

Aqui os dejo una captura donde vemos que el total de usuarios en una consulta de 5 días no coincide con la suma de los usuarios por día:
diferencias-usuarios-por-dia

Por este tipo de pecularidades es preferible trabajar con fechas amplias cuando hablemos de usuarios, pues cuanto menor sea el rango de fechas seleccionados más usuarios parciales estaremos cogiendo.

Primer indicador: Sesiones por usuario

El es el indicador más fácil al que podemos acceder y surge de la simple división entre sesiones y usuarios. Una métrica que nos dirá cuantas sesiones provocan de media los usuarios en nuestro site.

Para muchos la forma más sencilla de acceder a este indicador será ir Google Analytics a sus informes de Público >> Visión general y realizar la división a mano.

Es un cálculo bastante directo y sencillo al alcance de todo el mundo.

Sin embargo hay que saber que en realidad esta es una métrica nativa de Google Analytics llamada "Sesiones por usuario" y por lo tanto podemos usarla en nuestros informes personalizados:

metrica-sesiones-por-usaurio

Esto tiene varias ventajas, a parte de evitarnos hacer una división a mano, claro. Principalmente disponer esta métrica nos aporta dos ventajas:

- 1. Nos permite ver cómodamente la evolución de la misma en el tiempo con las típicas gráficas de evolución de GA.
- 2. Permite poder cruzarla con distintas dimensiones de analítytics para empezar a intuir como es la revisita según distintos criterios: Países, dispositivos, Canales de captación, etc.

informe-metricas-por-usuario
(nótese que el problema que decíamos que existía con los usuarios al separar por días sigue aquí vigente y por ejemplo en esta captura si miramos la gráfica por días vemos que el valor e sesiones/usurio/dia se mantiene de forma estable en unas 1,3 sesiones)

¿Y para que quiero yo saber este dato?

Las sesiones por usuario nos indican cuantas sesiones hacen los usuarios pero también que ratio de información incompleta tengo en un análisis por sesiones. Por lo general sabemos que el análisis a nivel de usuario en métricas globales de sesiones/usuario que queden por debajo del 1,2 es probable que no mezcan la pena. Estamos hablando de negocios en los que la reincidencia de un usuario es muy baja y casi todas las métricas se conforman a nivel de sesión.

Por encima de estos valores ya entramos en la zona interpretable, valores más altos suponen una desviación mayor en el análisis de sesiones y los más bajos una desviación menor. Así un ratio de de 2,00 sesiones/usuario nos indicaría que la mitad de los datos de conversión y funnels no son del todo correctos, pues esos usuarios que nos aparecen en cierto paso del embudo de conversión en realidad tuvieron otra visita en la que siguieron evolucionando. Nos queda claro, pero es quizas un poco abstracto. Asi que esto nos lleva a nuestro segundo indicador.

Segundo indicador: Desviación directa de los informes de sesión

En base al anterior indicador vamos a crear otro un poco más descriptivo. Decíamos que a mayor número de sesiones por usuario más "incorrectos" son nuestros datos a nivel de sesión. Vamos por lo tanto a calcular el ratio de desviación de la realidad que sufren nuestros informes generales, al menos para conocerlo.

Este ratio tiene que decirnos en que porcentaje la información que vemos puede no ser del todo correcta. Sería algo parecido al muestreo, estadisticamente podemos trabajar sabiendo que esta desviación existe y sacar conclusiones pero no podemos obviar que esta desviación existe y que a niveles muy altos puede hacernos tomar conclusiones erróneas.

Este cálculo es tan simple como

  • ( (sesiones - usuarios) / sesiones ) x 100

Y no, no es una métrica que nos ofrezca analytics de forma nativa. pero si que podríamso si quisiésemos crearla con las métricas calculadas.

Por ejemplo. Tenemos 200 sesiones y 100 usuarios. Esto nos da 2,00 sesiones por usuario y una desviación de los informes de sesión de un 50%...

( (sesiones - usuarios) / sesiones ) x 100
= ( ( 200 - 100 ) / 200 ) x 100
= ( 100 / 200 ) x 100
= 0,5 x 100
= 50 %

Así que en este caso podemos decir que la desviación de nuestros informes es del 50%, es un caso exagerado que permite trabajar a nivel de sesión pero solo si nuestro volumen de visitas es grande y no vamos a sacar informes muy granulares.

¿Existe una desviación de los datos de sesión normal?

Realmente no existe, depende de demasiados factores como el tipo de producto, el precio y los métodos de pago, el tipo de campañas que hagamos, la notoriedad y reputación de la marca, etc. Como extremos puedo hablaros de que las webs de captación de registros (leads) en base a landings suelen estar por de un 20% o incluso 5% de desviación, mientras que webs de productos caros y complejos como pueden ser paquetes vacacionales o excursiones pueden incluso pasar ese 50% del que hablábamos antes prácticamente obligádnote a trabajar a nivel de usuario.

Tercer indicador: tamaño del proceso de decisión del usuario

Y cambiamos de tercio totalmetne de tercio para irnos a los informes de embudos multicanal y centrarnos ahora un poco en nuestras conversiones. Estos informes son de los pocos informes de Google Analytics que se orientan totalmetne al usuario. En ellos podemos ver como los datos de procedencia de las visitas (normalemnte canales de captación) se van sucediendo para terminar consiguiendo las conversiones.

No vamos a abordar aqui todos los informes de este tipo, para eso tenemos otro post dedicado al análisis de conversiones multicanal. Recordemos que solo estamos intentando evaluar la necesidad real que tenemos de hacer análisis a nivel de usuario.

Lo primero al usar estos informes es seleccionar las conversiones que queremos observar. Por defecto (y por desgracia) en estos informes se autoseleccionan todos los objetivos de GA + conversiones de ecommerce + objetivos de dobleclick (si los tenemos integrados con GAP). Esto no nos conviene porque mezclamos churras con merinas y terminamos no viendo nada. Lo suyo es empezar seleccionado el macroobjetivo principal de nuestro negocio para más adelante, si queremos, analizar la conversión de otros objetivos.

MCF-seleccionar-conversion

Una vez tenemos seleccionada la conversión a seguir, es el momento de evaluar la longitud del proceso de decisión del usuario, es decir, cuan largo es este proceso.

Para ello tenemos dos posibles visiones:

1) Medirla en días desde la primera visita.
2) O en Sesiones totales necesarias para convertir.

tamaño-proceso-decisión

Medir en días es quizás más cercano a nuestra realidad. Nos va a ser más facil comunicar que el usuario se toma de media 2 semanas para decidir reservar un apartamento que hablar a alguien no muy metido en el online de sesiones.

Por otro lado, para mi al menos, tiene más sentido hablar de sesiones si las entendemos como distintas aproximaciones que hace el usuario a la web antes de decidirse. Y es que podemos encontrarnos con procesos rapidos pero complejos en los que un usuario visita una oferta 4 veces en solo 2 días y por el contrario procesos de maduración muy lenta pero con poca consulta en los que un usuario necesite varias semanas para decidirse pero apenas acceda 2 o 3 veces a la web en ese tiempo. Son circunstancias distintas asi que en realidad no podemos obviar ninguno de los dos valores (al menos en una primera aproximación).

Aqui nos contraremos con el problema de que los datos vienen muy desglosados, por numero de días o de sesiones (según el informe que miremos) y eso lo dispersa mucho. Así que tenemos que saber que queremos mirar:

Lo primero: porcentaje de conversiones directas.

Es decir, en el día 0 o la sesión 1. este el mejor indicador que tendremos de que porcentaje de nuestros ratios de conversión y funnels a nivel de sesión son exactos. Si tenemos por ejemplo solo un 20% de conversiones en primera sesión, significa que en nuestros funnels solo el 20% de los datos son lo que creemos, el resto de ratios estan llenos de visitas previas que hacen bajar los porcentajes de conversión.

Aquí consideraremos los datos por encima del 50% como entornos donde el análisis de conversión a nivel de sesión sigue teniendo sentido y por debajo del 20% como conversiones con un mix de sesiones demasiado arriesgado como para creernos nuestros funnels.

Una vez hemos hecho este ejercicio con nuestra conversión principal podemos cambiando la selección de conversión analizada ocuparnos de ver cada uno de los objetivos que tenemos configurados. Si hemos sido listos y hemos dado de alta cada uno de los pasos de nuestro embudo como objetivos podremos ver para cada paso en que porcentaje se alcanza este en primera visita.

Otro dato interesante: la mediana del tamaño del proceso de decisión

Es decir, del total de conversiones ordenadas por su distancia cual es la distancia de la conversión que se encuentra en el punto medio.

Esto podemos hacerlo llevando estos datos a excel, o calculandolo a mano, que no es tan dificil. Para hacerlo a mano necesitamos encontrar el punto medio, que será el total de conversiones/2.

En el gráfico que indicabamos antes:
tamaño-proceso-decisión

Tenemos un total de 643 conversiones, asi que la mediana se encuentra en la conversión 322.

Recorremos los datos de menor a mayor hasta encontrarla.

643 conversiones / 2 = 332 conversiones
332 - 235 en primera sesión = 97
97 - 145 en segunda sesión = -48

Asi que la mediana está en 2 sesiones para convertir

Esta mediana es otra referencia que nos dice por lo general cuantas conversiones suelen hacer falta para convertir.

Una vez tenemos esta mediana para nuestro macroobjetivo tambien podemos sacarla para otros objeitvos que tengamos viendo para cada paso del embudo de conversión cuanto hace falta para alcanzarlo.

Y por ultimo, agrupaciones por distancias

Por ultimo si queremos dar una visión más completa podemos dividir porcentajes de conversión por distancias de conversion (en tiempo o sesiones) pero en ese caso es preferible que hagamos nuestros propias agrupaciones.

A mi personalmente me funciona bastante bien crear grupos que con un tamaño que crece exponencialmetne, entendiendo que a mayor distancia de conversión en realidad también las diferencias están mas dialtadas. Asi por lo tanto los grupos de conversiones según sesiones con un sistema así serían:

- Conversión en 1 visita
- En 2-3 visitas
- En 4-7 visitas
- En 8-15 visitas
etc...

Con este tipo de datos podemos segmentar un poco mejor los distintos tipos de procesos decisión a sabiendas de que no hay solo un patrón para tomar decisiones.

Conclusiones

Con estos 3 tipos de indicadores la decisión de si lanzarnos a realizar análisis a nivel de usuario o no se vuelve mucho más sencilla.

Las sesiones por usuario son un primer y rapidísimo indicador sobre la necesidad que tenemos de cambiar nuestra perspectiva. El porcentaje de desviación de los informes de sesión terminarán de hacernos comprender la gravedad del problema que tenemos con los informes que estamos consumiendo al tiempo que nos permitirá explicar de forma comprensible que tenemos controlado hasta que punto podemos fiarnos de nuestros datos. Por ultimo un análisis del tamaño del proceso de decisión nos permitirá llevar esta problemática al terreno que más nos interesa: cómo afectan estas desviaciones a mi conversión y por qué. Este último punto será el que nos permita terminar de dibujar nuestro escenario.

¿qué decisión debo tomar? Ahí está nuestro trabajo, saber transmitir si tenemos o no un problema por realizar análisis orientados a sesión. A partir de aquí lo que hay que sopesar es: "cuanto me cuesta resolver la situación" vs "cuanto me afecta no hacerlo" y tomar una decisión.

En el caso de que los datos te lleven a meterte en el mundo del usuario, bienvenido seas. Esta serie de posts es para ti, te invito a seguir leyendo estos distintos capítulos para ir viendo como resolver cada problema:



Temas Relacionados: analitica web

Autor:

3 Comentarios para “Analisis de desviación de los datos de sesión ¿Necesito analizar a nivel de usuario?”

  1. ant dice:

    Seria bueno que GA autoclasificase usuarios en funcion de su recencia, sesiones y engagement medio por sesion. Una aproximacion al modelo RFM, que creo que por ahi van los tiros de buena parte del post.

    Gran post! 😉

    • inaki dice:

      Hola Ant. Gracias por comentar de nuevo!

      GA tiene algunas métricas cercanas a lo que comentas que iremos comentando en otros post. Dame un pelin de tiempo a ver si te convence.

      El RFM (o una aproximación a lo que sería una especie de RFM en web) lo tocaremos en el post sobre fidelización y el engagement en el post sobre los primeros pasos del customer Journey. Ahi no se si le has dado una oportunidad a los objetivos automáticos de GA, se parecen mucho a un engagement medido de forma automática aunque a nivel sesión 😉 no es perfecto pero tiene su cosa...

  2. manuel dice:

    Iñaki
    Me ha hecho y me hará reflexionar mucho en mi día a día
    Me ha surgido varias dudas, pero prefiero madurar las ideas que mencionas volviendome a leer el post e identificando los diferentes casos reflejandolos en situaciones reales que actualmente puedo tener e intentaré darte mi punto de vista al respecto
    Gracias por el post, me gusto mucho

Anímate y deja tu comentario

Esto son experimentos, no preguntes ;) prueba metadescription Prueba title