Fuentes de tráfico en Google Analytics: el flujo de adquisición
Una vez que colocamos el seguimiento de Google Analytics en un sitio web (ya sea vía código o GTM), cada vez que se produce un hit o interacción por parte del usuario, se envía y procesa información en los servidores de Google Analytics, donde es almacenada para ser consultada desde nuestra interfaz de GA, la API de informes, etc. Dicha información es mandada como parámetros de URL y estructurada de la siguiente manera (podemos verlo en Tag Assistant por ejemplo).
No es necesario conocer todo el detalle técnico, pero sí podemos observar de forma sencilla cómo la información se manda a Google Analytics en cada paso.
Para ver esto, haz click en Tag Assistant / Etiqueta de Google Analytics / Hit que nos interese / URLs / Formato tabla, es decir:
El listado de todos los parámetros que es posible enviar en las URLs podemos verlo en este link: Protocolo de medición. Este mismo protocolo es usado para enviar hits a Analytics desde entornos distintos al sitio web (ej. plataformas de Call Centers, tiendas físicas, etc.). Y por desgracia el que se usa en muchos casos para el spam referral… (Artículo relacionado: aquí una solución antispam: cómo ignorar los hits no enviados por ti)
Como mínimo cada hit ha de incluir estos datos:
Como contenido relacionado para ampliar información, también contamos con esta referencia: Campos para configurar. Esta, en resumidas cuentas, nos dice qué datos pueden ser establecidos a medida desde el envío del hit vía código o GTM. Ambas listas son muy similares pero no idénticas.
En este post nos vamos a centrar concreta y únicamente en cómo Google envía y determina la fuente y el medio de una visita (y resto de datos de campaña), explicado paso a paso.
¿Cómo determina Google Analytics la fuente y el medio de una visita?
(Fuente e imagen: https://support.google.com/analytics/answer/6205762)
Los valores de procedencia de la sesión se envían en los datos de campaña y fuente de tráfico, se procesan de acuerdo a la lógica de Google Analytics y de acuerdo a ésta se almacenan en las tablas y se muestra en los informes.
Al igual que nosotros activamente en las agrupaciones de canales podemos modificar y revisar la lógica o algoritmo seguido para el reparto de sesiones entre canales, de acuerdo a una serie de reglas; Google Analytics internamente también sigue una serie de pasos para determinar los valores o fuentes de adquisición para cada sesión realizada.
Como en todo en la vida, se deben marcar unos patrones de conducta y seguirlos, y a la vez crear unas etiquetas para denominar e identificar las cosas, sin más. Pues bien, las exclusiones de referencia entran dentro de toda esta lógica, veamos en qué paso y de qué modo afectan. Igualmente, hay otros componentes del flujo que también se pueden determinar desde el propio administrador de Google Analytics.
Para ello, detengámonos un momento a revisar el flujo para determinar la procedencia de una sesión de Google Analytics, paso a paso. Este tutorial de Google Analytics me parece clave para tener unas bases sólidas en cuanto a fuentes de adquisición en Analytics.
1. Lo primero es lo primero :D. Antes de nada, GA verifica si el envío del hit* lleva aparejados los ID de clic publicitario (parámetros gclid o gclsrc). Si es así se adjudica la sesión, a sus propias campañas de publicidad, realizadas vía AdWords o DoubleClick. Todo queda en casa y para de contar. Si es así, extrae de algún modo todas las dimensiones relacionadas (gracias al enlace Analytics – AdWords): fuente, medio, campaña, contenido, término / palabra clave y otras relacionadas con costes.
2. Si no existen IDs de publicidad de Google, entonces pasamos a comprobar que el hit no lleve asociados de origen unos parámetros de campaña personalizados (campaingSource -cs-, campaignMedium -cm-…). Estos parámetros también se pueden pasar en el propio hit de GA —al configurar el código o GTM—. Ojo que no nos referimos aún a parámetros de URL (etiquetado), sino parámetros del protocolo de medición o campos de configuración definidos “a mano” por algo.
*Veamos cómo se establecerían estos campos en GTM:
3. A continuación, se pasa a comprobar la URL de destino (documentLocation o dl) para verificar si contiene parámetros de etiquetado manual de enlaces (utm_).
4. En caso contrario, accedemos a la lógica de “reparto” de tráfico conforme a la propia información de fuentes de tráfico (documentReferrer o dr incluido en el hit). Es aquí donde podemos meter más mano para personalizar. Concretamente todos los puntos resaltados en oscuro se pueden configurar desde el Admin de Google Analytics:
4.1. Como primer paso, se contrasta (en caso de que exista) el referrer frente a la lista de motores de búsqueda conocidos. Y si es así se manda a “buscador.com” / organic. Estos motores los podemos completar en el Admin de GA con “Fuentes de búsqueda orgánica”. Para mí, la lástima es que esto sea a nivel individual, lo que es poco operativo, molaría hacer un listado a nivel “global”, entre todos. Además, también podemos decidir en Admin si queremos que algún término de búsqueda pase a ser ignorado de modo que pase a engordar más nuestro tráfico directo (nombre de marca por ej.).
4.2. Si no es un buscador, pasamos al siguiente y último paso. Es aquí donde miramos si el dominio referrer está en la lista de exclusión de referencia. Y si no lo está, extraemos la información (fuente, medio, campaña, etc. del referrer).
4.3 Si está en la lista de exclusión de referencia (o directamente viene con un referrer vacío), solo nos queda una comprobación más antes de mandarlo a tráfico directo: que no haya datos de adquisición previos en la cookie de campaña (ya que si los hay, tienen prioridad y se utilizan durante su periodo de 6 meses de vigencia —timeout period, también configurable—, hasta que sean sobrescritos por otra campaña* diferente o caduquen).
*Aquí con campaña Google se refiere a cualquier info de adquisición recogida, cualquier dominio de referencia existente (sea campaña de pago o no).
Cómo se define una sesión en Analytics
Por tanto, es fundamental saber que cada visita o sesión siempre va a llegar asociado una única campaña (a la cual luego podremos atribuir la conversión, en caso de que se produzca). Si cambia cualquier UTM o campo de campaña, se generará automáticamente nueva sesión. Solo hay una excepción a esta norma, que se produce cuando utilizamos la función de Exclusiones de referencia de Google Analytics, precisamente para poder establecer excepciones a esto y forzar que aunque salgamos a otro dominio y volvamos la sesión continúe intacta.
Si nos preguntan en qué consiste una sesión de Google Analytics, lo más común es oír la típica explicación del conjunto de interacciones o hits (páginas vistas, eventos, etc.) que el usuario realiza desde que llega a un sitio web hasta que se va y está inactivo durante un plazo de 30 minutos. Por tanto, a veces parece que el único y principal motivo para que una sesión o visita finalice, son estos famosos 30 minutos de inactividad, ¿no? Pero como ya hemos visto no es el único…
Algunos posibles motivos para que finalice una sesión y se inicie una nueva (en caso de seguir navegando):
- Inactividad durante 30 minutos
- Cambio de fuente / medio /… (información de campaña)
- Cambio de día
- Borrado o pérdida de cookies (por ello en seguimiento multidominio también necesitamos “decorar” los links y forms que provocan cambios de hostname, para que la cookie se comparta)
- Utilización del campo para configurar “sessionControl” en algún hit del usuario
- …
Otra lectura y conclusión fundamental de todo esto: aunque sabemos que está ya muy claro, aún lo vemos en más ocasiones de las esperadas –>> NUNCA nunca nunca nunca utilizaremos parámetros UTM para etiquetar enlaces internos (dentro del propio seguimiento), pues si lo hacemos cambiaremos de sesión y perderemos las fuentes de tráfico originales, con lo que diremos adiós a una correcta atribución de conversiones.
BONUS TRACK
- A pesar de que Google Analytics tenga sus lógicas bien planteadas de base, a veces ocurren imprevistos y puede ocurrir que aparezcan datos extraños o erróneos en los informes (pérdida de una referencia, error de etiquetado, …), por ello, es muy recomendable utilizar dimensiones personalizadas o grupos de contenido “de respaldo” para URL (completa con parámetros) y Referrer. Mira en este tutorial cómo hacerlo con GTM, ¡es sencillísimo y os resolverá muchos Expedientes X!
- Aunque sea en una fase posterior ya dentro de la herramienta, el último paso que nos faltaría dar para entender al 100% los informes de Adquisición de Analytics, sería comprender las equivalencias y relaciones entre tipologías de fuentes y medios y los Canales a que corresponden (según la agrupación de canales predetermidada). Aquí está:
*Para ver estas reglas predefinidas, ve a Conversiones / Conversiones Multicanal / Conversiones Asistidas / Agrupaciones de canales / Copiar plantilla de agrupación de canales MCF…
Bueno días,
Gracias por vuestro post. Me gustaría saber si saber donde podría encontrar una lista de buscadores más o menos actualizada que Google no detecte como orgánico por defecto.
Un saludo
Buenas Francesc! De nuevo, gracias a ti también por leernos y por comentar 🙂
Desconozco si hay alguna iniciativa conjunta / colaborativa para esto.
De momento, compartimos con vosotros este archivo donde tenemos unos 60 buscadores no detectados por defecto por Google: https://docs.google.com/spreadsheets/d/116MY3mDepJp35-RjFR7bxV2FO0kwD5Rp3L6gTVKY12c/edit?usp=sharing (al menos cuando se creó la lista, puede haber cambiado…).
Por otro lado, hemos encontrado estos recursos que pueden resultar útiles también:
LISTA OFICIAL de BUSCADORES reconocidos por Google –>> https://support.google.com/analytics/answer/2795821?hl=en#ChangeOrganicSearchSettings
Y un post con algunas ideas más –>> http://antezeta.com/news/universal-analytics-search-engines
Saludos!
Buenos días,
Gracias de nuevo. He editado el listado que habéis pasado con buscadores que tenía yo. Lo podéis consultar en: [el enlace que proporcionó el usuario ya no funciona]
Si no tenéis inconveniente, he puesto aukera como fuente.
Un saludo
Gracias Francesc. Perfecto!
Hola,
Tengo un problema que no se si os habréis topado con el. Me he equivocado en algunos fuente/medio mezclando los conceptos. ¿Puedo cambiar los datos de fuente/medio de alguna forma fácil? He visto lo de la API pero me da un miedo. No se si hay algo más sencillo.
Muchas gracias, un saludo.