21 Jun 2016
Lista de exclusion de referencia en Google Analytics
Lectura: 12 mins.
|
Dificultad:

Lista de exclusión de referencia en Google Analytics

Como ya sabéis, la lista de exclusión de referencia de Analytics está orientada a modificar y controlar el tratamiento que la herramienta ha de dar a ciertas sesiones de tráfico de referencia, es decir, a cómo los sitios webs especificados van a ser clasificados en Google Analytics en los informes de Adquisición (concretamente, en cuanto a fuente y medio de tráfico). Esta configuración también tiene otras implicaciones en cuanto a número y duración de las sesiones afectadas, vamos a ir viendo todo poco a poco.

Por desgracia, a veces, Google Analytics no es tan sencillo y fiable como desearíamos. ¡Nada es perfecto! Pues bien, recientemente nos hemos encontrado un pequeño-gran bug en las Exclusiones de Referencia de Google Analytics, más adelante veremos cuál es.

 

¿Para qué sirve la Lista de exclusión de referencia de Google Analytics? ¿Cómo lograr una atribución correcta de conversiones?

Por defecto, en Google Analytics siempre que se produce un cambio en los datos de campaña (fuente, medio, campaña, …), el contador se reinicia, y se fuerza el comienzo de una nueva sesión. Otra forma de decirlo: una sesión solo puede tener una fuente y medio de tráfico, con lo que si un usuario sale a lo largo de su navegación a otro dominio y después vuelve a nuestro site, al cambiar la fuente de tráfico, el usuario comienza una sesión diferente, y se pierden los datos de campaña originales. En resumen: 1 usuario, 2 sesiones y pérdida de la atribución.

Por todo lo anterior, un uso muy extendido de esta configuración, de las exclusiones de referencia, es lograr que las pasarelas de pago sean totalmente inocuas para Google Analytics, es decir, que no afecten a la correcta atribución de aquellas conversiones que implican navegar a un portal externo a realizar el pago y después volver al sitio principal (si es que se vuelve), a la página de confirmación o de Pedido realizado.

Salvo que hagamos un envío proactivo del hit desde la propia pasarela (vía protocolo de medición de Google Analytics), en principio, si el usuario no regresa a la página de confirmación, por más que el pago se haya realizado, la transacción no será registrada en GA. Un tip muy útil sería siempre siempre forzar la vuelta del usuario, es decir, redirigir automáticamente tras completar el pago, desde la pasarela al sitio web (en este post se explica cómo hacerlo en Paypal).

Lista de exclusion de referencia en Google Analytics

Otra utilidad fundamental de este ajuste es evitar/minimizar las autorreferencias, es decir, aquellas visitas extrañas que registra a veces Analytics desde nuestro propio dominio/s (el del seguimiento). Este problema, en teoría, debería verse muy reducido con la migración a la librería de Universal Analytics, aunque todavía ocurre, las pequeñas contradicciones de Google Analytics… Importa este informe personalizado si quieres saber fácilmente si está ocurriendo esto en tu propiedad de Google Analytics.

Informe para detectar Autorreferencias

 

Otro fin fundamental de esta utilidad es la correcta configuración del seguimiento multidominio o de subdominios en Google Analytics. Hemos de incluir en la lista todos los dominios y subdominios incluidos en el seguimiento para que no se interrumpan las navegaciones, se generen sesiones innecesarias, o queden incompletas. Esto es por lo que hemos visto antes, para evitar cambios en los datos de referencia lo ignoramos, y así no generamos sesiones múltiples.

 

¿Qué ocurre si incluyo un dominio en la lista de exclusión de referencia?

Cada vez que el usuario navega a otra página y vuelve con un fuente / medio distinto, la sesión se reinicia. Por ello precisamente existe este campo de configuración, aquí definimos los dominios externos que queremos utilizar como excepciones a la regla anterior.

Como vimos en este post sobre las fuentes de tráfico, las exclusiones de referencia se comparan siempre con el valor del referrer antes de mandar una sesión a “Tráfico de Referencia”.

De cara a Google Analytics, el tráfico de dominios o subdominios de la lista de exclusión pasará a ser tráfico directo (no de referencia), en caso de acceder directamente desde uno de estos dominios excluidos. Además, como todo tráfico directo, si tiene info de adquisición previa se la asignamos y sobrescribimos la fuente directa.

Referral exclusion google analytics

 

En cambio, si nos hallamos en el supuesto contrario (el usuario sale del site y vuelve en una misma navegación) ocurrirá que la sesión continuará a la vuelta “como si nada”, por donde se quedó y como si no hubiera salido el usuario. De este modo es como conseguiremos que las conversiones se adjudiquen a las fuentes correctas y no a pasarelas de pago o direct.

Por último, dentro de esta cuestión es importantísimo aclarar, aunque ya lo sabréis, que todos los hits y datos de navegación de usuarios que acceden desde dominios excluídos como referrals siguen siendo registrados en GA. Las páginas vistas, eventos, compras, etc. sí se guardan en Analytics, lo que pasa es que van a sumarse a la sesión que estaba en curso justo antes de salir del site (o a una nueva sesión directa), y no a una sesión de referral. Por tanto, no es que queden fuera, sino que entran de otro modo.

¿Y por qué cuento esto? Porque por lo visto ha habido quienes han utilizado esta lista (y lo han recomendado a otros) para los dominios semalt y demás de referral spam. ¡Por favor no lo hagáis! Es incorrecto, lejos de dejar fuera el spam lo que haréis será invitarle a pasar y sentarse a la mesa como uno más, eso sí, bien camuflado en las profundidades del tráfico directo para que no le podamos reconocer. Puedes probar esta solución si aun tienes SPAM en tus analíticas.

 

¿Y si no lo incluyo y debe estar en la lista?

Pongámonos en el caso más típico y conflictivo: la pasarela de pago.

Se me ocurren como mínimo dos supuestos donde GA realiza a veces, de forma incorrecta, la atribución de conversiones, estos son:

  1. Que la fuente de la conversión sea la propia pasarela de pago (más fácil de detectar). Esto ocurre por ej. cuando el usuario vuelve a una página de confirmación segura (https://), al mantener el referrer correctamente lo trata como una nueva sesión que llega desde esa página y convierte con un solo hit, ¡¡qué éxito!! Jajaja 😀
  2. Que la fuente de la conversión sea siempre tráfico directo (más difícil de detectar). Esto ocurre por ej. cuando el usuario vuelve a una página de confirmación NO segura (http://), al perder el referrer Analytics lo trata como una nueva sesión de tráfico directo, y que también convierte con un solo hit jejej

Podemos crear un informe personalizado donde será fácil detectar ambos casos, aquí te lo hemos dejado en la Galería de Soluciones de Google Analytics, donde Aukera cuenta con una sección y vamos subiendo cositas poco a poco.

Informe para detectar Problemas de Atribución

¿Por qué siguen apareciendo autorreferencias y/o transacciones desde pasarelas aun después de haberlo configurado?

Hay al menos dos posibles motivos:

  1. Esta configuración NO es retroactiva. Los datos anteriores ya van a quedar así, lo queramos o no.
  2. Si un usuario ya nos visitó antes del cambio en la configuración y se le asignó una cookie de campaña con su procedencia, cuando regrese en un futuro por vía “directa”, durante los 6 meses siguientes (periodo en que caduca por defecto la información de campaña), sus sesiones se seguirán atribuyendo a la fuente inicial.

Para contrastar que la exclusión esté bien, mejor fíjate solo en las visitas nuevas para dejar de lado el efecto recuerdo de las cookies de campaña en el tráfico “directo”.

 

Problemas con la lista de exclusión de referencia de Google Analytics

La parte más crítica de este campo de configuración se halla en el tipo de comparación que hace Google respecto a los dominios excluidos.

Siempre que queramos medir conjuntamente un dominio principal y sus subdominios, para evitar referencias de unos a otros, hemos de añadir los subdominios del dominio de la propiedad web en la lista de exclusión de referencia, ya que los subdominios no están en la configuración por defecto.

Analytics self referral problem

Fuente: https://support.google.com/analytics/answer/3198398?hl=en

Sin embargo, para el resto de dominios diferentes al dominio principal configurado en la propiedad de Analytics, el comportamiento es diferente.

¿Qué ocurre? Este campo de configuración tiene un comportamiento un poco inestable / impredecible a veces. Si introducimos en la lista un dominio de nivel superior sin www (ej. paypal.com), esto hará que también estemos excluyendo automáticamente todos sus subdominios como referrals, ¡mucho ojo! Parece que antes directamente no se reconocían los subdominios, hasta que se ha solucionado hace poco.

Agregar tráfico de referencia

Fuente: https://support.google.com/analytics/answer/2795830?hl=es

Y para más inri, ahora viene la traca, lo que hemos detectado estos días, y entendemos que es un bug de Google Analytics provisional. Parece ser que a pesar de que Google dice expresamente en su documentación que las exclusiones de referencia solo incluyen búsquedas parciales para el caso de los subdominios, esto no es así ahora mismo. Recientemente nos ha ocurrido algún caso en que hemos comprobado que la coincidencia parcial (sin ser un subdominio) también afecta en la exclusión. Es decir, si incluyo en la lista paypal.com, pseudopaypal.com también quedará excluido. Hemos tenido algún caso de este estilo y justo tras aplicar la solución del punto siguiente se ha corregido. Una pequeña faena, sí señor, a veces no tan pequeña. Esperamos que lo solucionen cuanto antes 🙂

 

¿Cómo podemos corregirlos?

Vale, ¡estoy es lo que hay! ¿Podemos arreglarlo? Menos problemas y más soluciones 🙂

Al igual que esperamos que se trate de un error temporal, esto se trata de una solución provisional también.

Con un poco de JavaScript y desde Google Tag Manager, podremos también influir en cómo enviar la información de referencia a Google Analytics.

Por ejemplo, podemos crear una variable en GTM que revise si los nombres de dominio de referencia incluyen mi dominio o alguno de los dominios del seguimiento y, en ese caso, reescribirlos por otros. Así Google Analytics lo interpretará perfect.


// {{Referrer Filtered}}
// Referrer: Devuelve referrer con hostname reescrito si puede dar problemas con el referral exclusion de GA (match parcial sin ser subdominio)
// (ej. link de otracosa.com a cosa.com -> referrer excluido, kk!)
// ej. http://cosa.com/blah --> http://cosa-ref.com/blah
// Req: {{Auto Link Domains}} lista dominios separados en comas guardado en variable
// Req: {{Referrer Hostname}}
function() {
var refs = {{Auto Link Domains}}.split(',');
for(i = 0, il = refs.length; i < il; i++) {
var refMatch = new RegExp('[a-zA-Z0-9-]' + refs[i].trim().replace('.','.') + '$');
if(refMatch.test({{Referrer Hostname}})) {
return {{Referrer}}.replace(/.[a-zA-Z]+//,'-ref$&');
}
}
return {{Referrer}};
}

De este modo, veremos nuestros referrals conflictivos un poco modificados en nuestro informe de Tráfico de Referencia, pero es un mal menor… Mejor eso que no camuflarlo en el tráfico directo.

Simo Ahava da otra solución diferente en su blog. También vía JavaScript, y también lo que hace es generar una variable que sobrescriba el referrer, pero el procedimiento es distinto. ¿Cómo lo hace? directamente sin configurar nada en la lista de exclusión de GA. Se crea una variable de JavaScript Personalizado para que en caso de que coincida el referrer con algún dominio de la lista de exclusión alternativa creada vía código en GTM (en la misma variable), se sustituye esa info de referencia por otra (null), de modo que la información de adquisición llega a Analytics directamente como tráfico directo (si no se conoce referrer también entra en direct).

¡A gusto de cada uno! Como veis, todo es tener una idea e ir a por ello. Con imaginación, algo de desarrollo, y Tag Manager, casi todo es posible 😉

Te recomendamos leer también los otros artículos sobre seguimiento multidominio: