4 Mar 2015
url-erronea-sitemap
Lectura: 5 mins.
|
Dificultad:

¿Hay URLs erróneas en mi Sitemap?

Quien más quien menos todo el que se dedica al marketing online conoce los archivos Sitemap, que normalmente van de la mano de su primito el archivo robots (si te interesa ese tema escribí un post interesante con muchas visitas hace algún tiempo) y que son armas muy interesantes para comunicarnos con Google y trasladarle cómo queremos indexar el contenido de nuestro sitio.

El Sitemap de un sitio web “profundo” puede tener cientos o miles de páginas. De hecho la limitación que tiene un único sitemap son 50.000 URLs… y lo normal es tener varios recopilados en un sitemapindex (¿no sabes lo que es? Google te lo explica bastante bien aquí). Así que a menudo tenemos que hacer un acto de fe y creernos que nuestro CMS lo está gestionando bien, que todas esas URLs siguen existiendo y no hay errores 404 a la vista.

Pero la duda a menudo es alargada como la sombra del ciprés y tenemos que buscar la evidencia empírica: ¿Cómo sabemos si hay URLs erróneas en nuestro Sitemap? (Nótese que uso el femenino al referirme a LAS URLs, lo he hecho toda mi vida, pero gracias a mi compañero Aitor ahora sé después de casi 15 años que en realidad es más acertado utilizar el masculino para referirse a LOS URLs).

Comprobar las URLs de un Sitemap con Screaming Frog

Screaming-Frog-detectar-errores-urls

La herramienta de optimización on-page Screaming Frog posiblemente sea la más potente del mercado (y una de las que más uso y más me gustan), su funcionamiento “habitual” es introducir una URL (la raíz del dominio por lo general) y esperar que ésta rastree todo el sitio, visitando una por una todas las páginas enlazadas internamente, para darnos información tan interesante como:

  • Códigos de respuesta de la página (200 -ok-, 404, 301, 302, etc.)
  • Longitud en caracteres y píxeles de todas las metaetiquetas
  • Enlaces entrantes / salientes / salientes externos
  • Dirección de todas las canonicalizaciones de página…

Pero lo que muchos usuarios “soft” de Screaming Frog tal vez no sepan es que además del rastreo en modo “araña/robot”, existen otros modos de uso de la herramienta, como el modo “Lista” que permite recorrer una serie de URLs concretas a partir de un listado introducido o un archivo XML como es el caso -habitualmente- de los Sitemaps. ¿Cómo lo hacemos? Pues de eso va este post, comenzamos…

1. Localiza el sitemap

A menudo lo encontrarás en el directorio raíz del sitio web y con extensión XML. Por ejemplo, en el sitio web de la empresa que comercializa Screaming Frog, la ruta del sitemap es:

http://www.screamingfrog.co.uk/sitemap.xml

2. Descarga el archivo sitemap.xml a tu ordenador

La anterior URL del sitemap muestra eso, un archivo. Así que sólo hay que guardarlo en nuestro equipo… por ejemplo en Chrome puedes hacer botón derecho sobre la pantalla y elegir “Guardar como” (y guardarlo tal cual, en formato xml).

3. Selecciona el modo Lista

En el menú principal de Screaming Frog escoge modo “Lista” en lugar del modo por defecto de rastreo. Igual que en esta imagen:

Modo lista en el menú de Screaming Frog

4. Importa el archivo Sitemap descargado

Al elegir el modo lista, aparecerá un botón “Upload list” (subir lista). Hacemos clic y seleccionamos “From a file” (desde un archivo).

Subir archivo XML en Screaming Frog

Ahí se abrirá una ventana donde elegiremos el tipo de archivo “SiteMap (.xml)” para luego escoger el archivo sitemap que acabamos de descargar.

5. Comprueba los códigos 404

Screaming Frog recorrerá todas las URL del sitemap y marcará el código 404 en la columna “Response” cuando una página no se encuentre. Ordena la información haciendo clic en esa columna y tendrás todos los 404 juntos!

 

Y así de sencillo es. Hace años existían otras formas que generalmente pasaban por convertir el sitemap en enlaces de texto y luego importarlo desde Xenu (¿no conoces este mítico software para encontrar broken links?) u otros programas, pero desde que llegó Screaming Frog a nuestra vida es todo un poco más fácil! Por cierto, que conste que éste no es un post patrocinado ni nada por el estilo, aunque lo parezca!

En Aukera utilizamos la versión Premium de Screaming Frog (por 99 libras al año merece y mucho la pena) pero supongo que este “truco” servirá igual para la versión gratuita siempre que el Sitemap tenga menos de 500 URLs. Así que ya lo sabes… la próxima vez que tengas entre manos una auditoría SEO para un sitio web con un sitemap bastante “tocho” recurre a este sistema para comprobar que se está generando. Google te lo agradecerá!

 

Enlaces de interés:

Descargar el software Screaming Frog

10 Cosas interesantes que puedes hacer con Screaming Frog -entre ellas ésta del sitemap- (inglés)