21 Sep 2016
SEO para documentos PDF
Lectura: 10 mins.
|
Dificultad:

SEO para documentos PDF

El formato PDF de Acrobat es, con mucha diferencia, el más extendido para colgar documentos en la web. Con una simple búsqueda en Google, este nos dice que tiene indexados unos 2.530 millones de archivos PDF, frente a los 95,7 millones de archivos del tipo “Word” (tanto DOC como DOCX).

Y es que casi todos los proyectos online incluyen información en PDF. Esto debería hacernos recapacitar sobre el tiempo que se dedica a la optimización SEO de este tipo de archivos, ya que a menudo no es suficiente.

Vaya por delante que no es recomendable fundamentar una estrategia SEO en este tipo de contenido, máxime teniendo en cuenta que Google muestra menos PDFs entre sus resultados de búsqueda si lo comparamos con años atrás, probablemente debido a su mayor capacidad para interpretar las intenciones de búsqueda.

Además estos documentos no ofrecen las opciones de navegación de un sitio web e incluso el tracking analítico es bastante más complejo. Así pues será menos interesante desde el punto de vista de la conversión de objetivos de negocio.

En cualquier caso seguirá habiendo documentos PDF cuya existencia esté totalmente justificada. Estos deberán someterse a una optimización SEO que permita colaborar en la mejora de la visibilidad online del dominio.

SEO para documentos PDF

URL del documento

Esto incluye tanto la ruta de subdirectorios donde alojamos nuestros archivos como, sobre todo, el propio nombre de archivo del PDF.

Y es que mientras dedicamos interminables horas de trabajo a definir una arquitectura web con una jerarquización de páginas “Google friendly”, parece que los documentos podemos subirlos a cualquier parte. ¡Como si no tuviesen la menor trascendencia! :S

Algunos ejemplos reales:

https://www.ams.usda.gov/sites/default/files/media/LSPrpslCmbndW2009RecApr2011.pdf
http://www.hicta.or.jp/hotnews/img/upimg/00800/859_1.pdf

Otro error que nos encontramos a menudo son los espacios dentro del nombre de archivos PDF o el uso de caracteres no convencionales y letras mayúsculas.

Un ejemplo real:

http://www.blakjak.net/adsl/cisco/Cisco%20837%20Cabling%20&%20Setup%20Guide.pdf

Sugerencia de optimización:

http://www.blakjak.net/adsl/cisco/cisco-837-cabling-setup-guide.pdf

Cabe señalar que los CMS suelen incluir rutas por defecto para los archivos subidos y que estas generalmente son bastante mejorables. En caso de duda sobre cómo editarlo, consulte con el responsable del gestor, con su programador de cabecera o con el propio Google. 😉

Metadatos PDF

La meta-información clave aquí es el título del documento dado que Google lo trata de forma similar al “Title” de una página HTML. Es decir, semánticamente es relevante y además se mostrará generalmente en los snippets y por tanto será nuestra principal arma de cara al CTR.

Adicionalmente es interesante rellenar el meta-dato del autor del documento, simplemente escribiendo el nombre de la persona o bien la empresa, o el dominio donde se cuelga. Esto hará que tu contenido pueda ser considerado como la fuente original en caso de existir copias.

Si bien varios autores recomiendan rellenar campos como la descripción (Subject) o las palabras clave (Keywords) nuestras pruebas nos dicen que dichos campos no aportan valor semántico a Google y no hay pruebas de que actualmente lo tenga en cuenta para algo.

Por ejemplo la descripción (ahora) no se muestra en los snippets ni siquiera cuando Google no tiene nada mejor que mostrar, dándole aún menos importancia que la “Description” de las páginas HTML. Y con los meta-keywords tres cuartos de lo mismo.

Dicho de otra forma, es preferible centrarse en un buen “Title” y cubrir la autoría del “Author” para después incluir una entradilla del documento en formato texto con contenido muy relevante, de manera que Google encuentre ahí la relevancia necesaria para mostrar ese fragmento en sus snippets. ¿Te sobra tiempo en tu vida? Pues rellena todos los campos que quieras..! 🙂

Para la edición de metadatos PDF os recomendamos la descarga e instalación de PDF Metadata Editor, ya que goza de una interfaz muy sencilla, es gratuito y no recopila ninguna información del usuario ni de los archivos:

PDF metadata editor

Y si utilizas los programas con licencia de Adobe para editar este tipo de documentos, puedes consultar la sección de ayuda para configurar los metadatos.

Optimización semántica

Los archivos PDF no dejan de ser piezas de contenido que Google indexa y que tiene que catalogar y rankear. Así que resulta tan necesario como en las páginas HTML optimizar el contenido a nivel semántico, siguiendo las mismas pautas básicas (riqueza semántica, sinonimia, enlazado relevante, encabezados, introducciones, etc.).

Sin embargo debe tenerse cuidado con la importancia que otorgamos a estos documentos dentro de nuestra estrategia SEO. Ya hemos dicho que la visibilidad de los PDF en búsquedas ha disminuido, así que generalmente los términos derivados de un Keyword Research solo los repartiremos entre landings HTML.

¿Para qué puede resultar entonces útil un PDF en lo relativo al SEO? Existen varios casos concretos donde puede tomar importancia dentro de la estrategia de visibilidad, un par de ejemplos:

  • Intención de búsqueda documental
    Existen usuarios que directamente quieren encontrar un archivo descargable, generalmente para poder exportarlo a otro soporte (ej: pendrive) y/o compartirlo con otros usuarios como un archivo adjunto.

    • “descargar…”
    • “pdf…”
    • “whitepaper seo”, “catálogo muebles”
    • “filetype:pdf”
  • Long-tail técnico
    Es habitual para productos de alto componente técnico que algunas búsquedas SEO importantes (realizadas a menudo por responsables de compras) incluyan especificaciones técnicas muy complejas, a menudo incluidas en catálogos de referencias en formato PDF, entre otras cosas porque maquetarlo en HTML puede ser tedioso.

    • Tablas de características
    • Materiales
    • Composiciones
    • Medidas…

Adicionalmente, es de alto interés optimizar semánticamente estos documentos para contribuir en la estrategia SEO del dominio o proyecto. Es decir, al igual que ocurre con las páginas HTML, el contenido ayudará a Google a generar un contexto semántico.

De igual forma las conexiones internas entre documentos del dominio, a través de los enlaces internos, repartirán tanto la autoridad como la relevancia, debiendo pues tratarse de forma —casi— similar al resto de páginas.

Por último, siempre que esté justificado, será una buena idea incluir un pequeño índice de contenidos donde se detallen las secciones principales. De esta forma enriqueceremos aún más la densidad natural para las keywords principales del documento.

Enlaces rastreables

Ya hemos dejado caer que Google trata los documentos PDF casi como cualquier otra página de las que indexa. A nivel de link-juice el funcionamiento es el mismo, si bien no está claro que los porcentajes de autoridad transmitida sean exactamente los mismos que en los casos HTML.

De esta forma será imprescindible incluir siempre enlaces a nuestro sitio web, porque si el PDF no incluye links, su autoridad “morirá” sin ser transmitida. Es recomendable incluir siempre al menos un enlace a nuestra Home y, si procede, otros enlaces tipo “deep linking”.

Todos estos enlaces deberán situarse en lugares estratégicos para el usuario, de manera que le seduzcan hacia el clic, pudiendo comenzar así una sesión en nuestra web. Una vez allí será presa de nuestra experiencia de uso y podrá experimentar nuestros intentos de provocar la conversión.

Dado que este tipo de archivos suelen compartirse desde diferentes sitios, incluir enlaces a nuestra web también será una forma sencilla de generar enlaces externos desde dominios de terceros.

Hablando de enlaces externos no perdamos de vista que los archivos PDF pueden generar importantes oportunidades para el Link Building proactivo. Por ejemplo dejando enlaces a “nuestros” manuales de usuario desde foros de soporte para un producto.

Por último, si el contenido del PDF es adaptable (y con adaptable quiero decir que te lo pueden copiar) procura proteger el archivo frente a la edición. Aunque no es infalible al menos estarás poniendo más trabas a tu competencia a la hora de quitar los enlaces que has introducido a tu sitio web.

Peso del archivo

Ya sabemos que Google tiene en cuenta los tiempos de carga a la hora de establecer sus rankings y otorgar mayor o menor visibilidad online a los contenidos, especialmente con la gran penetración de las búsquedas desde dispositivos móviles.

Teniendo en cuenta que los PDFs a menudo son muy visuales y pueden contener cientos de páginas, será importante poner los medios a nuestro alcance para evitar que la descarga de este tipo de documentos sea demasiado lenta.

Por ejemplo si vamos a colgar un catálogo de productos, a menudo con gran resolución dado que están concebidos para su impresión en papel, lo ideal será generar una versión web del mismo con resoluciones pensadas para monitor, y ser dicha versión la que colguemos en nuestro sitio web.

También existen varias herramientas online para disminuir el peso de los archivos PDF; te recomendamos Small PDF, ya que su interfaz es muy sencilla, el ratio de compresión es bastante bueno y los tiempos de subida-bajada de archivos contra su servidor son bastante mejores que los de la competencia.

Cómo reducir el tamaño de un PDF

Y por supuesto Adobe tiene su propia sección de ayuda para la optimización de PDFs con Acrobat Pro y con el resto de sus programas bajo licencia.

Lógica SEO

Generalmente todo lo que es bueno desde el punto de vista SEO para una página HTML será bueno para una página (archivo) PDF. ¿Sabías que incluso es posible incluir el atributo “ALT” a las imágenes de estos documentos? 🙂

Por supuesto también será importante prevenir las duplicidades para mejorar la experiencia de rastreo de los buscadores. Tanto entre PDFs (a menudo se sube un archivo actualizado y no se elimina su anterior versión) como entre las versiones HTML y PDF de un mismo contenido.

Por lo general cuando cohabiten versiones HTML y PDF deberá darse prioridad a la primera, incluyendo un enlace a la versión PDF para aquellos usuarios que necesiten descargar el archivo para manejar más ágilmente esa información. En tal caso configurar el archivo robots.txt puede prevenir el rastreo de ciertos subdirectorios de documentación.

Si el volumen de PDFs en tu sitio web es elevado, probablemente te resulte útil generar un sitemap para este tipo de documentos y subirlo vía Search Console, para controlar más fácilmente la saturación de indexación de los mismos.

En resumen, un PDF es como una página HTML, pero sin las ventajas de usabilidad y accesibilidad propias de la web moderna. Por ello deberá priorizarse el uso de las páginas web tanto para los usuarios como para los rastreadores.

A nivel SEO es importante cumplir estas mínimas pautas de optimización pero, como hemos dicho, las estrategias y estudios han de fundamentarse en el contenido HTML, buscando posteriormente nichos de posicionamiento para este tipo de documentos.