Imagínate que estás buscando algo en Google y el primer resultado donde haces clic tiene un contenido ilegible, sin sentido o incluso que aparezca una página sin texto. ¿Cómo te quedarías?

Pues bien, Google lucha continuamente contra ese tipo de contenido que no aporta nada de valor, también llamado thin content. Te vamos a explicar en qué consiste, cómo detectarlo y qué puedes hacer para evitarlo en tu web.

¿Qué es el thin content y cómo detectarlo?

 

El thin content hace referencia al contenido de baja o mala calidad de algunas páginas de una web. Es decir, contenido que no responde de manera correcta y útil a la consulta que realiza el usuario en Google u otro buscador.  A continuación te explico cómo puedes detectar ese contenido de baja calidad:

  • La herramienta de todo SEO, Screaming Frog

Se trata de un software que deberás instalarte en tu ordenador y que te permite rastrear la web de manera gratuita hasta 500 URL. Puedes comprobar los metadatos duplicados y URL de tu web, pero también puedes guiarte un poco por el número de palabras que reporta de cada página. Por ejemplo, si varias URL diferentes tienen exactamente el mismo número de palabras, es posible que el contenido sea el mismo.

Una de las reglas de Google es no indexar contenido que no es relevante o thin content.

 

Descárgate los datos brutos que exportas de Screaming Frog en un Excel o Spreadsheets y utiliza formatos condicionales y filtros para ir directamente a las páginas afectadas.

  • SafeCont

Una herramienta española de uso profesional especializada en detectar thin content y análisis de la estructura. De manera muy gráfica, podrás ver una métrica llamada Pandarisk, que, como intuirás, es el porcentaje de riesgo de que tu web pueda ser penalizada por Google Panda, el algoritmo que se encarga de “evaluar” el contenido de tu web.

 

  • Utiliza el comando “site:https//midominio.com”

Esta es la manera manual (y, por decirlo así, “casera”) para comprobar tanto si existen metadatos similares que no aportan nada (texto con lorem ipsum, como ejemplo extremo) como si tienes páginas que hablan de lo mismo o aparecen las páginas legales. A nivel thin content no da mucha más información, pero te pueden salir en los resultados las páginas que ni siquiera sabías que existían. Por ejemplo, podrás saber, en caso de que hayas creado tú mismo tu web con una plantilla del CMS, si se indexó contenido de prueba.

¿Qué hago si he detectado thin content?

 

En caso de haber descubierto páginas vacías, sin apenas texto o que se duplique en otras páginas, puedes tomar algunas de las siguientes medidas:

  • Utilizar meta robots Noindex

Si tienes páginas que no tienen el objetivo de posicionar o no vas a trabajarlas, añade una etiqueta noindex para que el robot de Google no pierda tiempo en rastrearla.Si utilizas Rankmath, puedes modificar dicha información de manera muy sencilla sobre las páginas afectadas.

Piensa en tu estrategia SEO antes de realizar cualquier acción sobre las páginas de tu sitio web.

Acuérdate siempre de comprobar que realmente está bien cambiada en el código. Puedes verlo directamente en el HTML de la página (botón derecho del ratón >”ver código fuente” >y realiza una búsqueda con ctrl+g de “robots”). Debería salirte algo como esto:


<meta name=”robots” content=”noindex,follow”/>


Otra manera sencilla de comprobarlo es con la extensión Seerobots.

  • Utilizar rel Canonical

Este tipo de etiqueta tiene la finalidad de indicarle a Google que el contenido de la página que está rastreando no aporta nada, que la preferida es otra URL principal.Es muy típico utilizarla en paginaciones, que es un tipo de contenido autogenerado cuya única utilidad es la de ir agrupando en páginas todo el contenido de una categoría, subcategoría o etiqueta.Puedes comprobar si tus paginaciones tienen canonical siguiendo el mismo proceso de ver el código fuente, sólo que esta vez busca “canonical” y comprueba que la URL que aparece es la de la categoría o página principal. Deberías ver un fragmento de código como este:

rel=”canonical” href=”https://midominio.com/pagina-principal”

 

  • Mejorar el contenido

En el caso de que tengas el objetivo de posicionar esas páginas que has encontrado con thin content, no dudes en trabajarte un contenido único donde, sobre todo, respondas a la consulta de los usuarios.En este punto, la pregunta del millón es: ¿de qué extensión debo hacer el contenido? Pues básate en los resultados que ofrece el buscador sobre la consulta que quieres responder.

Fíjate si la respuesta se ofrece directamente en los resultados o hay que entrar en las páginas y comprende si los resultados que salen son más informacionales, transaccionales o un popurrí de ambos.Con los propios resultados también te puedes hacer una idea de la extensión del contenido o si merece la pena luchar por esa intención. Sobre todo, ten en mente que lo que prima es la calidad.

¿Por qué es importante combatirlo?

 

Es importante porque es un “mini punto” que ganas en tu estrategia SEO y toda buena acción será bienvenida. ¿Cómo es eso? Desde una perspectiva de posicionamiento orgánico, si tienes páginas indexadas sin contenido o este es duplicado, están sucediendo dos cosas:

 

  1. Estás permitiendo que el robot rastree esas URL con contenido pobre, por lo que estás haciéndole perder tiempo de rastreo. Además, estás perjudicándote a ti mismo al no “ayudar” al bot a que se pase por las páginas que más te interesan a la hora de posicionar, o lo que es lo mismo, las que tengan calidad de verdad.Todo lo que rodea la idea de ayudar a Google a entender las páginas va de la mano de tener una buena estructura de la información.

 

  1. Dependiendo de lo grande que sea tu web, puedes llegar a caer en una penalización de uno de sus animalillos, Google Panda.

En definitiva, ahora ya sabes qué es el thin content y cómo combatirlo por lo que no tienes excusa para ir poniéndolo en práctica. ¿Tienes alguna duda? Pregúntanos, somos todo oídos….o más bien ojos.

¿TE HA GUSTADO? NO SEAS EGOÍSTA, Y ¡COMPARTE!