Como localizar y eliminar el contenido duplicado de tu web paso a paso


Hoy por hoy el “pecado” más grave que puede cometer un sitio web para Google es el contenido duplicado así deberemos estar alerta para localizarlo y eliminarlo de nuestros sitios web a toda costa. Es uno de los factores de SEO onpage en el que hay que tomar más precauciones y tomar medidas rapidamente.

Es muy común que el blogero que no tiene muchos conocimientos de SEO piense que por instalar un cms tipo wordpress y un plugin SEO tipo All-in-one-seo ya va a tener solucionado los aspectos más importantes del SEO, pero no es así, tanto en wordpress como en Prestashop por citar algunos de los más utilizados (este último para sitios de ecommerce) generan mucho contenido duplicado.

Primeramente tenemos que escanear el sitio web para localizarlo y saber como actúar y para ello yo utilizo una herramienta online muy sencilla de usar y muy efectiva y es de Virante, aquí os dejo el enlace.

aquí abajo en la imágen podéis observar como nos da dos errores y nos dice que tenemos contenido duplicado, os pongo estos dos errores por que son los más comunes y los que suelen generar los cms antes mencionados. (Es de una web Joomla)

 

Bién ahora paremos a solucionar esto y eliminar el contenido duplicado. Si te fijas en la imágen verás que el error que nos da es que Google ha indexado el dominio con www y sin ellas, por lo que tenemos contenido duplicado. Para solucionar esto deberemos tocar el archivo .htaccess . Este archivo es muy delicado y si “te lo cargas” te cargas la web, así que si no sabes lo que haces mejor que se lo digas a tu webmaster o SEO. lo primero que deberemos hacer es bajarnos una copia del .htaccess que tenemos ahora para evitar posibles “sustos” En el caso de que haya algún problema lo resubes y listo.

Bien ahora os dejo las líneas que tenéis que añadir a vuestro .htaccess , lo podéis editar directamente con el cliente ftp que uséis, ya sea Filezilla, CuteFtp u otro. Es más rápido que descargarlo, editarlo con el block de notas y subirlo de nuevo, y los clientes ftp suelen tener todos editor. El archivo .htacess lo tenéis en la raíz de vuestro sitio web.

Es básicamente una redirección 301 de www. a sin ellas y viceversa:

de www. a sin ellas
RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} ^www.yourblogname.com [NC]
RewriteRule ^(.*)$ http://yourblogname.com/$1 [L,R=301]

Viceversa:

RewriteEngine On
RewriteBase /
RewriteCond %{HTTP_HOST} ^yourblogname.com [NC]
RewriteRule ^(.*)$ http://www.yourblogname.com/$1 [L,R=301]

Cómo es obvio debes cambiar donde pone yourblogname.com por vuestro dominio.

Ahora vuelve a comprobar con la herramienta de contenido duplicado y lo más normal es que los dos errores se hayan corregido y te de todo ok.

Bién el segundo paso sería modificar el .htaccess para tener una url canónica

RewriteEngine On
RewriteCond %{HTTP_HOST} ^yourblogname.com$ [NC]
RewriteRule ^(.*)$ http://www.yourblogname.com/$1 [R=301,L]

Y con todo esto ya no deberias tener contenido duplicado, si te sigue dando error todavía en el segundo caso, para el dominio.com y domnio.com/index.php (o algo similar) habría que hacer una redirección 301:

#SEO Friendly 301 Redirects
Redirect 301 /abc/file.html http://www.yourblogname.com/def/file.html

Y ahora si vuleves a escanear la web con la herramienta online de contyenido duplicado te saldrá algo como esto, ¡Felicidades! Pero si usas wordpress por ejemplo se puede dar otro tipo de contenido duplicado q esta herramienta no detectaría, pero eso para otro post.

Si necesitas un SEO/webmaster profesional para que se encargue de tu blog, web o tienda online aquí puedes contactar conmigo

Fuente: htaccess-guide.com


Agregar Comentario

Your email address will not be published. Required fields are marked *

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.

Black.gif
Share This