Como evitar contenido duplicado en wordpress y apache con .htaccess para SEO – parte 1

Optimizando el servidor apache y su contenido para evitar posibles penalizaciones de google panda por duplicidad y mejorar el SEO

Hola chicos, para los que estas optimizando vuestra pagina con SEO ONPAGE, quise hacer esta pequeña entrada para corregir y detectar algunos fallos de contenido duplicado, que se generan en los servidores apache que usualmente nos ofrecen con wordpress y que al algoritmo de google, no le gusta para nada.

Google Panda Logo

Google Panda Logo

Que es google Panda?

Es básicamente un cambio en el funcionamiento del algoritmo de google con referente a la forma de posicionamiento de su buscador, mejorando la interacción de google con las paginas y permitendole penalizar a los sitios web con contenido duplicado (contenido que generalmente se roba, copiar y pegar, en de otras paginas. y algunos otros detalles que veremos un poco mas adelante). Mirad en Wikipedia Google Panda

Como estamos Generando contenido duplicado?

  1. La mas obvia y clasica de todas, es copiar y pegar contenido
  2. Creando Categorias o tags con contenido que ya esta en otra url, y no especificarle a los robots que ese contenido no debe ser indexado, por ejemplo con un meta NOINDEX
  3. Ahora a un nivel mas alto, desde el servidor, por ejemplo, tiene tienes un wordpress en apache, es muy normal que cuando tu pongas tu tupaginaweb.com/?i=55 o cualquier numero, puedes acceder y seguir viendo todo tu contenido. Esto es un problema que se ve reflejado, cuando alguien te enlaza desde otro sitio web, por consecuencia las arañas de google llegan alli.

El dia de hoy vamos a solucionar el punto numero tres. y luego hablaremos de los otros dos. Si estas un poco perdido aun, te recomiendo que leas el post de Glosario SEO en surferkoala, que esta buen guapo.

Apache genera contenido duplicado a mi wordpress, como lo soluciono para evitar futuros problemas de SEO con el google panda?

Que contenido duplicado me esta generando apache?

Esta permitiendo que un usuario acceda por vinculos que no deberían existir, por ejemplo, intenta ingresar a.

  1. tupaginweb.com/?i=1 o cualquier numero o letra (excepto la ?s=’que se utilizar para consultas’) –> se puede ver desde alli tu pagina home, pero no te redirige
  2. tupaginaweb.com/? –> Lo mismo
  3. tupaginaweb.com/?a cualquiera letra –> El mismo problema
Contenido Duplicado

Contenido Duplicado

Si alguien que conoce de este problema, se pasa de cabrón y te enlaza con alguna de estas url, y la araña de google te pilla, (y se encuentra con que no tienes puesto un canonical y/o una redirecion 301), pues alli estas perdiendo algunos puntitos valiosos con google para posicionarte mejor (realmente no es  que google panda te vaya a penalizar, pero de seguro que notara que algo no anda bien, y son pequeñas cositas que si los corregimos, podemos ir ganando ante los ojos de google y así superar la competencia)

Cual es la solución?

Primeramente, debes tener un enlace Canónico (Si estas en wordpress puedes instalar algun plugin que se encarge de eso) apuntando a la url correcta, luego para evitar problemas hay dos formas de solucionar esto, directamente bloqueando la url desde el archivo robots.txt o generando una redireccion 301 desde el  archivo .htaccess (esto solo lo puedes hacer si estas alojado en un hosting)

Agregando al robots.txt :
Agregando una redireccion 301 en .htaccess (Recomendado):

Si vas a usar el segundo metodo, te recomiendo que hagas un Disallow: /?s=* para que las arañas no indexen las consultas de los cuadros de busqueda de tu sitio

Nota: Si estan en wordpress deben usar “=([0-9]+)$ ” en la linea 5, y no usar “=(.*)”, porque podria redireccionar algunas cositas propias del wordpress como la vista previa de los post

Para entender como funciona o como surge este codigo, debes leer un poco de expresiones regulares, y seguramente practicar un poco, y luego leer como funciona el redireccionamiento y las reglas en el apache con el .htaccess.

Trucos de SEO ONPage por Alex Navarro

Podéis ver el video del Alex Navarro, un experto en SEO, y cofundador de QUONDOS y también les recomiendo pasar a ver los vídeos de SEO Lunes de los chicos de SiSube

Curso de Search Console O Webmaster Tools por David Ibiza

Si os ha sonado un poco raro todo esto de las arañas y robots, seria bueno que vieran el curso de search console o webmastertools, de David Ibiza, la cual es basicamente una herramiento que nos brinda google y bing, para administrar y optimizar nuestro sitio web con respecto a los buscadores, en el caso de google se llama search console. 

Resumen
Evitar Duplicidad en wordpress SEO del apache
Nombre del Articulo
Evitar Duplicidad en wordpress SEO del apache
Descripcion
Corregir errores de contenido duplicado que en servidores apache, con ayuda de redirecciones 301 usando el htaccess y algunos trucos de seo on page. Entra ya
Autor
Nombre del Editor
XeeDBeam
Logo del Editor

Leave a Reply

Se el primero en comentar

Notify of
avatar
wpDiscuz