Cómo usar un validador de mapa de sitio para solucionar errores

Enviar un mapa del sitio XML puede proporcionar a los motores de búsqueda un desglose completo de cada página del sitio web que desea que indexen. Por lo tanto, es un paso esencial en su estrategia de optimización de motores de búsqueda (SEO) . Si bien su complemento de mapa de sitio de confianza puede haber creado su hermoso mapa de sitio para usted, su trabajo no se detiene allí. Para obtener los mejores resultados posibles, deberá utilizar un validador de mapa del sitio para asegurarse de que no está enviando archivos con errores.

En este artículo, hablaremos sobre qué son los validadores de mapas de sitio y cómo funcionan. Luego, lo guiaremos a través de los errores comunes que puede encontrar al usar un validador de mapas de sitios y cómo solucionarlos. ¡Hagámoslo!

¿Qué es un validador de mapa de sitio?

Un mapa del sitio es un archivo que contiene una lista de todas las URL de su sitio web que desea que indexen los motores de búsqueda. Los sitemaps vienen en formato XML o HTML , siendo el primero la opción más popular.

Técnicamente, no  necesita  enviar un mapa del sitio de su sitio web a Google u otros motores de búsqueda . Estas plataformas utilizan rastreadores para navegar por su sitio, identificar cada URL e indexar esas páginas. Sin embargo, la creación de un mapa del sitio le brinda control total sobre qué URL indexan los motores de búsqueda y cuáles no  (como contenido privado o redundante).

En la mayoría de los casos, utilizará mapas de sitio generados automáticamente. Si usa WordPress, los complementos de SEO como Yoast pueden ayudarlo a crear mapas de sitios que puede enviar a Google Search Console :

Un validador de mapa de sitio es una herramienta que puede procesar esos archivos XML o HTML y asegurarse de que no contengan errores. Por «errores» queremos decir:

  • Páginas que los motores de búsqueda no pueden rastrear
  • 404 errores
  • 401 errores
  • Demasiadas URL en el mapa del sitio
  • URL no canónicas

Si su mapa del sitio contiene alguno de esos errores, es posible que los motores de búsqueda no puedan indexar todas las páginas que enumera. La lectura manual de archivos XML para encontrar problemas puede llevar mucho tiempo y también es necesario probar las URL. Afortunadamente, los validadores de mapas de sitios le permiten omitir todo ese trabajo y comenzar a corregir cualquier error que identifiquen.

Cómo usar un validador de mapa de sitio

Usar un validador de mapa de sitio es simple. Según la herramienta que utilice, es posible que deba cargar un archivo XML o proporcionar una URL al mapa del sitio de su sitio web. La última opción podría aplicarse si utiliza una herramienta como XML Sitemap Validator .

Ingrese la URL del mapa del sitio que desea verificar y la herramienta devolverá un informe que incluye los errores que encuentre.

Si obtiene un informe limpio y sin problemas, los motores de búsqueda pueden indexar las URL dentro del mapa del sitio. Puede enviar de forma segura el mapa del sitio a Google , Bing , Yandex o donde quiera sin temor. Sin embargo, si se encuentra con errores, necesitará saber cómo corregirlos. Eso nos lleva a la siguiente sección.

5 errores comunes del mapa del sitio y cómo solucionarlos

Desafortunadamente, algunos sitemaps no se validan a la perfección, pero cubriremos algunos de los errores más comunes que los validadores de sitemaps pueden encontrar en los archivos que les envías. Comencemos analizando las páginas con «problemas» de rastreo.

1. Páginas con problemas de rastreo

Los problemas de rastreo se encuentran entre los problemas más comunes que devolverán los validadores. Este error significa que el servicio no pudo rastrear una de las páginas en su mapa del sitio.

Generalmente, cuando el validador o el motor de búsqueda no pueden rastrear una página, significa uno de los siguientes escenarios:

  • La página tarda demasiado en cargar. Si su sitio web tarda demasiado en cargarse, la conexión con el rastreador se interrumpirá. Eso significa que es posible que algunas páginas no se indexen.
  • Su sitio web utiliza demasiados redireccionamientos. Cuando los redireccionamientos no están configurados correctamente , su sitio web puede terminar en un bucle de redireccionamiento. Eso significa que los motores de búsqueda no podrán rastrearlo.
  • El sitio web está impidiendo que los motores de búsqueda lo rastreen. Puede configurar WordPress para bloquear rastreadores (usando  etiquetas noindex  ) para que su sitio web no se indexe. Por lo general, puede hacer esto mientras construye su sitio o crea páginas privadas.
  • La página devuelve un código de error que no es 404 o 401. Los validadores de Sitemap pueden analizar errores 404. Sin embargo, otros códigos de error HTTP generarán una advertencia de «problema de rastreo».

El error de «problemas de rastreo» puede ser ambiguo. Sin embargo, puede determinar el problema exacto visitando la URL en cuestión. Si la página se carga rápida y correctamente, es posible que su sitio web esté bloqueando el rastreo de los motores de búsqueda.

Si la página se carga sin errores, recomendamos probar los tiempos de carga de su sitio web para ver si hay problemas de rendimiento. De lo contrario, debería ver códigos de error específicos o instancias de múltiples redireccionamientos.

2. Errores 404

Los errores 404 en un mapa del sitio son fáciles de resolver. Si una página ya no existe, puede eliminar esa entrada del mapa del sitio manualmente o configurar una redirección para ella. La mejor opción para usted dependerá de si esa página aún recibe tráfico.

El análisis del sitio web de Google Search Console y otros servicios revelará si una página 404 todavía recibe visitantes. En ese escenario, su mejor apuesta es configurar una redirección a la página o publicación relevante más cercana para que no se pierda ese tráfico. Siempre que use una sola redirección, no dará como resultado un error de validación del mapa del sitio.

3. Errores 401

Un error 401 «no autorizado» en un mapa del sitio significa que los rastreadores no pueden acceder a una página específica porque no tienen los permisos necesarios. Este error suele aparecer cuando se trata de una página que requiere que los usuarios inicien sesión.

La única solución a este error es eliminar las páginas que requieren autorización del mapa del sitio. No se debe indexar ninguna página que solo puedan ver los usuarios registrados. De lo contrario, los visitantes que hagan clic en él en las páginas de resultados de los motores de búsqueda (SERP) se encontrarán frente a un error 401.

4. Demasiadas URL en el mapa del sitio

Los motores de búsqueda pueden rastrear sitios web masivos con miles de páginas. Sin embargo, según nuestra experiencia, los sitemaps comienzan a mostrar errores si enumera cerca de (o más) 50,000 páginas.

Si esa es tu situación, entonces felicitaciones por el esfuerzo. 50.000 páginas es mucho . Sin embargo, la mayoría de los sitios web con más de 50 000 páginas probablemente tengan varias URL de contenido generado por el usuario. En ese escenario, desea priorizar las páginas más importantes de su sitio mientras elimina las entradas del mapa del sitio que los usuarios podrían no querer ver en los SERP.

5. URL no canónicas en el mapa del sitio

A veces, los motores de búsqueda pueden confundirse cuando ven varias versiones de una URL para la misma página. Por ejemplo, es posible que pueda acceder a una página de blog simple utilizando cualquiera de las siguientes URL:

  • http://tuwebsite.com
  • http://www.tuwebsite.com
  • https://tuwebsite.com
  • https://www.tuwebsite.com

En la práctica, todas esas URL pueden conducir a la misma página (si redirige el tráfico HTTP a HTTPS ). Sin embargo, los motores de búsqueda pueden ver esas URL como cuatro entradas diferentes en un mapa del sitio, lo que genera errores de validación.

La forma sencilla de resolver este problema es designar una URL canónica para su sitio web de WordPress. Los complementos de SEO como Yoast asignarán URL canónicas para su sitio automáticamente. Si está utilizando un archivo XML generado por un complemento de SEO, no debería encontrarse con el error «no canónico» al usar un validador de mapa de sitio.

Conclusión

A medida que crece su sitio web, el uso de un mapa del sitio se vuelve más crítico. Los mapas del sitio le permiten decirle a los motores de búsqueda qué páginas deben indexar y cuáles ignorar. Además, el uso de un validador de mapa de sitio lo ayudará a detectar errores para que los rastreadores no tengan problemas al indexar su sitio web.

Solo para recapitular, los cinco errores más comunes con los que se puede encontrar con un validador de mapa de sitio son:

  1. Páginas con problemas de rastreo:  deberá verificar sus tiempos de carga, redireccionamientos y visitar la página de su sitio web para determinar el problema exacto.
  2. Errores 404:  este error significa que debe eliminar la página inexistente de su mapa del sitio o configurar una redirección para ella.
  3. Errores 401:  considere eliminar las páginas restringidas de su mapa del sitio.
  4. Demasiadas URL en el mapa del sitio:  es posible que deba ser selectivo con las páginas de su mapa del sitio y eliminar las menos útiles.
  5. URL no canónicas en el mapa del sitio:  recomendamos configurar una URL canónica para páginas específicas.

¿Tiene alguna pregunta sobre el uso de un validador de mapa de sitio? ¡Hablemos de ellos en la sección de comentarios a continuación!

Imagen destacada vía hanss / shutterstock.com