Mapa del sitio XML. Tutorial completo

XML vs JSON
Shares

Construir un sitemap.xml es un paso importante en la creación de un sitio web, pero muchos principiantes se asustan porque piensan que es demasiado complicado. Decidimos recopilar y sistematizar el conocimiento disponible en este campo. ¡Ahora crear un mapa del sitio será extremadamente fácil!

¿Qué es sitemap.xml?

Un mapa del sitio es un archivo que contiene una lista de las páginas de tu sitio. Ayuda a los robots a indexar y alcanzar los recursos necesarios, especialmente los de nueva creación y los de difícil acceso.

De acuerdo con las pautas de Google, el mapa del sitio como un solo archivo no debe exceder los 50 MB y las 50,000 URL y debe estar en formato XML.

No siempre es una buena idea incluir todas tus páginas en tu mapa del sitio, ya que muchas de ellas pueden tener un valor rel ‘nofollow’ o ‘noindex’. Pero no te preocupas, en un momento obtienes más información sobre qué URL incluir en tu mapa del sitio.

¿De qué datos consta sitemap.xml?

El formato XML permite la presentación de datos de forma estructurada. El uso de este formato significa que todos envían la información de la URL de la misma manera y los rastreadores la leerán sin problemas. El archivo sitemap.xml debe estar codificado en UTF-8 y constar de 3 etiquetas obligatorias.

Las etiquetas más importantes en sitemap.xml

  • <url set> Contiene el archivo y la referencia al estándar de protocolo actual. Es el elemento inicial y final de cada archivo sitemap.xml. Incluye todas las etiquetas.
  • <url> Etiqueta principal de cada entrada de URL. Puedes enriquecerlo con etiquetas adicionales.
  • <loc> La etiqueta representa la ubicación de la subpágina. La etiqueta de ubicación debe contener la URL completa, incluido el protocolo HTTP/HTTPS.

Etiquetas opcionales en sitemap.xml

  • <lastmod> Muestra la última fecha de modificación. Los robots saben si el contenido de una página dada ha cambiado desde el último escaneo. En lastmod, usamos W3C Datetime (YYYY-MM-DD).
  • <priority> Se supone que la etiqueta indica las subpáginas más importantes. El rango de valores en esta etiqueta es de 0,0 a 1,0, donde la prioridad predeterminada para las subpáginas es 0,5. Desafortunadamente, Google Robots ignora esto (fuente).
  • <changefreq> Etiqueta que especifica la frecuencia de los cambios. De hecho, este elemento fue para ayudar a determinar la frecuencia de escaneo de una subpágina determinada. Puedes insertar uno de los siguientes valores:
    • siempre – documentos que se cambian cada vez que se abren;
    • cada hora – se cambia cada hora;
    • diariamente – se cambia diariamente;
    • semanalmente – se cambia cada semana;
    • por mes – se cambia cada mes;
    • anualmente – se cambia cada año;
    • nunca – nunca se cambia.
La image de Mugé de Pixabay

¿Qué URL están en el mapa del sitio?

Como mencioné al comienzo de este artículo, no todas las URL deben incluirse en tu mapa del sitio. Algunos elementos pueden dañar el proceso de indexación. Así que asegúrate de que tu mapa del sitio contenga solo subpáginas valiosas:

  • Páginas que generan el código de respuesta 200;
  • Las páginas que no están bloqueadas en el archivo robots.txt;
  • Enlaces canónicos;
  • Páginas de valores de usuario;
  • Páginas no protegidas con contraseña o de difícil acceso;

Al mirar el tipo de sitio web, estos serán tu página de inicio, categorías y páginas de productos, publicaciones de blog, categorías de blog, páginas de preguntas frecuentes y páginas estáticas.

¿Qué URL no deberían estar en el mapa del sitio?

Es útil saber qué direcciones evitar al crear un mapa del sitio:

  • URL con redirecciones;
  • Páginas de error 40X y 50X;
  • Páginas bloqueadas por robots.txt;
  • Páginas etiquetadas con noindex;
  • Páginas de bajo valor para los usuarios (reglamentos, política de privacidad);
  • Páginas de paginación;
  • Páginas de resultados de búsqueda;
  • Páginas con parámetros de filtrado o clasificación;

¿Cómo generar un mapa del sitio? – Los métodos más populares

Dependiendo del tamaño de la página y del sistema CMS utilizado, la generación del mapa del sitio se puede hacer usando herramientas gratuitas (generadores de sitemap.xml), herramientas integradas o plugins.

¿Cómo generar sitemap.xml para WordPress?

Comencemos con el CMS más popular. La forma más rápida y fácil de crear un mapa del sitio es usar el plugin Yoast SEO. Crea automáticamente un mapa del sitio para nosotros. Solo seleccionamos la configuración adecuada y decidimos qué recursos incluir. El plugin es muy intuitivo y fácil de usar. Además, su versión básica tiene opciones que son suficientes para la mayoría de los webmasters.

Cómo generar un mapa del sitio en Yoast SEO
Sitemaps de UltaHost generados por Yoast SEO

¿Cómo generar sitemap.xml para otro CMS?

Otros CMS populares también tienen sistemas de plugins decentes. Pero si no puedes encontrar un plugin o módulo que podría haber usado para crear tu mapa del sitio, eso no significa que tengas que prepararlo manualmente. Hay muchas herramientas gratuitas y de pago que puedes utilizar.

En este artículo, quiero discutir los aspectos decisivos de sitemap.xml, por lo que no habrá suficiente espacio para comparar generadores de mapas de sitios gratuitos, pero busca en Google “generador de mapas de sitios XML gratuitos” y obtendrás docenas de resultados.

Un generador en línea gratuito que crea un mapa del sitio tiene algunas limitaciones. Por lo general, este es un máximo de 500 URL que puedes colocar en sitemap.xml. Entonces, si tu sitio web no es demasiado complicado, puedes encontrar fácilmente un generador gratuito de sitemap.xml. Si tu sitio web es complejo, debes esforzarte más en elegir un buen software.

Los sitemaps creados manualmente no se actualizan automáticamente. Recuerda actualizarlos después de agregar nuevos productos, publicaciones o páginas.

¿Dónde colocar el archivo sitemap.xml?

El archivo sitemap.xml generado generalmente se encuentra en el directorio raíz del sitio web al que hace referencia y está disponible en https://tusitio.com/sitemap.xml. Por lo general, pero no siempre. Tanto el nombre como la ruta pueden diferir dependiendo de si el mapa del sitio se agregó manualmente o si usaste soluciones integradas.

Para facilitar que los rastreadores encuentren tu mapa del sitio, es una buena idea incluir una ruta en tu archivo robots.txt. Todo lo que tenemos que hacer es agregar una regla de Sitemap.

Los tipos más populares de sitemap.xml

Los sitemaps no son siempre los mismos. Según el tipo y el tamaño de tu sitio web, es posible que necesites diferentes tipos de mapas de sitio. Asegúrate de averiguar qué es un índice de mapa de sitio, cuándo elegir un mapa de imagen y cómo se relaciona tu mapa de sitio con Google News.

Mapa del sitio clásico

Un mapa del sitio XML estándar vincula a las páginas de tu sitio. Mayormente conocido como sitemap.xml

Mapa de resumen Sitemap-index.xml

Un índice de mapa de sitio no es nada más que un mapa de sitio que contiene otros mapas de sitio. Se utiliza para sitios complejos en los que un gran mapa del sitio tiene más de 50 MB. Debes dividir a tu sitio en varios más pequeños mapas de sitio y conectarlos entre sí mediante el índice del mapa del sitio.

Además, el plugin Yoast SEO mencionado anteriormente crea un índice de mapa del sitio para diferentes tipos de páginas. Yoast SEO crea un mapa del sitio separado para páginas, publicaciones de blog, categorías de blog o autores.

La foto de Christina Morillo de Pexels

Mapa del sitio con archivos de imagen y películas

Si deseas que tus archivos de imágenes aparezcan en la búsqueda de imágenes de Google, puedes aumentar tus posibilidades de hacerlo creando un mapa del sitio dedicado. Los robots de indexación no tienen problemas para encontrar e indexar archivos de imagen, pero configuraciones como lazyload pueden dificultarles la tarea.

Sitemap de artículos en Google News

Google News se ha convertido en una fuente de información para muchos usuarios. Merece la pena luchar por un buen puesto allí. El mapa del sitio del artículo debe contener enlaces a artículos que no tengan más de dos días de antigüedad.

¿Cómo cargo sitemap.xml en Google Search Console?

No creamos sitemaps para nosotros o los usuarios, sino para los rastreadores. Recomiendo publicar tu mapa del sitio y enviarlo a Google Search Console para que los rastreadores de Google puedan acceder fácilmente a él.

Paso 1: Ve a la pestaña “Sitemaps” en el menú lateral.

Paso 2: Ingresa la ruta a tu mapa del sitio. Por lo general, este es sitemap.xml o sitemap-index.xml.

Paso 3: Verifica el estado de tu mapa del sitio después de cargarlo. Debes verificar la fecha de carga, la última lectura, el estado y las URL detectadas. Si ves “error al descargar”, vuelve a enviar tu mapa del sitio. Si el error persiste, comprueba que el archivo está disponible en la dirección proporcionada.

¿Por qué es tan importante sitemap.xml desde el punto de vista de SEO?

La creación de sitemaps en 2005 fue un paso significativo hacia una mejor indexación de las páginas web por parte de los motores de búsqueda. A lo largo de los años, los motores de búsqueda y sus robots de indexación han evolucionado y encuentran mejor los recursos en las subpáginas.

La verificación y optimización del mapa del sitio también se ha convertido en una parte esencial de las auditorías de SEO. Los robots no tendrán problemas para indexar tus subpáginas con la estructura correcta de la página y un buen enlace interno, pero lo hacen lentamente.

Crear un mapa del sitio es una tarea relativamente rápida y sencilla que te ayudará a encontrar páginas difíciles de alcanzar. Puedes ayudar a los robots a descubrir tus páginas más rápido. Al enviar tu mapa del sitio en Google Search Console, obtendrás resultados de SEO más rápido.

Conclusión

Un mapa del sitio es uno de los elementos básicos de la optimización de un sitio web. Puedes crear un mapa del sitio utilizando el CMS y sus funciones integradas o utilizando herramientas generalmente disponibles. Generarlo y agregarlo en GSC facilitará que los robots lleguen a todas las subpáginas que deseas indexar. Agregar un mapa del sitio es especialmente importante para sitios grandes y nuevos.

Si te ha gustado este artículo, te encantará la plataforma de hosting UltaHost. Obtén soporte 24/7 de nuestro equipo. Nuestra infraestructura de alta calidad se centra en el escalado automático, el rendimiento y la seguridad. ¡Déjanos mostrarte la diferencia! ¡Consulta nuestros planes!

Previous Post
How to build a committed community on the blog

¿Cómo construir una comunidad de blog comprometida?

Next Post
Google Forms

¿Cómo usar Formularios de Google? Tutorial paso a paso

Related Posts
 25% off   Enjoy Powerful Next-Gen VPS Hosting from as low as $5.50