El posicionamiento en buscadores de los sitios que diseñamos y realizamos tiene una enorme importancia en un entorno muy competitivo como la web de hoy. Frecuentemente, la posición del sitio en la lista de resultados determina el éxito o el fracaso de nuestro trabajo, aún con diseños creativos y profesionales.
¿Qué es y para qué sirve un sitemap?
La condición básica y fundamental del posicionamiento es la certeza de que todas las páginas del sitio se encuentran indexadas correctamente, y esto no es siempre fácil de lograr.
Aquí es donde los Sitemaps pueden ser de gran ayuda.
En el mundo del diseño web, el posicionamiento en los buscadores de los sitios que realizamos ha ganado una enorme importancia. Una medida de ello es la cantidad de tiempo y esfuerzo que dedicamos a optimizar los sitios primero y a conseguir buenos enlaces entrantes después.
Un requisito básico para que todo ese empeño rinda frutos es lograr que todas las páginas del sitio estén correctamente indexadas en los motores de búsqueda. Esto ocurrirá siempre y cuando los crawlers (arañas) de los buscadores importantes visiten e indexen esas páginas con la periodicidad adecuada y sin omitir ninguna.
Aún sin recurrir a ningún procedimiento extra, las arañas relevan las páginas de los sitios web simplemente siguiendo los enlaces (a menos que estos incluyan el atributo “no-follow”), pero hay más cosas que pueden hacerse.
Una buena estrategia consiste en suministrar a los buscadores una “lista” de las páginas que nos interesa que se indexen, junto con alguna información adicional que haga la visita más eficaz. Concretamente, eso se logra mediante el uso de Sitemaps.
Un sitemap es un archivo XML que contiene una lista de las páginas del sitio junto con alguna información adicional, tal como con qué frecuencia la página cambia sus contenidos, cuándo fue su última actualización y qué tan importante es respecto al resto de las páginas del mismo sitio.
La construcción del archivo XML debe seguir una serie de pautas especificadas en el protocolo de sitemaps, que describimos a continuación:
Contenidos obligatorios del sitemap
El protocolo Sitemap se construye en base a etiquetas XML (Tags) incluidas en un archivo con codificación UTF-8.
Los valores de datos (por contraposición a las etiquetas mismas) deben utilizar códigos de escape para ciertos caracteres especiales, tal como se acostumbra en HTML.
Por ejemplo, las comillas dobles deben ser reemplazadas por " y los signos < y > por < y > respectivamente.
El archivo XML debe:
- Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>
- Especificar el protocolo estándar al que responde dentro de la etiqueta de apertura <urlset>
- Incluir una entrada <url> por cada dirección URL (que corresponderá a cada una de las páginas del sitio) como nodo XML padre.
- Incluir un nodo XML hijo <loc> para cada dirección URL (cada nodo XML padre <url>).
Resumiendo estos aspectos en un ejemplo (sitio con dos páginas):
Código :
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.misitio.com/</loc> </url> <url> <loc>http://www.misitio.com/contacto.htm</loc> </url> </urlset>
Contenidos opcionales del sitemap
Cada nodo <url> padre puede contener (además del nodo <loc> hijo obligatorio) cierta información adicional útil para que el proceso de indexación se realice más inteligentemente.
Los nodos opcionales, aunque importantes, son:
<lastmod>Fecha</lastmod>
Se refiere a la fecha de la última modificación de la página que figura en <loc>
Esta fecha debe expresarse en formado AAAA-MM-DD, por lo que el 8 de julio de 2006 será 2006-07-08.
<changefrec>Frecuencia</changefrec>
Se refiere a que tan a menudo cambia la página que figura en <loc> y será un dato que indicará a la araña con qué frecuencia volver a visitar el sitio. Es un valor orientativo, por lo que no quiere decir que deba cumplirse forzosamente.
Frecuencia puede tomar alguno de los siguientes valores: always (siempre, para páginas que cambian cada vez que se muestran. Típicamente, las dinámicas), hourly (a cada hora), daily (diariamente), weekly (semanalmente), monthly (mensualmente), yearly (anualmente) o never (nunca, típicamente para páginas archivadas).
<priority>Valor</priority>
Se refiere a la importancia que tiene la página que figura en <loc> respecto de las demás que componen el sitio. Es simplemente una manera de indicar prioridades relativas dentro del sitio, sin ningún efecto hacia el exterior del mismo.
Valor puede tomar valores entre 0 y 1. El valor por defecto es 0.5
Volviendo al ejemplo anterior y agregando los atributos opcionales:
Código :
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.misitio.com/</loc> <lastmod>2006-11-20</lastmod> <changefrec>monthly</changefrec> <priority>0.8</priority> </url> <url> <loc>http://www.misitio.com/contacto.htm</loc> <lastmod>2006-08-01</lastmod> <changefreq>yearly</changefreq> <priority>0.3</priority> </url> </urlset>
El archivo XML así construido se aloja en el servidor como un archivo más del sitio, con la salvedad de que puede contener las URL contenidas en el mismo directorio en que se encuentra o en otros contenidos en él.
Por esta razón se recomienda enfáticamente colocar sitemap.xml directamente en el root del sitio.
A partir de este punto solo queda enviar el sitemap a los buscadores, que generalmente disponen de una página específica para aceptarlo.
Para el caso de Yahoo de Argentina, puede sugerirse un sitio y enviar el sitemap desde http://ar.search.yahoo.com/free/submit?fr=FP-tab-web-t (requiere registro previo).
El caso de Google es sutilmente distinto, ya que la construcción del sitemap sigue un protocolo propio, muy similar pero más sencillo. Cuenta además con una interfaz muy completa de seguimiento.
Todo en http://www.google.com/webmasters/sitemaps/siteoverview (requiere registro previo).
¿Sabes SQL? ¿No-SQL? Aprende MySQL, PostgreSQL, MongoDB, Redis y más con el Curso Profesional de Bases de Datos que empieza el martes, en vivo.
Por DanielSemper el 22 de Noviembre de 2006
Muy bien rakidwam
Por Zah el 22 de Noviembre de 2006
A muchos nos servirá.
Por Sisco el 22 de Noviembre de 2006
Gracias muchas!
Por La100rra el 22 de Noviembre de 2006
Más información aquí.
Por Pedro el 22 de Noviembre de 2006
Buen tip!
Por Zguillez el 23 de Noviembre de 2006
Por Suriv el 23 de Noviembre de 2006
Por faustmaniako el 23 de Noviembre de 2006
Pd. Gracias por el tip!!
Por noctam el 25 de Noviembre de 2006
gracias!!
Por blanca el 03 de Marzo de 2007
Por SidV el 06 de Marzo de 2007
Por SidV el 06 de Marzo de 2007
La100rra :
Más información aquí.
Queria aclarar que existe una version actualizada (beta) de este plug para WordPress, leer:
Código :
Salu2
Por Horacio Reyes el 22 de Abril de 2007
pueden ver la mia en: http://wadooa.com/sitemap.xml.gz
esta hecha con motor de dokuwiki: http://wadooa.com/doku.php
saludos,
wadooa user
Por GNGC el 23 de Abril de 2007
Abres el Notepad.exe
agregas la URL
http://tusitioweb.com/paginas.html
Asi todas.
Por Miguel el 30 de Abril de 2007
GRACIAS
Por Campi el 19 de Mayo de 2007
Por ricardo el 02 de Septiembre de 2007
Por The Fricky! el 02 de Septiembre de 2007
Otra cosa interesante que leí cuando investigaba sobre los sitemaps es que puedes colocar en tu archivo robots.txt esta línea
Código :
y así los agentes pueden detectar tu sitemap sin necesidad de enviarlo a los buscadores.
De hecho, yo tengo registradas las páginas en las herramientas para webmasters de Google y detectan correctamente el sitemap por el robots.txt
Por Nestor el 13 de Octubre de 2007
mis sitio es pro-maq.com.ar
Por Marcelo el 17 de Enero de 2008
Gracias!!!
Por porkeno el 20 de Enero de 2008
Por Cristobal el 23 de Agosto de 2008
Gracias por la información es muy util
Por Perro_Callejero el 10 de Diciembre de 2008
Por Luis Martinez el 28 de Abril de 2009
Por El forro el 05 de Octubre de 2009
Por fernando el 11 de Noviembre de 2009
Por playaelcuco.com el 19 de Noviembre de 2009
Por Clau el 25 de Noviembre de 2009
Por Daniel Pérez el 11 de Enero de 2010
Por diseñoweb el 18 de Enero de 2010
Por <a href="ht el 18 de Enero de 2010
Por <p>...<p> el 12 de Abril de 2010
Por Socioporn.com el 20 de Marzo de 2012
Lo acabo de usar en mi sitio