Do not speak Spanish? Read this post in English.

Lunes, 24 d octubre d 2011.

Indexación en buscadores: Una aplicación, si no es una web, no puede posicionarse

Con el cambio profesional que he vivido en los últimos meses -para el que no lo sepa, dejé mi puesto en Ulises-Grupo Planeta y ahora trabajo desde Ibiza como consultor de marketing online independiente- mis cientes, experiencias y en consecuencia el tipo de trabajo que realizo ha dado pequeños giros más o menos drásticos. Como con todo, esto tiene sus partes buenas y malas -aunque en conjunto estoy muy contento con mi decisión-.

Dentro de esas "nuevas" experiencias empiezo a encontrarme un caso bastante común que anteriormente veía muy de tanto en tanto: Webs que en realidad son aplicaciones pensadas para un usuario y mientras son desarrollos bastante complejos, no cumplen los criterios básicos que necesita una web a día de hoy para ser trabajada en buscadores. Estoy hablando de aplicaciones muy ricas en javascript y ajax, complejos buscadores que solo provocan páginas con envíos de formularios, webs creadas según necesidades de campañas de marketing y que por tanto controlan la navegación del usuario sin ofrecer estructuras claras, webs que cambian sus contenidos constantemente para orientarse a la conversión, etc... webs, en definitiva complejas, con un gran trabajo de desarrollo detrás pero con un nulo acercamiento al SEO y lo que es peor, a los estándares web.

La realidad es que estamos viviendo un momento en el que los perfiles de los profesionales del mundo web están mezclados como nunca y no se garantiza en muchos sitios que las soluciones propuestas tengan realmente sentido en lo que a día de hoy sigue siendo técnicamente internet: "Documentos únicos unidos mediante enlaces entre si". El tema de este cambio de perfil en el mundo online, da para un post por si solo así que hoy no me extenderé demasiado en esto. Simplemente creo que a día de hoy no se da prioridad a conocimientos muy básicos de Internet en favor de las cosas que están más "de moda" y esto da lugar a webs bastante sorprendentes: con ciertos aspectos técnicos y/o de acercamiento al usuario realmente muy avanzados pero con una base con la que es difícil trabajar en buscadores.

El documento: el átomo de internet

El fallo más común que se suele comenter creo que está en la concepción de "qué es un documento". Algo que para los que empezamos creando páginas web estáticas era vital hoy no parece serlo tanto. Un documento es la pieza básica que forma cada elemento de internet y que conforma cada unidad de información separada que existe en la web. Un Documento es cada página web de un site, cada fotografía suelta, cada archivo pdf e incluso cada odioso archivo flash de las webs de branding americanas.

Para que nos entendamos, un documento es lo que se nos muestra al cargar una URL en internet. Para el que ande más despistado comentar el término URL (uniform resource locator), que es el identificador único de un recurso/documento en internet. En la práctica una URL es la dirección de la página web que vemos escrita en la barra de navegación en nuestro navegador al cargar una página. Y suele tener un aspecto del tipo:

http://midominio.com/mi/pagina/web.html?con-variable=a-algo&otra-variable=a-otra-cosa

Por lo tanto, cada vez que entramos en una URL con nuestro navegador, lo que hacemos es solicitar un documento para poder verlo.

Cabe destacar que cada URL es única y aunque por se definición no es obligatorio, en la práctica se debe escribir siempre y igual y con la misma forma EXACTA. Por ejemplo, todas estas URLs, en la práctica, son documentos distintos:

  • (original) - http://midominio.com/pagina.html?con-variable=a-algo&otra-variable=a-otra-cosa
  • (con www.) - http://www.midominio.com/pagina.html?con-variable=a-algo&otra-variable=a-otra-cosa
  • (sin .html) http://midominio.com/pagina?con-variable=a-algo&otra-variable=a-otra-cosa
  • (con mayúsculas) - http://midominio.com/Pagina.html?con-variable=a-algo&otra-variable=a-otra-cosa
  • (con variables invertidas) - http://midominio.com/pagina.html?otra-variable=a-otra-cosa&con-variable=a-algo
  • (con https) https://midominio.com/pagina.html?con-variable=a-algo&otra-variable=a-otra-cosa

Así pues, cada URL distinta, debe devolver un documento distinto. Y, de la misma forma, un documento debe poder ser siempre accedido mediante una URL única (sin más añadidos). Cualquier cosa que se salga de este patrón de correspondencia "URL = Documento", no suele estar bien resuelta:

  • Usar la misma URL para varios resultados de búsqueda distintos (mediante envíos por POST o con cookies)
  • Usar URLs distintas o con órdenes distintos en sus valores para acceder al mismo documento
  • Cargar en una URL una parte del documento y luego con AJAX llamar a otro documento e incorporarlo en el primero
  • Dividir un documento en frames donde cada uno de ellos es en realidad una URL y por tanto un documento por si solo...

Los buscadores, aún no muestran información, sino Documentos

Fijémonos en como funciona un buscador a día de hoy... ¿que nos devuelve? Por mucho que nos empeñemos en ver cosas raras, la realidad es que la inmensa mayoría de los resultados corresponden a documentos concretos (con URLs distintas y diferenciadas que nos indican bajo el resultado). De ahí la importancia de que nuestras webs funcionen como conjuntos de documentos: de otra forma, ¿como van a poder mostrarnos los buscadores? Es cierto, que Internet avanza poco a poco hacia la web semántica, donde los conceptos e informaciones no necesitarán de documentos, sino que serán resultados por si solos, pero seguimos muy lejos de esa concepción todavía... como decía, el documento sigue siendo el átomo de internet.

Por lo tanto, fuera de si nos gusta o no esta forma de entender internet como un conjunto de documentos agrupados en dominios, la realidad es que si queremos aparecer en los buscadores no nos queda otra que entender las cosas tal y como están definidas... o eso o comernos los mocos mientras la competencia se queda con nuestra parte del pastel de buscadores (si crees que es tu opción, ahí no entro).

Entonces, ¿las URL's Amigables? ¿Son documentos?

Las Urls amigables son un gran invento y en SEO nos hemos apoyado mucho en ellas para decirle a todo el mundo como hacer las cosas... pero... la realidad es que no son realmente las urls amigables lo que más nos ayuda a mejorar las páginas, sino el hecho de que al incorporarlas estamos obligando a los desarrolladores a seguir esta equivalencia de la que hablabamos: Una URL = Un documento. Así, al obligar a las páginas a usar urls con nombres y apellidos conseguiamos 3 cosas:

  • Poner una URL clara asociada a un documento que nos interesa posicionar
  • Hacer legible y facilmente "copiable" esa url para las personas
  • De paso, poner alguna keyword en la url, que algo ayuda

Realmente, en mi experiencia, la mejora real sufrida al pasar a URL's amigables no es por usar keywords sino por obligar a las webs a definir bien cuales son sus documentos.

¿Dónde está el problema? Cuando pensamos que simplemente es por la keyword y dejamos que los programadores creen una capa de urls amigables por encima de la web, sin eliminar las antiguas URL's. En ese caso lo que estamos haciendo es precisamente lo contrario de lo que queremos: Usar dos URL's para un único documento. O lo que en SEO llamamos "Contenidos Duplicados".

Un documento por Concepto explicado

Entendiendo como funciona Internet, a la que empezamos a trabajar en SEO llegamos a una conclusión clara: Si los buscadores solo pueden ofrecer documentos como resultados de búsqueda, realmente necesito separar en un documento distinto cada detalle de información que tengo en mi web en documentos distintos para que el buscador pueda mostrarlos como un resultado.

Este es el motivo por el que muchas veces al entrar un SEO a mirar una web empieza a pedir que se separen y creen páginas para todo...

  • Tenemos una lista de personas: Un documento por persona
  • Tenemos una serie de servicios ofrecidos: Un documento por servicio
  • Tenemos noticias o un blog: Un documento por noticia o post
  • Tenemos una galería de multimedia: Un documento por imágen o vídeo
  • Etc...

De otra forma, los buscadores no sabrían como ofrecer justo ese elemento cuando alguien lo busque.

Internet es Información, y un documento necesita contenido

Otro de los problemas clásicos es precisamente cuando comprendemos que necesitamos muchos documentos pero no nos fijamos de realmente cuanta información tenemos de estos... Imaginemos el caso de la lista de personas que teníamos anteriormente. Vemos una serie de expertos en X materia en la página "Expertos" de nuestro site. Por el bien del SEO decidimos que queremos separar estas personas en documentos distintos por si alguien busca a estos Expertos por su nombre y apellidos, que vean que trabajan con nosotros y por eso conviene que nos contraten. ¿El problema? que en mi listado de expertos yo solo había puesto su nombre, su foto y su cargo... ¿Realmente puedo crear un documento solo con un nombre, una foto y una línea de texto? Poder, podemos... pero es dificil que podamos posicionar gran cosa solo con esto. La solución: buscar más datos de cada persona: una Biografía, los datos de su CV, sus intereses, etc. ¿O te crees que Linkedin y Facebook te piden tantos datos solo por tu bien?

Si, seguramente este paso significa "trabajar", pero nadie dijo que hacer SEO fuese solo tocar 3 etiquetas... bueno si se dice... pero es que la gente dice muchas tonterias sobre el SEO.

Arañas y documentos

Por último, un documento necesita ser indexado. Llamamos indexar al hecho de que los buscadores descubran que un documento existe y lo almacenen en sus bases de datos para poder mostrarlo en sus resultados. Por lo tanto lo que queremos es poder garantizar que todos nuestros documentos son tenidos en cuenta por los buscadores para eso tenemos 2 herramientas, la primera mucho más útil que la segunda.

1. Los links:

Los links -ya sean con etiqueta "a" o "area"- son los que siguen las arañas de los buscadores -los famosos googlebot, bingbot, etc...- para encontrar nuevos documentos en internet. Estas lo que hacen es buscar URLs por el html de nuestros documentos y probar si ahí encuentran nuevos documentos que leer.

Así pues, lo que tenemos que hacer siempre no es solo conseguir que nuestra web se componga de documentos claros sino que además estos tiene que ir ofreciendo links entre ellos de forma que ni un solo documento escape de las arañas. Además hay que tener en cuenta que las arañas "se cansan" de seguir links, por lo que cuanto antes encuentren esos links mejor... No sería la primera vez que alguien divide su información en cientos de páginas consecutivas, ofreciendo solo links de anterior y siguiente para descubrir que en los buscadores solo aparecen las 3 primeras páginas...

Hay que ofrecer el camino más corto en links hacia todos los documentos de nuetras webs. Para ello nada mejor que dibujar realmente cual es la estructura de nuestro site, viendo que paginas son hijas de otras y dibujando -al menos mentalmente- un árbol de contenidos que tenga en cuenta todos nuestros documentos. A partir de ahí sabremos que cada "documento madre", debe ofrecer links hacia sus "documentos hijos" y podremos conseguir que en pocos pasos las arañas indexen todos nuestros documentos.

2. Los sitemaps.xml:

Los sitemaps.xml son una ayuda que los buscadores nos dan para indicarle directamente en su sitema que documentos tenemos en nuestro site. Al final se reducen a una colección de urls con una prioridad de 0.1 a 1.0 y una periodicidad de modificación del contenido de las páginas.

Los sitemaps están muy bien, pero no debemos caer en el error de pensar que con solo incluir ahí un documento los buscadores lo leeran y lo tendrán en cuenta. Son solo una ayuda. Los links son y serán siempre lo más importante.

Tu aplicación... ¡debe ser una web!

Una vez explicado todo esto la conclusión es evidente. Toda esa web tan compleja que has montado y que no sabes por qué no acabas de posicionar bien debe transformarse en una web: un conjunto de documentos con urls únicas y links que lleven hasta todos ellos.

Esto podrás hacerlo de muchas formas distintas...

  • Hay quien reestructura toda su web por completo
  • Hay quien hace pequeños añadidos con bloques de links para poder parecerse más a esta estructura
  • Hay quien realmente monta una estructura por detrás de lo que es su web principal donde todo adquiere formato de web normal menos dinámica
  • Hay quien incluso fabrica una web normal y luego le añade con javascript todos los efectos. Esta opción me encanta pero sin duda es la que más trabajo da
  • .

La solución no es lo importante y seguramente para llegar a ella tendrás en cuenta muchos factores: tu web actual, tu equipo, lo que esperas de tus usuarios, etc. Lo importante son los documentos: Mientras ofrezcas documentos a los buscadores, podrás aspirar a ser alguien en ellos...

Temas Relacionados: seo

Autor:

3 Comentarios para “Indexación en buscadores: Una aplicación, si no es una web, no puede posicionarse”

  1. Brillante documento Iñaki. Estoy seguro que ayudará a mucha gente a tener un poco más de criterio. Cada día podemos aprender un poco más sobre SEO. Gracias por tu generosidad.

  2. Saludos,

    Una solución para evitar el contenido duplicado es asegurarse de hacer redirecciones 301 (movido permanentemente) cuando cambiamos las URL y de establecer la url canónica para que google asuma que http://www.midominio.com es igual a midominio.com.

  3. Un saludo Iñaki, hacia tiempo que no entraba a leerte, estaba tan ocupado con un proyecto nuevo, que bien me vendría tu ayuda ya que lo saco a internet el próximo lunes.

    Sobre tu post como siempre, "las cosas cuanto más claras mejor", que es tu filosofía y a tu edad es difícil cambiar. Opino lo mismo o se hacen bien o no se hacen.

Anímate y deja tu comentario