Do not speak Spanish? Read this post in English.

Domingo, 17 d enero d 2010.

Parecido seo entre dos keywords

Buenas, llevo una temporada que apenas publico por aquí. Estoy ultimamente bastante liado en mi vida offline y el blog se ha resentido. Esperemos que no dure demasiado.

En este post quisiera explicar una teoría personal sobre el parecido entre palabras y como poder valorar este parecido con una cifra. La idea es dar -a la larga- una herramienta a los redactores de contenidos para que sepan que palabras son las mejores para usar en relación a una keyword concreta. Para ello lo que haremos es encontrar es el “porcentaje de similitud entre dos keywords” cualesquiera, y para eso, como nó, usaremos a Google. Antes de nada avanzar que esta es una teoría personal y por tanto muchos discreparán sobre su utilidad...

La Base

Por experiencia sabemos que Google interpreta, no solo keywords y densidades de palabra concretas sino que cada vez es más capaz de entender distintas formas de expresar la misma keyword, sinónimos e incluso términos relacionados…

¿Cómo debe hacer eso? Sin duda, Google nos ha ido demostrando a lo largo del tiempo que se fia más de su gran base de datos de páginas mundiales que de productos realizados por terceros. Solo en algunos casos más sociales, como la wikipedia, ha estimado que esos contenidos webs tienen validez por si solas. Para mi un claro ejemplo de esto son los correctores ortográficos o las búsquedas recomendadas, en los que hemos podido ver como se recomiendan a veces palabras mal escritas solo porque la mayor parte de la gente las escribe así en las webs (por suerte esto pasa cada vez menos, pero ha sido una realidad).

Hipótesis

Esto me lleva a pensar (y es solo una hipotesis) que la fuente para conseguir ver esta similitud entre keywords debe ser la misma: la repetición en una misma página de esas keywords debe marcar esa similitud. Por lo tanto si dos keywords se usasen mucho en un mismo texto en multitud de páginas del global de internet, tendría sentido entender que estas están relacionadas y que usar una de ellas debería dar peso semántico a la segunda.

Por lo tanto, si yo comparo 2 keywords, puede interesarme mucho ver, sobre el total de veces que esas 2 keywords se han usado en internet, en que porcentaje se han usado conjuntamente en un mismo contenido.

El parecido entre dos keywords sería:

Apariciones de ambas KW en las mismas páginas /
(Apariciones KW-1 en internet + Apariciones KW-2 en internet - Apariciones de ambas KW en las mismas páginas)
x 100

¿Esto como lo resolvemos? Pues buscando las páginas totales indexadas en el buscador para esas keywords por separado y volviendo a buscar páginas indexadas para esas keywords en conjunto.

Pongamos, por ejemplo, que voy a buscar el parecido entre "libro" y "novela", tendríamos que buscar estos valores:

A: Indexadas para la búsqueda "libro", actualmente: 140.000.000
B: Indexadas para la búsqueda "novela", actualmente: 26.200.000
C: Indexadas para la búsqueda "libro novela", actualmente: 24.500.000

Siguiendo la fórmula el parecido entre ambas keywords es de:

24500 / ( 140000 + 262000 - 24500) x 100 = 17,3%

Ahora comparemos la keyword "libro" con "texto":

A: Indexadas para la búsqueda "libro", actualmente: 140.000.000
B: Indexadas para la búsqueda "texto", actualmente: 151.000.000
C: Indexadas para la búsqueda "libro texto", actualente: 40.100.000

40100 / ( 140000 + 151000 - 40100) x 100 = 15,9%

Entonces, si esta teoría fuese cierta, resultaría que nos es más útil, para posicionar la keyword "libro" incluir la keyword "novela" en el texto que la keyword "texto" aunque en realidad ambas están muy relacionadas...

Y, bueno, eso es todo. Como decía es algo personal y seguramente tienes algo que opinar sobre el tema. Hazlo sin miedo. ¿Te parece algo que puede llegar a ayudar a redactores si se simplifica o automatiza el calculo?

Temas Relacionados: seo

Autor:

5 Comentarios para “Parecido seo entre dos keywords”

  1. david dice:

    Me parece muy válida e interesante tu teoria, el contexto es cada vez más importante y que es la propia redacción de un mismo texto la que en muchas ocasiones marca la diferencia.

  2. Alex dice:

    La semántica y similaridad no sólo va ligada a la densidad. Si te interesan estos temas, te sugiero que veas todo lo que hay, desde hace muchos años, en el área de investigación semántica, procesamiento de lenguaje, y áreas formales del trabajo en websearch (que no son a nivel textual). Usualmente, los vectores de trabajo usan la "similaridad" en planos mucho más complejos que la mera repetición. Los algoritmos reales trabajan en otros planos.

  3. Los algoritmos cada día van más encaminado y es un punto a tener en cuenta para el futuro, a mi me ha gustado tu formula aunque no la he realizado nunca.

  4. Pero es una teoría muy pillada por los pelos, ¿no?
    Quiero decir, que si Google lo hiciera con una simple división, no sería un algorítmo semántico, sería un chiste SEO.

    Esto es como lo del KEY, dividiendo el volumen de búsqueda entre el numero de resultados, que da un número totalmente arbitrario, ya que ambos valores (el segundo mucho más) son una aproximación estadística, es decir, que está echado a ojo por Google para dar una idea. Tomarlos como algo más que eso sería como creer en los marcianos.

    Vamos, que el 'porcentaje de similitud entre dos keywords', perfectamente podría ser el número de veces que un término está incluido en la definición de la RAE del otro. O en la Espasa Calpe.

  5. ikhuerta dice:

    Buenas, Gracias por vuestros comentarios.

    Dejar claro que no creo que la semántica se reduzca a repetición de keywords. Simplemente argumentaba que la base podía estar ahí, en el global de páginas, y a partir de ahí se introducirían todos los algoritmos que queráis...

    Como bien dicen Miguel el KEY es arbitrario pero aun así útil. A sabiendas de que a este calculo le faltan por tener en cuenta mil indicadores que ni siqueira conocemos, se trataba de lanzar una idea que pudiese, como decía, resultar mínimamente útil a redactores...

    La idea sería: voy a hacer un listado de x palabras relacionadas con mi keyword, veamos cuales tengo que usar con mayor prioridad... en ese caso este porcentaje de relación quizás pudiese ayudarles.

    Me interesa vuestra opinión sobre eso... Entiendo que alex no cree ni que la base sea correcta y que Miguel piensa que faltan tantas cosas a tener en cuenta -"tan pillado por los pelos"- que no serviría de ayuda... ¿cierto?

Anímate y deja tu comentario

Esto son experimentos, no preguntes ;) prueba metadescription Prueba title