La Autoridad Temática tras la filtración de Google
En mayo de 2024, la industria digital alcanzó un punto de inflexión sin precedentes. La filtración de más de 2,500 páginas de documentación técnica interna de Google (la "Google Search API Leak") puso fin a la era de las especulaciones sobre la autoridad temática.
Las definiciones reveladas confirmaron que los motores de búsqueda modernos ya no ven un sitio web únicamente como un gráfico de enlaces (el modelo clásico de PageRank). En el marco actual de recuperación de información, un sitio se analiza como un vector en un espacio matemático multidimensional.
Entre los miles de atributos filtrados, el Site Focus (referenciado como siteFocusScore) surgió como un parámetro de calidad crítico. Es una métrica matemática que marca una línea clara entre los servicios liderados por expertos y los sitios generalistas. La documentación también introduce el Site Radius (siteRadius), que complementa al Site Focus describiendo el grado de dispersión temática del contenido dentro de un dominio.
¿Qué significa esto en la práctica? Vamos a profundizar.
¿Qué es el Site Focus?
El parámetro siteFocusScore es un valor numérico que define el nivel de concentración temática de un dominio. En pocas palabras, es una métrica que responde a una pregunta clave: ¿Es este sitio web un experto especializado en un solo campo, o es simplemente otro portal generalista?
Para entender cómo funciona este mecanismo, usemos una analogía sencilla:
- Site Focus alto (El efecto láser): Imagina un sitio que publica contenido exclusivamente sobre un tema; por ejemplo, la elaboración de café de especialidad. Cada artículo está interconectado temáticamente. La "energía" de este sitio actúa como un láser: estrecho, pero increíblemente potente y preciso. Para los algoritmos, un sitio así es la autoridad indiscutible en su nicho.
-
Site Focus bajo (El efecto bombilla): En el otro extremo están los portales multitemáticos que cubren desde construcción hasta alta costura. Su contenido está disperso por todo el mapa temático. Funcionan como una bombilla estándar: iluminan un área amplia, pero la luz es difusa y débil. Un sitio así tiene una puntuación de enfoque baja porque carece de una especialización clara.

Las matemáticas vectoriales operan bajo un principio sencillo: los expertos son más confiables. Si un sitio tiene un Site Focus alto, es mucho más probable que los sistemas de clasificación asuman que cualquier publicación posterior en ese dominio también cumplirá con altos estándares de calidad temática.
Comentario

Matuesz Godzic, Head of Growth en WhitePress®
Hoy en día, el SEO se está convirtiendo en una ingeniería de precisión, y el auge de la IA solo está acelerando ese ritmo. Ya no hay lugar para conjeturas ni para basar estrategias en métricas vacías. Necesitas saber exactamente por qué eliges un portal específico para publicar. La clave es crear contenido que genere autoridad, no solo en Google, sino en todos los canales que extraen conocimiento de nuestro trabajo. La era de la manipulación y de 'forzar' el tráfico mediante palabras clave no relacionadas se está desvaneciendo. Esta revolución no ocurrirá de la noche a la mañana, pero su progreso es constante e inevitable.
¿Cómo se calcula la puntuación de Site Focus?
Los algoritmos no leen el texto como los humanos; lo convierten en números. Para replicar este proceso con precisión, se requiere ingeniería de datos avanzada. El mecanismo para calcular la consistencia temática se puede dividir en cuatro etapas clave:
-
Extracción de contenido: El proceso comienza rastreando el sitemap y extrayendo los datos textuales clave de cada subpágina. El objetivo es aislar el "ADN semántico" de cada artículo.
-
Vectorización (Embedding): A continuación, las representaciones basadas en palabras se convierten en representaciones matemáticas llamadas vectores, que luego se integran en un espacio multidimensional. En este entorno, "significado" equivale a "ubicación": los textos con temas similares aterrizan cerca unos de otros.
-
Cálculo del Centroide (El corazón del sitio): Este es el paso más crítico. Se calcula un vector promedio, conocido como centroide, para todos los vectores (páginas) de un dominio determinado. El centroide es el "centro de gravedad" matemático del sitio. Define la identidad del portal: el punto alrededor del cual orbita todo el contenido.
-
Medición de distancia: Finalmente, el sistema mide qué tan cerca están las páginas individuales de este centroide. Cuanto más densamente agrupados estén los vectores alrededor del centro, mayor será la puntuación de Site Focus.
Gracias a este enfoque, el sistema no adivina el tema: lo calcula. Puede ver claramente si el portal mantiene el rumbo (un grupo denso de puntos) o si deriva en direcciones aleatorias. También cabe destacar que tanto el Site Focus como el Site Radius son métricas dinámicas; cambian cada vez que se publica, actualiza o elimina contenido, y a medida que evoluciona el perfil temático del dominio.
Por qué los números brutos no son suficientes
Si dependiéramos únicamente de cálculos matemáticos brutos, el resultado no significaría mucho para el usuario medio. Esto se debe a que los modelos de lenguaje modernos son propensos a un fenómeno llamado anisotropía.
Básicamente, los vectores de texto tienden a agruparse en un área estrecha y restringida del espacio vectorial, a menudo llamado "Efecto Cono". Debido a esto, incluso artículos temáticamente diferentes pueden mostrar una alta similitud de base simplemente porque comparten el mismo idioma y estructura gramatical.
Si calculas el Site Focus utilizando datos sin procesar en este contexto, podrías obtener un valor abstracto como 0.064. Por sí solo, ese número no tiene sentido. Sin un punto de referencia, es imposible saber si indica una alta autoridad o un caos temático.
La solución: Calibración
Para convertir estos números en información empresarial útil, los resultados deben someterse a una calibración (ajuste). Esto implica establecer una escala de referencia comparando portales multitemáticos amplios con sitios de nicho hiperespecializados.
Al hacerlo, las matemáticas puras se traducen en categorías claras e intuitivas. Esto permite a los usuarios distinguir fácilmente entre un portal "todoterreno" y una autoridad temática estrictamente enfocada.
¿Qué es el Site Radius?
Mientras que el Site Focus describe la salud general de un sitio web (verificando su consistencia total), el Site Radius nos permite evaluar cada artículo individualmente. Es una métrica de distancia que calcula cuánto se ha "alejado" una subpágina específica del tema central del sitio.
Para visualizar esto, los analistas de datos suelen recurrir a una analogía astronómica:
- El Sol (Centroide): El tema principal del sitio web (ej. "Automoción").
- Los Planetas (Subpáginas): Artículos individuales.
- La Órbita (Radius): La distancia de un planeta respecto al Sol.
¿Cómo interpretar el Radius?
- Site Radius bajo (Órbita cerrada): Un artículo estrechamente alineado con el tema central (ej. un texto sobre neumáticos en un portal de coches) se mantiene cerca del "Sol". Esto indica que el contenido es relevante y encaja con el perfil experto del sitio.
- Site Radius alto (El Cometa): Si ese mismo portal publica un artículo que no tiene nada que ver con coches (ej. una receta de cocina), terminará en una órbita muy lejana. Su vector se sitúa lejos del centroide.
Un Site Radius elevado suele ser una señal de alerta. Puede indicar un intento de manipular los rankings, una "dilución" de la autoridad del sitio o la falta de una estrategia de contenidos cohesionada.
¿Cómo usar estas métricas en la práctica?
Aunque el Site Focus y el Radius no son factores de clasificación independientes por sí solos, te permiten abordar el SEO y el marketing de contenidos con una estructura mucho más sólida. Las decisiones dejan de basarse en el "instinto" para centrarse en análisis fundamentados en datos reales.
Es importante señalar que estas métricas no se pueden extraer directamente de Google Search Console ni de las herramientas SEO estándar. Son producto de un análisis vectorial avanzado y requieren procesar enormes conjuntos de datos mediante Modelos de Lenguaje Extensos (LLMs). Por tanto, lo normal es acceder a ellas a través de plataformas especializadas; ¡y muy pronto estarán disponibles directamente en la plataforma WhitePress®!
Precisión al elegir dónde publicar
Los métodos tradicionales para elegir un sitio de publicación —para un post de invitado, por ejemplo— suelen basarse en categorías generales y carecen de la profundidad que aportan el Site Focus y el Radius. ¿Buscas portales para conseguir enlaces o menciones de marca y mejorar tu visibilidad en la IA y en Google? Con estas métricas, puedes llevar tus esfuerzos al siguiente nivel. Esto es especialmente útil al promocionar un producto especializado, ya que te permite identificar con precisión webs que tienen una alta concentración de contenido sobre tu tema específico.
Además, estos sistemas pueden encontrar el lugar adecuado para una publicación incluso en portales generalistas, identificando clústeres de contenido que están semánticamente relacionados con tu artículo. Esto significa que, a pesar de un Site Focus general más bajo para el dominio, puedes elegir con exactitud el mejor punto para colocar un enlace o mención. Es un gran paso hacia un link building de alta calidad y precisión quirúrgica.
Comentario

Katarina Dahlin, Senior Growth Hacker & SEO Expert at WhitePress®
Hace unos años, podía posicionar un mismo sitio para varios temas no relacionados sin mucha dificultad. Hoy, eso ya no funciona, mientras que los sitios enfocados temáticamente están superando a los más amplios, incluso cuando estos últimos tienen más contenido. La forma en que el algoritmo clasifica los sitios ha cambiado notablemente, haciendo que la limpieza de contenido (content pruning) y un enfoque más crítico en la creación sean esenciales. El mismo principio se aplica al link building: elegir medios con relevancia temática se ha vuelto crítico para el éxito.
Higiene temática y limpieza de contenidos (Content Pruning)
Para los propietarios de sitios web, el Site Radius es una herramienta de diagnóstico increíblemente valiosa. Permite señalar con exactitud qué subpáginas se han alejado demasiado de tu tema central. Esto facilita la identificación de artículos que podrían estar diluyendo la autoridad de tu dominio, como publicaciones obsoletas que ya no encajan con tu perfil actual.
En muchos casos, la limpieza de contenidos —el proceso de eliminar material que infla artificialmente el radio de tu sitio— puede aumentar la autoridad del dominio de forma más eficaz que publicar artículos nuevos. A veces, basta con una simple actualización, fusionar publicaciones relacionadas o situarlas en un contexto temático más sólido.
Categorización automática
La innovación más importante aquí es el abandono de la "autodeclaración". Hasta ahora, la categoría de un portal dependía totalmente de cómo lo describía el editor. Gracias a los embeddings semánticos, ahora son los propios vectores de contenido los que definen la categoría. El sistema asigna automáticamente un portal al "cubo semántico" correcto basándose en lo que realmente publica, y no en lo que afirma ser en el pie de página.
Comentario

Itamar Blauer, Head of Marketing & Growth en WhitePress® (UK)
El Site Focus y el Site Radius ofrecen una imagen más clara de la relevancia de un sitio web basándose en cálculos matemáticos contextuales al contenido real. Permite a los especialistas en marketing ver rápidamente si un sitio está altamente especializado, si es de temática amplia o si está disperso en diversos temas, y qué tanto coincide con los temas con los que quieren asociarse.
Las matemáticas: la nueva moneda del SEO
La filtración de la documentación de la API de Google fue un momento crucial que confirmó que la Autoridad Temática (Topical Authority) es una variable sólida y calculable. Sirve como una señal clara de que el SEO se está convirtiendo cada vez más en una disciplina de ciencia de datos, más que en una interpretación subjetiva.
Métricas como el Site Focus y el Site Radius nos permiten navegar por este panorama con precisión matemática. En lugar de depender de la intuición, la industria está obteniendo acceso a cifras reales, lo que permite a las marcas construir su visibilidad de forma estratégica y en perfecta alineación con la lógica de los motores de búsqueda modernos.