Topical Authority à la lumière de Google Leak
En Mai 2024, l'industrie numérique a connu un tournant sans précédent. La fuite de plus de 2 500 pages de documentation technique interne de Google ("Google Search API Leak") a mis fin à l'ère des spéculations autour de l'autorité thématique.
Les définitions révélées ont confirmé que les moteurs de recherche modernes ne considèrent plus un site web uniquement comme un graphe de liens (le modèle PageRank classique). Dans le cadre actuel de Information Retrieval, un site est analysé comme un vecteur dans un espace mathématique multidimensionnel.
Parmi les milliers d'attributs divulgués, Site Focus (référencé sous le nom de siteFocusScore) s'est imposé comme un paramètre de qualité essentiel. Il s'agit d'une mesure mathématique qui établit une distinction claire entre les services dirigés par des experts et les sites généralistes. La documentation présente également Site Radius (siteRadius), qui complète Site Focus en décrivant le degré de dispersion thématique du contenu au sein d'un domaine.
Qu'est-ce que cela signifie concrètement ? Voyons cela de plus près..
Qu'est-ce que Site Focus ?
Le paramètre siteFocusScore est une valeur numérique qui définit le niveau de concentration thématique d'un domaine. En termes simples, il s'agit d'un indicateur qui répond à une question fondamentale : ce site web est-il spécialisé dans un domaine particulier ou s'agit-il simplement d'un site généraliste parmi tant d'autres ?
Pour comprendre comment fonctionne ce mécanisme, utilisons une analogie simple :
-
High Site Focus (l'effet laser) : Imaginez un site qui publie exclusivement du contenu sur un seul sujet, par exemple la préparation du café. Tous les articles sont liés entre eux par leur thème. L'« énergie » de ce site agit comme un laser : étroite, mais incroyablement puissante et précise. Pour les algorithmes, un tel site fait figure d'autorité incontestée dans son domaine.
-
Low Site Focus (l'effet ampoule) : À l'autre extrémité du spectre se trouvent les sites multithématiques qui couvrent tous les domaines, de la construction à la haute couture. Leur contenu est dispersé sur l'ensemble de la carte thématique. Ils fonctionnent comme une ampoule standard : ils éclairent une large zone, mais la lumière est diffuse et faible. Un tel site a un faible score de concentration, car il ne dispose pas d'une spécialisation claire.

Les mathématiques vectorielles fonctionnent selon un principe simple : les experts sont plus fiables. Si un site web a un Site Focus élevé, les systèmes de classement sont beaucoup plus susceptibles de supposer que toute publication ultérieure sur ce domaine répondra également à des normes élevées de qualité thématique.
Commentaire

Mateusz Godzic, Head of Growth chez WhitePress®
Aujourd'hui, le référencement naturel devient une ingénierie de précision et l'essor de l'IA ne fait qu'accélérer ce rythme. Il n'y a plus de place pour les conjectures ou les stratégies basées sur des indicateurs creux. Vous devez savoir exactement pourquoi vous choisissez un site spécifique pour la publication. La clé est de créer un contenu qui renforce votre autorité, non seulement sur Google, mais aussi sur tous les canaux qui tirent parti de notre travail. L'ère de la manipulation et du « trafic forcé » via des mots-clés sans rapport avec le sujet touche lentement à sa fin. Cette révolution ne se fera pas du jour au lendemain, mais sa progression est constante et inévitable.
Comment le score Site Focus est-il calculé ?
Les algorithmes ne lisent pas le texte comme le font les humains ; ils le convertissent en chiffres. Pour reproduire ce processus avec précision, il faut recourir à des techniques avancées d'ingénierie des données. Le mécanisme de calcul de la cohérence thématique peut être décomposé en quatre étapes clés :
-
Extraction de contenu : le processus commence par l'exploration du plan du site et l'extraction des données textuelles clés de chaque sous-page. L'objectif est d'isoler l'« ADN sémantique » de chaque article.
-
Vectorisation (intégration) : ensuite, les représentations basées sur les mots sont converties en représentations mathématiques appelées vecteurs, qui sont alors intégrées dans un espace multidimensionnel. Dans cet environnement, la « signification » équivaut à la « localisation » : les textes ayant des thèmes similaires se retrouvent proches les uns des autres.
-
Calcul du centroïde (le cœur du site) : Il s'agit de l'étape la plus critique. Un vecteur moyen, appelé centroïde, est calculé pour tous les vecteurs (pages) d'un domaine donné. Le centroïde est le « centre de gravité » mathématique du site. Il définit l'identité du site, le point autour duquel gravitent tous les contenus.
-
Mesure de la distance : enfin, le système mesure la proximité des pages individuelles par rapport à ce centre de gravité. Plus les vecteurs sont regroupés autour du centre, plus le score Site Focus est élevé.
Grâce à cette approche, le système ne devine pas le sujet, il le calcule. Il peut voir clairement si le site reste sur la bonne voie (un groupe dense de points) ou s'il dérive dans des directions aléatoires. Il convient également de noter que Site Focus et Site Radius sont des mesures dynamiques ; elles changent chaque fois que du contenu est publié, mis à jour ou supprimé, et à mesure que le profil thématique du domaine évolue.
Pourquoi les chiffres bruts ne suffisent pas
Si nous nous basions uniquement sur des calculs mathématiques bruts, le résultat n'aurait pas beaucoup de sens pour l'utilisateur moyen. En effet, les modèles linguistiques modernes sont sujets à un phénomène appelé anisotropie.
Essentiellement, les vecteurs de texte ont tendance à se regrouper dans une zone étroite et restreinte de l'espace vectoriel, souvent appelée effet de cône. De ce fait, même des articles thématiquement différents peuvent présenter une similitude de base élevée simplement parce qu'ils partagent la même langue et la même structure grammaticale.
Si vous calculez le Site Focus à partir de données brutes dans ce contexte, vous obtiendrez peut-être une valeur abstraite telle que 0,064. En soi, ce chiffre n'a aucune signification. Sans point de référence, il est impossible de savoir s'il indique une autorité élevée ou un chaos thématique.
La solution : Calibration
Pour transformer ces chiffres en informations commerciales exploitables, les résultats doivent être calibrés (ajustés). Cela implique d'établir une échelle de référence en comparant des sites généralistes traitant de nombreux sujets à des sites hyper-spécialisés.
De cette manière, les mathématiques brutes sont traduites en catégories claires et intuitives. Cela permet aux utilisateurs de faire facilement la distinction entre un site « fourre-tout » et une autorité thématique strictement ciblée.
Qu'est-ce que Site Radius ?
Alors que Site Focus décrit la santé globale d'un site web (en vérifiant sa cohérence globale), Site Radius nous permet d'évaluer chaque article individuellement. Il s'agit d'une mesure de distance qui calcule à quel point une sous-page spécifique s'est « éloignée » du thème central du site.
Pour visualiser cela, les analystes de données ont souvent recours à une analogie astronomique :
- Le Soleil (centroïde) : Le sujet principal du site Web (par exemple, « Automobile »).
- Les planètes (sous-pages) : articles individuels.
- L'orbite (rayon) : distance entre une planète et le Soleil.
Comment interpréter Radius ?
Un Site Radius élevé est souvent considéré comme un signal d'alarme. Il peut indiquer une tentative de manipulation des classements, une « dilution » de l'autorité du site ou l'absence d'une stratégie de contenu cohérente.
Comment utiliser ces indicateurs dans la pratique ?
Bien que Site Focus et Radius ne soient pas des facteurs de classement autonomes, ils vous permettent d'aborder le référencement et le marketing de contenu avec un degré de structuration beaucoup plus élevé. Les décisions ne reposent plus sur l'intuition, mais sur une analyse fondée sur des données concrètes.
Il est important de noter que ces indicateurs ne peuvent pas être extraits directement de Google Search Console ou des outils SEO standard. Ils sont le résultat d'une analyse vectorielle avancée et nécessitent le traitement d'ensembles de données volumineux à l'aide de modèles linguistiques à grande échelle (LLM). Par conséquent, vous y accédez généralement via des plateformes spécialisées, mais ils seront bientôt disponibles directement sur la plateforme WhitePress® !
Précision dans le choix des emplacements de publication
Les méthodes traditionnelles de sélection d'un site de publication, par exemple pour un article invité, reposent souvent sur des catégories générales et ne fournissent pas les informations détaillées offertes par Site Focus et Radius. Vous recherchez des sites pour acquérir des liens ou des mentions de marque afin d'améliorer votre visibilité dans l'IA et Google ? Grâce à ces indicateurs, vous pouvez passer à la vitesse supérieure. Cela s'avère particulièrement utile pour promouvoir un produit spécialisé, car cela vous permet d'identifier précisément les sites web qui proposent un contenu très concentré sur votre sujet spécifique.
De plus, ces systèmes peuvent trouver le bon emplacement pour une publication, même sur des sites généralistes, en identifiant les groupes de contenus sémantiquement liés à votre article. Cela signifie que malgré un Site Focus global plus faible pour le domaine, vous pouvez toujours choisir avec précision le meilleur emplacement pour insérer un lien ou une mention de marque. Il s'agit d'une avancée majeure vers une création de liens de haute qualité et ciblée avec précision.
Commentaire

Katarina Dahlin, Senior Growth Hacker & SEO Expert chez WhitePress®
Il y a quelques années, je pouvais classer un seul site pour plusieurs sujets sans rapport entre eux sans grande difficulté. Aujourd'hui, cela ne fonctionne plus, alors que les sites axés sur un sujet précis surpassent les sites plus généraux, même lorsque ces derniers proposent davantage de contenu. La manière dont l'algorithme classe les sites a considérablement changé, rendant indispensable la suppression de contenu et une approche plus critique de la création de contenu. Le même principe s'applique à la création de liens. Le choix d'éditeurs pertinents sur le plan thématique est devenu essentiel pour réussir la création de liens.
Hygiène thématique et tri du contenu
Pour les propriétaires de sites web, Site Radius est un outil de diagnostic extrêmement précieux. Il vous permet d'identifier précisément les sous-pages qui s'éloignent trop de votre thème principal. Vous pouvez ainsi repérer facilement les articles qui risquent de nuire à l'autorité de votre domaine, tels que les publications obsolètes qui ne correspondent plus à votre profil actuel.
Dans de nombreux cas, l'élagage de contenu—le processus consistant à supprimer le contenu qui gonfle artificiellement le rayonnement de votre site—peut renforcer l'autorité de domaine plus efficacement que la publication de nouveaux articles. Parfois, une simple mise à jour, la fusion d'articles liés ou leur placement dans un contexte thématique plus fort suffisent.
Catégorisation automatique
La principale innovation réside dans l'abandon du principe d'« auto-déclaration ». Jusqu'à présent, la catégorie d'un site dépendait entièrement de la description fournie par son éditeur. Grâce à l'intégration sémantique, ce sont désormais les vecteurs de contenu eux-mêmes qui définissent la catégorie. Le système attribue automatiquement à chaque site la catégorie sémantique appropriée en fonction de son contenu réel, plutôt que de se baser sur la description fournie dans le pied de page.
Commentaire

Itamar Blauer, Head of Marketing & Growth chez WhitePress® (UK)
Site Focus et Site Radius fournissent une image plus claire de la pertinence d'un site web sur la base de calculs mathématiques contextuels au contenu réel du site. Cela permet aux professionnels du marketing de voir rapidement si un site est très spécialisé, traite de thèmes généraux ou aborde des sujets variés, et dans quelle mesure il correspond aux thèmes auxquels ils souhaitent être associés.
Les mathématiques : la nouvelle devise du SEO
La fuite de la documentation de l'API Google a marqué un tournant décisif, confirmant que l'autorité thématique est une variable difficile à calculer. Elle montre clairement que le référencement naturel devient de plus en plus un domaine relevant de la science des données plutôt que de l'interprétation subjective.
Des indicateurs tels que Site Focus et Site Radius nous permettent de naviguer dans ce paysage avec une précision mathématique. Au lieu de se fier à l'intuition, le secteur dispose désormais de chiffres concrets, ce qui permet aux marques de renforcer leur visibilité de manière stratégique et en parfaite adéquation avec la logique des moteurs de recherche modernes.