Google over het beschermen van het ankertekstsignaal tegen de invloed van spamsites

Tijdens de Google SEO Office Hours-sessie beantwoordde Google Search Quality Team-lid Duy Nguyen een vraag over links op spamsites en hoe vertrouwen daarmee samenhangt. Het was interessant hoe de Googler zei dat ze het ankertekstsignaal opslaan. Dit is niet iets waar vaak over gesproken wordt. Vertrouwen opbouwen met Google is belangrijk voor veel uitgevers en SEO’s. Er is een idee dat “vertrouwen” uw website zal helpen om geïndexeerd te worden en goed te rangschikken. Het is ook bekend dat er geen “vertrouwen”-metriek is, wat sommige leden van de zoekgemeenschap soms in de war brengt. Hoe kan een algoritme worden vertrouwd als het iets niet meet? Googlers beantwoorden deze vraag eigenlijk niet, maar er zijn patenten en onderzoeksdocumenten die een idee geven.

Google vertrouwt geen links van spamsites

Een persoon die een vraag voorlegde aan SEO Hours vroeg: “Als een domein bestraft wordt, heeft dat dan invloed op de links die er vandaan komen?”
Googler Duy Nguyen antwoordde:
“Ik neem aan dat je met ‘bestraft’ bedoelt dat het domein is gedegradeerd door onze spam-algoritmen of door handmatige actie.” Over het algemeen vertrouwen we geen links van sites waarvan we weten dat ze spam zijn. Dit helpt ons om de kwaliteit van de ankersignalen te behouden.

Vertrouwen en referenties

Googlers praten over vertrouwen, en het is duidelijk dat ze het hebben over hun algoritmen die iets vertrouwen of iets niet vertrouwen. In dit geval gaat het niet om het niet tellen van links op spamsites, maar vooral om het niet tellen van het bijlagetekstsignaal. De SEO-gemeenschap heeft het over ‘vertrouwen opbouwen’, maar in dit geval gaat het er echt om geen spam te creëren.

Hoe bepaalt Google dat een website spam is?

Niet elke site wordt bestraft of handmatig gedaan. Sommige sites zijn niet eens geïndexeerd, wat het werk is van Google Spam Brain, een AI-platform dat webpagina’s op verschillende punten analyseert, te beginnen met crawlen.
Spam Brain Platform werkt als volgt:

  • Indexerende poortwachter

    Spam Brain blokkeert websites tijdens het crawlen, inclusief inhoud die wordt gedetecteerd met behulp van de zoekconsole en sitemaps.

  • Jaagt op geïndexeerde spam

    Spam Brain legt ook spam vast die is geïndexeerd op het moment dat een site in aanmerking komt voor ranking.

Het platform van Spam Brain werkt door kunstmatige intelligentie te trainen op basis van de kennis van Google over spam. Google merkte op hoe Spam Brain werkt: “Door onze diepgaande kennis van spam te combineren met AI, konden we vorig jaar onze eigen anti-spam AI bouwen die ongelooflijk effectief is in het detecteren van bekende en opkomende spamtrends. We weten niet wat”kennis van spamGoogle praat erover, maar er zijn verschillende patenten en research papers over. Degenen die diep in dit onderwerp willen duiken, kunnen het artikel lezen dat ik schreef over het concept van Link Distance Ranking Algorithms – The Link Ranking Method. Ik heb ook een gedetailleerd artikel gepubliceerd over verschillende wetenschappelijke artikelen waarin op links gebaseerde algoritmen worden beschreven die kunnen beschrijven wat het pinguïnalgoritme is. Hoewel er de afgelopen tien jaar of langer veel patenten en research papers zijn gepubliceerd, is er sindsdien niets meer gepubliceerd door zoekmachines en universitaire onderzoekers. Het belang van deze patenten en onderzoeksdocumenten is dat ze in een andere vorm hun weg kunnen vinden naar het algoritme van Google, zoals voor training en kunstmatige intelligentie zoals Spam Brain. Het patent, besproken in een artikel over op afstand gebaseerde linkranking, beschrijft hoe de methode PageRank-scores toekent op basis van de afstand tussen een reeks vertrouwde “thuissites” en de pagina’s waarnaar ze verwijzen. De seed-sites zijn als referentiepunten om te berekenen welke sites normaal zijn en welke niet (dwz junk). De intuïtie is dat hoe verder een site verwijderd is van de oorspronkelijke site, hoe groter de kans dat de site als spam wordt beschouwd. Dit deel van spamdetectie via linkafstand wordt besproken in de onderzoeksdocumenten die worden aangehaald in het Penguin-artikel dat ik eerder noemde.
octrooi, (Pagina’s rangschikken met behulp van afstanden in een weblinkgrafiek), legt uit:

“Het systeem wijst vervolgens lengtes toe aan de links op basis van de eigenschappen van de links en de eigenschappen van de pagina’s die aan de links zijn gekoppeld. Vervolgens berekent het systeem de kortste afstanden van de eerste set pagina’s naar elke pagina in de set pagina’s op basis van de lengte van de links tussen de pagina’s. Het systeem bepaalt vervolgens een PageRank-score voor elke set pagina’s op basis van de berekende kortste afstanden.

Gereduceerde linkgrafiek

Hetzelfde patent vermeldt ook wat bekend staat als een gereduceerde linkgrafiek. Dit is echter niet het enige patent dat zich bezighoudt met gereduceerde linkgrafieken. Gereduceerde linkgrafieken zijn ook buiten Google bestudeerd. Een linkgrafiek is als een kaart van internet die is gemaakt door koppelingen in kaart te brengen. Een verkleinde linkgrafiek verwijdert links van lage kwaliteit en gerelateerde sites. Wat overblijft is een zogenaamd gereduceerd linkdiagram.
Hier is een citaat uit het Google-patent hierboven:
“Reduced Link Graph Merk op dat de links die deelnemen aan de k kortste paden van de bovenliggende elementen naar de pagina’s een subgrafiek vormen die alle links bevat die “vloeien” in ranglijsten van de bovenliggende elementen. Hoewel deze subgrafiek veel minder links heeft dan de originele linkgrafiek, hebben de k kortste paden van de beginelementen naar elke pagina van deze subgrafiek dezelfde lengte als de paden in de originele grafiek. …Bovendien kan de rangschikkingsstroom voor elke pagina worden teruggestuurd naar de dichtstbijzijnde k zaden via de paden van deze subgrafiek.

Google vertrouwt geen links van bestrafte sites

Het is duidelijk dat Google links van bestrafte sites niet vertrouwt. Soms is het echter niet bekend of een Spam Brain-site wordt bestraft of als spam wordt gemarkeerd. Voordat u probeert een link van een site te krijgen, is het een goed idee om te onderzoeken of de site niet vertrouwd is. Naar mijn mening mogen statistieken van derden niet worden gebruikt bij dergelijke zakelijke beslissingen, omdat de berekeningen die worden gebruikt om de score af te leiden, verborgen zijn. Als een site al verwijst naar mogelijk spam-sites die inkomende links hebben van potentiële betaalde links, zoals PBN’s (Private Blog Networks), dan is het hoogstwaarschijnlijk een spam-site.

Afbeelding afkomstig van Shutterstock/Krakenimages.com
Houd de SEO-werkuren bij:

Relevante berichten