Enthüllung von 18.000 Ranking-Kriterien: Das Yandex-Leak

0
(0)

Die russische Suchmaschine Yandex geriet kürzlich in die Schlagzeilen, als ein ehemaliger Mitarbeiter streng geheime Informationen zu den Ranking-Kriterien der Suchmaschine enthüllte. Die Veröffentlichung dieses umfangreichen Datenbestandes, der als eines der größten Leaks aller Zeiten gilt, hat die SEO-Community aufhorchen lassen. Doch was genau können SEO-Experten aus diesem Yandex-Leak lernen, und welche Auswirkungen könnten sich daraus auf Google und die Welt der Suchmaschinenoptimierung ergeben? Dieser Artikel wirft einen Blick auf die brisanten Informationen und gibt einen Umriss der Situation.

Ein Blick auf die Zahlen: 18.000 Ranking-Kriterien

Der Yandex-Leak offenbarte anfänglich beeindruckende 1.900 Bewertungsparameter, die von einem Insider der Öffentlichkeit zugänglich gemacht wurden. Doch bei näherer Untersuchung stellt sich heraus, dass es insgesamt ganze 18.000 Ranking-Variablen sind, die in dieser 44-GB-Datei enthalten sind. Diese Variablen decken nicht nur die Suchfunktion von Yandex ab, sondern beziehen sich auch auf andere Dienste des Unternehmens wie Karten, E-Mail, Metrika, Disc und die Cloud.

Was SEOs aus dem Yandex-Leak lernen können

Trotz der immensen Menge an veröffentlichten Daten ist zu beachten, dass es sich um eine veraltete Version des Yandex-Repositorys handelt. Schätzungsweise bestehen bis zu 64 % der Daten aus veraltetem oder inaktivem Code. Darüber hinaus beinhalten die veröffentlichten Codefragmente auch Testtechniken, die ausschließlich intern für die Prüfung der eigenen Dienste von Yandex genutzt wurden. Die Aktualität und Relevanz dieser Informationen für die heutige Suchmaschinenoptimierung sind daher fraglich.

Dennoch sind einige SEO-Experten der Meinung, dass die veröffentlichten Daten und Ranking-Variablen wertvolle Einblicke bieten. Insbesondere die folgenden Erkenntnisse könnten nützlich sein:

Welche Ranking-Indizes verwendet Yandex?

Das veröffentlichte Archiv enthält keine ausdrückliche Erwähnung der von Google verwendeten Variablen und Signale. Dennoch besteht die Möglichkeit von Überschneidungen, die dazu beitragen könnten, die Funktionsweise von Suchmaschinen besser zu verstehen. SEOs könnten von diesen Erkenntnissen profitieren.

Die Ranking-Elemente von Yandex

Nach dem Leak wurden die veröffentlichten Informationen von SEO-Experten analysiert. Es scheint, dass Yandex seine Ranking-Elemente in drei Hauptgruppen unterteilt:

  1. Statische Elemente: Diese sind direkt mit der Website verknüpft und umfassen Dinge wie interne Links, Header und Anzeigenverhältnisse.
  2. Dynamische Elemente: Hierzu gehören Textrelevanz, Schlüsselworteinbindung und TF*IDF, die sich sowohl auf die Website als auch auf die Suchanfrage beziehen.
  3. Benutzerbezogene Elemente: Hier spielen der Standort des Benutzers, die Abfragesprache und die Änderung des Zwecks eine Rolle.

Zudem wurde festgestellt, dass Wochentage und die Tageszeit das Ranking beeinflussen können.

Einblick in wichtige Kategorien

Malte Landwehr, ein SEO-Spezialist, konnte 40 % der Ranking-Variablen in verschiedene Kategorien einteilen. Dazu gehören:

  • Benutzer-Feedback
  • Links
  • Textrelevanz
  • Überlegenheit und Glaubwürdigkeit
  • Die Bedeutung von „YMYL“ (Your Money or Your Life)

Landwehr bestätigte auch, dass „YMYL“ tatsächlich zur Website-Optimierung eingesetzt wird und es spezielle Ranking-Kriterien für Themen aus den Bereichen Medizin, Finanzen und Recht gibt.

Einzigartige Regeln für Yandex

Eine weitere interessante Erkenntnis ist, dass Yandex bestimmte einzigartige Vorschriften anwendet. Beispielsweise erhalten Wikipedia-Links und -Referenzen mehr Gewicht in der Bewertung. Auch einige soziale Netzwerke wie die russische Version von Facebook (VKontakte) oder TikTok haben ein eigenes Ranking-Kriterium. Darüber hinaus wurden Details zu HTTPS, Urheberschaft, Erkennung von übersetztem Material, Seitenleistung sowie Benutzerbewertungen und -kommentaren offengelegt. Zusätzlich gibt es zehn Elemente, die sich auf den Wochentag und die Tageszeit beziehen und das Ranking beeinflussen.

Ausblick und Unsicherheit

Die Analyse der gestohlenen Informationen durch SEO-Experten ist aufgrund ihrer Größe und Komplexität noch nicht abgeschlossen. Es ist durchaus möglich, dass in den kommenden Wochen weitere Erkenntnisse und Enthüllungen folgen werden, die das Verständnis der Ranking-Faktoren von Yandex vertiefen.

Yandex-Leak: Ein wiederholter Vorfall

Yandex ist eine der weltweit größten Suchmaschinen und die zehnthäufigst besuchte Website. Obwohl der jüngste Vorfall keine Auswirkungen auf die persönlichen Daten der Benutzer hatte, stellt der offenbarte Code an sich ein Sicherheitsrisiko für Yandex dar. Hacker könnten die Informationen nutzen, um nach Sicherheitslücken zu suchen und diese auszunutzen.

Es sei darauf hingewiesen, dass dies nicht das erste Mal ist, dass Yandex mit einem solchen Vorfall konfrontiert ist. Bereits 2015 versuchte ein ehemaliger Mitarbeiter, den Suchmaschinencode für fast 30.000 US-Dollar zu verkaufen.

Ein Auszug aus einem Code:

Gruppe: [
„Datum und Uhrzeit“,
„Domäne“,
„Schnelle Klicks“,
„Statische Registrierungshosts“,
„Statische Registrierungsdokumente“,
„Regex“,
„LinkBM25“,
„TextBM25“,
„Text und Link BM25“,
„BM25F“,
„Bestes Formular“,
„UrlBM25“,
„Positionssprachmodell“,
„DBM25“,
„AuxBM25“,
„Annotation“,
„Tocm“,
„Bocm“,
„Kombinierte Zusammenfassungen“,
„SWBM25“,
„QI“,
„Kombinierte Sequenzen“,
„Exakte Gruppen“,
„Q-Segmente“,
„Abfrage-Wortsequenzen TR“,
„Abfrage-Wortsequenzen LR“,
„SynSetLocm“,
„Xref“,
„Legacy LR“,
„Legacy TR“,
„Dynamisch“,
„BCLM“,
„Link-Formen“,
„Text-Formen“,
„Registrierungswort-Hosts“,
„Abfrage“,
„Abfragetitel-Schnipsel-CTR“
]

Bereich {
Name: „Web-Produktion“

Faktor {
    Index:              0
    CppName:            "FI_PAGE_RANK"
    Name:               "PR"
    Wiki:               "https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRank"
    Anti-SEO-Obergrenze:  1.0
    Tags:               [TG_DOC, TG_LINK_GRAPH, TG_STATIC, TG_L2, TG_UNUSED]
    Beschreibung:        "Page Rank. Der Faktor wird umgeschrieben."
    Autoren:            "aavdonkin"
    Verantwortliche:       "aavdonkin"
}

Faktor {
    Index:              1
    CppName:            "FI_TEXT_RELEV"
    Name:               "TR"
    Anti-SEO-Obergrenze:  0.95
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Textrelevanz (maxfreq - die Häufigkeit des am häufigsten vorkommenden Worts, das die Bedeutung der Dokumentenlänge hat)."
    Autoren:            ["gulin", "iseg", "leo", "maslov"]
    Verantwortliche:       ["gulin", "leo", "maslov"]
}

Faktor {
    Index:              2
    CppName:            "FI_LINK_RELEV"
    Name:               "LR"
    Anti-SEO-Obergrenze:  1.0
    Gruppe:              "Dynamisch"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED]
    Beschreibung:        "Linkrelevanz. Der Faktor wird umgeschrieben."
    Autoren:            ["aavdonkin", "gulin", "leshch", "melkov"]
    Verantwortliche:       ["aavdonkin", "gulin", "melkov"]
}

Faktor {
    Index:              3
    CppName:            "FI_PAGE_RANK_BONUS"
    Name:               "PrBonus"
    Wiki:               "https://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/PageRankBonus"
    Gruppe:              "Dynamisch"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Prioritätsbonus, Priorität 7 - Textpriorität. Der Faktor ist binär und hat den Wert 0 für alle ein-Wort-Anfragen und fast immer den Wert 1 für Anfragen mit zwei oder mehr Wörtern, außer für sehr wenige Antworten, für die es keine Links gibt, die einen Quorum passiert haben, und der Text hat auch kein Quorum bestanden."
    Autoren:            ["gulin", "leo"]
    Verantwortliche:       "pavelgur"
}

Faktor {
    Index:              4
    CppName:            "FI_TEXT_RELEV_ALL_WORDS"
    Name:               "TRp1"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Strict-Priorität für TR - Textpriorität - alle Wörter der Anfrage sind irgendwo im Dokument vorhanden (sie müssen jedoch die Kontextbeschränkungen der Anfrage erfüllen, z.B. müssen beide Wörter im selben Satz sein)."
    Autoren:            ["denplusplus", "gulin", "leo"]
    Verantwortliche:       ["alsafr", "gulin", "leo"]
}

Faktor {
    Index:              5
    CppName:            "FI_TEXT_RELEV_PHRASE"
    Name:               "TRp2"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_REARR_USE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Phrase-Priorität für TR - Textpriorität - alle Wörter der Anfrage sind im Dokument in einer Reihe vorhanden."
    Autoren:            ["denplusplus", "gulin", "leo"]
    Verantwortliche:       ["alsafr", "gulin", "leo"]
}

Faktor {
    Index:              6
    CppName:            "FI_LINK_RELEV_ALL_WORDS"
    Name:               "LRp1"
    Gruppe:              "Dynamisch"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_DEPRECATED]
    Beschreibung:        "(Strict) - alle Wörter der Anfrage in einem Link vorhanden."
    Autoren:            ["gulin", "leo"]
    Verantwortliche:       ["gulin", "leo"]
}

Faktor {
    Index:              7
    CppName:            "FI_LINK_RELEV_PHRASE"
    Name:               "LRp2"
    Gruppe:              "Dynamisch"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_LINK_TEXT, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_DEPRECATED]
    Beschreibung:        "(Phrase) - alle Wörter der Anfrage in einer Reihe in einem Link vorhanden."
    Autoren:            ["gulin", "leo"]
    Verantwortliche:       ["gulin", "leo"]
}

Faktor {
    Index:              8
    CppName:            "FI_TEXT_RELEV_TITLE"
    Name:               "TRtitle"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Vorhandensein einer exakten Phrase (Anfrage-Text) im Titel (genauer gesagt, im ersten Satz des Dokuments). Kontextbeschränkungen und Stoppwörter werden in der Genauigkeit wie bei TRp2 berücksichtigt, d.h. Faktor[8] vermindert Faktor[5]."
    Autoren:            ["denplusplus", "gulin", "leo"]
    Verantwortliche:       ["alsafr", "gulin", "leo"]
}

Faktor {
    Index:              9
    CppName:            "FI_TEXT_RELEV_WHOLE_HR_MATCHED"
    Name:               "TRhr"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein Abschnitt wurde gefunden, der ein Quorum passiert hat, in dem alle Wortpositionen als BEST_RELEVANT markiert sind (Titel oder Metakeywords)."
    Autoren:            ["gulin", "leo"]
    Verantwortliche:       ["gulin", "leo"]
}

# TODO(FACTORDEL-65): Ersetzen Sie durch TG_REMOVED
Faktor {
    Index:              10
    CppName:            "FI_REMOVED_10"
    Name:               "Entfernt_10"
    Tags:               [TG_UNUSED]
}

Faktor {
    Index:              11
    CppName:            "FI_NEWS"
    Name:               "Nachrichten"
    Wiki:               "http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassifikationsv ? v = tkd # h45859-3"
    Tags:               [TG_HOST, TG_STATIC, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Dies sind Nachrichten (erkannt an charakteristischen Mustern in der URL)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              12
    CppName:            "FI_SHOP"
    Name:               "Geschäft"
    Anti-SEO-Obergrenze:  1.0
    Wiki:               "http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassifikationsv ? v = tkd # h45859-4"
    Tags:               [TG_HOST, TG_STATIC, TG_BINARY, TG_DEPRECATED, TG_OFTEN_ZERO]
    Beschreibung:        "Dies ist ein Geschäftsangebot (erkannt an charakteristischen Mustern in der URL). Nicht verwendet (veraltet)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              13
    CppName:            "FI_CATALOG"
    Name:               "Katalog"
    Anti-SEO-Obergrenze:  1.0
    Wiki:               "http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/Klassifikationsv ? v = tkd # h45859-2"
    Tags:               [TG_HOST, TG_STATIC, TG_BINARY, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Dies ist ein Katalog (erkannt an charakteristischen Mustern in der URL oder am Yandex-Katalog)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              14
    CppName:            "FI_YA_BAR"
    Name:               "YaBar"
    Anti-SEO-Obergrenze:  1.0
    Wiki:               "http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/YaBar"
    Tags:               [TG_BROWSER, TG_HOST, TG_STATIC, TG_USER, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE, TG_USERFEAT_VISITS_ACTIVITY_DOWNLOADS, TG_USERFEAT]
    Beschreibung:        "Besuche aus der Yandex-Bar - Beschreibung der Daten. Der Faktor wird umgeschrieben."
    Autoren:            ["kostyagin", "somov"]
    Verantwortliche:       ["tarum", "niknik"]
}

Faktor {
    Index:              15
    CppName:            "FI_LONG"
    Name:               "Lang"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Langes Dokument (je länger das Dokument, desto höher ist der Faktorwert)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              16
    CppName:            "FI_HIT_WEIGHT"
    Name:               "TRhitw"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_REARR_USE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Hitweigt - eine Variante der Textrelevanz, bei der die Gewichte aller Hits als gleich betrachtet werden (d.h. es werden keine Aufschläge für den Titel und die Nähe der Wörter berücksichtigt). Dabei müssen die entsprechenden Hits die Einschränkungen des Syntaxmagiers erfüllen, d.h. man kann sagen, dass der Faktor TRhitw genau dann gleich 0 ist, wenn SoftAndOk gleich 0 ist."
    Autoren:            ["gulin", "leo"]
    Verantwortliche:       ["gulin", "leo"]
}

Faktor {
    Index:              17
    CppName:            "FI_LONG_QUERY"
    Name:               "LongQuery"
    Gruppe:              "Abfrage"
    Tags:               [TG_QUERY_ONLY, TG_DYNAMIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Summe der idf-Wörter der Anfrage. Der Name spiegelt nicht die tatsächliche Bedeutung wider: Zum Beispiel wird dieser Faktor für die Anfrage 'Гадяч' höher sein als für die Anfrage 'Москва Питер Екатеринбург Самара'."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              18
    CppName:            "FI_PURE_TEXT"
    Name:               "PureText"
    Tags:               [TG_BINARY, TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Wiki:               "http://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/LongText"
    Beschreibung:        "Langer Text ohne Links."
    Autoren:            "leo"
    Verantwortliche:       ["tsimkha", "leo"]
}

Faktor {
    Index:              19
    CppName:            "FI_ROOT"
    Name:               "Wurzel"
    Anti-SEO-Obergrenze:  1.0
    Tags:               [TG_BINARY, TG_DOC, TG_STATIC, TG_REARR_USE, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Wiki:               "http://wiki.yandex-team.ru/jandekspoisk/kachestvopoiska/factordev/web/factors/Root"
    Beschreibung:        "Das ist die Startseite."
    Autoren:            "gulin"
    Verantwortliche:       ["gulin", "tsimkha"]
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    Index:              20
    CppName:            "FI_REMOVED_20"
    Name:               "Entfernt20"
    Tags:               [TG_UNUSED]
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    Index:              21
    CppName:            "FI_REMOVED_21"
    Name:               "Entfernt21"
    Tags:               [TG_UNUSED]
}

Faktor {
    Index:              22
    CppName:            "FI_GEO"
    Name:               "Geo"
    Tags:               [TG_DYNAMIC, TG_LOCALIZED_COUNTRY, TG_HOST, TG_BINARY, TG_DEPRECATED, TG_UNDOCUMENTED, TG_OFTEN_ZERO]
    Beschreibung:        "Bedeutet Übereinstimmung des Benutzergebiets und der Website auf Länderebene. Der Faktor ist binär: 1 - übereinstimmend, 0 - nicht. Es basiert auf der ((http://wiki.yandex-team.ru/ЯндексПоиск/КлассификацияСайтовИСтраниц/Географическая/ИспользованиеВПоиске geografischen Klassifikation von Websites))."
    Autoren:            ["ark-kum", "gulin", "maslov"]
    Verantwortliche:       ["ark-kum", "gulin", "maslov"]
}

Faktor {
    Index:              23
    CppName:            "FI_SUBQUERY_THEME_MATCH"
    Name:               "SubqueryThMatch"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_THEME_CLASSIF, TG_UNDOCUMENTED, TG_L2, TG_DEPRECATED]
    Beschreibung:        "Übereinstimmung der thematischen Spektren der Anfrage und des Dokuments. Das Thema der Anfrage ergibt sich aus der Arbeit ((http://wiki.yandex-team.ru/EvgenijjKroxalev/subquery Zaubererregeln SubquerySearch)). Das Thema des Dokuments wird aus dem Yandex-Katalog entnommen."
    Autoren:            ["abokov", "ekrokhalev", "gulin"]
    Verantwortliche:       ["gulin", "lamo"]
}

Faktor {
    Index:              24
    CppName:            "FI_SR"
    Name:               "SR"
    Tags:               [TG_DOC, TG_STATIC, TG_TRANS, TG_UNDOCUMENTED, TG_UNUSED]
    Beschreibung:        "Zusammengesetzter statischer Rang, der aus statischen Komponenten nach einer separaten Formel zusammengestellt wird ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#oftnd1 *))."
    Autoren:            ["gulin", "somov"]
    Verantwortliche:       ["gulin", "somov"]
}

Faktor {
    Index:              25
    CppName:            "FI_REFINES"
    Name:               "TRref"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_DYNAMIC, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Faktor für die Anzahl der Feinabstimmungen. In der Anfragesprache gibt es die Funktion der Benutzerfeinabstimmungen ('Wort, vor dem ein Prozentzeichen steht'). Der einzige bekannte ((http://staff.yandex-team.ru/gulin wertvolle Einsatz dieser Funktion)) - dies ist die Anfrage [%официальный %сайт НазваниеФирмы]. Den Benutzern ist diese Funktion unbekannt, da sie in keiner Dokumentation beschrieben ist. Es wird erwartet, dass sie aus der Abfragesprache verschwinden wird, aber in der Zaubersprache werden Wörter mit der Priorität USER_REFINE verbleiben. Der Faktor zeigt an, wie viele USER_REFINE-Wörter gleichzeitig innerhalb einer einzigen Hit-Übereinstimmung aufgetreten sind. Es wird angenommen, dass sie von 0 bis 3 reichen (wenn >3, wird angenommen, dass 3)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              26
    CppName:            "FI_CATEGORY_CONTENT"
    Name:               "Kat"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_UNDOCUMENTED, TG_OFTEN_ZERO]
    Beschreibung:        "Die Website befindet sich im Katalog, aber hat keine Kategorien, d.h. sie hat Inhalt."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              27
    CppName:            "FI_NOT_ADULT"
    Name:               "NotAdult"
    Tags:               [TG_DOC, TG_STATIC, TG_BINARY, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Diese Website enthält keine Pornografie. Statischer Faktor."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              28
    CppName:            "FI_SIZE_MODIFIER"
    Name:               "SizeModifier"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Modifikator aufgrund der Länge des Dokuments (einschließlich der Masse des Textes)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              29
    CppName:            "FI_STRICT_PARENT_ID"
    Name:               "Elternteil"
    Tags:               [TG_DOC, TG_STATIC, TG_PARENT_ID_STRICT, TG_L2, TG_UNUSED]
    Beschreibung:        "Harte (binäre) Bindung an die Mutter. Es wird angenommen, dass die Karte des Stammbaums von oben nach unten durchgeht: Erstens die Mutter, dann der Vater. Oder, es wird angenommen, dass der älteste Vater schreibt. Wenn die harte Bindung nicht in der Mutter vorhanden ist, wird sie durch den Vater ersetzt."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              30
    CppName:            "FI_HAS_DOC_IMAGES"
    Name:               "Bild"
    Tags:               [TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein Faktor, der die Anwesenheit von Bildern auf der Seite anzeigt."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              31
    CppName:            "FI_COUNTRY"
    Name:               "Land"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_COUNTRY, TG_L2, TG_UNUSED]
    Beschreibung:        "Das Land des Benutzers und das Land der Seite stimmen überein."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              32
    CppName:            "FI_REGION"
    Name:               "Region"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_REGION, TG_UNUSED]
    Beschreibung:        "Die Region des Benutzers und die Region der Seite stimmen überein."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              33
    CppName:            "FI_QUERY_REGION"
    Name:               "RegionAnfrage"
    Tags:               [TG_QUERY_ONLY, TG_DYNAMIC, TG_REGION, TG_UNUSED]
    Beschreibung:        "Die Region der Anfrage und die Region der Seite stimmen überein."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              34
    CppName:            "FI_LAST_MODIFIED"
    Name:               "ZuletztBearbeitet"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_STATIC, TG_DOC_TEXT, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Übereinstimmung mit dem Zeitpunkt der letzten Veröffentlichung des Dokuments."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              35
    CppName:            "FI_INTENT_DEMAND"
    Name:               "TRdemand"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_STATIC, TG_DOC_TEXT, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Begriffe der Anfrage sind exakt im Dokument vorhanden."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              36
    CppName:            "FI_TEXT_CLICK_THROUGH"
    Name:               "TextCT"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "CTR von Text-Hits. Der Faktor spiegelt das Verhalten der Benutzer wider und variiert je nach der Effektivität des Verlaufs. Siehe auch Faktor[38]."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              37
    CppName:            "FI_NON_TITLE_TEXT"
    Name:               "TRtitlev"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Vorhandensein der Anfrage im Text außerhalb des Titels."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              38
    CppName:            "FI_TEXT_CLICK_THROUGH_RAW"
    Name:               "TextCTraw"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "CTR von Text-Hits ohne allgemeine Klicks. Ähnlich wie Faktor[36], aber die CTR wird nicht aus den allgemeinen CTR-Daten übernommen."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              39
    CppName:            "FI_LOAD_CONTENT"
    Name:               "TRnojs"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Text- oder HTML-Code des Dokuments enthält den vollständigen Inhalt. Es wird erwartet, dass dieser Faktor in Faktor[17] übergeht, in den Regressionsformeln aber nicht genutzt wird. "
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              40
    CppName:            "FI_AGE_OLDER"
    Name:               "TRage1"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Seitenerstellung in der Vergangenheit (älter als 1 Jahr)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              41
    CppName:            "FI_AGE_NEWER"
    Name:               "TRage0"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Seitenerstellung in der letzten Zeit (weniger als 1 Jahr)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              42
    CppName:            "FI_PHRASE_STATISTIC"
    Name:               "TRstat"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Der Text des Dokuments enthält eine oft vorkommende Phrase."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    Index:              43
    CppName:            "FI_IP"
    Name:               "IP"
    Tags:               [TG_DOC, TG_STATIC, TG_DOC_TEXT, TG_BINARY, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Adresse des Dokuments auf der Haupt-IP des Hosts."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_WT"
    Name:               "TRWT"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Die Tendenz des Textes ist durch die Suchanfrage verursacht (die Wortpositionen sind wie in der Anfrage)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_AUTOTHEME"
    Name:               "AutoTh"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Das Thema der Seite stimmt mit dem Thema der Anfrage überein."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_ANCHOR_RELATIVE_SIZE"
    Name:               "REL"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Übereinstimmung der Anzahl der Wörter des Ankerfragments, das zur Seite gehört, mit der Anzahl der Wörter auf der Seite."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_ANCHOR_TH"
    Name:               "TRanT"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "CTR von Text-Hits der Seite mit dem Anker."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_LEXICOSPAM"
    Name:               "LexikoSpam"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Das Vorhandensein von Lexikospam - eine große Menge an Spam aus allgemeinen Sätzen in der Anfrage. Der Faktor dämpft allgemeine Texthits und erhöht allgemeine Textloss."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_HEURISTIC_KEFIR"
    Name:               "HeuristischKefir"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein statischer Faktor, der aus ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/NovyjMakrosHeuristikKefir)) errechnet wurde."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_AID"
    Name:               "TRaid"
    Tags:               [TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein Aufruf zur Hilfe: Ein Dokument wird benötigt, da viele Benutzer auf ihn verweisen."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_DOCUMENT_HOMONYPH"
    Name:               "Homonyph"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Die Dokumentenüberschrift enthält ein homonym the Anfrage."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_DELIVERY_BAD"
    Name:               "TRgood"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Das Dokument enthält Daten über die Lieferung, deren Übereinstimmung nicht garantiert werden kann."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_HELP_BAD"
    Name:               "TRhelp"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Das Dokument enthält Hilfeinformationen, deren Übereinstimmung nicht garantiert werden kann."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_GENDER"
    Name:               "Geschlecht"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Geschlechtsspezifische Übereinstimmung (z.B. Seite 'Kinderzeichnungen' wird nicht für Anfragen wie 'Taschengeld' oder 'Taschengeldmädchen' gefunden)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_LATENT_USER_REQUIREMENTS"
    Name:               "Anforderungen"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Latente Benutzeranforderungen. Es handelt sich um eine große Anzahl von Texten, die aufgrund des Themas, der Intonation oder aus einem anderen Grund gefunden werden, obwoe. Anfragen. Diese ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#KomponentLatent", ")[sollten nicht berücksichtigt werden])."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_SITE_CLUSTER"
    Name:               "SiteCluster"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_L3_OVERWRITE, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein Faktor, der durch ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/TekushhieKomponenty/#KomponentGroupsTematic)", "[die Anwesenheit einer Gruppe von Seiten, die nach einem gemeinsamen Thema erstellt wurden]")."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_MAINPAGE_SPAM"
    Name:               "MainSpam"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Spam auf der Hauptseite, ein Faktor für die Unterdrückung von Text-Hits."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_DISPLAY_URL"
    Name:               "URL"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Entspricht der URL des Dokuments."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_DISPLAY_VOCAL_URL"
    Name:               "VocalURL"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Entspricht der URL des Dokuments mit Akzenten, hervorgehobenen Buchstaben und dem Präfix 'Vocal'."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_VOCAL_QUERY"
    Name:               "VocalAnfrage"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Entspricht der Anfrage mit Akzenten, hervorgehobenen Buchstaben und dem Präfix 'Vocal'."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_HEURISTIC_TOPICS"
    Name:               "HeuristikThemen"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Faktor für Dokumente, die bei der Bildung von Themen gefunden wurden. Ein Faktor aus ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/NovyjMakrosHeuristikLemmatika)) wird nach der Formel ((http://wiki.yandex-team.ru/JandeksPoisk/KachestvoPoiska/ObshayaFormula/NovyjMakrosHeuristikThemen)) verwendet."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_BAD_TEXT"
    Name:               "BadText"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Textloss aus Makrofaktoren - die Qualität des Dokumententextes."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

# TODO(FACTORDEL-97): Ersetzen Sie durch TG_REMOVED, TG_REUSABLE und entfernen Sie alte Formeln
Faktor {
    CppName:            "FI_LEMMATIKA"
    Name:               "Lemmatika"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Faktor für die Qualität der Lemmatisierung (Stabilität)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_ORIGINALITY_RAW"
    Name:               "Rohoriginal"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Faktor für die Einzigartigkeit des Dokumententextes (auf Rohdatenebene)."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_RELEVANT_TEXT_ID"
    Name:               "Relevanz"
    Tags:               [TG_DOC, TG_DYNAMIC, TG_REARR_USE, TG_L2, TG_L3_OVERWRITE]
    Beschreibung:        "Übereinstimmung der Dokumenttexte (gesamte Texte, nicht Paragraphen) untereinander."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_SCHRODINGER_ENTROPY"
    Name:               "ShEN"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_L2, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Entropie des Dokumententextes aus Sicht des Suchsystems. Für diese Entropie sind die Sichtbarkeitswahrscheinlichkeiten der Dokumentobjekte entscheidend."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_SITUS"
    Name:               "Ort"
    Tags:               [TG_DOC, TG_STATIC, TG_COUNTRY, TG_L2, TG_L3_OVERWRITE]
    Beschreibung:        "Das Land der Seite."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_TAGS"
    Name:               "Etiketten"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Ein Faktor, der den Übereinstimmungsfaktor für Webseiten einschränkt."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_TEXTLINKS"
    Name:               "Textlinks"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Texte von Links zu dieser Seite."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_TEXT"
    Name:               "Text"
    Gruppe:              "Legacy TR"
    Tags:               [TG_DOC, TG_DOC_TEXT, TG_STATIC, TG_REARR_USE, TG_UNDOCUMENTED, TG_OFTEN_ZERO, TG_NN_OVER_FEATURES_USE]
    Beschreibung:        "Text eines Dokuments."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

Faktor {
    CppName:            "FI_MODERATION_SCORE"
    Name:               "Moderation"
    Tags:               [TG_DOC, TG_STATIC, TG_L2, TG_UNUSED]
    Beschreibung:        "Der qualitativen Beurteilungsfaktor für Webseiten."
    Autoren:            "gulin"
    Verantwortliche:       "gulin"
}

}

In diesem speziellen Fall handelt es sich um eine Liste von Faktoren, die in den Suchalgorithmus von Yandex, einer Suchmaschine, eingebunden sind. Jeder Faktor hat eine spezifische Funktion und kann bei der Rangfolge von Suchergebnissen eine Rolle spielen. Da diese Faktoren Teil eines proprietären Suchalgorithmus sind, ist es unwahrscheinlich, dass detaillierte Informationen zu ihrer Funktionsweise öffentlich verfügbar sind.

Wenn Sie Informationen zu einem bestimmten Faktor benötigen oder eine tiefere Analyse der Funktionsweise eines dieser Faktoren wünschen, würde ich empfehlen, sich direkt an Yandex oder die entsprechenden Suchmaschinenexperten zu wenden. Sie könnten Ihnen unter Umständen weitere Einblicke in die Verwendung dieser Faktoren und deren Bedeutung für die Suchergebnisse geben.

Selber recherchieren

Auf https://yandex-explorer.herokuapp.com/ findet ihr eine Zusammenstellung aller Rankingfaktoren. Dort können Sie nach bestimmten Kriterien suchen.

Welche interessanten Infos konnte man aus dem Code extrahieren, die wichtig für das Ranking wären?

Es ist nur ein Bruchteil dessen, was man aus der ganzen Liste an Daten gewinnen kann. Das zeigt, wie umfangreich die Rankingfaktoren sind. Man lässt es nur ahnen wie komplex Suchmaschinen aufgebaut sind.

  1. Schema Markup: Die Verwendung von Schema.org-Markup zur Bereitstellung strukturierter Informationen für Suchmaschinen.
  2. XML-Sitemaps: Das Vorhandensein und die Aktualität Ihrer XML-Sitemap.
  3. Gebrochene Links: Das Beheben von gebrochenen Links auf Ihrer Website.
  4. URL-Länge: Die Länge Ihrer URL-Struktur.
  5. Öffentliches WHOIS: Die Verfügbarkeit und Zugänglichkeit der WHOIS-Daten Ihrer Domain.
  6. Antwortzeit des Servers: Die Geschwindigkeit, mit der Ihr Server auf Anfragen reagiert.
  7. Click-Through Rate (CTR) von SERPs: Wie oft Ihre Suchergebnisse angeklickt werden.
  8. Webseite-Kategorie: Die Kategorisierung Ihrer Website nach Branche und Thema.
  9. Keywords in den ersten 100 Wörtern: Das Vorhandensein von Keywords in den ersten 100 Wörtern Ihrer Inhalte.
  10. Verwendete Technologien: Die Nutzung von modernen Webtechnologien wie AMP (Accelerated Mobile Pages).
  11. Geschwindigkeit mobiler Seiten: Die Geschwindigkeit Ihrer mobilen Website.
  12. Responsive Webdesign: Die Anpassung Ihrer Website an verschiedene Bildschirmgrößen.
  13. User-Generated Content: Die Integration von nutzergenerierten Inhalten.
  14. Datenqualität: Die Genauigkeit und Konsistenz Ihrer Unternehmensdaten im Web.
  15. Social Signals: Die Präsenz und Aktivität Ihrer Marke in sozialen Medien.
  16. Lokale Link-Netzwerke: Der Aufbau von lokalen Link-Netzwerken und Verbindungen.
  17. Internationale TLDs: Die Verwendung von länderspezifischen Top-Level-Domains für internationale Märkte.
  18. Datenschutzrichtlinien: Die Bereitstellung von Datenschutzrichtlinien auf Ihrer Website.
  19. Content Delivery Network (CDN): Die Nutzung eines CDN zur Beschleunigung der Website-Ladezeiten.
  20. Syndizierte Inhalte: Die Nutzung von syndizierten Inhalten auf Ihrer Website.
  21. Flash-Inhalte: Das Vermeiden von Flash-Inhalten, da sie für Suchmaschinen schwer zu indizieren sind.
  22. Panda Penalty: Die Vermeidung von Duplicate Content und minderwertigen Inhalten, um einer möglichen „Panda Penalty“ zu entgehen.
  23. Keyword-Dichte: Die optimale Verteilung von Keywords auf einer Seite.
  24. Disavow-Datei: Die regelmäßige Pflege und Aktualisierung Ihrer Disavow-Datei für unerwünschte Backlinks.
  25. Ankertext-Diversität: Die Vielfalt von Ankertexten in Backlinks.
  26. Keyword in URLs: Die Verwendung von Keywords in den URLs Ihrer Seiten.
  27. Suchfunktion auf der Website: Die Integration einer Suchfunktion auf Ihrer Website.
  28. Mobilfreundlichkeit: Die Optimierung Ihrer Website für mobile Endgeräte.
  29. Outbound-Link-Qualität: Die Qualität der Websites, auf die Sie verlinken.
  30. AdSense-Integration: Die Integration von Google AdSense-Anzeigen auf Ihrer Website.
  31. HTTPS: Die Verwendung von HTTPS-Verschlüsselung auf Ihrer Website für Sicherheit und Datenschutz.
  32. Alexa-Ranking: Das Alexa-Ranking Ihrer Website im Vergleich zu anderen Websites weltweit.
  33. Reputation und Vertrauen: Die Online-Reputation und das Vertrauen, das Ihre Website bei den Nutzern und Suchmaschinen genießt.
  34. Anzahl der Kommentare: Die Anzahl und Qualität der Kommentare auf Ihrer Website.
  35. Beiträge in sozialen Medien: Die Aktivität und Sichtbarkeit Ihrer Website in sozialen Medien.
  36. Webseiten-Perfomance: Die allgemeine Performance und Ladezeiten Ihrer Website.
  37. Altersfreigabe der Website: Die Einhaltung von Altersfreigabe-Richtlinien, wenn dies auf Ihre Website zutrifft.
  38. Gesetzliche Anforderungen: Die Einhaltung gesetzlicher Anforderungen und Vorschriften, z.B. DSGVO.
  39. Erreichbarkeit für Bots: Die Gewährleistung, dass Suchmaschinen-Bots Ihre Website problemlos durchsuchen können.
  40. Cross-Browser-Kompatibilität: Die optimale Darstellung Ihrer Website auf verschiedenen Webbrowsern.
  41. Social Bookmarking: Die Nutzung von Social-Bookmarking-Diensten zur Förderung Ihrer Inhalte.
  42. Verlinkung zu vertrauenswürdigen Websites: Das Setzen von Links zu vertrauenswürdigen und autoritativen Websites.
  43. Content Freshness: Die Aktualität und Frische Ihrer Inhalte.
  44. Öffentliche Meinungsführer: Die Zusammenarbeit mit Meinungsführern und Influencern in Ihrer Branche.
  45. Text-to-HTML-Verhältnis: Das ausgewogene Verhältnis von Text zu HTML-Code auf Ihren Seiten.
  46. Conversion Rate Optimierung: Die Optimierung von Conversion-Raten auf Ihrer Website.
  47. Redaktionelle Richtlinien: Die Einhaltung von redaktionellen Richtlinien für Qualitätsinhalte.
  48. Werbung und Pop-ups: Die Zurückhaltung bei übermäßiger Werbung und Pop-ups auf Ihrer Website.
  49. Durchschnittliche Besuchsdauer: Die Verweildauer der Nutzer auf Ihrer Website.
  50. Voice Search Optimierung: Die Optimierung für sprachgesteuerte Suchanfragen.
  51. Erfahrungsberichte und Bewertungen: Die Präsentation von Kundenbewertungen und Erfahrungsberichten.
  52. Rich Snippets und Strukturierte Daten: Die Nutzung von strukturierten Daten für erweiterte Suchergebnisse.
  53. Zugänglichkeit: Die Gewährleistung, dass Ihre Website für Menschen mit Behinderungen zugänglich ist.
  54. Sitelinks: Die Anzeige von Sitelinks in den Suchergebnissen.
  55. Gesichtserkennung und Bildoptimierung: Die Optimierung von Bildern für Gesichtserkennung und Bildsuche.
  56. Geografische Ausrichtung: Die geografische Ausrichtung Ihrer Website, wenn Sie lokale Dienstleistungen anbieten.
  57. TrustRank: Das Vertrauen, das Ihre Website von Suchmaschinen erhält.
  58. URL-Kanonisierung: Die Behebung von URL-Kanonisierungsproblemen.
  59. Sprachauswahl: Die Bereitstellung von Inhalten in verschiedenen Sprachen für internationale Zielgruppen.
  60. Website-Struktur und Navigation: Die Benutzerfreundlichkeit und Klarheit Ihrer Website-Struktur und Navigation.
  61. Geografische Zielseite: Die Erstellung von spezifischen Zielseiten für verschiedene geografische Standorte.
  62. Online-Community-Beiträge: Die Beteiligung an relevanten Online-Communities und Diskussionsforen.
  63. Offline-Werbung: Die Verknüpfung Ihrer Online-Marketingbemühungen mit Offline-Werbung und Veranstaltungen.
  64. Google News-Inklusion: Die Einbeziehung Ihrer Website in Google News und die Bereitstellung von Nachrichteninhalten.
  65. Markenbekanntheit: Die Bekanntheit und Wahrnehmung Ihrer Marke in der Öffentlichkeit.
  66. Verfügbarkeit mobiler Apps: Die Bereitstellung von mobilen Apps, die mit Ihrer Website verknüpft sind.
  67. App Store-Optimierung: Die Optimierung von App Store-Seiten für mobile Apps.
  68. Verwendung von Responsive Design: Die Nutzung von responsive Webdesign, um Ihre Website auf verschiedenen Geräten korrekt anzuzeigen.
  69. Mehrsprachige Apps: Die Bereitstellung von mehrsprachigen mobilen Apps.
  70. Beziehungen zu anderen Medien: Die Pflege von Beziehungen zu anderen Medienunternehmen und Publikationen.
  71. SEO-Tools und -Software: Die Nutzung von SEO-Tools und Software zur Überwachung und Optimierung Ihrer Website.
  72. User Intent: Die Ausrichtung auf die Absicht der Benutzer, um deren Bedürfnisse besser zu erfüllen.
  73. Videopräsentationen: Die Erstellung und Bereitstellung von Videoinhalten auf Ihrer Website.
  74. Keyword-Lückenanalyse: Die Identifizierung von Keywords, für die Ihre Website noch nicht gut gerankt ist.
  75. Reciprocal Links: Der Austausch von Links mit anderen Websites.
  76. Textlänge: Die Länge Ihrer Textinhalte und deren Relevanz.
  77. Relevante Fachbegriffe: Die Verwendung von branchenspezifischem Vokabular und Fachbegriffen.
  78. Verkaufsfördernde Inhalte: Die Bereitstellung von Inhalten, die die Konvertierungsraten steigern.
  79. Redaktionelle Qualität: Die Qualität und Relevanz Ihrer redaktionellen Inhalte.
  80. Einsatz von Rich Media: Die Verwendung von Rich-Media-Inhalten wie Videos und interaktive Elemente.
  81. Nutzung von User-Generated Content: Die Einbindung von Inhalten, die von Nutzern erstellt wurden, z.B. Bewertungen und Kommentare.
  82. Branchenführer-Zitate: Die Erwähnung und Zitate von Branchenführern in Ihren Inhalten.
  83. Google AMP-Seiten: Die Erstellung von Accelerated Mobile Pages (AMP) für mobile Nutzer.
  84. Viren und Malware: Die Sicherstellung, dass Ihre Website frei von Viren und Malware ist.
  85. Wortanzahl in Meta-Tags: Die Verwendung von Meta-Tags mit angemessener Wortanzahl.
  86. Dienstleistungen und Produkte: Die klare Darstellung Ihrer Dienstleistungen und Produkte auf der Website.
  87. Chatbots und Kundensupport: Die Bereitstellung von Chatbots und Kundenunterstützung für Website-Besucher.
  88. Strategische Partnerschaften: Die Bildung strategischer Partnerschaften mit anderen Unternehmen oder Websites.
  89. Benutzerfreundlichkeit und Barrierefreiheit: Die Benutzerfreundlichkeit und Barrierefreiheit Ihrer Website für alle Nutzer.
  90. Überarbeitung alter Inhalte: Die Aktualisierung und Überarbeitung von älteren Inhalten, um deren Aktualität sicherzustellen.

Welche Kenntnisse hat man daraus gewonnen?

Was können wir aus Yandex lernen und auf Google anwenden? Diese Frage bleibt nach wie vor aktuell. Obwohl es sicherlich viele Gemeinsamkeiten zwischen Yandex und Google gibt, könnte sie wohl nur von einem Google-Softwareentwickler, der an der Suchmaschine arbeitet, definitiv beantwortet werden.

Aber vielleicht stellen wir die falsche Frage.

Dieser Code sollte uns wirklich dabei helfen, unser Verständnis von moderner Suchtechnologie zu erweitern. Vieles von dem, was die SEO-Community in den frühen 2000er Jahren über Suchmaschinen gelernt hat, basiert auf Tests und Informationen von Suchmaschinenexperten. Das war zu einer Zeit, als die Welt der Suchmaschinenoptimierung weitaus weniger undurchsichtig war. Leider hat sich unser Wissen nicht im gleichen Tempo weiterentwickelt wie die Suchmaschinen selbst.

Die Erkenntnisse aus den zahlreichen Funktionen und Faktoren des Yandex-Lecks sollten zu neuen Hypothesen darüber führen, was bei Google getestet und für das Ranking berücksichtigt werden sollte. Dies sollte auch dazu führen, dass mehr Aspekte durch SEO-Crawling, Linkanalyse und Ranking-Tools analysiert und gemessen werden.

Beispielsweise könnte die Ähnlichkeit zwischen Suchanfragen und Dokumenten mithilfe von BERT-Einbettungen im Vergleich zu Konkurrenzseiten ein wertvolles Maß sein, da moderne Suchmaschinen solche Techniken verwenden.

Ähnlich wie die AOL-Suchprotokolle uns daran hinderten, das Klickverhalten auf den Suchergebnisseiten zu erraten, bringt uns die Codebasis von Yandex von abstrakten Überlegungen zu konkreten Erkenntnissen. Unsere Aussagen können dadurch besser qualifiziert werden.

In dieser Hinsicht ist diese Codebasis ein Geschenk, das immer wieder gegeben wird. Es ist erst seit einem Wochenende verfügbar, und schon jetzt haben wir einige überzeugende Erkenntnisse gewonnen.

Es ist anzunehmen, dass einige ehrgeizige SEO-Ingenieure, die mehr Zeit zur Verfügung haben, weiter graben und vielleicht sogar fehlende Teile ergänzen werden, um den Code zum Laufen zu bringen. Ebenso werden Ingenieure von Suchmaschinenunternehmen diese Entwicklungen aufmerksam verfolgen, um mögliche Innovationen für ihre eigenen Systeme zu finden.

Gleichzeitig werden wahrscheinlich Anwälte von Google aggressiv gegen das Scrapen dieses Codes vorgehen.

Wir sind gespannt auf die Weiterentwicklung unseres Bereichs, die von neugierigen Menschen vorangetrieben wird, die diese Gelegenheit nutzen.

Aber hey, wenn Sie keine Erkenntnisse aus dem tatsächlichen Code gewinnen möchten, können Sie sich gerne anderen wichtigen Themen widmen, wie beispielsweise der Diskussion über Subdomains im Vergleich zu Unterverzeichnissen.

Insgesamt wirft das Yandex-Leak viele Fragen auf, sowohl im Hinblick auf die Sicherheit von Suchmaschinenbetreibern als auch auf die Möglichkeiten und Risiken, die solche Enthüllungen für SEO-Experten und Webseitenbetreiber mit sich bringen. Die Entwicklungen in diesem Bereich werden zweifellos aufmerksam verfolgt werden.

Wie hilfreich war dieser Beitrag?

Klicke auf die Sterne um zu bewerten!

Durchschnittliche Bewertung 0 / 5. Anzahl Bewertungen: 0

Bisher keine Bewertungen! Sei der Erste, der diesen Beitrag bewertet.

admin

Hallo liebe Besucher und alle SEO-Freaks! Willkommen auf meiner SEO-Seite.

Wer schreibt hier? Ich bin leidenschaftlicher SEO, & ITler. Ich bin sei 2008 selbständiger SEO-Profi. Habe bereits mehrere Projekte betreut und erfolgreich  begleitet - Referenzen. Ich freue mich, euch bei allen SEO-Fragen helfen zu können. Warte auf eure Kommentare!

Wenn Sie SEO-Beratung benötigen, bin ich gerne für Sie da. Schreiben Sie mir gerne dazu eine Mail: Zum kontaktformular

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert