Deusu.de Blog

19.3.2015

Verbesserung am Ranking

In meinem gestrigen Blog-Posting hatte ich eine Verbesserung beim Ranking angekündigt. Und diese Verbesserung ist seit gestern Abend auch bereits da.

Des öfteren hat es mich geärgert, dass ich in den Suchergebnissen Seiten fand, die in Sprachen waren, die kaum jemand hier in Deutschland versteht.

Zwar verstehen Benutzer einer deutschen Suchmaschine in der Regel Deutsch und mit recht hoher Wahrscheinlichkeit auch noch Englisch, danach geht es mit den Sprachkenntnissen aber bergab. Französisch-Kenntnisse sind schon deutlich weniger gut vertreten (meine Französisch-Note in der Schule schwankte übrigens immer zwischen 5 und 6), und Russisch-Kenntnisse noch weniger.

Ich habe mir also zunächst mal im Internet frei verfügbare Wortlisten für diverse Sprachen besorgt. Auf Anhieb fand ich derartige Listen für Deutsch, Englisch, Französisch und Holländisch.

Wenn eine Suchabfrage läuft, werden jetzt alle Ergebnisse mit diesen Wortlisten verglichen. Die Sprache mit den meisten passenden Wörtern wird dann als Sprache eines Ergebnisses betrachtet. Aber auch nur dann, wenn mindestens 25% der Wörter des Ergebnisses dieser Sprache zugeordnet werden können.

Dies funktioniert erstaunlich gut. Ich schätze, dass auf diese Weise bei 95% der Seiten die Sprache korrekt erkannt wird, wobei es noch den Fall "unbekannte Sprache" gibt, wenn das Ergebnis keiner der vier unterstützten Sprachen zugeordnet werden kann.

Aber was mache ich mit dieser Information denn nun?

Jede Seite bekommt wie bisher für das Ranking einen Zahlenwert zugeteilt, der sich aus ein paar Dutzend Faktoren zusammen setzt. Einige dieser Faktoren sind z.B. ob der Suchbegriff in der URL vorkommt, in der Überschrift oder im Snippet. Auch die Position eines Wortes im Snippet ist wichtig.

Für deusu.de mache ich jetzt dann noch folgendes:

Unbekannte Sprache: Ranking-Wert runter auf 1/10
Holländisch und Französisch: Runter auf die Hälfte
Englisch: Unverändert
Deutsch: Wert um 50% erhöhen

Dies führt dann dazu, dass Seiten in Deutsch deutlich besser gerankt werden, Seiten in Englisch im Vergleich dazu etwas nach unten rutschen, Seiten in Holländisch und Französisch noch weiter runter, und Seiten deren Sprache nicht bestimmt werden kann ganz nach hinten kommen.

Dies sind aber nur relative Verschiebungen. Es kann immer noch der Fall eintreten, dass eine Seite, die nicht auf Deutsch ist, ganz oben gelistet wird, wenn sie denn deutlich relevanter als alle anderen ist.

Ich denke, dass das für ein deutschsprachiges Publikum insgesamt eine gute Lösung darstellt.

Für deusu.org benutze ich ein ähnliches Verfahren. Dort wird Englisch um 50% angehoben und Seiten auf Deutsch werden wie Seiten auf Holländisch oder Französisch behandelt, also beim Ranking-Wert auf die Hälfte reduziert.

Wer also primär an Ergebnissen auf Englisch interessiert ist, der findet auf deusu.org wahrscheinlich die besseren Ergebnisse.

Kommentare:

Sie möchten einen Kommentar zu diesem Blog-Posting abgeben? Falls ja, tragen Sie Ihren Kommentar bitte einfach in dem unten stehenden Feld ein, und klicken dann auf "Absenden".

Kommentare erscheinen erst nach manueller Kontrolle. Leider gab es sonst zu viel Spam.


Zurück zur Blog-Übersicht