Deusu.de Blog

1.12.2015

Fazit November 2015 - Vorschau auf Dezember

Ich werde das bisherige monatliche Spendenfazit mal ab jetzt zu einem allgemeineren Rückblick auf den abgelaufenen Monat ausbauen, und mit einer Vorschau auf den kommenden Monat versehen. Dadurch wird dieses Posting deutlich länger, aber auch informativer...

Spenden:

Im November kamen durch Spenden €389 zusammen. Das ist der beste Wert bisher. Die Spenden haben sich also vom allerschlechtesten Wert im Oktober zum allerbesten Wert im November gesteigert.

Oder mit einem Wort: WOW!!!

Ein besonderes WOW, weil auch die Höhe der individuellen Spenden neue Rekorde gesetzt hat. Der Monat begann am 2.11. mit einer Spende über €100, was bis dahin die höchste Einzelspende war, die jemals einging. Und der Monat endete mit einer €250 Spende, die am 30.11. einging. Und damit mit einem weiteren neuen Rekord.

Vielen, VIELEN Dank an alle Spender (es waren insgesamt fünf).

Benutzerzahlen:

Die Benutzerzahlen sind im Tagesdurchschnitt um 6,6% gegenüber dem Oktober gestiegen. Auch da geht es also aufwärts.

Auch die Anzahl der Suchabfragen, die pro Benutzer gemacht werden, ist leicht angestiegen. Hier bin ich mir aber nicht sicher, ob dies gut oder schlecht ist. Gut wäre, wenn die Leute DeuSu intensiver nutzen weil es gute Ergebnisse liefert. Schlecht wäre, wenn sie mehr Suchabfragen brauchen um letztendlich das Gesuchte zu finden. Ich habe leider keine Ahnung welches der beiden hier zutrifft.

Technik:

Technisch hat sich im November auch viel getan. Der Suchindex hat jetzt mehr als 1 Milliarde Seiten. Dadurch werden jetzt zu selteneren Themen mehr Seiten gefunden. Und teilweise wird auch erst dadurch überhaupt etwas gefunden.

Suchabfragen werden jetzt teilweise parallel bearbeitet, was die Suche schneller macht. Erst dadurch ist die Erhöhung des Datenbestandes überhaupt möglich geworden. Sonst wäre die Suche nämlich durch die größere Datenmenge so langsam geworden, dass es einfach nicht mehr akzeptabel gewesen wäre.

Am Ranking habe ich auch Änderungen vorgenommen. Hier besteht aber noch weiterer Verbesserungsbedarf. Mehr dazu weiter unten.

Und zuletzt hat auch das Webdesign ein Facelifting bekommen. Ich habe mich auf kleinere Änderungen beschränkt. Neues Logo, etwas andere Farbgebung.

Vorschau auf Dezember:

Der Suchindex wird ständig von mir aktualisiert werden. Dies geschieht in kleinen Schritten. Etwa alle 1-2 Tage wird es ein kleineres Update geben. Insgesamt wird es circa 1-2 Monate dauern bis jeweils der komplette Index aktualisiert ist.

Am Webdesign werde ich auch weiter Änderungen vornehmen. Ich glaube ich müsste deutlicher machen, was DeuSu ist, warum es wichtig ist, und warum man dafür spenden sollte. Ich glaube, dass kommt im Moment noch nicht gut genug rüber. Während dies Änderungen an den Texten sein werden, wird die Suchergebnisseite Änderungen an der Optik bekommen. Denn die gefällt mir einfach nicht. Ich kann noch nicht sagen was genau mir daran nicht gefällt. Sie "fühlt" sich einfach nicht richtig an.

Und als größter Punkt auf meiner To-Do Liste: Das Ranking. Hier muss ich zur Erklärung etwas ausholen...

Das Ranking:

Die Suche läuft in zwei Phasen ab. Zunächst einmal werden die einzelnen Teilindizes durchsucht. Es gibt einen Hauptindex mit etwas mehr als 1 Milliarde Seiten (der genau genommen selber aus 32 Teilindizes besteht), aber auch noch kleinere Indizes mit jeweils weniger als 1 Million Seiten für aktuelle Nachrichten, Blogbeiträge und neu angemeldete Seiten. In dieser ersten Phase wird nur ein sehr grobes Ranking vorgenommen.

Dann werden die circa 2000 Top-Seiten aus der ersten Phase genommen, und nur für diese Ergebnisse wird ein erneutes, viel detaillierteres Ranking vorgenommen. Dieses ist deutlich rechenaufwendiger als das Ranking der ersten Phase. Viel zu rechenaufwendig um es auf alle Ergebnisse anwenden zu können.

Das aktuelle Problem liegt darin, dass in der 1. Phase zwar schon ganz gut vorsortiert wird - mit reichlich Ergebnissen die ich als gut ansehe, auch wenn diese hier mitunter auf den hinteren Plätzen der Top-2000 liegen - es aber in der 2. Phase nicht so recht klappt die wirklich guten Ergebnisse auf die erste Suchergebnisseite zu bringen. Für einige Suchabfragen funktioniert das jetzt schon sehr gut, für andere aber nur sehr schlecht. Es ist also diese 2. Phase an der ich arbeiten werde.

Der schwierige Teil besteht darin die einzelnen Ranking-Kriterien in ein gutes Verhältnis zueinander zu setzen. Z.B. ist es besser wenn ein Suchbegriff als 3. Wort in der Überschrift steht als an 4. Stelle, oder wenn eine Seite mehr eingehende Links hat, oder wenn ein Suchbegriff in der URL vorkommt. Aber was ist wichtiger? Die Position des Suchbegriffs, die Anzahl der eingehenden Links, oder dass der Begriff in der URL vorkommt?

Zur Zeit gibt es rund zwei Dutzend Ranking-Kriterien. Da gibt es enorm viele Möglichkeiten wie diese miteinander kombiniert werden können.

Ich habe im Moment keine Antwort darauf, was der beste Weg sein wird hier zu optimieren. Ich werde einfach mal verschiedene Ansätze ausprobieren müssen. Die Änderungen an der Technik im November waren da anders. Da wusste ich im Vorfeld ziemlich genau was ich machen muss, und konnte mir recht sicher sein, dass es funktionieren würde. Beim Ranking hingegen stochere ich etwas im Dunkeln. Es ist wie so oft beim Programmieren: Try and Error...

Kommentare:
Von: (Unbekannt)
2.12.2015, 11:39
 

Das Ranking

"oder wenn eine Seite mehr eingehende Links hat"

Der größte Krebs im Internet kommt genau von diesen Webseiten. Wenn ich nach informativen Wissen in allen Bereichen suche, dann lande ich bei den Massensuchmaschinen meist auf "Hauptstrominternetseiten", weil diese die meisten eingehenden Links haben.

Die kleineren Webseiten die mit "Liebe" zur jeweiligen Informationen gemacht werden ziehen da den kürzeren Zweigstengel.

Von: Michael Schöbel
2.12.2015, 11:58
 

Ja, dem stimme ich voll zu. Das ist auch einer der Gründe dafür, dass ich die Linkanzahl schon jetzt nur sehr klein bewerte.

Auch bei Google hat PageRank ja immer weniger Einfluss auf das Ranking. Dabei sind die damit groß geworden.

Es gibt aber inzwischen einfach zu viele Seiten die in diesem Punkt zu manipulieren versuchen.

Ich bin der festen Meinung, dass die Qualität einer Seite nicht davon abhängt von wem oder von wie vielen sie verlinkt wird, sondern davon welche Inhalte sie hat.

-- Michael Schöbel

Von: (Unbekannt)
4.12.2015, 10:11
 

Mehrere mögliche Erlärungen für die Nutzer- und Spenderzahlen:
- vorweihnachtliche Großzügigkeit
- DeuSu wurde irgendwo prominent erwähnt
- Leute haben Citizenfour auf ARD gesehen und sich danach nach alternativen Suchmaschinen umgesehen :)

Hast du eigentlich Zahlen dazu, wo deine Nutzer herkommen? Also z.B. ob viele Tor-Nutzer dabei sind?

Von: Michael Schöbel
4.12.2015, 10:22
 

Die meisten neuen Benutzer kommen von Google und haben dort nach "suchmaschine" gesucht. Es kommen auch viele Leute von Suchmaschinenverzeichnissen.

Tor kann ich höchstens am User-Agent erkennen (Firefox 38). Macht circa 2% der Suchabfragen aus.

Was angestiegen ist, ist die Anzahl der Leute die DeuSu offenbar in Firefox als Suchmaschine hinzugefügt haben. Sind etwa 2-3% der Suchabfragen. Vor einem Monat waren das nur halb so viele.

-- Michael Schöbel

Von: (Unbekannt)
4.12.2015, 10:38
 

Die IP-Adressen der Tor-Exitnodes sind öffentlich bekannt. Daran könntest du Tornutzer zuverlässig erkennen.

Von: Michael Schöbel
4.12.2015, 10:48
 

Nur dass ich IP-Adressen gar nicht speichere.

Der Aufwand so eine Abfrage in den CGI-Script für die Suche einzubauen, damit ich irgendwo logge "Tor Ja/Nein", das ist den Aufwand nicht wert.

-- Michael Schöbel

Von: (Unbekannt)
10.12.2015, 21:24
 

Ich hoffe wirklich, dass diese Suchmaschine weiter bestehen bleibt - weg mit den Marktmonopolen und zu Datensicherheit (=die einzig wahre Sicherheit)

Von: (Unbekannt)
12.12.2015, 14:37
 

Hi,

kann ich auch manuell Websites Indexieren?

Von: Michael Schöbel
12.12.2015, 14:40
 

Ich vermute mal, damit ist die Funktion zum Anmelden von Seiten gemeint:

https://deusu.de/addurl.html

-- Michael Schöbel

Von: (Unbekannt)
12.12.2015, 16:43
 

Danke

Von: (Unbekannt)
12.12.2015, 16:47
 

Wie Lage dauert es bis die Website aufgenommen wird?

Von: Michael Schöbel
12.12.2015, 16:51
 

Maximal 5-6 Stunden.

-- Michael Schöbel

Sie möchten einen Kommentar zu diesem Blog-Posting abgeben? Falls ja, tragen Sie Ihren Kommentar bitte einfach in dem unten stehenden Feld ein, und klicken dann auf "Absenden".

Kommentare erscheinen erst nach manueller Kontrolle. Leider gab es sonst zu viel Spam.


Zurück zur Blog-Übersicht