Deusu.de Blog

1.10.2016

Fazit September 2016

 

Spenden:

Im September sind €238,91 an Spenden eingegangen. Immer noch etwas unter dem Soll, aber deutlich besser als die Monate davor. Ich denke mal die Sommerflaute ist jetzt vorbei.

Meinen herzlichen Dank an alle Spender!!!

Ich werde in den nächsten Tagen noch mal ein Blog-Posting zur Finanzierung und allgemein zur Zukunft von DeuSu machen. Da steht eine Weichenstellung an.

 

Besucherzahlen:

Hier gibt es sehr gute Nachrichten. Im Durchschnitt kamen pro Tag fast 50% mehr Besucher zu DeuSu als im Vormonat.

Der Grund dafür ist, dass ich mit einem Posting auf Hacker News mehrere Tausend Besucher auf deusu.org bekommen konnte.

Das führte dann zu einer sehr plötzlichen Spitze in den Besucherzahlen. Zeitweise kamen innerhalb von 30 Minuten so viele Leute auf DeuSu wie sonst an einem ganzen Tag. Am Tag des Postings kamen circa 4700 Besucher auf DeuSu, rund 10x so viele wie sonst.

Und die Server haben selbst das noch gut weggesteckt. Zwar waren Suchabfragen etwas langsamer als sonst, dauerten durchschnittlich aber trotzdem nur knapp 0,4 Sekunden.

 

Such-API

Das Such-API ist jetzt im Produktivbetrieb. Die Testphase ist also vorbei.

Es wird immer noch nur sehr spärlich benutzt, aber das wird wohl einfach noch mehr Zeit brauchen.

 

Vorschau auf den Oktober:

Wahrscheinlich kommende Woche werde ich sämtliche Crawl- und Index-Daten veröffentlichen. Ich bin im Moment dabei die Dokumentation dafür zu schreiben.

Besonders die Crawl-Daten werden Interesse wecken, enthalten sie doch URL, Überschrift, Kurzzusammenfassung und alle vorkommenden Begriffe von rund 2,1 Milliarden Webseiten.

Ich gehe davon aus, dass die Veröffentlichung dieser Daten DeuSu einiges an weltweiter Aufmerksamkeit bringen wird. Immerhin ist der Datenbestand von DeuSu größer als der von CommonCrawl, und die sind in Fachkreisen ja nicht gerade unbekannt. Deren Betriebskosten liegen übrigens bei mehreren Hunderttausend Dollar im Jahr, während der Betrieb von DeuSu nur einen Bruchteil davon kostet. Und CommonCrawl bietet lediglich Crawl-Daten, DeuSu hingegen betreibt mit den Daten eine eigene Suchmaschine.

Kommentare:
Von: (Unbekannt)
2.10.2016, 14:17
 

Hallo Michael,

es geht also voran :D ! . Ich promote "DeuSu" zwischenzeitlich auch bei jedem den ich kenne (vor allem über Facebook). Das kann sicherlich nicht schaden :D .

Gruß Alex

Von: (Unbekannt)
3.10.2016, 07:42
 

Hi Michael, ich freue mich, dass es voran geht!

Ein kurzer Hinweis: Deusu ist nun (wieder) in die Suchmaschine mit U integriert. Du siehst es ja in Deinen Logs, nehme ich an. Wir laufen aktuell noch im Testbetrieb begrenzt auf DE, werden das dann aber bald auf CH, AT, GB, US ausweiten.

Viele Grüße
Tobias

Von: Michael Schöbel
3.10.2016, 07:47
 

Du kannst https://www.unbubble.eu ruhig beim Namen nennen. Da habe ich kein Problem mit. :)

Jetzt wird das API endlich etwas Nutzung bekommen...

-- Michael Schöbel

Von: (Unbekannt)
3.10.2016, 08:05
 

Oh, das ist aber nett! :) Unser Service ist und bleibt auf Indexer wie DeuSu angewiesen. Insofern drücke ich auch die Daumen, dass die Veröffentlichung Deines Datenbestandes für Aufmerksamkeit und ordentlich Spenden sorgt.

Grüße und schönen Feiertag
Tobias

Von: (Unbekannt)
18.10.2016, 11:55
 

Ein schönes Features wäre auch eine erweiterte Suche (oder API) anzubieten:

- Seite wurde im Zeitraum X geändert
- enthält Link zu einer spezifischen Seite X
- Nur innerhalb einer bestimmten Domain X suchen

Von: Michael Schöbel
18.10.2016, 12:01
 

Die ersten beiden gehen im Moment nicht. Dafür wäre es auch nötig erheblich mehr Informationen über die Seiten zu speichern als das derzeit der Fall ist. Kurz gesagt, es wäre mehr Hardware nötig.

Suchen innerhalb einer bestimmtem Domain geht schon. Beispiel:

https://deusu.de/query?q=host%3Awww.heise.de+snowden

-- Michael Schöbel

Sie möchten einen Kommentar zu diesem Blog-Posting abgeben? Falls ja, tragen Sie Ihren Kommentar bitte einfach in dem unten stehenden Feld ein, und klicken dann auf "Absenden".

Kommentare erscheinen erst nach manueller Kontrolle. Leider gab es sonst zu viel Spam.


Zurück zur Blog-Übersicht