Deusu.de Blog

9.4.2017

Fazit März 2017

 

Spenden:

Im März sind €391,55 an Spenden eingegangen. Deutlich über dem Soll. Damit sind im 1. Quartal insgesamt €961,46 an Spenden eingegangen, was auch leicht über dem Soll liegt.

Meinen herzlichen Dank an alle Spender!!! Ohne euch wäre DeuSu nicht möglich!

 

Besucherzahlen:

Die durchschnittliche Zahl an Besuchern pro Tag lag im März circa 5% unter dem Wert vom Februar.

 

Suchindex

Am 7.4.2017 konnte ich das Update des Suchindex vollenden. Im Moment ist der älteste Teil des Suchindex circa 2,5 Monate alt. Und ich habe bereits damit begonnen für das nächste Update erneut zu crawlen.

Kommentare:
Von: (Unbekannt)
23.4.2017, 18:50
 

"über Soll" ist eine feine Sache :) Die Besucherzahlen werden ganz sicher steigen. Ich werde meinen bescheidenen Beitrag jedenfalls sehr gerne leisten wollen. Liebe Grüße :)

Andreas Jacke

https://offene-quellen.org - Das freie Netzwerk rund um Freies Wissen - Freie Software und Open Source

Von: (Unbekannt)
26.4.2017, 09:04
 

was kann Deusu eigentlich finde? alles was ich bisher mit deusu gesucht habe wurde nicht gefunden nur sachen die weit etfernt etwas damit zu tun haben wurden angezeigt warum ist das so?

Von: Michaela Schöbel
26.4.2017, 09:08
 

2 Mrd. Seiten Datenbestand sind zwar schon eine ganze Menge, aber immer noch nur ein Bruchteil dessen was Google oder Bing im Suchindex haben.

Ein größerer Index ist mit den gegenwärtigen (Finanz-) Mitteln nicht machbar. Die Software könnte das. Es würde aber mehr Server erfordern, und dafür fehlt einfach das Geld.

-- Michaela

Von: (Unbekannt)
21.5.2017, 15:36
 

Hi Michaela,

gibt es eine Road-Map, was kommende Features betrifft?

Interessieren würde mich die Möglichkeit https zu crawlen, zum anderen, ob es möglich sein wird, einen Term-Vektor zu einer Suchabfrage zu erhalten.

SOLR kann das zwar, ist aber sehr ressourcenhungrig

Vielen Dank,

Babette

Von: Michaela Schöbel
21.5.2017, 15:43
 

Hallo Babette,

keine echte Roadmap, aber HTTPS ist das woran ich im Moment arbeite. Schwer zu sagen wann das endlich fertig wird. Ich bin im Moment beruflich ziemlich ausgelastet. Innerhalb der nächsten 3 Monate wird das wohl eher nicht fertig werden.

Term-Vektor... ich vermute du meinst Phrasensuche, also Sachen in Anführungszeichen wo die Wörter auch so direkt hintereinander vorkommen müssen? Das ist derzeit nicht geplant. Das Problem damit ist, dass das den Resourcenbedarf heftig nach oben schrauben würde, weil zusätzlich noch die Wortpositionen im Index abgespeichert werden müssten.

-- Michaela

Von: (Unbekannt)
25.5.2017, 16:48
 

Warum werden populäre Links zu YouTube, Facebook, Twitter, Instagram und Co. nicht indexiert und wann gibt es endlich HTTPS-Support für zu indexierende Seiten?

Von: Michaela Schöbel
25.5.2017, 16:57
 

Du hast die beiden Punkte hier genau zusammen gebracht. Diese Seiten leiten alle zu HTTPS URLs weiter, und können deshalb wegen des fehlenden HTTPS-Supports noch nicht erfasst werden.

Gerade solche Seiten haben aber noch ein anderes Problem: Die haben auf einer Domain so viele URLs, dass ich die unmöglich alle crawlen kann. Welche der Seiten dann gecrawlt werden ist dann mehr oder weniger First-Come-First-Serve. Die Seiten, für die beim Crawlen zuerst ein Link gefunden wird, werden dann zuerst gecrawlt. Das sollten in der Regel auch die häufig verlinkten Seiten sein.

HTTPS-Support wird dieses Jahr noch kommen. Wird aber noch ein paar Monate dauern. Das ist *ganz* oben auf meiner Prioritätenliste für DeuSu.

-- Michaela

Von: (Unbekannt)
26.5.2017, 00:14
 

Hallo Michaela,

Ich habe mich schon oft nach einer Suchmaschine ohne kommerzielles oder sonstige DatenKlau - Interessen umgeschaut. Aber erst jetzt bin ich auf "deusu.de" gestoßen.

Meinem ersten Eindruck scheint das ein unterstützenswertes Projekt zu sein! Mit Freuden werde auch ich meinen bescheidenen Beitrag leisten.

SheikYerbouti

Sie möchten einen Kommentar zu diesem Blog-Posting abgeben? Falls ja, tragen Sie Ihren Kommentar bitte einfach in dem unten stehenden Feld ein, und klicken dann auf "Absenden".

Kommentare erscheinen erst nach manueller Kontrolle. Leider gab es sonst zu viel Spam.


Zurück zur Blog-Übersicht