SiteCrawl - warum eine eigene Suchmaschine?

Gründe für eine eigene Suchmaschine

Wir beobachten seit vielen Jahren den Markt und die Entwicklung der Suchmaschinen und deren Konzepte. Es gibt fertige Systeme zum Download und Betrieb auf einem eigenen Server um beispielsweise eigene Quellen durchsuchen zu können, aber letztendlich möchte man nicht wirklich mit verschiedenen Systemen umgehen müssen um alles abzudecken. Die Lösung war also eine Software die möglichst alles kann und nichts kostet. Da es ausserdem zwei völlig verschiedene Konzepte von Suchmaschinen gibt, musste eine Lösung her die sowohl externe Suchmaschinen abfragen kann, als auch über einen Crawler beliebig viele eigene Quellen indexieren kann.

Die eierlegende Wollmilchsau unter den Suchmaschinen

Seit 2018 betreiben wir eine eigene Suchmaschine (SuMa), die das Internet bzw. das WWW indexiert und so die Suche nach Inhalten auf Webseiten ermöglicht. Die Suchmaschine wird mit zwei verschiedenen Software-Systemen betrieben die zwei verschiedene Suchkonzepte kombiniert. Durch die Aggregation der Daten aus beiden Software-Systemen gibt es eine gemeinsame Suchabfrage die auf der SiteCrawl-Webseite ermöglicht wird.

Suche nach Dateien und Medien

Der Grund warum wir eine eigene Suchmaschine betreiben ist ausschliesslich der weil wir und Sie mit dieser Suchmaschine Ergebnisse finden die in keiner anderen Suchmaschine zu finden sind, wir aber unsere eigenen Quellen auch durchsuchbar machen möchten um leichter Quellen und Referenzen zu finden. Da diese Inhalte häufig über viele, verteilt liegende, Systeme gespeichert und archiviert sind, kann nur durch eine intelligente Suchfunktion darauf zeitnah zugegriffen werden.

Wir haben Zugriff auf sonst geschlossene Quellen im Intranet, indexieren damit auch unseren eigenen Medienbestand und ermöglichen damit die gezielte Suche nach spezialisierten Inhalten, die so nur mit und über unsere Suchmaschine gefunden werden können. So werden beispielsweise über die Suchmaschine auch der komplette Datenbestand des FTP-Servers, der Netzwerkspeicher (NAS), des Media Streaming Servers und des File-Index indexiert und damit von einer zentralen Stelle aus durchsuchbar gemacht.

Wir haben so die Möglichkeit unabhängig von externen Anbietern und Betreibern die Inhalte selbst bestimmen zu können, angepasst auf den tatsächlichen Bedarf. Da bei vielen Internetnutzern eine Suchmaschine als Standard-Startseite eingestellt ist, stellt dieser Dienst eines der wichtigen Basisdienste dar.

Suche im Intranet und im Internet

Wir nutzen für die Suche im Intranet und im Internet verschiedene Suchindexe, da diese völlig verschiedene Nutzungskriterien haben. Während die Internet-Suchmaschine für alle nutzbar ist und aussschliesslich Webseiten im öffentlichen Raum indexiert, nutzt die Intranet-Suchmaschine ausschliesslich lokale Quellen und durchsucht auch Dateien und deren Metainformationen. Die Intranet-Suchmaschine ist allerdings nur für die im Intranet angeschlossenen Nutzer verfügbar.

Video über alternative Suchmaschinen

Wir empfehlen das Video unter diesem Link.