Eine Suchmaschine ist ein Instrument, welches der
Informationsgewinnung im Internet dient und es Internet-Nutzern ermöglicht durch
Verwendung von Keywords Webseiten zu finden.
Um über die Suchanfragen auf die
indexierten Daten zugreifen zu können, werden Webseiten von Suchmaschinen auf ihre Inhalte hin geprüft und gespidert.
Die dadurch erfassten Daten/Inhalte werden dann
in Datenbanken gespeichert, weswegen Suchmaschinen auch das
zentrale Navigationsinstrument im Internet sind.
Üblicherweise setzt sich eine Suchmaschine aus folgenden Komponenten zusammen:
- Spider, der selbstständig Linksverfolgt und sich durch den Datenbestand des Internets bewegt.
- Merkmalsextraktor, der wichtige Merkmale und Texte aus den gefundenen Webseiten extrahiert, wodurch die Datenmenge erkennbar verkleinert wird.
- Indexierer, der extrahierte Merkmale und Texte der Dokumente verwaltet und den schnellen Zugriff über diese Merkmale auf Texte erlaubt
- Sortierer, der die Dokumente nach ihrer Relevanz in Bezug auf eine Suchanfrage ordnet, wobei spezielle Algorithmen eingesetzt werden.
- User-Interface, welches das Frontend der Suchmaschine darstellt und das Formulieren einer Suchanfrage und die Präsentation der Suchergebnisse in geordneter Form ermöglicht.