Zum Inhalt springen

Web-Crawler

Onmylist.de | Aktualisiert: 18. Oktober 2024

Ein Crawler, auch Web Crawler oder Web Spider genannt, ist ein automatisiertes Programm, das das World Wide Web systematisch durchsucht. Sein Hauptzweck besteht darin, Inhalte im World Wide Web für Suchmaschinen wie Google und Bing zu indizieren. Einfach ausgedrückt, ist es wie ein Roboter, der Informationen von Websites sammelt, indem er deren URLs analysiert und Links zu anderen Seiten verfolgt.

Crawler „kriechen“ (oder „spinnen“) durch Websites und indexieren sie in Datenbanken, indem sie Algorithmen ausführen, die Suchmaschinen dabei helfen, relevante Ergebnisse schnell zu finden und anzuzeigen, wenn jemand Suchanfragen eingibt. Der Prozess des Durchsuchens des Internets mit einem Webcrawler wird „Webcrawling“ genannt. Er kann dazu verwendet werden, neue Websites zu identifizieren, Änderungen an bestehenden Websites zu verfolgen, Marketing-Intelligence-Daten zu sammeln und so weiter. Crawler sind hocheffektive Werkzeuge für die Datenerfassung im Internet, da sie große Teile des Netzes auf einmal abdecken und dabei bestimmte Informationen über jede besuchte Seite sammeln, die bei manueller Ausführung zu viel Zeit oder Ressourcen in Anspruch nehmen würden. Dies trägt folglich dazu bei, die Suchmaschine weiter zu verfeinern und schneller bessere Ergebnisse zu liefern!

Relevante Glossareinträge
Index (SEO)

Die Indexierung ist ein wesentlicher Bestandteil des SEO-Prozesses. Sie bezieht sich auf den Prozess, bei dem Suchmaschinen (wie Google, Bing, Yahoo! usw.) gebeten werden, den

Weiterlesen »
Pagespeed

PageSpeed ist eine Kennzahl, mit der die Geschwindigkeit von Webseiten gemessen wird. Sie ist ein wichtiger Faktor für ein positives Benutzererlebnis auf Websites und kann

Weiterlesen »
eCPC

eCPC (effective Cost per Click) steht für effektive Kosten pro Klick und ist eine Kennzahl zur Messung der Leistung von Online-Werbekampagnen. Sie berechnet die Gesamteinnahmen

Weiterlesen »
XPath

XPath steht für „XML Path Language“ und ist eine Abfragesprache, mit der Sie Knoten aus einem XML-Dokument auswählen können. Sie wird häufig in der Webentwicklung

Weiterlesen »
Client (SEO)

Client, auch bekannt als „clientseitige Anwendung“, ist eine Anwendung oder ein Programm, das auf dem lokalen Computer oder Gerät eines Benutzers und nicht auf einem

Weiterlesen »
At-Zeichen

Das At-Zeichen oder @-Symbol ist ein weit verbreitetes Sonderzeichen, das in vielen verschiedenen Zusammenhängen verwendet wird. Es gibt es seit den 1960er Jahren und wird

Weiterlesen »