Welche AI-Crawler gibt es und wie steuerst du sie?

Ein Überblick über GPTBot, ClaudeBot und Co: welche Bots deine Seite besuchen und wie du sie per robots.txt gezielt erlaubst oder blockierst.

Die wichtigsten AI-Crawler

Verschiedene AI-Anbieter schicken eigene Crawler durchs Web. Diese Bots besuchen deine Seite, laden das HTML und werten es aus.

BotBetreiberZweck
GPTBotOpenAIInhalte für ChatGPT und Modelltraining
OAI-SearchBotOpenAILive-Abruf für die Suche in ChatGPT
ClaudeBotAnthropicInhalte für Claude
PerplexityBotPerplexityLive-Abruf für Perplexity-Antworten
Google-ExtendedGoogleSteuert die Nutzung für Gemini und AI Overviews
Applebot-ExtendedAppleSteuert die Nutzung für Apple Intelligence
CCBotCommon CrawlOffener Datensatz, den viele Modelle nutzen
BytespiderByteDanceInhalte für ByteDance-Modelle

Die Liste wächst laufend, weil ständig neue AI-Dienste dazukommen.

Woran du sie erkennst

Jeder seriöse Bot verrät sich in deinen Server-Logs durch eine eindeutige Kennung:

  • User-Agent: ein Namensschild wie GPTBot/1.0 oder ClaudeBot/1.0, das der Bot bei jeder Anfrage mitschickt.
  • Log-Analyse: Suche in den Zugriffs-Logs nach diesen Namen, um zu sehen wer wie oft vorbeikommt.
  • Kein JavaScript: Die meisten AI-Crawler holen nur das rohe HTML, nicht per JavaScript nachgeladene Inhalte.

robots.txt: erlauben oder blockieren

In der Datei robots.txt in deinem Wurzelverzeichnis legst du pro Bot fest, was er darf. Ein Beispiel:

User-agent: GPTBot
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: *
Allow: /

Das sperrt GPTBot und CCBot komplett, während alle anderen Crawler die Seite lesen dürfen. Wichtig: robots.txt ist eine Bitte, kein technischer Zwang. Seriöse Bots halten sich daran, unseriöse ignorieren sie.

Blockieren oder zulassen: was ist sinnvoll?

  • Sichtbarkeit gewünscht: Wer in AI-Antworten vorkommen will, sollte die relevanten Bots zulassen.
  • Inhalte schützen: Bezahlinhalte oder sensible Bereiche kannst du gezielt sperren.
  • Bewusst entscheiden: Ein pauschaler Block kostet Reichweite in AI-Suchen, ein pauschales Zulassen gibt alles frei.

Unser Audit zeigt dir, welche AI-Crawler deine robots.txt aktuell blockiert.

Bereit deine Website zu optimieren?

Teste jetzt kostenlos wie gut deine Website für AI-Systeme optimiert ist.

Kostenlos scannen