robots.txt 2026: Welche KI-Crawler du erlauben solltest (und welche nicht)

Albert Ipgefer
Gründer · Wohlstandsmarketing
Die robots.txt ist der erste Kontakt zwischen deiner Webseite und jedem Crawler — auch jedem KI-Crawler. Eine falsche Zeile dort und du verschwindest still und leise aus den Antworten von ChatGPT, Perplexity oder Claude.
Warum die robots.txt 2026 wichtiger ist denn je
Bis 2023 war die robots.txt für die meisten Webseiten kaum relevant — man hat sie einmal eingerichtet und nie wieder angefasst. Mit dem Aufkommen generativer KI hat sich das geändert: Jeder große KI-Anbieter hat einen eigenen Bot, und jeder dieser Bots respektiert (idealerweise) die robots.txt.
Die wichtigsten KI-Bots im Überblick
- GPTBot — OpenAI, für ChatGPT und Custom GPTs
- OAI-SearchBot — OpenAI, für SearchGPT
- ChatGPT-User — OpenAI, On-Demand-Abrufe durch Nutzer
- PerplexityBot — Perplexity AI
- ClaudeBot & anthropic-ai — Anthropic, für Claude
- Google-Extended — Google, separater Schalter für Bard/Gemini-Training
- CCBot — Common Crawl, Quelle für viele Open-Source-Modelle
Empfohlene Konfiguration
Für die meisten Unternehmen, die in KI-Antworten auftauchen wollen, ist die einfachste und beste Konfiguration: alle Bots erlauben.
User-agent: *
Allow: /
# KI-Crawler ausdrücklich erlaubt
User-agent: GPTBot
Allow: /
User-agent: OAI-SearchBot
Allow: /
User-agent: ChatGPT-User
Allow: /
User-agent: PerplexityBot
Allow: /
User-agent: ClaudeBot
Allow: /
User-agent: anthropic-ai
Allow: /
User-agent: Google-Extended
Allow: /
User-agent: CCBot
Allow: /
Sitemap: https://example.com/sitemap.xmlWer einzelne Bereiche (z. B. Kundenbereich, Admin-Panel) ausschließen will, ergänzt entsprechende Disallow-Direktiven. Wer bestimmte Bots aussperren möchte (z. B. um Training-Daten-Nutzung zu verhindern), setzt für diesen User-Agent Disallow: / — sollte sich dabei aber bewusst sein, dass damit auch KI-Empfehlungen wegfallen.
Über den Autor

Albert Ipgefer
Gründer · Wohlstandsmarketing
Albert baut seit 2025 mit Wohlstandsmarketing Webseiten + KI-Sichtbarkeit für DACH-Mittelstand. Spezialisiert auf die 90-Tage-WSM-Methode: konvertierende Webseite live in 7 Tagen, danach 83 Tage konstante Optimierung für Google, ChatGPT, Perplexity und Claude. Sitz in Bad Ems, betreut Kunden in der gesamten DACH-Region.
Die 11 teuersten Marketing-Fehler im Mittelstand
Konkrete Lösung pro Fehler + eine 30-Tage-Profi-Checkliste am Ende. Direkt nach Anmeldung in deinem Postfach.
Das könnte dich auch interessieren
Weitere Artikel zum Thema
ChatGPT-Optimierung-Agentur: Worauf 2026 wirklich achten
Artikel lesen →Technisches SEOSchema.org für lokale Anbieter: 5 Markups, die du 2026 brauchst
Artikel lesen →Technisches SEOSEO-Agentur für Handwerker: Worauf 2026 wirklich achten
Artikel lesen →Technisches SEOCore Web Vitals 2026: Wie schnell deine Webseite wirklich sein muss
Artikel lesen →Webdesign + KI-Sichtbarkeit in deiner Region
Vor Ort für DACH-Mittelstand
Aktiv in 13 Städten — Sitz in Bad Ems, Termine vor Ort oder remote.
FAQ
Häufige Fragen zu diesem Thema
Was passiert, wenn ich GPTBot blockiere?+
Deine Inhalte werden nicht ins Trainings- und Live-Datenset von ChatGPT aufgenommen. Du wirst dort dann nicht empfohlen — auch nicht bei Suchanfragen, die exakt zu dir passen würden.
Schaden KI-Crawler meiner Server-Performance?+
In der Regel nein. Seriöse KI-Crawler respektieren Crawl-Delays. Wenn du Probleme siehst, kannst du Crawl-Delay-Direktiven setzen oder nur bestimmte Pfade freigeben.
Brauche ich robots.txt überhaupt, wenn ich keinen sensiblen Content habe?+
Ja. Auch wenn du nichts blockierst, ist eine saubere robots.txt mit allen erlaubten Bots ein positives Signal. Sie zeigt, dass deine Seite professionell gepflegt wird.