# llms.txt

# Dies ist eine hypothetische llms.txt-Datei, die Ihre robots.txt-Anweisungen widerspiegelt.
# WICHTIG: Es gibt keinen offiziellen Standard für llms.txt, der von allen LLM-Anbietern anerkannt wird,
# und diese Datei kann ohne Workarounds nicht direkt in Ihren Shopify-Shop hochgeladen werden.
# Sie dient als anschauliches Beispiel dafür, wie solche Anweisungen strukturiert sein könnten.

# Allgemeine LLM-Bot-Regeln (entspricht User-agent: * in robots.txt)
User-agent: *LLM* # Steht für jeden Crawler mit großem Sprachmodell
Disallow: /admin
Disallow: /cart
Disallow: /checkout
Disallow: /checkouts/
Disallow: /orders
Disallow: /account
Disallow: /carts
Disallow: /*?oseid=
Disallow: /*preview_theme_id
Disallow: /*preview_script_id
Disallow: /apple-app-site-association
Disallow: /.well-known/shopify/monorail
Disallow: /cdn/wpm/*.js
Disallow: /recommendations/products

# Diese sind für die LLM-Indizierung zulässig (NICHT BLOCKIEREN):
Allow: /collections/
Allow: /products/
Allow: /blogs/
Allow: /pages/
Allow: /search # inkl. sortierte, gefilterte und getaggte Inhalte

# Google-spezifische LLM-Direktive
User-agent: Google-Extended # Offizieller Bot, der von Google für Gemini/Bard-Modelle verwendet wird
Disallow: /admin/
Zulassen: /

# GPT-basierte Modelle von OpenAI (ChatGPT usw.)
User-Agent: GPTBot
Verbieten: /admin/
Zulassen: /

# Hypothetischer LLM-Bot für Werbeinhalte
User-Agent: AdLLMBot
Verbieten: /checkout
Verbieten: /checkouts/
Verbieten: /carts
Verbieten: /orders

# Hypothetischer LLM-Bot für die Bildverarbeitung (z. B. zukünftige visuelle Modellindizierung)
User-Agent: ImageLLMBot
Disallow: /admin/
Allow: /

# Hypothetischer LLM-Bot für Pinterest
User-Agent: PinterestLLM
Crawl-Delay: 1

# Hypothetische LLM-Bots für Ahrefs
User-agent: AhrefsLLMBot
Crawl-delay: 10
Disallow: /checkout
Disallow: /checkouts/
Disallow: /cart
Disallow: /admin
Disallow: /orders

User-agent: AhrefsSiteAuditLLM
Crawl-delay: 10
Disallow: /checkout
Disallow: /checkouts/
Disallow: /cart
Disallow: /admin
Disallow: /orders

# Hypothetischer LLM-Bot für MJ12bot
User-agent: MJ12LLMBot
Crawl-delay: 10

# Veraltete oder aggressive LLM-Scraper blockieren
User-agent: OutdatedLLMScraper
Disallow: /

# Beste Verwendungszwecke für eine hypothetische llm.txt-Datei:
# 1. Datenschutz und -sicherheit: Verhindern Sie, dass LLM-Crawler auf sensible Bereiche zugreifen.
# 2. Inhaltskontrolle für KI-Training: Erlauben oder verbieten Sie Inhalte für das Training von KI-Modellen ausdrücklich.
# 3. Ressourcenmanagement: Verringern Sie potenziell die Serverlast, indem Sie Crawl-Verzögerungen anfordern.
# 4. Schutz geistigen Eigentums: Signalisieren Sie Präferenzen für die Nutzung von Inhalten.
# 5. Gezielte Anweisungen: Wenden Sie bestimmte Regeln auf verschiedene LLM-User-Agents an.