# llms.txt # Dies ist eine hypothetische llms.txt-Datei, die Ihre robots.txt-Anweisungen widerspiegelt. # WICHTIG: Es gibt keinen offiziellen Standard für llms.txt, der von allen LLM-Anbietern anerkannt wird, # und diese Datei kann ohne Workarounds nicht direkt in Ihren Shopify-Shop hochgeladen werden. # Sie dient als anschauliches Beispiel dafür, wie solche Anweisungen strukturiert sein könnten. # Allgemeine LLM-Bot-Regeln (entspricht User-agent: * in robots.txt) User-agent: *LLM* # Steht für jeden Crawler mit großem Sprachmodell Disallow: /admin Disallow: /cart Disallow: /checkout Disallow: /checkouts/ Disallow: /orders Disallow: /account Disallow: /carts Disallow: /*?oseid= Disallow: /*preview_theme_id Disallow: /*preview_script_id Disallow: /apple-app-site-association Disallow: /.well-known/shopify/monorail Disallow: /cdn/wpm/*.js Disallow: /recommendations/products # Diese sind für die LLM-Indizierung zulässig (NICHT BLOCKIEREN): Allow: /collections/ Allow: /products/ Allow: /blogs/ Allow: /pages/ Allow: /search # inkl. sortierte, gefilterte und getaggte Inhalte # Google-spezifische LLM-Direktive User-agent: Google-Extended # Offizieller Bot, der von Google für Gemini/Bard-Modelle verwendet wird Disallow: /admin/ Zulassen: / # GPT-basierte Modelle von OpenAI (ChatGPT usw.) User-Agent: GPTBot Verbieten: /admin/ Zulassen: / # Hypothetischer LLM-Bot für Werbeinhalte User-Agent: AdLLMBot Verbieten: /checkout Verbieten: /checkouts/ Verbieten: /carts Verbieten: /orders # Hypothetischer LLM-Bot für die Bildverarbeitung (z. B. zukünftige visuelle Modellindizierung) User-Agent: ImageLLMBot Disallow: /admin/ Allow: / # Hypothetischer LLM-Bot für Pinterest User-Agent: PinterestLLM Crawl-Delay: 1 # Hypothetische LLM-Bots für Ahrefs User-agent: AhrefsLLMBot Crawl-delay: 10 Disallow: /checkout Disallow: /checkouts/ Disallow: /cart Disallow: /admin Disallow: /orders User-agent: AhrefsSiteAuditLLM Crawl-delay: 10 Disallow: /checkout Disallow: /checkouts/ Disallow: /cart Disallow: /admin Disallow: /orders # Hypothetischer LLM-Bot für MJ12bot User-agent: MJ12LLMBot Crawl-delay: 10 # Veraltete oder aggressive LLM-Scraper blockieren User-agent: OutdatedLLMScraper Disallow: / # Beste Verwendungszwecke für eine hypothetische llm.txt-Datei: # 1. Datenschutz und -sicherheit: Verhindern Sie, dass LLM-Crawler auf sensible Bereiche zugreifen. # 2. Inhaltskontrolle für KI-Training: Erlauben oder verbieten Sie Inhalte für das Training von KI-Modellen ausdrücklich. # 3. Ressourcenmanagement: Verringern Sie potenziell die Serverlast, indem Sie Crawl-Verzögerungen anfordern. # 4. Schutz geistigen Eigentums: Signalisieren Sie Präferenzen für die Nutzung von Inhalten. # 5. Gezielte Anweisungen: Wenden Sie bestimmte Regeln auf verschiedene LLM-User-Agents an.