Gdzie umieścić plik robots.txt?

Plik robots.txt musi znajdować się w katalogu głównym witryny, dostępny pod adresem twojadomena.com/robots.txt. Nie działa w podkatalogach. Każda subdomena potrzebuje własnego pliku — blog.example.com i www.example.com wymagają oddzielnych plików robots.txt.

Jak zablokować boty AI takie jak GPTBot i ClaudeBot?

Dodaj specyficzne reguły: User-agent: GPTBot / Disallow: / (blokuje OpenAI), User-agent: ClaudeBot / Disallow: / (blokuje Anthropic), User-agent: Google-Extended / Disallow: / (blokuje AI Google). Nasz generator ma preset 'Block AI Bots', który dodaje wszystkie te reguły jednym kliknięciem.

Jaka jest różnica między Allow a Disallow w robots.txt?

Disallow blokuje dostęp do określonej ścieżki (np. Disallow: /admin/ blokuje katalog admin). Allow pozwala na dostęp, nadpisując szerszą regułę Disallow (np. Disallow: /images/ z Allow: /images/public/ blokuje wszystkie obrazy oprócz folderu public). Gdy obie reguły pasują, pierwszeństwo ma bardziej specyficzna (dłuższa ścieżka). Przy równej specyficzności wygrywa Allow.

Czy robots.txt naprawdę blokuje crawlery?

Robots.txt ma charakter doradczy, nie wymuszający. Dobrze zachowujące się crawlery jak Googlebot i Bingbot respektują reguły. Jednak złośliwe boty i scrapery mogą je całkowicie zignorować. Dla rzeczywistej kontroli dostępu użyj reguł .htaccess, uwierzytelniania, firewalli lub nagłówka X-Robots-Tag. Traktuj robots.txt jako uprzejmą prośbę, nie mechanizm bezpieczeństwa.

Czym jest crawl-delay w robots.txt?

Crawl-delay to dyrektywa, która prosi crawlery o odczekanie określonej liczby sekund między żądaniami. Np. Crawl-delay: 10 prosi boty o czekanie 10 sekund między pobraniami stron. Przydatne dla serwerów o ograniczonych zasobach. Google nie obsługuje crawl-delay (użyj Google Search Console), ale Bing i Yandex go respektują.

Czy powinienem dodać dyrektywę Sitemap w robots.txt?

Tak, to najlepsza praktyka. Dodaj Sitemap: https://example.com/sitemap.xml poza blokami User-agent. Pomaga to wyszukiwarkom odkryć Twoją mapę witryny XML bez polegania wyłącznie na Google Search Console. Możesz dodać wiele dyrektyw Sitemap, jeśli masz kilka map witryny.

Czy mogę używać wildcardów w robots.txt?

Tak, Google i Bing obsługują dwa wzorce wildcardów: gwiazdka (*) dopasowuje dowolną sekwencję znaków (np. Disallow: /*.json blokuje URL kończące się na .json), a dolar ($) dopasowuje koniec URL (np. Disallow: /*.pdf$ blokuje tylko URL kończące się dokładnie na .pdf). Nie wszystkie crawlery obsługują wildcardy, więc testuj swoje reguły.

Jak sprawdzić, czy mój robots.txt działa?

Możesz przetestować robots.txt na kilka sposobów: (1) Użyj testera robots.txt w Google Search Console. (2) Wejdź na twojadomena.com/robots.txt w przeglądarce, aby sprawdzić dostępność pliku. (3) Użyj naszego narzędzia [HTTP Headers](/http-headers), aby sprawdzić status odpowiedzi. (4) Użyj narzędzia Inspekcji URL w Google, aby zobaczyć, czy Googlebot ma dostęp do Twoich stron.

Generator Robots.txt — Twórz i Dostosowuj Pliki Robots.txt

Czym Jest Plik Robots.txt?

Plik robots.txt to prosty plik tekstowy umieszczony w katalogu głównym Twojej witryny (np. example.com/robots.txt), który informuje roboty wyszukiwarek i inne boty, które strony lub sekcje witryny mogą, a których nie mogą odwiedzać. Plik ten działa zgodnie ze standardem Robots Exclusion Protocol.

Choć robots.txt ma charakter doradczy (nie jest wymuszany technicznie), wszystkie główne wyszukiwarki, takie jak Google i Bing, respektują jego dyrektywy. To pierwsza linia kontroli indeksowania dla każdej witryny internetowej. Nasz wizualny generator pozwala tworzyć reguły robots.txt bez konieczności ręcznej edycji kodu — z gotowymi presetami i wsparciem blokowania botów AI.

Generator robots.txt z edytorem wizualnym pokazujący presety, reguły crawlerów i podgląd pliku — Edytor wizualny generatora robots.txt z gotowymi presetami i podglądem pliku w czasie rzeczywistym

Jak Stworzyć Plik Robots.txt

Postępuj zgodnie z poniższymi krokami, aby stworzyć plik robots.txt za pomocą naszego darmowego generatora.

Krok 1: Wybierz Preset

Wybierz szybki preset: 'Allow All' (zezwól na wszystko), 'Block All' (zablokuj wszystko), 'Standard' (zalecana konfiguracja) lub 'Block AI Bots' (zablokuj boty AI). Możesz też zacząć od zera.

Krok 2: Dodaj Reguły Crawlerów

Wybierz user-agent (Googlebot, Bingbot, GPTBot itp.) i ustaw dyrektywy Allow lub Disallow dla konkretnych ścieżek na Twojej witrynie.

Krok 3: Skonfiguruj Sitemap i Crawl-Delay

Dodaj URL swojej mapy witryny XML i opcjonalnie ustaw crawl-delay, aby ograniczyć częstotliwość indeksowania.

Krok 4: Pobierz i Zainstaluj

Kliknij Download, aby pobrać plik robots.txt, a następnie wgraj go do katalogu głównego witryny (dostępny pod adresem twojadomena.com/robots.txt).

Dyrektywy Robots.txt — Dokumentacja

Plik robots.txt używa zestawu dyrektyw do komunikacji z robotami wyszukiwarek. Każda dyrektywa pełni inną funkcję — od wskazywania crawlera, przez blokowanie ścieżek, po wskazywanie mapy witryny.

Dokumentacja dyrektyw robots.txt — User-agent, Disallow, Allow, Sitemap i Crawl-delay z przykładami — Główne dyrektywy robots.txt: User-agent, Disallow, Allow, Sitemap i Crawl-delay

WymaganyUser-agent

Określa, którego crawlera dotyczy reguła. Użyj * dla wszystkich botów lub konkretnych nazw: Googlebot, Bingbot, GPTBot. Każdy blok reguł zaczyna się od User-agent.

BlokowanieDisallow

Blokuje dostęp do określonej ścieżki. Np. Disallow: /admin/ blokuje katalog admin. Disallow: / blokuje całą witrynę dla danego bota.

ZezwalanieAllow

Pozwala na dostęp do ścieżki, nadpisując szerszą regułę Disallow. Np. Allow: /images/public/ zezwala na dostęp mimo Disallow: /images/. Gdy obie pasują, wygrywa dłuższa ścieżka.

OdkrywanieSitemap

Wskazuje URL mapy witryny XML. Umieszczany poza blokami User-agent. Możesz dodać wiele dyrektyw Sitemap dla różnych map. Użyj naszego Generatora Sitemap do stworzenia mapy.

CzęstotliwośćCrawl-delay

Prosi boty o odczekanie X sekund między żądaniami. Np. Crawl-delay: 10 = czekaj 10 sekund. Bing i Yandex respektują, ale Google ignoruje (użyj Search Console). Przydatne dla serwerów o ograniczonych zasobach.

Jak Zablokować Boty AI w Robots.txt

Aby uniemożliwić crawlerom AI wykorzystywanie treści Twojej witryny do trenowania modeli, dodaj specyficzne reguły do pliku robots.txt. Poniżej znajdziesz najpopularniejsze boty AI i odpowiadające im reguły blokujące.

GPTBot (OpenAI): User-agent: GPTBot + Disallow: / — blokuje crawlera OpenAI używanego do trenowania ChatGPT. ClaudeBot (Anthropic): User-agent: ClaudeBot + Disallow: / — blokuje crawlera Anthropic. Google-Extended: User-agent: Google-Extended + Disallow: / — blokuje crawlera Google do trenowania AI (inny niż Googlebot wyszukiwarki). CCBot (Common Crawl): User-agent: CCBot + Disallow: / — blokuje crawlera Common Crawl, publicznego datasetu używanego przez wiele systemów AI. Nasz generator ma preset 'Block AI Bots', który dodaje wszystkie te reguły jednym kliknięciem.

Najlepsze Praktyki Robots.txt

Prawidłowo skonfigurowany plik robots.txt pomaga wyszukiwarkom efektywnie indeksować Twoją witrynę. Stosuj poniższe praktyki, aby uniknąć typowych problemów.

Umieść w katalogu głównym — plik musi być dostępny pod adresem twojadomena.com/robots.txt
Dodaj dyrektywę Sitemap — pomaga wyszukiwarkom odkryć Twoją mapę witryny XML
Nie blokuj CSS i JavaScript — Google musi renderować strony do nowoczesnej indeksacji
Używaj specyficznych reguł — unikaj Disallow: / chyba że celowo blokujesz całą witrynę
Testuj przed publikacją — użyj testera robots.txt w Google Search Console
Aktualizuj po zmianach struktury — nowe katalogi lub sekcje mogą wymagać nowych reguł
Każda subdomena potrzebuje własnego robots.txt — blog.example.com i www.example.com to oddzielne pliki
Pamiętaj: robots.txt to nie zabezpieczenie — dla danych wrażliwych użyj uwierzytelniania i firewalla

Robots.txt vs Inne Metody Kontroli Dostępu

Plik robots.txt to tylko jeden ze sposobów kontroli dostępu do witryny. W zależności od potrzeb możesz potrzebować bardziej restrykcyjnych metod, szczególnie gdy chodzi o ochronę wrażliwych danych.

Robots.txt jest doradczy — boty mogą go zignorować. Meta tag robots (noindex, nofollow) kontroluje indeksację na poziomie pojedynczej strony. X-Robots-Tag w nagłówkach HTTP działa jak meta robots, ale dla dowolnych typów plików (PDF, obrazy). .htaccess i firewalle zapewniają rzeczywiste blokowanie na poziomie serwera. Sprawdź nagłówki HTTP swojej witryny, aby zobaczyć, jakie metody kontroli są aktywne.

Powiązane Narzędzia

DNS Robot oferuje kompletny zestaw darmowych narzędzi SEO i zarządzania witrynami. Oto narzędzia najczęściej używane razem z Generatorem Robots.txt.

Generator Sitemap

Generuj mapy witryn XML, aby ułatwić wyszukiwarkom odkrywanie stron.

HTTP Headers

Analizuj nagłówki odpowiedzi i bezpieczeństwa dowolnej strony.

Redirect Checker

Śledź łańcuchy przekierowań 301/302 dowolnego URL.

Analizer Linków

Znajdź wszystkie linki wewnętrzne i zewnętrzne na dowolnej stronie.

Detektor CMS

Wykryj jaki CMS, serwer WWW i CDN używa strona.

Wyszukiwanie DNS

Sprawdź rekordy DNS i propagację globalną domeny.

Czym Jest Plik Robots.txt?

Jak Stworzyć Plik Robots.txt

Postępuj zgodnie z poniższymi krokami, aby stworzyć plik robots.txt za pomocą naszego darmowego generatora.

Krok 1: Wybierz Preset

Wybierz szybki preset: 'Allow All' (zezwól na wszystko), 'Block All' (zablokuj wszystko), 'Standard' (zalecana konfiguracja) lub 'Block AI Bots' (zablokuj boty AI). Możesz też zacząć od zera.

Krok 2: Dodaj Reguły Crawlerów

Wybierz user-agent (Googlebot, Bingbot, GPTBot itp.) i ustaw dyrektywy Allow lub Disallow dla konkretnych ścieżek na Twojej witrynie.

Krok 3: Skonfiguruj Sitemap i Crawl-Delay

Dodaj URL swojej mapy witryny XML i opcjonalnie ustaw crawl-delay, aby ograniczyć częstotliwość indeksowania.

Krok 4: Pobierz i Zainstaluj

Kliknij Download, aby pobrać plik robots.txt, a następnie wgraj go do katalogu głównego witryny (dostępny pod adresem twojadomena.com/robots.txt).

Dyrektywy Robots.txt — Dokumentacja

WymaganyUser-agent

Określa, którego crawlera dotyczy reguła. Użyj * dla wszystkich botów lub konkretnych nazw: Googlebot, Bingbot, GPTBot. Każdy blok reguł zaczyna się od User-agent.

BlokowanieDisallow

Blokuje dostęp do określonej ścieżki. Np. Disallow: /admin/ blokuje katalog admin. Disallow: / blokuje całą witrynę dla danego bota.

ZezwalanieAllow

Pozwala na dostęp do ścieżki, nadpisując szerszą regułę Disallow. Np. Allow: /images/public/ zezwala na dostęp mimo Disallow: /images/. Gdy obie pasują, wygrywa dłuższa ścieżka.

OdkrywanieSitemap

Wskazuje URL mapy witryny XML. Umieszczany poza blokami User-agent. Możesz dodać wiele dyrektyw Sitemap dla różnych map. Użyj naszego Generatora Sitemap do stworzenia mapy.

CzęstotliwośćCrawl-delay

Jak Zablokować Boty AI w Robots.txt

Najlepsze Praktyki Robots.txt

Prawidłowo skonfigurowany plik robots.txt pomaga wyszukiwarkom efektywnie indeksować Twoją witrynę. Stosuj poniższe praktyki, aby uniknąć typowych problemów.

Umieść w katalogu głównym — plik musi być dostępny pod adresem twojadomena.com/robots.txt
Dodaj dyrektywę Sitemap — pomaga wyszukiwarkom odkryć Twoją mapę witryny XML
Nie blokuj CSS i JavaScript — Google musi renderować strony do nowoczesnej indeksacji
Używaj specyficznych reguł — unikaj Disallow: / chyba że celowo blokujesz całą witrynę
Testuj przed publikacją — użyj testera robots.txt w Google Search Console
Aktualizuj po zmianach struktury — nowe katalogi lub sekcje mogą wymagać nowych reguł
Każda subdomena potrzebuje własnego robots.txt — blog.example.com i www.example.com to oddzielne pliki
Pamiętaj: robots.txt to nie zabezpieczenie — dla danych wrażliwych użyj uwierzytelniania i firewalla

Robots.txt vs Inne Metody Kontroli Dostępu

Powiązane Narzędzia

DNS Robot oferuje kompletny zestaw darmowych narzędzi SEO i zarządzania witrynami. Oto narzędzia najczęściej używane razem z Generatorem Robots.txt.

Generator Sitemap

Generuj mapy witryn XML, aby ułatwić wyszukiwarkom odkrywanie stron.

HTTP Headers

Analizuj nagłówki odpowiedzi i bezpieczeństwa dowolnej strony.

Redirect Checker

Śledź łańcuchy przekierowań 301/302 dowolnego URL.

Analizer Linków

Znajdź wszystkie linki wewnętrzne i zewnętrzne na dowolnej stronie.

Detektor CMS

Wykryj jaki CMS, serwer WWW i CDN używa strona.

Wyszukiwanie DNS

Sprawdź rekordy DNS i propagację globalną domeny.

Generator Robots.txt — Twórz i Dostosowuj Pliki Robots.txt

Czym Jest Plik Robots.txt?

Jak Stworzyć Plik Robots.txt

Dyrektywy Robots.txt — Dokumentacja

Jak Zablokować Boty AI w Robots.txt

Najlepsze Praktyki Robots.txt

Robots.txt vs Inne Metody Kontroli Dostępu

Powiązane Narzędzia

Najczęściej Zadawane Pytania o Robots.txt

Czym jest plik robots.txt?

Jak stworzyć plik robots.txt?

Gdzie umieścić plik robots.txt?

Jak zablokować boty AI takie jak GPTBot i ClaudeBot?

Jaka jest różnica między Allow a Disallow w robots.txt?

Czy robots.txt naprawdę blokuje crawlery?

Czym jest crawl-delay w robots.txt?

Czy powinienem dodać dyrektywę Sitemap w robots.txt?

Czy mogę używać wildcardów w robots.txt?

Jak sprawdzić, czy mój robots.txt działa?

Generator Robots.txt — Twórz i Dostosowuj Pliki Robots.txt

Czym Jest Plik Robots.txt?

Jak Stworzyć Plik Robots.txt

Dyrektywy Robots.txt — Dokumentacja

Jak Zablokować Boty AI w Robots.txt

Najlepsze Praktyki Robots.txt

Robots.txt vs Inne Metody Kontroli Dostępu

Powiązane Narzędzia

Najczęściej Zadawane Pytania o Robots.txt

Czym jest plik robots.txt?

Jak stworzyć plik robots.txt?

Gdzie umieścić plik robots.txt?

Jak zablokować boty AI takie jak GPTBot i ClaudeBot?

Jaka jest różnica między Allow a Disallow w robots.txt?

Czy robots.txt naprawdę blokuje crawlery?

Czym jest crawl-delay w robots.txt?

Czy powinienem dodać dyrektywę Sitemap w robots.txt?

Czy mogę używać wildcardów w robots.txt?

Jak sprawdzić, czy mój robots.txt działa?