Onde colocar o arquivo robots.txt?

O robots.txt deve ficar no diretório raiz do site, acessível em seudominio.com/robots.txt. Não funciona em subdiretórios. Cada subdomínio precisa do seu próprio arquivo — blog.exemplo.com e www.exemplo.com exigem robots.txt separados.

Como bloquear bots de IA como GPTBot e ClaudeBot?

Adicione regras específicas: User-agent: GPTBot / Disallow: / (bloqueia OpenAI), User-agent: ClaudeBot / Disallow: / (bloqueia Anthropic), User-agent: Google-Extended / Disallow: / (bloqueia IA do Google). Nosso gerador tem o preset 'Block AI Bots' que adiciona todas essas regras com um clique.

Qual a diferença entre Allow e Disallow?

Disallow bloqueia acesso a um caminho (ex: Disallow: /admin/ bloqueia o diretório admin). Allow permite acesso, útil para sobrescrever um Disallow mais amplo (ex: Disallow: /images/ com Allow: /images/public/). Quando ambos se aplicam, a regra mais específica (caminho mais longo) tem precedência.

O robots.txt realmente bloqueia crawlers?

É consultivo, não obrigatório. Crawlers bem-comportados como Googlebot e Bingbot respeitam as regras. Porém, bots maliciosos podem ignorar completamente. Para controle real de acesso, use .htaccess, autenticação, firewalls ou X-Robots-Tag. Pense no robots.txt como um pedido educado, não como segurança.

O que é crawl-delay no robots.txt?

Crawl-delay pede aos crawlers para esperar X segundos entre requisições. Ex: Crawl-delay: 10 pede espera de 10 segundos. Útil para servidores com recursos limitados. Google não suporta (use Search Console), mas Bing e Yandex respeitam.

Devo incluir Sitemap no robots.txt?

Sim, é boa prática. Adicione Sitemap: https://exemplo.com/sitemap.xml fora de qualquer bloco User-agent. Ajuda motores de busca a descobrir seu XML sitemap sem depender apenas do Search Console. Pode incluir múltiplas entradas para vários sitemaps.

Posso usar wildcards no robots.txt?

Sim, Google e Bing suportam: asterisco (*) para qualquer sequência de caracteres (ex: Disallow: /*.json bloqueia URLs terminando em .json) e cifrão ($) para fim de URL (ex: Disallow: /*.pdf$ bloqueia apenas URLs terminando exatamente em .pdf). Nem todos os crawlers suportam wildcards.

Como testar se meu robots.txt funciona?

Teste de várias formas: (1) Use o testador de robots.txt do Google Search Console. (2) Acesse seudominio.com/robots.txt no navegador para verificar acessibilidade. (3) Use nossa ferramenta de Headers HTTP para checar o status. (4) Use a ferramenta de Inspeção de URL do Google para ver se o Googlebot acessa suas páginas.

Gerador de Robots.txt — Criar e Personalizar Arquivos Robots.txt

O Que é um Arquivo Robots.txt?

Um arquivo robots.txt é um arquivo de texto simples colocado no diretório raiz do seu site (ex: exemplo.com/robots.txt) que diz aos crawlers de motores de busca e bots quais páginas ou seções podem e não podem acessar. Ele segue o padrão Robots Exclusion Protocol.

Embora seja consultivo (não obrigatório), todos os grandes motores de busca como Google e Bing respeitam as diretivas do robots.txt. É a primeira linha de controle de rastreamento para qualquer site.

Nosso gerador visual permite criar regras de robots.txt sem necessidade de editar código manualmente, com presets prontos e suporte a bloqueio de bots de IA.

Gerador de robots.txt com editor visual mostrando presets, regras de crawler e preview do arquivo — Editor visual do gerador de robots.txt com presets prontos e preview em tempo real

Como Criar um Arquivo Robots.txt

Siga estes passos para criar seu robots.txt usando nosso gerador:

Passo 1: Escolha um Preset

Selecione um preset rápido: 'Allow All' (permite tudo), 'Block All' (bloqueia tudo), 'Standard' (configuração recomendada) ou 'Block AI Bots' (bloqueia bots de IA). Ou comece do zero.

Passo 2: Adicione Regras de Crawler

Selecione um user-agent (Googlebot, Bingbot, GPTBot, etc.) e defina diretivas Allow ou Disallow para caminhos específicos do seu site.

Passo 3: Configure Sitemap e Crawl-Delay

Adicione a URL do seu XML sitemap e opcionalmente defina um crawl-delay para limitar a frequência de rastreamento.

Passo 4: Baixe e Instale

Clique em Download para obter seu robots.txt e faça upload para o diretório raiz do seu site (acessível em seudominio.com/robots.txt).

Referência de Diretivas Robots.txt

Conheça as principais diretivas disponíveis no robots.txt:

ObrigatórioUser-agent

Especifica qual crawler a regra se aplica. Use * para todos os bots, ou nomes específicos como Googlebot, Bingbot, GPTBot.

BloqueioDisallow

Bloqueia o acesso a um caminho específico. Ex: Disallow: /admin/ bloqueia o diretório admin. Disallow: / bloqueia todo o site.

PermissãoAllow

Permite acesso a um caminho, sobrescrevendo Disallow mais amplo. Ex: Allow: /images/public/ permite acesso mesmo com Disallow: /images/.

DescobertaSitemap

Indica a URL do XML sitemap. Colocado fora de qualquer bloco User-agent. Aceita múltiplas entradas para vários sitemaps.

FrequênciaCrawl-delay

Pede aos bots para esperar X segundos entre requisições. Bing e Yandex respeitam, mas Google ignora (use Search Console).

Como Bloquear Bots de IA com Robots.txt

Para impedir que crawlers de IA usem seu conteúdo para treinamento, adicione regras específicas ao robots.txt:

GPTBot (OpenAI): User-agent: GPTBot + Disallow: / — bloqueia o crawler da OpenAI usado para treinamento do ChatGPT.

ClaudeBot (Anthropic): User-agent: ClaudeBot + Disallow: / — bloqueia o crawler da Anthropic.

Google-Extended: User-agent: Google-Extended + Disallow: / — bloqueia o crawler do Google para treinamento de IA (diferente do Googlebot de busca).

CCBot (Common Crawl): User-agent: CCBot + Disallow: / — bloqueia o crawler do Common Crawl, dataset público usado por muitas IAs.

Nosso gerador tem o preset 'Block AI Bots' que adiciona todas essas regras com um clique.

Robots.txt vs Outros Métodos de Controle

O robots.txt é apenas uma forma de controlar o acesso ao seu site. Compare com outros métodos:

Comparação entre robots.txt, meta robots, X-Robots-Tag e .htaccess para controle de acesso — Robots.txt é consultivo; para bloqueio real, use .htaccess ou firewall

ConsultivoRobots.txt

Consultivo, respeitado por bots bem-comportados. Fácil de implementar. Não é segurança real — bots maliciosos podem ignorar.

Por PáginaMeta Robots Tag

Tag HTML <meta name='robots'> com noindex, nofollow. Controla indexação por página. Mais granular que robots.txt.

Por ArquivoX-Robots-Tag Header

Header HTTP que funciona como meta robots mas para qualquer tipo de arquivo (PDF, imagem). Ideal para conteúdo não-HTML.

Obrigatório.htaccess / Firewall

Bloqueio real no servidor. Impede acesso completamente, não apenas rastreamento. Use para segurança real.

Boas Práticas para Robots.txt

Siga estas práticas para um robots.txt eficaz:

Coloque no diretório raiz — deve ser acessível em seudominio.com/robots.txt
Inclua diretiva Sitemap — ajuda motores de busca a descobrir seu XML sitemap
Não bloqueie CSS e JavaScript — Google precisa renderizar suas páginas para indexação moderna
Use regras específicas — evite Disallow: / exceto quando necessário (bloqueia todo o site)
Teste antes de publicar — use o testador de robots.txt do Google Search Console
Atualize após mudanças de estrutura — novos diretórios ou seções podem precisar de regras
Cada subdomínio precisa do seu próprio robots.txt — blog.exemplo.com e www.exemplo.com são separados
Lembre-se: robots.txt não é segurança — use autenticação e firewalls para dados sensíveis

Ferramentas Relacionadas

Explore nossas outras ferramentas grátis para SEO e gerenciamento de sites:

Gerador de Sitemap

Gere XML sitemaps para ajudar motores de busca a encontrar suas páginas.

Verificador de Headers HTTP

Analise headers de resposta e segurança de qualquer site.

Verificador de Redirecionamento

Rastreie cadeias de redirecionamento 301/302 de qualquer URL.

Analisador de Links

Encontre todos os links internos e externos em qualquer página.

Detector de CMS

Descubra qual CMS, servidor web e CDN um site usa.

Verificador SSL

Verifique certificado SSL, protocolo TLS e validade.

O Que é um Arquivo Robots.txt?

Nosso gerador visual permite criar regras de robots.txt sem necessidade de editar código manualmente, com presets prontos e suporte a bloqueio de bots de IA.

Como Criar um Arquivo Robots.txt

Siga estes passos para criar seu robots.txt usando nosso gerador:

Passo 1: Escolha um Preset

Selecione um preset rápido: 'Allow All' (permite tudo), 'Block All' (bloqueia tudo), 'Standard' (configuração recomendada) ou 'Block AI Bots' (bloqueia bots de IA). Ou comece do zero.

Passo 2: Adicione Regras de Crawler

Selecione um user-agent (Googlebot, Bingbot, GPTBot, etc.) e defina diretivas Allow ou Disallow para caminhos específicos do seu site.

Passo 3: Configure Sitemap e Crawl-Delay

Adicione a URL do seu XML sitemap e opcionalmente defina um crawl-delay para limitar a frequência de rastreamento.

Passo 4: Baixe e Instale

Clique em Download para obter seu robots.txt e faça upload para o diretório raiz do seu site (acessível em seudominio.com/robots.txt).

Referência de Diretivas Robots.txt

Conheça as principais diretivas disponíveis no robots.txt:

ObrigatórioUser-agent

Especifica qual crawler a regra se aplica. Use * para todos os bots, ou nomes específicos como Googlebot, Bingbot, GPTBot.

BloqueioDisallow

Bloqueia o acesso a um caminho específico. Ex: Disallow: /admin/ bloqueia o diretório admin. Disallow: / bloqueia todo o site.

PermissãoAllow

Permite acesso a um caminho, sobrescrevendo Disallow mais amplo. Ex: Allow: /images/public/ permite acesso mesmo com Disallow: /images/.

DescobertaSitemap

Indica a URL do XML sitemap. Colocado fora de qualquer bloco User-agent. Aceita múltiplas entradas para vários sitemaps.

FrequênciaCrawl-delay

Pede aos bots para esperar X segundos entre requisições. Bing e Yandex respeitam, mas Google ignora (use Search Console).

Como Bloquear Bots de IA com Robots.txt

Para impedir que crawlers de IA usem seu conteúdo para treinamento, adicione regras específicas ao robots.txt:

GPTBot (OpenAI): User-agent: GPTBot + Disallow: / — bloqueia o crawler da OpenAI usado para treinamento do ChatGPT.

ClaudeBot (Anthropic): User-agent: ClaudeBot + Disallow: / — bloqueia o crawler da Anthropic.

Google-Extended: User-agent: Google-Extended + Disallow: / — bloqueia o crawler do Google para treinamento de IA (diferente do Googlebot de busca).

CCBot (Common Crawl): User-agent: CCBot + Disallow: / — bloqueia o crawler do Common Crawl, dataset público usado por muitas IAs.

Nosso gerador tem o preset 'Block AI Bots' que adiciona todas essas regras com um clique.

Robots.txt vs Outros Métodos de Controle

O robots.txt é apenas uma forma de controlar o acesso ao seu site. Compare com outros métodos:

ConsultivoRobots.txt

Consultivo, respeitado por bots bem-comportados. Fácil de implementar. Não é segurança real — bots maliciosos podem ignorar.

Por PáginaMeta Robots Tag

Tag HTML <meta name='robots'> com noindex, nofollow. Controla indexação por página. Mais granular que robots.txt.

Por ArquivoX-Robots-Tag Header

Header HTTP que funciona como meta robots mas para qualquer tipo de arquivo (PDF, imagem). Ideal para conteúdo não-HTML.

Obrigatório.htaccess / Firewall

Bloqueio real no servidor. Impede acesso completamente, não apenas rastreamento. Use para segurança real.

Boas Práticas para Robots.txt

Siga estas práticas para um robots.txt eficaz:

Coloque no diretório raiz — deve ser acessível em seudominio.com/robots.txt
Inclua diretiva Sitemap — ajuda motores de busca a descobrir seu XML sitemap
Não bloqueie CSS e JavaScript — Google precisa renderizar suas páginas para indexação moderna
Use regras específicas — evite Disallow: / exceto quando necessário (bloqueia todo o site)
Teste antes de publicar — use o testador de robots.txt do Google Search Console
Atualize após mudanças de estrutura — novos diretórios ou seções podem precisar de regras
Cada subdomínio precisa do seu próprio robots.txt — blog.exemplo.com e www.exemplo.com são separados
Lembre-se: robots.txt não é segurança — use autenticação e firewalls para dados sensíveis

Ferramentas Relacionadas

Explore nossas outras ferramentas grátis para SEO e gerenciamento de sites:

Gerador de Sitemap

Gere XML sitemaps para ajudar motores de busca a encontrar suas páginas.

Verificador de Headers HTTP

Analise headers de resposta e segurança de qualquer site.

Verificador de Redirecionamento

Rastreie cadeias de redirecionamento 301/302 de qualquer URL.

Analisador de Links

Encontre todos os links internos e externos em qualquer página.

Detector de CMS

Descubra qual CMS, servidor web e CDN um site usa.

Verificador SSL

Verifique certificado SSL, protocolo TLS e validade.

Gerador de Robots.txt

O Que é um Arquivo Robots.txt?

Como Criar um Arquivo Robots.txt

Referência de Diretivas Robots.txt

Como Bloquear Bots de IA com Robots.txt

Robots.txt vs Outros Métodos de Controle

Boas Práticas para Robots.txt

Ferramentas Relacionadas

Perguntas Frequentes Sobre Robots.txt

O que é um arquivo robots.txt?

Como criar um arquivo robots.txt?

Onde colocar o arquivo robots.txt?

Como bloquear bots de IA como GPTBot e ClaudeBot?

Qual a diferença entre Allow e Disallow?

O robots.txt realmente bloqueia crawlers?

O que é crawl-delay no robots.txt?

Devo incluir Sitemap no robots.txt?

Posso usar wildcards no robots.txt?

Como testar se meu robots.txt funciona?

Gerador de Robots.txt

O Que é um Arquivo Robots.txt?

Como Criar um Arquivo Robots.txt

Referência de Diretivas Robots.txt

Como Bloquear Bots de IA com Robots.txt

Robots.txt vs Outros Métodos de Controle

Boas Práticas para Robots.txt

Ferramentas Relacionadas

Perguntas Frequentes Sobre Robots.txt

O que é um arquivo robots.txt?

Como criar um arquivo robots.txt?

Onde colocar o arquivo robots.txt?

Como bloquear bots de IA como GPTBot e ClaudeBot?

Qual a diferença entre Allow e Disallow?

O robots.txt realmente bloqueia crawlers?

O que é crawl-delay no robots.txt?

Devo incluir Sitemap no robots.txt?

Posso usar wildcards no robots.txt?

Como testar se meu robots.txt funciona?