Bagaimana cara membuat file robots.txt?

Gunakan pembuat robots.txt gratis kami: (1) Pilih preset (Izinkan Semua, Blokir Semua, Standar, atau Blokir Bot AI) atau mulai dari awal. (2) Tambahkan aturan crawler dengan memilih user-agent dan mengatur direktif Allow atau Disallow untuk path tertentu. (3) Atur URL Sitemap dan crawl-delay jika diperlukan. (4) Klik Download untuk mendapatkan file robots.txt, lalu unggah ke direktori root website Anda.

Di mana harus meletakkan file robots.txt?

File robots.txt harus ditempatkan di direktori root website Anda agar dapat diakses di https://domainanda.com/robots.txt. File harus berada di level domain teratas — menempatkannya di subdirektori tidak akan berfungsi. Setiap subdomain memerlukan file robots.txt tersendiri. Misalnya, blog.contoh.com dan www.contoh.com memerlukan file robots.txt terpisah.

Bagaimana cara memblokir bot AI seperti GPTBot dan ClaudeBot?

Untuk memblokir crawler AI dari mengambil konten Anda, tambahkan aturan User-agent dan Disallow spesifik di robots.txt. Contoh: User-agent: GPTBot / Disallow: / memblokir crawler OpenAI, User-agent: ClaudeBot / Disallow: / memblokir crawler Anthropic, dan User-agent: Google-Extended / Disallow: / memblokir crawler pelatihan AI Google. Pembuat kami memiliki preset 'Blokir Bot AI' yang menambahkan semua aturan bot AI utama dengan satu klik.

Apa perbedaan antara Allow dan Disallow di robots.txt?

Disallow memberitahu crawler untuk tidak mengakses path tertentu (misalnya, Disallow: /admin/ memblokir direktori admin). Allow secara eksplisit mengizinkan akses ke path tertentu, berguna untuk menimpa aturan Disallow yang lebih luas (misalnya, Disallow: /images/ dengan Allow: /images/publik/ memblokir semua gambar kecuali folder publik). Ketika keduanya cocok, aturan yang paling spesifik (path terpanjang) berlaku. Jika spesifisitas sama, direktif Allow menang.

Apakah robots.txt benar-benar memblokir crawler?

Robots.txt bersifat nasihat, bukan wajib. Crawler yang patuh seperti Googlebot, Bingbot, dan mesin pencari utama lainnya mematuhi aturan robots.txt. Namun, bot jahat dan scraper mungkin mengabaikannya sepenuhnya. Untuk kontrol akses yang sesungguhnya, gunakan metode sisi server seperti aturan .htaccess, autentikasi, firewall, atau header X-Robots-Tag. Anggap robots.txt sebagai permintaan sopan, bukan mekanisme keamanan.

Apa itu crawl-delay di robots.txt?

Crawl-delay adalah direktif yang meminta crawler menunggu sejumlah detik tertentu antara permintaan ke server Anda. Contoh: Crawl-delay: 10 meminta bot menunggu 10 detik antara pengambilan halaman. Berguna untuk server dengan sumber daya terbatas. Catatan: Google tidak mendukung crawl-delay (gunakan Google Search Console), tetapi Bing, Yandex, dan crawler lain mematuhinya.

Haruskah saya menyertakan direktif Sitemap di robots.txt?

Ya, menyertakan direktif Sitemap (misalnya, Sitemap: https://contoh.com/sitemap.xml) adalah praktik terbaik. Ini membantu mesin pencari menemukan sitemap XML Anda tanpa hanya bergantung pada Google Search Console atau Bing Webmaster Tools. Direktif Sitemap ditempatkan di luar blok User-agent dan berlaku secara global. Anda dapat menyertakan beberapa direktif Sitemap jika memiliki beberapa sitemap.

Bisakah saya menggunakan wildcard di robots.txt?

Ya, Google dan Bing mendukung dua pola wildcard dalam robots.txt: tanda bintang (*) mencocokkan urutan karakter apa pun (misalnya, Disallow: /*.json memblokir semua URL yang berakhiran .json), dan tanda dolar ($) mencocokkan akhir URL (misalnya, Disallow: /*.pdf$ memblokir hanya URL yang tepat berakhiran .pdf, bukan /panduan-pdf/). Tidak semua crawler mendukung wildcard, jadi uji aturan Anda.

Bagaimana cara menguji apakah robots.txt saya berfungsi?

Anda dapat menguji robots.txt Anda dengan beberapa cara: (1) Gunakan Robots.txt Tester di Google Search Console untuk memeriksa apakah URL tertentu diblokir. (2) Kunjungi domainanda.com/robots.txt di browser untuk memverifikasi file dapat diakses. (3) Gunakan alat pemeriksa header HTTP kami untuk memeriksa status respons URL robots.txt Anda. (4) Gunakan alat URL Inspection Google untuk melihat apakah Googlebot dapat mengakses halaman Anda.

Pembuat Robots.txt — Buat & Kustomisasi File Robots.txt

Apa Itu File Robots.txt?

File robots.txt adalah file teks biasa yang ditempatkan di direktori root website Anda (misalnya, contoh.com/robots.txt) yang memberitahu crawler mesin pencari dan bot halaman atau bagian mana dari situs Anda yang boleh dan tidak boleh diakses. File ini mengikuti standar Robots Exclusion Protocol.

Meskipun bersifat nasihat (tidak bisa dipaksakan secara teknis), semua mesin pencari utama seperti Google dan Bing mematuhi direktif robots.txt. File ini merupakan garis pertahanan pertama dalam mengontrol bagaimana bot berinteraksi dengan situs Anda.

Setiap website sebaiknya memiliki file robots.txt — bahkan jika hanya berisi satu baris Sitemap: untuk membantu mesin pencari menemukan sitemap Anda.

Pembuat robots.txt dengan editor visual untuk membuat aturan crawler dan memblokir bot AI — Antarmuka pembuat robots.txt: pilih preset, tambahkan aturan, dan unduh file siap pakai

Cara Membuat File Robots.txt

Gunakan pembuat robots.txt gratis kami untuk membuat file robots.txt dengan cepat dan mudah:

Langkah 1: Pilih Preset atau Mulai dari Awal

Pilih salah satu preset cepat: Izinkan Semua (semua bot boleh mengakses semua halaman), Blokir Semua (tidak ada bot yang boleh mengakses), Standar (izinkan bot utama, blokir path sensitif), atau Blokir Bot AI (blokir GPTBot, ClaudeBot, dan lainnya).

Langkah 2: Tambahkan Aturan Crawler

Pilih user-agent (Googlebot, Bingbot, GPTBot, dll.) dan atur direktif Allow atau Disallow untuk path tertentu. Tambahkan sebanyak mungkin aturan yang Anda butuhkan.

Langkah 3: Atur Sitemap dan Crawl-Delay

Tambahkan URL sitemap Anda (misalnya, https://situs.com/sitemap.xml) dan atur crawl-delay jika server Anda memiliki sumber daya terbatas.

Langkah 4: Unduh dan Unggah

Klik Download untuk mendapatkan file robots.txt, lalu unggah ke direktori root website Anda agar dapat diakses di https://situs.com/robots.txt.

Referensi Direktif Robots.txt

Berikut adalah direktif utama yang digunakan dalam file robots.txt dan cara menggunakannya:

User-agent

Menentukan crawler mana yang ditargetkan oleh aturan. Gunakan * untuk semua bot, atau nama spesifik seperti Googlebot, Bingbot, GPTBot. Setiap blok aturan dimulai dengan User-agent.

Disallow

Memberitahu crawler untuk tidak mengakses path tertentu. Contoh: Disallow: /admin/ memblokir folder admin. Disallow: / memblokir seluruh situs untuk user-agent tersebut.

Allow

Secara eksplisit mengizinkan akses ke path tertentu, berguna untuk menimpa aturan Disallow yang lebih luas. Contoh: Disallow: /images/ + Allow: /images/publik/ memblokir semua gambar kecuali folder publik.

Sitemap

Menunjukkan lokasi sitemap XML Anda. Ditempatkan di luar blok User-agent dan berlaku secara global. Anda dapat menyertakan beberapa direktif Sitemap jika memiliki beberapa sitemap.

Crawl-delay

Meminta crawler menunggu sejumlah detik tertentu antara permintaan. Berguna untuk server dengan sumber daya terbatas. Catatan: Google tidak mendukung crawl-delay (gunakan Search Console), tetapi Bing dan Yandex mematuhinya.

Contoh Robots.txt yang Umum

Berikut adalah beberapa konfigurasi robots.txt yang sering digunakan:

Izinkan Semua Bot

User-agent: *
Allow: /

Sitemap: https://situs.com/sitemap.xml

Blokir Semua Bot

User-agent: *
Disallow: /

Standar (Blokir Path Sensitif)

User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/
Disallow: /private/

Sitemap: https://situs.com/sitemap.xml

Blokir Bot AI

User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: *
Allow: /

Sitemap: https://situs.com/sitemap.xml

Cara Memblokir Bot AI dengan Robots.txt

Semakin banyak pemilik website yang ingin mencegah bot AI seperti GPTBot (OpenAI), ClaudeBot (Anthropic), dan Google-Extended (Google AI) dari mengambil konten mereka untuk pelatihan model bahasa. Berikut cara melakukannya:

Tambahkan aturan User-agent dan Disallow spesifik untuk setiap bot AI di file robots.txt Anda. Pembuat kami memiliki preset Blokir Bot AI yang menambahkan semua aturan bot AI utama dengan satu klik.

Perlu diingat bahwa robots.txt bersifat nasihat — bot yang patuh seperti GPTBot dan ClaudeBot mematuhi aturan ini, tetapi bot jahat mungkin mengabaikannya. Untuk kontrol akses yang lebih ketat, gunakan metode sisi server seperti firewall atau autentikasi.

GPTBot (OpenAI) — crawler yang mengumpulkan data untuk melatih model GPT
ClaudeBot (Anthropic) — crawler yang mengumpulkan data untuk model Claude
Google-Extended — crawler Google khusus untuk pelatihan AI (terpisah dari Googlebot)
CCBot (Common Crawl) — crawler yang mengumpulkan data untuk dataset pelatihan AI terbuka
Bytespider (ByteDance) — crawler TikTok/ByteDance untuk pelatihan AI
FacebookBot — crawler Meta untuk AI dan konten

Robots.txt vs Metode Kontrol Akses Lain

Robots.txt bukan satu-satunya cara mengontrol akses bot ke situs Anda. Berikut perbandingannya dengan metode lain:

NasihatRobots.txt

File teks di root website. Bersifat nasihat (bot yang patuh mematuhi, bot jahat bisa mengabaikan). Mudah dikelola dan standar industri. Cocok untuk mengontrol crawler mesin pencari.

Per HalamanMeta Robots Tag

Tag HTML <meta name="robots"> di setiap halaman. Lebih granular per halaman. Mendukung noindex, nofollow, noarchive. Tetapi bot harus membaca halaman dulu untuk menemukan tag ini.

Header HTTPX-Robots-Tag Header

Header HTTP yang dikirim server. Berfungsi seperti meta robots tetapi untuk file non-HTML (PDF, gambar). Dikonfigurasi di server (Apache, Nginx) atau CDN.

Memblokir.htaccess / Firewall

Aturan sisi server yang benar-benar memblokir akses. Bukan hanya nasihat — bot tidak bisa mengakses sama sekali. Gunakan untuk keamanan yang lebih kuat, bukan hanya kontrol SEO.

Praktik Terbaik Robots.txt

Ikuti praktik-praktik ini untuk memastikan file robots.txt Anda efektif dan tidak merugikan SEO:

Selalu tempatkan file di root domain — https://situs.com/robots.txt, bukan di subdirektori
Sertakan direktif Sitemap — bantu mesin pencari menemukan sitemap XML Anda
Jangan blokir CSS dan JavaScript — Google perlu merender halaman, memblokir aset menyebabkan masalah pengindeksan
Jangan gunakan robots.txt untuk menyembunyikan konten sensitif — gunakan autentikasi atau .htaccess
Setiap subdomain memerlukan file robots.txt terpisah — blog.situs.com dan www.situs.com berbeda
Uji aturan di Google Search Console — gunakan Robots.txt Tester untuk memverifikasi aturan
Gunakan wildcard dengan hati-hati — * dan $ tidak didukung semua crawler
Pantau perubahan — periksa file robots.txt secara rutin untuk memastikan tidak ada aturan yang salah konfigurasi

Alat Terkait

Jelajahi alat gratis kami lainnya untuk optimasi SEO dan manajemen website:

Pembuat Sitemap XML

Buat sitemap XML dengan crawling otomatis untuk situs Anda.

Pemeriksa Header HTTP

Analisis header respons dan keamanan website mana pun.

Deteksi CMS

Deteksi CMS, server web, dan CDN yang digunakan sebuah website.

Pemeriksa SSL

Periksa sertifikat SSL, protokol TLS, dan validitas.

Penganalisis Tautan

Temukan semua tautan internal dan eksternal di halaman mana pun.

Pemeriksa Redirect

Periksa rantai redirect 301/302 dari URL mana pun.

Apa Itu File Robots.txt?

Setiap website sebaiknya memiliki file robots.txt — bahkan jika hanya berisi satu baris Sitemap: untuk membantu mesin pencari menemukan sitemap Anda.

Cara Membuat File Robots.txt

Gunakan pembuat robots.txt gratis kami untuk membuat file robots.txt dengan cepat dan mudah:

Langkah 1: Pilih Preset atau Mulai dari Awal

Langkah 2: Tambahkan Aturan Crawler

Pilih user-agent (Googlebot, Bingbot, GPTBot, dll.) dan atur direktif Allow atau Disallow untuk path tertentu. Tambahkan sebanyak mungkin aturan yang Anda butuhkan.

Langkah 3: Atur Sitemap dan Crawl-Delay

Tambahkan URL sitemap Anda (misalnya, https://situs.com/sitemap.xml) dan atur crawl-delay jika server Anda memiliki sumber daya terbatas.

Langkah 4: Unduh dan Unggah

Klik Download untuk mendapatkan file robots.txt, lalu unggah ke direktori root website Anda agar dapat diakses di https://situs.com/robots.txt.

Referensi Direktif Robots.txt

Berikut adalah direktif utama yang digunakan dalam file robots.txt dan cara menggunakannya:

User-agent

Menentukan crawler mana yang ditargetkan oleh aturan. Gunakan * untuk semua bot, atau nama spesifik seperti Googlebot, Bingbot, GPTBot. Setiap blok aturan dimulai dengan User-agent.

Disallow

Memberitahu crawler untuk tidak mengakses path tertentu. Contoh: Disallow: /admin/ memblokir folder admin. Disallow: / memblokir seluruh situs untuk user-agent tersebut.

Allow

Sitemap

Menunjukkan lokasi sitemap XML Anda. Ditempatkan di luar blok User-agent dan berlaku secara global. Anda dapat menyertakan beberapa direktif Sitemap jika memiliki beberapa sitemap.

Crawl-delay

Contoh Robots.txt yang Umum

Berikut adalah beberapa konfigurasi robots.txt yang sering digunakan:

Izinkan Semua Bot

User-agent: *
Allow: /

Sitemap: https://situs.com/sitemap.xml

Blokir Semua Bot

User-agent: *
Disallow: /

Standar (Blokir Path Sensitif)

User-agent: *
Allow: /
Disallow: /admin/
Disallow: /api/
Disallow: /private/

Sitemap: https://situs.com/sitemap.xml

Blokir Bot AI

User-agent: GPTBot
Disallow: /

User-agent: ClaudeBot
Disallow: /

User-agent: Google-Extended
Disallow: /

User-agent: CCBot
Disallow: /

User-agent: *
Allow: /

Sitemap: https://situs.com/sitemap.xml

Cara Memblokir Bot AI dengan Robots.txt

GPTBot (OpenAI) — crawler yang mengumpulkan data untuk melatih model GPT
ClaudeBot (Anthropic) — crawler yang mengumpulkan data untuk model Claude
Google-Extended — crawler Google khusus untuk pelatihan AI (terpisah dari Googlebot)
CCBot (Common Crawl) — crawler yang mengumpulkan data untuk dataset pelatihan AI terbuka
Bytespider (ByteDance) — crawler TikTok/ByteDance untuk pelatihan AI
FacebookBot — crawler Meta untuk AI dan konten

Robots.txt vs Metode Kontrol Akses Lain

Robots.txt bukan satu-satunya cara mengontrol akses bot ke situs Anda. Berikut perbandingannya dengan metode lain:

NasihatRobots.txt

File teks di root website. Bersifat nasihat (bot yang patuh mematuhi, bot jahat bisa mengabaikan). Mudah dikelola dan standar industri. Cocok untuk mengontrol crawler mesin pencari.

Per HalamanMeta Robots Tag

Tag HTML <meta name="robots"> di setiap halaman. Lebih granular per halaman. Mendukung noindex, nofollow, noarchive. Tetapi bot harus membaca halaman dulu untuk menemukan tag ini.

Header HTTPX-Robots-Tag Header

Header HTTP yang dikirim server. Berfungsi seperti meta robots tetapi untuk file non-HTML (PDF, gambar). Dikonfigurasi di server (Apache, Nginx) atau CDN.

Memblokir.htaccess / Firewall

Aturan sisi server yang benar-benar memblokir akses. Bukan hanya nasihat — bot tidak bisa mengakses sama sekali. Gunakan untuk keamanan yang lebih kuat, bukan hanya kontrol SEO.

Praktik Terbaik Robots.txt

Ikuti praktik-praktik ini untuk memastikan file robots.txt Anda efektif dan tidak merugikan SEO:

Selalu tempatkan file di root domain — https://situs.com/robots.txt, bukan di subdirektori
Sertakan direktif Sitemap — bantu mesin pencari menemukan sitemap XML Anda
Jangan blokir CSS dan JavaScript — Google perlu merender halaman, memblokir aset menyebabkan masalah pengindeksan
Jangan gunakan robots.txt untuk menyembunyikan konten sensitif — gunakan autentikasi atau .htaccess
Setiap subdomain memerlukan file robots.txt terpisah — blog.situs.com dan www.situs.com berbeda
Uji aturan di Google Search Console — gunakan Robots.txt Tester untuk memverifikasi aturan
Gunakan wildcard dengan hati-hati — * dan $ tidak didukung semua crawler
Pantau perubahan — periksa file robots.txt secara rutin untuk memastikan tidak ada aturan yang salah konfigurasi

Alat Terkait

Jelajahi alat gratis kami lainnya untuk optimasi SEO dan manajemen website:

Pembuat Sitemap XML

Buat sitemap XML dengan crawling otomatis untuk situs Anda.

Pemeriksa Header HTTP

Analisis header respons dan keamanan website mana pun.

Deteksi CMS

Deteksi CMS, server web, dan CDN yang digunakan sebuah website.

Pemeriksa SSL

Periksa sertifikat SSL, protokol TLS, dan validitas.

Penganalisis Tautan

Temukan semua tautan internal dan eksternal di halaman mana pun.

Pemeriksa Redirect

Periksa rantai redirect 301/302 dari URL mana pun.

Apa Itu File Robots.txt?

Cara Membuat File Robots.txt

Referensi Direktif Robots.txt

User-agent

Disallow

Allow

Sitemap

Crawl-delay

Contoh Robots.txt yang Umum

Cara Memblokir Bot AI dengan Robots.txt

Robots.txt vs Metode Kontrol Akses Lain

Praktik Terbaik Robots.txt

Alat Terkait

Pertanyaan yang Sering Diajukan Tentang Robots.txt

Apa itu file robots.txt?

Apa itu file robots.txt?

Bagaimana cara membuat file robots.txt?

Bagaimana cara membuat file robots.txt?

Di mana harus meletakkan file robots.txt?

Di mana harus meletakkan file robots.txt?

Bagaimana cara memblokir bot AI seperti GPTBot dan ClaudeBot?

Bagaimana cara memblokir bot AI seperti GPTBot dan ClaudeBot?

Apa perbedaan antara Allow dan Disallow di robots.txt?

Apa perbedaan antara Allow dan Disallow di robots.txt?

Apakah robots.txt benar-benar memblokir crawler?

Apakah robots.txt benar-benar memblokir crawler?

Apa itu crawl-delay di robots.txt?

Apa itu crawl-delay di robots.txt?

Haruskah saya menyertakan direktif Sitemap di robots.txt?

Haruskah saya menyertakan direktif Sitemap di robots.txt?

Bisakah saya menggunakan wildcard di robots.txt?

Bisakah saya menggunakan wildcard di robots.txt?

Bagaimana cara menguji apakah robots.txt saya berfungsi?

Bagaimana cara menguji apakah robots.txt saya berfungsi?

Apa Itu File Robots.txt?

Cara Membuat File Robots.txt

Referensi Direktif Robots.txt

User-agent

Disallow

Allow

Sitemap

Crawl-delay

Contoh Robots.txt yang Umum

Cara Memblokir Bot AI dengan Robots.txt

Robots.txt vs Metode Kontrol Akses Lain

Praktik Terbaik Robots.txt

Alat Terkait

Pertanyaan yang Sering Diajukan Tentang Robots.txt

Apa itu file robots.txt?

Apa itu file robots.txt?

Bagaimana cara membuat file robots.txt?

Bagaimana cara membuat file robots.txt?

Di mana harus meletakkan file robots.txt?

Di mana harus meletakkan file robots.txt?

Bagaimana cara memblokir bot AI seperti GPTBot dan ClaudeBot?

Bagaimana cara memblokir bot AI seperti GPTBot dan ClaudeBot?

Apa perbedaan antara Allow dan Disallow di robots.txt?

Apa perbedaan antara Allow dan Disallow di robots.txt?

Apakah robots.txt benar-benar memblokir crawler?

Apakah robots.txt benar-benar memblokir crawler?

Apa itu crawl-delay di robots.txt?

Apa itu crawl-delay di robots.txt?

Haruskah saya menyertakan direktif Sitemap di robots.txt?

Haruskah saya menyertakan direktif Sitemap di robots.txt?

Bisakah saya menggunakan wildcard di robots.txt?

Bisakah saya menggunakan wildcard di robots.txt?

Bagaimana cara menguji apakah robots.txt saya berfungsi?

Bagaimana cara menguji apakah robots.txt saya berfungsi?