DEV Community

Cover image for Panduan Teknis Membangun Website yang 'Dibaca' AI dengan Schema Markup dan llms.txt untuk Meningkatkan Visibilitas di Mesin Pencari Generatif
Mightyblue
Mightyblue

Posted on

Panduan Teknis Membangun Website yang 'Dibaca' AI dengan Schema Markup dan llms.txt untuk Meningkatkan Visibilitas di Mesin Pencari Generatif

"The question isn't 'can you be found?' but 'can you be used?'"pertanyaan kritis dari artikel DEV.to yang menggeser paradigma SEO klasik ke era agent operability.


Website Anda tidak sedang dibaca. Ia sedang diproses.

Bukan oleh manusia yang scroll santai. Tapi oleh AI yang mem-parsing setiap baris kode, menimbang setiap tag HTML, dan memutuskan—dalam hitungan milidetik—apakah konten Anda layak dikutip atau dilewati begitu saja.

Ini realitas baru di 2026.


Sebuah laporan dari DEV Community membuktikan: file llms.txt yang ramai diperbincangkan ternyata tidak diminta oleh provider LLM besar. Lalu kenapa kita tetap harus peduli? Karena llms.txt bukan untuk training crawlers—tapi untuk client-side agents seperti Claude Code dan MCP. Bedanya fundamental.


Penelitian context engineering dari Anthropic mengonfirmasi: AI agents bekerja dengan mengekstrak informasi dari konten yang terstruktur secara semantik. Mereka butuh signal—bukan noise dari div soup dan skrip hidrasi yang tidak bermakna.

Maka kami angkat tema ini karena: optimasi website untuk kecerdasan buatan bukan lagi opsi. Ini adalah infrastruktur digital baru. Tanpa schema markup, semantic HTML, dan layer AI readability, website Anda tidak akan muncul dalam jawaban ChatGPT, Perplexity, atau Copilot. Bukan kalah peringkat—tapi tidak ada dalam jawaban sama sekali.


1. Dua Dunia yang Bertabrakan: Manusia vs. Mesin

Bayangkan Anda menyiapkan dua versi brosur toko. Satu versi untuk manusia: warna-warni, font artistik, ilustrasi menawan. Versi lain untuk robot: teks polos, hierarki jelas, data terstruktur rapi.

Website Anda saat ini mungkin hanya punya versi pertama.

Padahal, AI tidak peduli dengan estetika. Yang mereka baca adalah kode. Dan mayoritas website di Indonesia masih seperti buku tertutup bagi mereka.

1.1 Div Soup: Musuh Utama AI Crawler

Coba lihat kode website kebanyakan. Yang terlihat? Tumpukan <div> bersarang tanpa makna. Skrip hidrasi yang membuat konten utama baru muncul setelah JS selesai dijalankan. Cookie banners dan pop-up yang mengganggu.

Ini yang disebut div soup. Akibatnya fatal:

Masalah Dampak ke Website Anda
Struktur HTML tidak semantik AI tidak bisa membedakan artikel, navigasi, atau footer
Konten terbenam dalam client-side bundle ChatGPT ogah me-render JS berat; mereka ingin teks murni
Tidak ada machine-readable layer AI mengabaikan Anda dan mengutip kompetitor

1.2 Mengapa Semantic HTML Itu Penting?

HTML5 punya elemen yang sudah dirancang untuk memberi makna: <header>, <nav>, <main>, <article>, <section>, <footer>.

Bukan sekadar gaya. Ini adalah papan petunjuk untuk AI.

Penelitian GEO menunjukkan bahwa AI mengekstrak informasi jauh lebih akurat dari konten dengan hierarki H1/H2/H3 yang jelas. Satu paragraf pendek per satu ide. Daftar dan tabel yang terstruktur .

Contoh penerapan untuk website jasa Anda:

<article>
  <h1>Layanan Pembuatan Website Profesional</h1>
  <section>
    <h2>Mengapa Bisnis Perlu Website?</h2>
    <p>Data 2026 menunjukkan 76% konsumen mencari bisnis secara online sebelum membeli...</p>
  </section>
  <section>
    <h2>Paket Layanan Kami</h2>
    <ul>
      <li>Website Company Profile</li>
      <li>Toko Online (E-commerce)</li>
      <li>Landing Page Marketing</li>
    </ul>
  </section>
</article>
Enter fullscreen mode Exit fullscreen mode

2. Schema Markup: Memberi "Makna" pada Data Anda

Schema markup adalah kode terstruktur (format JSON-LD) yang ditempatkan di <head> website. Fungsinya: memberi tahu AI apa MAKNA dari konten Anda.

Bayangkan Anda punya halaman dengan teks: "Mulai 5 jutaan."

Tanpa schema, AI hanya membaca angka 5 juta. Dengan Product schema yang proper, AI tahu persis bahwa ini adalah harga, dalam mata uang IDR, untuk layanan pembuatan website, dengan durasi pengerjaan 14 hari.

2.1 Data yang Membuka Mata: Dari 16% ke 54% Akurasi

Sebuah studi dari Semrush menguji bagaimana GPT-4 memproses konten dengan dan tanpa Schema markup. Hasilnya:

  • Tanpa Schema: Akurasi ekstraksi informasi hanya 16%
  • Dengan Schema yang tepat: Akurasi melonjak ke 54%

Itu bukan peningkatan marginal. Itu lompatan fundamental dalam seberapa baik AI memahami website Anda .

2.2 Jenis Schema Prioritas untuk Bisnis Jasa

Berdasarkan rekomendasi praktisi GEO, berikut schema yang wajib Anda implementasikan di minggu pertama :

Prioritas Jenis Schema Fungsi untuk Bisnis Anda
1 (Wajib) Organization Identitas perusahaan: nama, logo, URL, kontak, media sosial
1 (Wajib) LocalBusiness Lokasi fisik di Karawang, jam operasional, area layanan
2 (Wajib) Service Setiap layanan (website, company profile, e-commerce, SEO, social media marketing) dengan deskripsi dan harga
3 (Sangat disarankan) FAQPage Pertanyaan umum: biaya, durasi, garansi, proses kerja sama
4 (Opsional tapi kuat) Review Rating bintang dan testimoni dari klien
5 (Bonus) HowTo Proses langkah demi langkah: dari konsultasi hingga serah terima

2.3 Contoh Kode JSON-LD untuk Service

{
  "@context": "https://schema.org",
  "@type": "Service",
  "name": "Pembuatan Website Company Profile",
  "description": "Jasa pembuatan website company profile yang responsif, SEO-friendly, dan siap AI dengan harga mulai Rp5.000.000",
  "provider": {
    "@type": "Organization",
    "name": "Masbadar.com",
    "url": "https://www.masbadar.com"
  },
  "areaServed": {
    "@type": "City",
    "name": "Karawang"
  },
  "priceRange": "Rp5.000.000 - Rp25.000.000"
}
Enter fullscreen mode Exit fullscreen mode

2.4 Cara Validasi Schema

Jangan asal pasang. Validasi dulu dengan:


3. llms.txt: File Kecil dengan Dampak Strategis

3.1 Apa Itu llms.txt?

llms.txt adalah file teks berformat Markdown yang diletakkan di https://websiteanda.com/llms.txt. Ibaratnya daftar isi premium untuk AI.

Konsep ini pertama kali diusulkan oleh Jeremy Howard (dari fast.ai dan Answer.AI) pada September 2024. Fungsinya: memberi AI peta situs yang sudah dikurasi—bukan semua halaman, tapi halaman penting saja .

Contoh isi llms.txt untuk bisnis Anda:

# Masbadar.com

> Penyedia jasa pembuatan website, company profile, e-commerce, SEO, dan pemasaran media sosial untuk bisnis di Karawang dan seluruh Indonesia.

## Layanan Utama
- [Pembuatan Website Profesional](https://www.masbadar.com/website): Mulai dari Rp5.000.000, termasuk hosting dan domain 1 tahun
- [Jasa SEO](https://www.masbadar.com/seo): Optimasi website agar muncul di halaman pertama Google
- [Toko Online (E-commerce)](https://www.masbadar.com/ecommerce): Solusi belanja online dengan sistem pembayaran terintegrasi
- [Company Profile](https://www.masbadar.com/company-profile): Desain profil perusahaan yang profesional dan informatif
- [Social Media Marketing](https://www.masbadar.com/sosmed): Kelola dan kembangkan akun bisnis Anda di Instagram, Facebook, TikTok

## Kontak dan Konsultasi
- [Hubungi Kami](https://www.masbadar.com/kontak): WhatsApp 0813-9881-8119
- [Portofolio](https://www.masbadar.com/portofolio): Hasil karya website untuk berbagai klien
Enter fullscreen mode Exit fullscreen mode

3.2 Fakta Mengejutkan: llms.txt Belum Terbukti Sempurna

Jujur saja. Data hingga awal 2026 menunjukkan:

  • 844.000 website sudah mengadopsi llms.txt
  • Tapi belum ada bukti bahwa LLM besar (ChatGPT, Claude, Gemini) benar-benar menggunakannya dalam pipeline crawling/training

Analisis Kevin Indig (analis SEO terkenal) blak-blakan:

"llms.txt is a good idea that lacks confirmed impact. Adopt it because it's low-cost, not because it's proven."

Lalu kenapa tetap kita buat?

Karena llms.txt bukan untuk training crawlers—tapi untuk client-side agents seperti Claude Code, MCP, dan Cursor. Pengembang sudah mulai menggunakan llms.txt sebagai kanonikal URL pertama yang dibuka saat agent coding butuh dokumentasi .

3.3 Langkah Implementasi llms.txt (10 Menit)

Langkah Tindakan
1 Buat file bernama llms.txt di komputer
2 Isi dengan format Markdown (lihat contoh di atas)
3 Upload ke folder public atau root direktori website
4 Akses https://www.masbadar.com/llms.txt untuk memastikan bisa diakses publik
5 (Opsional) Buat llms-full.txt untuk versi dengan konten lengkap

4. agents.json dan agent-card.json: Level Berikutnya

Jika schema markup dan llms.txt adalah fondasi, agents.json adalah lapisan interaksi.

File ini mendeskripsikan aksi apa yang bisa dilakukan AI di website Anda. Bayangkan skenario:

Seorang prospek bertanya ke ChatGPT: "Layanan apa saja dari Masbadar.com dan bagaimana cara pesan?"

Jika website Anda punya agents.json, ChatGPT bisa:

  1. Mengekstrak daftar layanan
  2. Menampilkan rentang harga
  3. Memberikan link langsung ke formulir pemesanan atau WhatsApp

Contoh struktur agents.json untuk bisnis jasa:

{
  "tools": [
    {
      "name": "get_services",
      "description": "Menampilkan daftar lengkap layanan jasa pembuatan website, company profile, e-commerce, SEO, dan social media marketing"
    },
    {
      "name": "get_pricing",
      "description": "Informasi paket dan harga setiap layanan"
    },
    {
      "name": "get_portfolio",
      "description": "Menampilkan portofolio website yang sudah dikerjakan untuk berbagai klien"
    },
    {
      "name": "request_consultation",
      "description": "Meminta jadwal konsultasi gratis dengan tim sales"
    }
  ]
}
Enter fullscreen mode Exit fullscreen mode

Menurut laporan tren desain web 2026, agents.json menjadi bagian dari AI readability layer yang luput dari prediksi awal tahun namun menjadi kisah nyata di pertengahan 2026 .


5. Langkah Konkret: How-To Implementasi untuk Website Anda

Minggu 1: Schema Markup (Prioritas Tertinggi)

  • Install plugin SEO (RankMath atau Yoast untuk WordPress)
  • Isi data Organization dan LocalBusiness dengan lengkap
  • Tambahkan Service schema untuk setiap layanan
  • Submit ke Google Search Console untuk indexing

Minggu 2: Audit Struktur Konten

Penelitian Digidop menganalisis 1.000 halaman yang sering dikutip AI. Pola universalnya:

  • Paragraf pendek (rata-rata 3 kalimat per paragraf)
  • Heavy use of lists (ul/ol)
  • Format tanya-jawab eksplisit untuk FAQ

Checklist audit konten:

  • [ ] Apakah setiap halaman memiliki satu H1?
  • [ ] Apakah sub-bab menggunakan H2/H3 yang hierarkis?
  • [ ] Apakah paragraf pertama setiap halaman berisi ringkasan satu kalimat?
  • [ ] Apakah data penting disajikan dalam bentuk tabel atau list?

Minggu 3: Implementasi File Teknis

File Lokasi Waktu Implementasi
llms.txt Root direktori 5 menit
llms-full.txt Root direktori (opsional) 10 menit
agents.json Root direktori 30 menit
Update robots.txt Root direktori 10 menit

Contoh robots.txt yang ramah AI:

User-agent: GPTBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: anthropic-ai
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /
Enter fullscreen mode Exit fullscreen mode

Minggu 4: Verifikasi dan Monitoring

Alat Fungsinya
Bing Webmaster Tools Melihat berapa kali website dikutip oleh Copilot
Google Search Console Memantau performa di AI Overviews
Schema.org Validator Memastikan kode schema valid

6. Apa yang Tidak Boleh Dilakukan (Anti-Pattern)

Berdasarkan pengalaman praktisi dan data lapangan:

Kesalahan Mengapa Berbahaya
Hanya mengandalkan llms.txt tanpa schema markup llms.txt masih belum terbukti digunakan oleh LLM besar. Schema markup adalah fondasi yang sudah teruji
Keyword stuffing untuk AI AI modern sudah pintar. Konten berkualitas > kepadatan keyword
Menggunakan Wix/Squarespace tanpa layer tambahan Platform ini sering membatasi akses ke robots.txt dan file statis; HTML yang dihasilkan bisa jadi div soup
Tidak mengizinkan AI crawlers di robots.txt Ini kesalahan paling fatal dan paling umum. Cek pengaturan Anda sekarang!

7. Mengukur Keberhasilan: Metrik Baru untuk Era AI

Berhenti hanya mengandalkan traffic organik. Mulai ukur:

AI Citation Volume

Berapa kali website Anda muncul sebagai sumber dalam jawaban ChatGPT, Perplexity, atau Bing Copilot.

StudioMeyer melaporkan: website mereka mendapatkan 2.300 kutipan dari Bing Copilot dalam tiga bulan pertama 2026, terverifikasi live di Webmaster Tools .

Share of Model (SoM)

Seberapa sering AI mengutip website Anda dibanding kompetitor untuk topik yang sama.

Conversion Rate dari LLM Referrals

Pengunjung yang datang dari AI cenderung lebih siap beli. Mengapa? Karena AI sudah "menjualkan" Anda terlebih dahulu sebelum mereka mengunjungi website.


8. Pertanyaan yang Sering Diajukan (FAQ)

❓ Apakah saya tetap perlu SEO tradisional?


Iya. SEO klasik (backlink, keyword, Core Web Vitals) masih penting. Tapi sekarang Anda perlu menambahkan GEO (Generative Engine Optimization) di atasnya. Keduanya berjalan paralel .

❓ Berapa lama efek AI readiness terlihat?


Timeline realistis berdasarkan laporan praktisi:

  • 1-7 hari: AI crawlers mulai menemukan file-file baru
  • 7-14 hari: Mulai terlihat kutipan di Bing Webmaster Tools
  • 30-60 hari: Peningkatan signifikan dalam citation volume

❓ Saya pakai jasa pembuatan website dari Masbadar.com, apakah sudah include AI readiness?


Tanyakan langsung ke tim kami. Sebagai penyedia jasa yang mengikuti perkembangan teknologi, kami sudah mulai mengimplementasikan layer-layer ini ke dalam paket pembuatan website. Artikel ini adalah bukti komitmen kami untuk terus update dengan tren 2026.

❓ Apakah AI readiness mahal?


Tidak untuk implementasi dasar. Schema markup dan llms.txt bisa dilakukan dengan biaya tambahan minimal jika website Anda sudah dibangun dengan struktur HTML yang baik. agents.json membutuhkan sedikit pekerjaan ekstra, tapi ROI-nya sepadan dengan peningkatan visibilitas.


"In 2026, we don't rank on page 1. We become the primary citable source for the LLM."Ved Prakash Yadav

Terjemahan: Pada 2026, kita tidak bersaing untuk halaman pertama Google. Kita bersaing untuk menjadi sumber utama yang dipercaya dan dikutip oleh AI.

Ved Prakash Yadav adalah pakar strategi digital modern yang menyadarkan industri bahwa target SEO telah bergeser. Bukan lagi traffic, tapi Share of Model (SoM)—seberapa sering model AI mengutip Anda. Filosofi ini mengubah cara kita membangun website: dari human-first menjadi human-and-AI-first.

Pada akhirnya, demikianlah inti dari optimasi website untuk kecerdasan buatan: bukan tentang trik teknis yang instan. Tapi tentang membangun fondasi yang memungkinkan AI "memahami" dan "mempercayai" bisnis Anda sebagai sumber otoritatif. Karena di era pencarian generatif, jika AI tidak bisa mengutip Anda, maka Anda tidak ada.


Artikel ini ditulis oleh tim Masbadar.com — penyedia jasa pembuatan website, company profile, e-commerce, SEO, dan pemasaran media sosial untuk bisnis di Karawang dan seluruh Indonesia. Kami tidak hanya membuat website yang indah dilihat manusia, tapi juga website yang 'dibaca' dan dikutip oleh AI.

📞 Konsultasikan kebutuhan website AI-ready Anda: 0813-9881-8119 (WhatsApp)
📧 Email: masbadar@gmail.com
🌐 Website: https://www.masbadar.com/

Top comments (0)