Dacă lucrezi în web development sau SEO tehnic, probabil consideri sitemap.xml un subiect rezolvat. Fișier generat automat, trimis în Search Console, gata.
Dar în ultimul an, lucrurile s-au schimbat fundamental. Și nu din cauza Google.
Bing a declarat sitemap-ul „infrastructură critică"
În iulie 2025, echipa Bing Webmaster a publicat un articol oficial: „Keeping Content Discoverable with Sitemaps in AI-Powered Search."
Ideea centrală: AI crawlerele nu funcționează ca motoarele de căutare clasice. Nu crawlează brute-force, tot ce găsesc. Sunt selective: prioritizează conținutul marcat ca proaspăt și relevant.
Sitemap-ul cu <lastmod> precis e semnalul principal pe care se bazează. Combinat cu protocolul IndexNow (notificare push la publicare), formează infrastructura de bază pentru vizibilitate AI.
87% din citările ChatGPT vin din Bing
Un studiu Stackmatix a arătat că 87% din citările ChatGPT se potrivesc cu top rezultatele din Bing. Asta schimbă calculul: dacă nu ești indexat în Bing, nu exiști pentru ChatGPT.
Iar Bing descoperă conținut prin: (1) sitemap.xml referit în robots.txt, (2) IndexNow pentru notificări în timp real, (3) Bing Webmaster Tools.
Lastmod: mai important ca niciodată, dar și mai fragil
Google folosește <lastmod> doar dacă e „consistently and verifiably accurate." Gary Illyes a confirmat: dacă datele sunt inexacte pe câteva pagini, Google pierde încrederea pentru tot domeniul.
Problema practică: CMS-uri care actualizează lastmod la fiecare save, fără schimbări de conținut. Un re-save pe 300 de pagini = Google ignoră tag-ul pe tot site-ul.
Pe WordPress, Yoast și RankMath fac asta implicit. Schimbi un widget din sidebar, lastmod se actualizează pe tot. Google vede: „300 pagini modificate simultan? Sigur." Și ignoră.
Ce ignoră Google complet
Din cele 4 tag-uri standard (loc, lastmod, changefreq, priority), Google ignoră oficial 2: changefreq și priority.
Documentația oficială Google confirmă: au fost abuzate, nu mai corelează cu realitatea, nu sunt procesate.
Conflicte frecvente pe care le ratezi
- Pagină în sitemap dar blocată în robots.txt → semnal contradictoriu
- URL-uri noindex în sitemap → „vino" + „dar nu indexa" simultan
- Protocol amestecat HTTP/HTTPS → Google le tratează ca domenii diferite
- Multiple sitemap-uri de la pluginuri diferite → URL-uri diferite, conflicte de lastmod
Conform SearchXPro, peste 20% din site-urile enterprise au cel puțin una din aceste erori.
Triunghiul crawl control
Sitemap, robots.txt și canonical tags trebuie aliniate. Fiecare controlează un aspect diferit:
- Sitemap: „Uite unde-s paginile importante"
- Robots.txt: „Aici nu ai voie"
- Canonical: „Ăsta e originalul"
Când se contrazic, Google nu-ți cere lămuriri. Decide singur.
Verificare rapidă
curl -s site.ro/sitemap.xml | head -20
Dacă 404: nu ai sitemap. Dacă se încarcă: verifică URL-urile, protocolul, datele lastmod. Compară cu rezultatele site:domeniu.ro din Google.
Am scris un ghid complet pe subiect, cu studii, greșeli și soluții practice: Sitemap XML: harta pe care nu i-ai dat-o lui Google
Articol publicat de FLASH SHIP S.R.L., agenție digitală din Sibiu, specializată în sisteme de creștere organică.
Top comments (0)