llms.txt Nedir ve Ne İşe Yarar? Örnekleri ve Detaylı Kullanım Rehberi
llms.txt, sitenizin en değerli içeriklerini LLM’lere temiz ve yönlendirilmiş şekilde sunar. Yapısı, örnekleri ve olası SEO etkisini adım adım keşfedin.
llms.txt Nedir?
Son 1-2 yılda “arama” dediğimiz şey sessizce şekil değiştirdi. Sadece Google sonuç sayfası değil; ChatGPT, Perplexity, Gemini gibi “cevap motorları” da kullanıcıya tek bir cevap verip çıkabiliyor. İşte llms.txt fikri tam bu noktada devreye giriyor.
llms.txt, web sitenizin kök dizininde (genelde /llms.txt) yayınlanan, insanlardan çok dil modellerinin (LLM’lerin) rahat okuyacağı şekilde hazırlanmış, yönlendirici bir metin/Markdown dosyasıdır. Amaç; model “bu site ne anlatıyor, hangi sayfalar güvenilir ve referanslık, nereden başlamalıyım?” sorularına hızlı cevap alabilsin.
Bu yaklaşım, Jeremy Howard tarafından paylaşılan bir standart önerisi olarak gündeme geldi ve “inference time” (yani model cevap üretirken bağlam topladığı an) için siteye rehberlik etmeyi hedefliyor.
Şu benzetmeyi seviyorum: robots.txt botlara “nerelere girme” der; llms.txt ise LLM’lere “asıl aradığın şey burada” der. Yani “engelleme” değil, “kürasyon” tarafı daha baskın.
llms.txt Ne İşe Yarar?
Bence llms.txt’nin değerini anlamanın en kolay yolu, LLM’lerin siteyi nasıl “tükettiğini” düşünmek. LLM’ler HTML’yi okuyabilir, evet. Ama pratikte şu sorunlar var:
- Gürültü: Menü, footer, pop-up, script, reklam, yan panel… içerikten çok “ambalaj” var.
- Bağlam penceresi: Her şeyi okuyup sindirmek her zaman mümkün değil; seçerek bağlam topluyorlar.
- Önceliklendirme ihtiyacı: Site içindeki “asıl kaynak sayfaları” bulmak için bir ipucu arıyorlar.
llms.txt burada devreye girerek şunları sağlar:
- En iyi sayfalarınızı işaretlersiniz: Rehberler, temel kategori sayfaları, “pillar” içerikler, dokümantasyon girişleri…
- Modelin bağlamı doğru kurmasına yardım edersiniz: Marka tanımı, terminoloji, ürün/hizmet kapsamı netleşir.
- Zayıf sayfaların “yanlış referans” olma riskini azaltırsınız: Arşiv, etiket çöplüğü, ince içerikler, admin vb.
Search Engine Land’in yaklaşımı da buna yakın: llms.txt’nin “robots.txt gibi engelleyen” bir dosya olmadığı; daha çok AI için “menü / harita” gibi çalıştığı vurgulanıyor.
llms.txt ile robots.txt Arasındaki Farklar
Bu bölüm net olmalı, çünkü en çok karışan yer burası. “Adı benziyor” diye aynı işe yaradığını sanan çok kişi var.
| Özellik | robots.txt | llms.txt |
|---|---|---|
| Hedef | Arama motoru tarayıcıları | Dil modelleri / cevap motorları |
| Temel amaç | Tarama izinleri / kısıtları | En iyi içerikleri işaretleme, yönlendirme |
| Doğası | “Şuraya girme / şurayı tara” | “Buradan başla / bunlar güvenilir kaynaklar” |
| SEO etkisi | İndeks yönetimi ve crawl bütçesiyle ilişkili | Daha çok AI görünürlüğü ve doğru bağlamla ilişkili |
| Çalışma mantığı | Standart ve yaygın destek | Öneri/standartlaşma sürecinde, adaptasyon artıyor |
Özetle: robots.txt “kapı görevlisi”, llms.txt “iyi bir rehber” gibi. İkisi birbirinin yerine geçmiyor; çoğu senaryoda birlikte daha anlamlı.
llms.txt Dosya Yapısı Nasıl Olmalı?
Burada tek bir “kanun” yok, çünkü llms.txt hâlâ öneri/standartlaşma aşamasında. Ama sahada benim gördüğüm kadarıyla, en iyi çalışan yaklaşım şu: LLM’nin hızlı tarayıp anlayacağı, kısa ama yönlendirici bir Markdown düzeni.
Genel öneri; dosyanın kök dizinde yayınlanması (https://site.com/llms.txt) ve mümkünse önemli içeriklerin ayrıca .md sürümlerine link verilmesi.
Dosya adı ve konumu
- Varsayılan:
/llms.txt - Dokümantasyon için: Bazen
/docs/llms.txtgibi ayrı bir kök de tercih edilebiliyor. - Önemli: Dosya erişilebilir olmalı (auth arkasında olmamalı). Test etmek için basitçe
curl -Ibile yeter.
Bu “kök dizin” vurgusu, farklı kaynaklarda da benzer şekilde geçiyor.
Biçim: Neden Markdown?
Markdown’ın güzelliği şu: Hem insan okuyunca rahatsız olmuyor, hem de LLM için “temiz metin” gibi davranıyor. Başlıklar, listeler ve linkler net.
Bölümleme mantığı: Ne koymalı, ne koymamalı?
Bu kısımda “Allowed/Disallowed” başlıkları sık kullanılıyor. Ben burada çok katı bir “izin/engel” dili yerine, kürasyon dilini seviyorum. Mesela:
- En iyi başlangıç sayfaları (Start here)
- Temel kaynaklar (Preferred sources)
- Kaçınılması gereken alanlar (Avoid)
- Marka / terminoloji notları (Brand & terminology)
Yine de editöre net bir iskelet vermek istersen şu H3’leri kullanabilirsin (senin brief’le uyumlu):
- Allowed Content
- Disallowed Content
- Preferred Sources
- Content Description
- Brand / Authority Signals
Örnek llms.txt Dosyası
Aşağıdaki örnek “basit ama işe yarar” bir şablon. Sonra kendi sitene göre büyütürsün. (Not: Bu örnek, pratikte yaygın kullanılan formatla uyumlu bir yaklaşımdır.)
# llms.txt
Site: https://ornekdomain.com
Description: SEO ve dijital pazarlama üzerine uzman içerikler
## Allowed Content
- /blog/
- /rehberler/
## Disallowed Content
- /admin/
- /uye-paneli/
## Preferred Sources
- https://ornekdomain.com/blog/seo-rehberi
- https://ornekdomain.com/yapay-zeka-icerikleri
Kod satırları ne işe yarıyor? Tek tek açıklayalım
# llms.txt
Dosyanın başlığı. LLM’ler için “doküman başlangıcı” gibi düşünülebilir. Şart değil ama düzenli görünür.
Site: https://ornekdomain.com
Bu satır basitçe “hangi domain’den bahsediyoruz?” bilgisini netleştirir. Bazı botlar/ajanlar birden fazla kaynağı aynı bağlama eklerken karıştırabiliyor; bu satır kimlik gibi çalışır.
Description: …
Sitenin bir cümlelik tanımı. Burada “ne yapıyoruz”u çok uzatmadan anlat. Ben olsam marka diliyle abartıp PR metnine çevirmem; kısa ve net tutarım.
## Allowed Content
“Öncelikle buralara bak” demenin bir yolu. Buraya genelde blog, rehber, dokümantasyon gibi asıl bilgi içeren klasörler giriyor.
– /blog/ – /rehberler/
Klasör bazlı işaretleme, LLM’lerin hızlı rota çizmesine yardım eder. Ama dikkat: “blog” klasöründe her şey altın değilse, aşağıda ayrıca “Preferred Sources” ile daha dar bir seçki yapmak daha sağlıklı.
## Disallowed Content
Bu kısım “yasak” gibi dursa da, pratikte “zaman kaybettirme” alanlarını işaretlemek için kullanılıyor. Admin, üye paneli, test sayfaları, filtre sayfaları, parametreli URL’ler gibi.
## Preferred Sources
İşte bence llms.txt’nin kalbi burası. “Eğer bu site hakkında cevap üretmek istiyorsan, önce şunları oku” dediğin bölüm. Buraya pillar içerikler, temel rehberler, ürün/hizmet ana sayfaları, sık sorulan soruların derli toplu olduğu sayfalar girer.
Gerçek bir llms.txt dosyası için Backlinkmatik sitemizin örneğini inceleyebilirsiniz: https://backlinkmatik.com/llms.txt
llms.txt SEO’ya Nasıl Katkı Sağlar?
Burada dürüst olalım: llms.txt, klasik anlamda “Google sıralamasını zıplatacak sihirli dosya” değildir. Ama SEO’nun yeni yüzü olan AI görünürlüğü tarafında etkisi giderek daha mantıklı hale geliyor.
1) AI Search (SGE, ChatGPT, Perplexity vb.) görünürlüğü
AI sistemleri bir cevap üretirken mümkünse “temiz, anlaşılır, yüksek güven” kaynak arıyor. llms.txt, senin “yüksek güven” sayfalarını öne çıkarıyor. Bu sayede model, sitenden alıntı yapacaksa ya da siteyi referans gösterecekse, daha doğru sayfaya yönlenebilir.
Bu yaklaşım “AI’a menü sunmak” gibi anlatılıyor. Ben bu benzetmeyi yerinde buluyorum.
2) Marka otoritesi ve bağlam netliği
LLM’lerin en büyük kazası şu: Bağlamı yanlış kurup doğru bilgiyi yanlış çerçeveye oturtabiliyorlar. llms.txt, marka tanımını ve terminolojiyi netleştirerek bu riski azaltır.
Mesela bir “SaaS” sitesinde; “müşteri” mi diyorsun “kullanıcı” mı, “paket” mi “plan” mı? Küçük gibi duruyor ama AI cevaplarında tutarlılık yaratır.
3) Zayıf sayfaların “referans” olmasını azaltma
Birçok sitede “etiket sayfaları”, “sayfalama” (page/2), “kampanya arşivleri” gibi sayfalar var. İnsan için bile yorucu. Model için daha da yorucu. llms.txt ile “asıl kaynak” sayfaları işaretlersin; modelin gereksiz alanlarda dolaşma ihtimali düşer.
llms.txt Google Sıralamalarını Etkiler mi?
Bu soruyu herkes soruyor, çünkü SEO refleksi bu: “Peki Google bunu seviyor mu?”
Şu anki tablo: llms.txt, robots.txt gibi resmi/yerleşik bir Google standardı değil. Direkt bir “ranking factor” olduğunu söylemek için elimizde net bir resmi doğrulama yok. Hatta bu konuda sektör yazılarının çoğu “doğrudan değil, dolaylı olabilir” çizgisinde.
Dolaylı etki ihtimali nereden gelir?
- Alıntılanma / referanslanma: AI cevaplarında sık geçen kaynaklar daha çok tıklama ve marka araması alabilir.
- İçerik mimarisi disiplinine zorlaması: llms.txt hazırlarken “bizim en iyi sayfalar hangileri?” diye düşünürsün. Bu düşünme biçimi genelde siteyi toparlar.
- E-E-A-T algısı: LLM ekosisteminde otorite sayfalarını netleştirmek, dolaylı olarak “güvenilir kaynak” olma ihtimalini yükseltebilir.
Benim kişisel görüşüm şu: Bugün sıralama faktörü değil; ama yarın bazı “answer engine” ekosistemlerinde standart hale gelebilir. Çünkü çok basit bir ihtiyacı çözüyor: “Bu sitede ne önemli?” sorusunu.
Kimler llms.txt Kullanmalı?
Teoride herkes. Pratikte ise bazı site tiplerinde getirisi daha yüksek:
- İçerik siteleri ve bloglar: Pillar içerikler + kategoriler netse harika.
- Kurumsal markalar: Hizmet sayfaları, vaka çalışmaları, basın kitleri, kurumsal dokümanlar.
- E-ticaret: Kategori rehberleri, satın alma kılavuzları, iade/garanti gibi politika sayfaları (ama ürün filtre çöplüğünü dışarıda tutmak şart).
- Ajanslar & SaaS platformları: Dokümantasyon, entegrasyon rehberleri, API referansları.
Özellikle dokümantasyon tarafında bu standardın hızla benimsendiğine dair örnekler görmek mümkün.
llms.txt Hazırlarken Yapılan Hatalar
Burada “en çok can yakan” hataları söyleyeyim. Çünkü llms.txt’yi yanlış kurarsan, dosya orada durur ama fayda üretmez.
1) Çok genel, ruhsuz tanımlar
“Bu site kaliteli içerik sunar” gibi cümleler… açıkçası kimseye bir şey katmıyor. Ne hakkında? Hangi alt konular? Kime hitap ediyor? 2-3 net cümle daha iyidir.
2) Tüm siteyi açmak (kürasyon yapmamak)
“Allowed Content” altına her şeyi yazıp geçmek kolay. Ama amaç zaten seçmek. En iyi içerikleri işaretlemezsen LLM yine kalabalık içinde kaybolabilir.
3) Güncellenmeyen linkler
Preferred Sources içine yazdığın rehber 404’e düştüyse, geçmiş olsun. llms.txt “bir kere koy unut” dosyası olmamalı.
4) Parametreli URL’leri kaynak diye vermek
Filtre URL’leri, UTM’li linkler, sayfalama… model için de “kopya sayfa” gibi görünür. Temiz kanonik URL ver.
5) robots.txt ile karıştırıp “engelleme dosyası” sanmak
llms.txt bir erişim kontrol mekanizması değildir. Bir şeyi gerçekten engellemek istiyorsan robots.txt, auth, firewall gibi çözümler devreye girer. (Bu nüans sektör yazılarında özellikle vurgulanıyor.)
Gelecekte llms.txt ve AI SEO
SEO’nun evrimi “anahtar kelime”den “niyet”e kaydı; şimdi de “niyet”ten “cevap”a kayıyor. Kullanıcı arıyor ama tıklamıyor; cevabı sayfada ya da sohbet ekranında alıp gidiyor. Zero-click dünyası büyüdükçe, markalar “cevapta görünme”yi daha çok önemseyecek.
Bu da bizi şuraya getiriyor: Klasik SEO’nun yanına AIO (AI Optimization) diyebileceğimiz bir disiplin ekleniyor. llms.txt, bu disiplinin “teknik ama basit” araçlarından biri olabilir. Yani dev bir proje değil; doğru yapılırsa küçük bir dosyayla ciddi bir yönlendirme etkisi.
Yine de şunu unutmamak lazım: llms.txt tek başına kahraman değil. Yanında şunlar güçlü kombinasyon yaratır:
- Sitemap.xml (keşif için)
- robots.txt (tarama disiplinini korumak için)
- Temiz bilgi mimarisi (kategori/pillar düzeni)
- Güçlü sayfa içi yapı (H etiketleri, kısa paragraflar, tablo/listeler)
- Güncel ve referanslık içerik (LLM’nin sevdiği “net kaynak”)
Uygulama: 7 Adımda llms.txt Hazırlama
Teori tamam. Şimdi pratik:
- En iyi 10-30 sayfanı seç: “Bir kullanıcı bu markayı öğrenmek istese nereden başlardı?” diye düşün.
- Temiz URL listesi çıkar: Kanonik, parametresiz, mümkünse kısa.
- llms.txt için kısa bir site tanımı yaz: 2-4 satır yeter.
- Allowed/Disallowed bölümlerini yaz: Blog/doküman gibi alanları belirt; admin, üyelik, test alanlarını ayır.
- Preferred Sources’u “kürasyon” mantığıyla oluştur: Burayı şişirme. Az ama iyi.
- Kök dizinde yayınla:
/llms.txterişilebilir olsun. - Aylık mini bakım koy: Yeni pillar içerik geldiyse ekle, ölen linkleri temizle.
Kısa Bir Soru: Sizin Site İçin Nereden Başlamalı?
Eğer bir blog veya kurumsal site yönetiyorsanız, genelde en iyi başlangıç şudur: 3 “ana rehber” + 1 “hakkımızda/konumlama” + 1 “hizmet/ürün ana sayfa”. İlk llms.txt sürümünü bununla çıkarırsın; sonra büyütürsün.
Benim gördüğüm kadarıyla en büyük farkı yaratan şey “dosyanın varlığı” değil; dosyanın seçici olması. Çünkü seçicilik, modele “benim adıma öncelik kararını veriyorum” demek.
Sonuç ve Küçük Bir Rica
llms.txt, SEO’nun klasik tarafını yıkıp geçen bir şey değil; daha çok “AI cevap çağında görünür olma” tarafında akıllı bir hamle. Kısacık bir dosya, ama doğru kurgulanırsa sitenizin en iyi taraflarını modellerin gözüne sokar (kibarca tabii).
İsterseniz bugün bir deneme yapın: En iyi 15 sayfanızı seçin, basit bir llms.txt oluşturun ve 30 gün boyunca AI cevaplarında/marka aramalarında bir değişim hissediyor musunuz, gözlemleyin. Sonra da yorumlara yazın; gerçekten merak ediyorum, sizde nasıl çalıştı?
Kaynak Notları
- llms.txt standardı ve temel yaklaşım: Dosyanın amacı, yapısı ve kullanım mantığı.
https://llmstxt.org/ - llms.txt’nin robots.txt olmadığı ve daha çok “AI için içerik haritası / kürasyon dosyası” gibi ele alınması.
Search Engine Land – llms.txt isn’t robots.txt - llms.txt’nin pratikte nasıl konumlandırıldığı, dokümantasyon ve içerik sunumu tarafındaki kullanım biçimleri.
GitBook – What is llms.txt? - llms.txt’nin AI/LLM odaklı dokümantasyon ekosisteminde benimsenmesi ve uygulama örnekleri (format yaklaşımları).
Answer.AI – llms.txt yazısı - llms.txt’nin içerik siteleri için ne ifade ettiği, kullanım senaryoları ve tartışmalı noktalar (avantaj/limitler).
Mintlify – What is llms.txt?