llms.txt, robots.txt és az AI-robotok: technikai alapok tulajdonosoknak

Két apró szövegfájl dönti el, hogy a mesterséges intelligencia egyáltalán elolvashatja-e az oldaladat. Az egyik a robots.txt, ami megmondja a robotoknak, hova mehetnek be; a másik az llms.txt, ami az AI-nek kínálja fel a lényeget. És itt jön a meglepő rész: sok magyar oldal véletlenül, egyetlen rossz sorral kizárja azokat a robotokat, amelyeket a ChatGPT és a Gemini használ. Nem rossz szándékból — egy túlbuzgó beállítás, egy sablonból átvett sor, és a kapu becsukódik.

Nem kell fejlesztőnek lenned ahhoz, hogy ezt megértsd, és ahhoz sem, hogy ellenőrizd. Elmagyarázom, mi ez a két fájl, miért számít, és hogyan nézheted meg a sajátodat öt perc alatt, böngészőből. A végén pontosan tudni fogod, hol keresd a hibát.

Mi az a robots.txt, és kit enged be?

A robots.txt egy egyszerű szövegfájl a webhely gyökerében, ami megmondja az automatikus látogatóknak — a robotoknak —, hová mehetnek be, és hová nem. Régóta létezik, eredetileg a keresőmotorok miatt. Az új benne az, hogy ma már az AI-cégek robotjai is ezt olvassák először, mielőtt egyetlen oldalt is letöltenének. Ha itt tiltás áll, a robot tisztességesen visszafordul — és a tartalma kimarad.

Érdemes név szerint ismerned a legfontosabb AI-robotokat, mert a nevük alapján lehet őket beengedni vagy kizárni:

GPTBot — az OpenAI robotja, ami a modellek tanításához gyűjt tartalmat.
OAI-SearchBot — szintén az OpenAI-tól, de ez a ChatGPT keresési funkcióját szolgálja: ez teszi lehetővé, hogy az oldal megjelenjen a válaszokban hivatkozott forrásként.
ClaudeBot — az Anthropic robotja a Claude modellekhez (a keresési forgalmat külön robot, a Claude-SearchBot intézi).
PerplexityBot — a Perplexity robotja, amely a saját közlése szerint kifejezetten a forrásként való megjelenítést szolgálja, nem a modelltanítást.
Google-Extended — a Google jelzőtokenje, amellyel külön szabályozható, hogy a tartalom hozzájáruljon-e a Gemini modelljeihez. Fontos részlet: ennek tiltása a hivatalos dokumentáció szerint a hagyományos Google-keresést nem érinti — csak a generatív felhasználást.

Itt egy különbségtételt érdemes őszintén kimondani, mert sok zavar ered belőle. A tréning és a válaszidézés nem ugyanaz. A tréninget végző robotok (mint a GPTBot) azért gyűjtenek, hogy a modellek tanuljanak az oldalból; a kereső- és válaszrobotok (mint az OAI-SearchBot vagy a PerplexityBot) azért jönnek, hogy a tartalmat élőben idézzék, forrásmegjelöléssel. Sok tulajdonos jogosan nem szeretné, ha a tartalma a modellek tanítóanyagába kerülne — de közben szeretne megjelenni az AI válaszaiban. Ez a kettő külön beállítható: lehet tiltani a tréninget, és engedni a keresést. A nemzetközi szakmai konszenzus ma épp efelé hajlik.

A gyakori hiba: a „mindent tiltó” sablon. Sok oldalon ott van egy User-agent: * mögött álló teljes tiltás, vagy egy botvédelmi réteg a tárhelyszolgáltatónál, amely az AI-robotokat is kizárja — sokszor anélkül, hogy a tulajdonos tudna róla. Egy gyakran idézett nemzetközi felmérés szerint a vizsgált B2B-szoftver- és webáruház-oldalak nagyjából 27%-a így, tudtán kívül tiltotta ki a nagy AI-robotokat. Ez az arány külföldi, üzleti szoftveres mintára vonatkozik, nem magyar kkv-kra — de a jelenség itthon is meglepően gyakori, és pont azért alattomos, mert láthatatlan.

Ha az AI-robotok elé akadály kerül, az minden további erőfeszítést értelmetlenné tesz. Hiába szép a honlap, hiába gondos a tartalom — ha a kapu zárva van, a modell az oldalt el sem éri. Ezért érdemes ezzel kezdeni, mielőtt bárki bonyolultabb dologba fog.

Mi az llms.txt, és kell-e neked?

Az llms.txt egy újabb keletű ötlet: szintén egy szövegfájl a webhely gyökerében, de a célja más. Míg a robots.txt azt mondja meg, hová nem mehet a robot, addig az llms.txt udvariasan felkínálja az AI-nek a lényeget — egy rendezett, tiszta tartalomjegyzéket arról, mik a webhely legfontosabb oldalai, és hol találja a megbízható leírásokat. Olyan, mintha az oldal a vendég kezébe adná a tartalomjegyzéket, ahelyett, hogy a vendég a polcokon keresgélne.

Mit tartalmazzon? A gyakorlatban egy rövid, ember által is olvasható listát: a vállalkozás nevét és egymondatos leírását, majd a kulcsoldalakra mutató hivatkozásokat — szolgáltatások, rólunk, kapcsolat, a fontosabb cikkek —, mindegyikhez egy tömör magyarázattal. Semmi varázslat, semmi kód. Egy jól szerkesztett tartalomjegyzék, az AI szemszögéből.

Legyek őszinte a státuszáról: az llms.txt feltörekvő konvenció, nem hivatalos szabvány. Néhány száz oldal használta a 2026 eleji állapot szerint, és egyetlen nagy AI-szolgáltató sem erősítette meg nyilvánosan, hogy élesben támaszkodna rá. Vagyis ma még nem bizonyított rangsorképző tényező. Akkor miért említem? Mert megtenni olcsó, a kockázata pedig gyakorlatilag nulla — egy fél óra munka, ami nem árthat, és ha a konvenció megerősödik, te már készen állsz. Nem csodaszer. Inkább előrelátás.

Tehát kell-e neked? Ha a robots.txt rendben van, és van fél szabad órád, akkor megéri. De a sorrend fontos: előbb a kapu, csak utána a tartalomjegyzék. Egy llms.txt mit sem ér, ha közben a robotok be sem jutnak az oldalra.

Hogyan ellenőrizd a sajátodat 5 perc alatt?

Ehhez nem kell fejlesztő, sem fizetős eszköz. Három lépés, böngészőből:

Nyisd meg a robots.txt fájlt. A böngésző címsorába írd be a saját címedet, a végére pedig ezt: /robots.txt — vagyis például azoldalam.hu/robots.txt. Egyszerű szöveget fogsz látni, vagy egy „nincs ilyen oldal” üzenetet.
Keresd a tiltó sorokat. Nézd át, szerepel-e benne a Disallow: / egy User-agent: * alatt — ez mindenkit kizár. Keress rá az AI-robotok nevére is (GPTBot, OAI-SearchBot, ClaudeBot, PerplexityBot): ha bármelyik mögött Disallow: / áll, az a robot ki van tiltva. Ha a fájl üres, hiányzik, vagy csak Allow sorokat tartalmaz, az általában jó jel.
Tegyél egy renderelhetőségi gyorspróbát. Ez azt méri, hogy a tartalom kód futtatása nélkül is látszik-e — mert a legtöbb AI-robot nem futtat JavaScriptet. Nyisd meg a kezdőlapodat, kattints jobb gombbal egy üres részen, és válaszd az „oldal forrásának megtekintése” lehetőséget. Ha a megnyíló szövegben megtalálod a honlap valódi mondatait, szövegét, akkor a robot is látja. Ha viszont főként üres kódvázat látsz, és a tartalom sehol — az figyelmeztető jel.

Ennyi az öt perc. A három lépésből kiderül, hogy a kapu nyitva van-e, és hogy az AI lát-e bármit az oldalból. Ezzel többet fogsz tudni a saját helyzetedről, mint sok drága jelentésből.

Fontos azonban a helyén kezelni, mit mond ez a próba, és mit nem. Az, hogy az AI-robotok be tudnak jönni, csak a belépő — nem azonos azzal, hogy az AI ajánlani fogja a vállalkozást. Az ajánlást elsősorban a weboldalon kívüli jelenlét dönti el: a vélemények, a független említések, a hiteles forrásokban való szereplés. A versenytársaid sem azért láthatók a mesterséges intelligencia előtt, mert ügyesebb a robots.txt-jük — hanem mert nagyobb a külső lábnyomuk. A cél az, hogy szándékosan építsd fel azt a jelenlétet, amit ma sokan a véletlenre bíznak. Erről részletesen írok abban, hogy miért nem egyenlő a GEO-pontszám az AI-ajánlással, a teljes mérési logikát pedig a módszertan oldalon foglalom össze.

Ez a két fájl tehát nem a verseny vége, hanem a rajtvonal. Ahol az AI-láthatóság elkezdődhet — vagy ahol csendben elakad. Ha a fenti próbán elakadsz, vagy nem vagy biztos benne, mit látsz, írj a kapcsolat oldalon, és készítek egy ingyenes mini-ellenőrzést a robots.txt-edről. Megnézem, hogy a kapu nyitva áll-e azoknak a robotoknak, amelyekre a vásárlóid nap mint nap kérdeznek. Ha a hagyományos keresés és az AI-keresés különbségére vagy kíváncsi, annak a SEO és GEO összevetése ad keretet, a teljes folyamatot pedig a hogyan működik oldalon követheted végig.

Kindl Dávid · Közzétéve: 2026. május 5. · Frissítve: 2026. július 5.

Gyakori kérdések

Mi a különbség a robots.txt és az llms.txt között?

A robots.txt azt mondja meg az automatikus robotoknak, hova mehetnek be az oldalon, és hova nem. Az llms.txt ezzel szemben felkínálja az AI-nek a webhely lényegét: rendezett tartalomjegyzéket a legfontosabb oldalakról. Az egyik kaput nyit vagy zár, a másik útba igazít.

Honnan tudom, hogy a webhelyem kizárja-e az AI-robotokat?

Nyisd meg a böngészőben a saját címedet a /robots.txt végződéssel, például azoldalam.hu/robots.txt. Keresd a Disallow: / sorokat egy User-agent: * alatt, vagy az AI-robotok neve (GPTBot, OAI-SearchBot, ClaudeBot, PerplexityBot) mögött. Ha ott tiltás áll, az adott robot ki van zárva.

Kötelező vagy szabvány az llms.txt?

Nem. Az llms.txt feltörekvő konvenció, nem hivatalos szabvány, és egyetlen nagy AI-szolgáltató sem erősítette meg, hogy élesben támaszkodna rá. Megtenni viszont olcsó, a kockázata pedig gyakorlatilag nulla, ezért előrelátásként megéri elkészíteni.

Ha beengedem az AI-robotokat, ajánlani fog a ChatGPT?

Nem feltétlenül. A robotok beengedése csak a belépő: ez teszi lehetővé, hogy az AI egyáltalán elérje az oldalt. Az ajánlást elsősorban a weboldalon kívüli jelenlét dönti el — a vélemények, a független említések és a hiteles forrásokban való szereplés.

Mennyire gyakori, hogy egy honlap véletlenül kizárja az AI-robotokat?

Egy gyakran idézett nemzetközi felmérés szerint a vizsgált B2B-szoftver- és webáruház-oldalak nagyjából 27%-a véletlenül, tudtán kívül kizárja a nagy AI-robotokat — például egy túlbuzgó tiltási sablon vagy a tárhelyszolgáltató botvédelme miatt. Ez az arány külföldi, üzleti szoftveres mintára vonatkozik, nem magyar kkv-kra, de a jelenség itthon is meglepően gyakori.