Az ingyenes MI-láthatóság-tesztelők: mit mérnek valójában, és mit hagynak ki?
Az ingyenes AEO- és GEO-graderek elvégzik a durva szűrést — jelzik, ha hiányzik a strukturált adatod, vagy ha az oldalad nehezen érthető az MI botjai számára. A legtöbbjük azonban egyetlen lekérdezéssel, egyetlen modellen fut, és a Claude-ot vagy a Perplexityt egyáltalán nem méri. Mielőtt egy gyorsteszt eredményéből következtetést vonnál le a láthatóságodra, érdemes tudnod, mit néz valójában az eszköz — és mit hagy ki szükségszerűen.
Nem azt mondom, hogy az ingyenes tesztek haszontalanok. Hanem azt, hogy más kérdésre válaszolnak, mint amire a legtöbben gondolnak. Ha ezt a különbséget értve használod őket, értékes előképet kapsz — ha nem, félrevezető számok alapján hozol döntést.
Mit mér egy tipikus ingyenes GEO-grader?
A legtöbb ingyenes MI-láthatóság-tesztelő három réteget néz meg: a technikai hozzáférhetőséget, az oldalon lévő strukturált adatot, és valamilyen formában azt, mennyire gépbarát az oldal tartalma. Ezek hasznosak. Ha a botod blokkolva van, ha hiányzik a JSON-LD, ha a tartalmad JavaScript mögé van zárva — ezeket egy jó grader jelzi.
A probléma ott kezdődik, amit nem mérnek. Négy strukturális korlátot érdemes ismerned minden ingyenes eszközzel kapcsolatban:
1. Egyetlen modell, egyetlen lekérdezés. A legnépszerűbb ingyenes graderek — mint az Ahrefs AIO-figyelője vagy a különböző „GEO score” kalkulátorok — jellemzően a Google AI Overviews megjelenését vizsgálják, esetleg egy-egy ChatGPT-lekérdezéssel egészítik ki. A Perplexity, a Claude és a Gemini app viselkedése nem szerepel az eredményben. Egy magyar kkv vásárlói ugyanakkor mind a négy felületen keresnek — ezért a lefedettség töredékes.
2. Csak a mechanizmust mérik, nem a tényleges felhasználói élményt. Az API-alapú tesztek — amelyek a modellek „tanult memóriájából” kérdeznek, élő keresés nélkül — mást mérnek, mint amit a vásárló a képernyőjén lát. 2026-ban a legtöbb fogyasztói MI-app (ChatGPT, Gemini, Perplexity) helyi ajánlási kérdéseknél alapból élő keresést futtat. Aki nem jelzi, melyik üzemmódban kapta az eredményt, az összekeveri a mechanizmust a valós felhasználói élménnyel. Hogy ez a két üzemmód mennyire eltérő képet ad, azt a ugyanaz a modell, keresés nélkül és kereséssel cikkben méréssel mutatom be.
3. Nem mérik a külső jelenlétet. A legsúlyosabb dimenzió — a 25%-os súlyú külső jelenlét: vélemények, független említések, katalógusok, sajtó — szinte sohasem szerepel az ingyenes graderek kimenetében, mert a mérése nem triviális. Egy eszköz, amely csak az oldaladon lévő jeleket nézi, a legdöntőbb tényezőt hagyja ki. A modell az ajánlásait nem a cég önjellemzéséből meríti, hanem abból, amit mások mondanak róla — ez pedig kívülről ered. Hogy a külső jelenlét miért viseli a legnagyobb súlyt, azt a a 7 dimenzió, amivel az MI-láthatóság mérhető írásban fejtem ki tételesen.
4. Nincs dátum, nincs összehasonlítás. Az ingyenes tesztelők általában pillanatfelvételt adnak, kontextus nélkül. Nem mutatják, hol tart a versenytársad, milyen volt a helyzet hat hónapja, és mi változott. Egy önálló szám dátum és összehasonlítás nélkül cselekvési alap helyett csak tájékozódási pont.
Miért nem elég egyetlen modell mérése?
Azért, mert a modellek viselkedése érzékelhetően eltér, és nem ugyanazt a közönséget érik el. A ChatGPT free 2026-ban GPT-5.5 Instant modellen fut, a Gemini app az ingyenes szinten Gemini 3.5 Flash-t használ, alapból Google-kereséssel kombinálva, a Claude app ingyenes szintje web-keresést is futtat, a Perplexity pedig minden lekérdezésnél grounded, azaz mindig élő keresési eredményre támaszkodik. Ez négy eltérő adatforrás, négy eltérő válogatási logika. Akinek a Gemini megtalálja a vállalkozását, azt a Perplexity akár nem is ismeri — vagy fordítva.
A Bain 2026 márciusi elemzése, amely több mint egymilliárd MI-hivatkozást vizsgált, azt találta, hogy a nagy nyelvi modellek „elsimítják az általános üzenetet, és az ismétlődő mintázatokat erősítik fel” — vagyis ahol nincs egyértelmű, modellek között is konzisztens jel, ott a modell könnyen versenytársat részesít előnyben. Ez azt is jelenti, hogy az egymodelles mérés vakfoltot hagy: nem látszik, hogy a céged egységesen látható-e az összes főbb platformon, vagy csak az egyiken.
Saját mérési tapasztalataim ezt megerősítik. Egyetlen lekérdezésen vizsgálva ugyanannak a vállalkozásnak a láthatósága modellenként drasztikusan eltérhet: előfordult, hogy a Gemini 6-ból 6 kérdésnél megnevezte az adott céget, míg a Claude — amelynek botja blokkolva volt a robots.txt-ben — ugyanonnan 0-t mutatott. A ClaudeBot tiltása és a Claude-app vakfoltja közötti összefüggést a ClaudeBot-tiltás: amikor saját magadat zárod ki cikkben vizsgálom meg részletesen.
Hogyan egészítsd ki az ingyenes tesztet valódi méréssel?
Az ingyenes gyorsteszt jó kiindulópont, de önálló cselekvési alap helyett szűrőként kezeld. Ha az eredmény technikai problémát jelez, azt javítsd ki — ezek napok kérdései, és valóban blokkolhatják az összes többi munkát. Ha a technikai réteg tiszta, a következő lépés a tényleges modellviselkedés mérése: valódi vásárlói kérdések feltevése, mindkét üzemmódban, több modellen.
A saját mérési keretrendszerem hét dimenziót vizsgál, mindegyiket dátumozottan és ismételhető módon. Az eredmény nem pillanatfelvétel, hanem összehasonlítható sor — látszik, mi változott, és mi nem. Egy magyar kkv számára ez azt jelenti, hogy nem kell fizetned azért, hogy megtudd: rendben van-e a technikai alap. Az ingyen elvégezhető mini-ellenőrzés folyamatát a hogyan működik oldalon írom le lépésről lépésre.
Van egy másik réteg, amelyet semmilyen ingyenes eszköz nem tud lefedni: az időbeli változás. Az MI-modellek betanított tudása frissül, az aggregátoradatok változnak, a versenytársak is lépnek. Egy egyszeri mérés ezért mindig csak egy időpillanat képe. A dátumozott, ismételt mérés ad valódi cselekvési irányt — nem az egyszeri szám, hanem a trend.
Mi marad ki a legtöbb ingyenes eszközből?
Ha sorba rendezem, mit nem mér szinte egyetlen ingyenes GEO-grader sem, a lista hosszabb, mint amit sok értékesítő bevall:
Külső jelenlét és vélemények. A Google-véleményeid száma és csillagátlaga, a független katalógusokban való megjelenés, a fórumok és sajtócikkek — ezek alkotják a legnagyobb súlyú dimenziót (25%), és ezeket ingyenes eszközzel szinte lehetetlen automatikusan mérni, mert sokszor bejelentkezés vagy speciális API-hozzáférés kell hozzájuk.
Modellspecifikus viselkedés. Azt, hogy a ChatGPT keresés nélkül mit mond a cégedről, vs. mit mond az alkalmazás élő kereséssel — ezt a kettős üzemmódot kevés ingyenes eszköz mutatja külön. Pedig a kettő szétválasztása nélkül nem tudod megmondani, hogy a tartalmadban van-e probléma, vagy csak a külső jelenlétben. Hogy a két üzemmód miért ad teljesen más képet, azt a mit mond a ChatGPT a vállalkozásodról cikk járja körbe részletesen.
Versenytárs-összehasonlítás. Önmagában egy pontszám semmit nem mond — az számít, hogy hol van a versenytársad. A legjobb graderek sem helyezik el a cégedet a helyi mezőnyben, nem mutatják, ki kerül be a válaszba helyetted, és nem veszik végig, hogy a modell valódi versenytársat nevez-e meg, vagy kitalált, nem létező céget. Ez utóbbi egyébként az egyik leggyakoribb és legsúlyosabb meglepetés a saját méréseim során: a modell a valóban létező versenytársak helyett kitalált neveket említ — és ezt egy technikai grader sosem jelzi.
Hallucináció és tévesen tulajdonított adatok. Az ingyenes eszközök azt nézik, megtalálja-e a modell az oldaladat. Azt nem nézik, hogy amit a modell rólad mond, az igaz-e. Előfordult, hogy egy cég neve pontosan jelent meg egy MI-válaszban, de az oda rendelt cím, telefonszám vagy a kínálat leírása egy másik vállalkozásé volt. Ez utóbbi eset a közvetlenül káros — és ezt csak éles lekérdezéssel, manuális ellenőrzéssel lehet feltárni. Hogy a hallucináció hogyan néz ki a magyar piac valódi esetein, azt a így hallucinál az MI a magyar cégekről cikk mutatja be mérési adatokkal.
Az ingyenes tesztelő orvosi hasonlattal olyan, mint egy vérnyomásmérő a drogériában. Hasznos első jel, de nem helyettesíti a vizsgálatot. Ha magas a szám, menj tovább — ne a mérőeszközbe fektess, hanem az okba.
Összefoglalva: az ingyenes MI-láthatóság-tesztelők jók arra, amire tervezték őket — a technikai alap gyors ellenőrzésére. Ha ezeket a jeleket jól értelmezed, időt és pénzt takarítasz meg azzal, hogy a valódi problémákra koncentrálsz, nem a tünetekre. Ahol keveset adnak: a külső jelenlétnél, a versenytárs-összehasonlításnál, a modellspecifikus viselkedésnél, és mindennél, ami a cégen kívül dől el. A pontos kiindulási képhez egy-két ingyenes teszt szükséges, de nem elégséges — a többi munkát éles lekérdezéssel, dátumozottan és több modellen kell elvégezni.