Wikidata-entitás magyar cégnek: hogyan és miért?
Az AI-modellek — ChatGPT, Gemini, Perplexity — nemcsak a weboldaladat olvassák: azt is ellenőrzik, hogy a cég más, megbízható adatforrásokban is létezik-e. A Wikidata az egyik legfontosabb ilyen forrás. Ha a vállalkozásod pontosan kitöltött entitásként jelenik meg rajta, az AI számára ez egyértelmű jel: „ez a szervezet valódi, azonosítható, és nem tévesztendő össze senki mással.” Ebben a cikkben megmutatom, miben különbözik a Wikidata a Wikipédiától, melyik magyar cégnek érdemes entitást létrehozni, és mit kell tenni, ha az adat hiányos vagy ellentmondásos.
Mi az a Wikidata, és miben különbözik a Wikipédiától?
A Wikipedia emberi olvasásra készült: cikkekből, bekezdésekből, folyó szövegből áll. A Wikidata ezzel szemben gépi olvasásra való: strukturált, kapcsolt adatbázis, amelyben minden „elem” (item) tulajdonságok és értékek hálójaként írja le az entitást. Egy cég Wikidata-elemén például szerepelhet a jogi forma (P31), az alapítás éve (P571), a székhely (P131), a weboldal (P856), az iparág (P452) és a sameAs hivatkozások más adatbázisokra.
Ezt a különbséget azért fontos érteni, mert az AI-modellek más-más célra használják a két forrást. A Wikipedia szöveges kontextust ad: honnan indult a cég, mit csinál, milyen összefüggésben emlegetik. A Wikidata ezzel szemben az entitásazonosítást segíti: a modell megbizonyosodhat arról, hogy az „ABC Kft.” a weboldaladon, a Google Cégprofilon és a Wikidatán ugyanaz a szervezet. Ez az azonosíthatóság közvetlenül az entitásdimenziót erősíti, amelyet a 7 dimenziós módszertanomban D4 jelöléssel mérek.
A Wikidata nyílt: bárki szerkesztheti, de a közösség moderálja. Új elem létrehozásakor igazolható, külső forrást kell megjelölni: újságcikket, cégjegyzék-bejegyzést, hatósági dokumentumot. A teljesen forrás nélküli elem törölhető. Ez egyszerre korlátozás és garanciamechanizmus: ami megmarad, amögött van bizonyíték.
Melyik magyar cégnek érdemes Wikidata-entitást létrehozni?
Nem minden vállalkozásnak szükséges. Az AI-láthatóság szempontjából a Wikidata elsősorban ott számít, ahol az entitásazonosítás a kritikus pont: hasonló nevű cégek között, több piacon jelenlévő szervezeteknél, vagy ha a cégnek erős a kereszthivatkozása (pl. szerepel sajtóban, katalógusokban, szakmai szövetségekben, de szétszórt adatokkal).
Három forgatókönyvet látok, ahol a Wikidata-entitás valódi értéket ad:
1. Névütközéses helyzet. Ha a cégnév köznévi szó, városnév, vagy nagyon hasonlít egy másik, közismertebb szervezet nevéhez, az AI könnyen összetéveszti a kettőt. Egy saját Wikidata-elem, amely pontosan tartalmazza a cégjegyzékszámot, a székhely pontos nevét és a weboldalt, segít a modellnek szétválasztani a két entitást. Hogy ez miért fontos az AI-ajánlások valóságában, azt a márkafelcserélés esetéről szóló írásomban részletezem.
2. Nemzetközi jelenlét. Ha a cég külföldre is értékesít, vagy külföldi partnerekkel dolgozik, a Wikidata különösen hasznos: az angolul kereső, másik ország AI-alapú eszközét használó potenciális partner vagy ügyfél szintén a Wikidatát kérdezi le az entitás-ellenőrzéshez. Egy jól kitöltött elem — angol és magyar leírással, sameAs hivatkozással az Organization sémára — ilyenkor utat nyit.
3. Szétszórt külső adatok egységesítése. Ha a cégről sok helyen szerepel adat — katalógusokban, sajtóban, szakmai listákon —, de ezek nem egy következetes entitáshoz kötődnek, az AI zűrzavart tapasztal. A Wikidata-elem ebben az esetben egyfajta „horgonyként” működik: a többi forrás ideális esetben erre a kanonikus entitásra mutat. Ez összefügg a NAP-konzisztencia kérdéskörével, amelyről a AI-hallucináció és a magyar cégek cikkben írok bővebben.
Ahol a Wikidata kevésbé sürgős: kis, erősen helyi, egyedi nevű vállalkozásoknál, ahol az AI a Google Cégprofilból és a weboldalból egyértelműen azonosítani tudja a szervezetet, és nincs névkonfliktus. Ilyenkor a Wikidata-elem ugyan nem árt, de a sorrend más: az elérhetőség, a strukturált adat és a külső vélemények egyszerű helyi cég esetén hamarabb hoznak változást.
Mit tesz az AI, ha a Wikidata-entitás hiányos vagy ellentmondásos?
Az AI-modell háromféleképpen reagálhat a hiányos vagy ellentmondásos Wikidata-adatra.
Kihagyja az entitást. Ha a modell nem tudja egyértelműen azonosítani a szervezetet — mert a Wikidata-elem hiányzik, vagy épp más adatot mutat, mint a weboldal —, inkább nem nevezi meg a céget, minthogy kockáztassa a tévedést. Ez nem büntetés, hanem óvatosság — de az eredmény ugyanaz: a cég kimarad onnan, ahol egyébként ott lehetne.
Keveri más entitással. Ha a cég neve hasonlít egy ismertebb szervezet nevéhez, és a Wikidata nem tudja szétválasztani őket, a modell átvehet adatokat a másik entitástól. Innen jönnek azok a helyzetek, amikor az AI helyes nevet mond, de rossz városba helyezi a vállalkozást, vagy egy másik cég tevékenységét írja le. Ez az egyik leggyakoribb AI-hiba, amelyet a saját méréseim során is dokumentálni tudtam.
Terjeszti a hibás adatot. Ha a Wikidata-elem létezik, de elavult vagy pontatlan adatot tartalmaz — régi telephelycímet, régen megváltozott telefonszámot, megszűnt weboldalt —, az AI ezt hitelesként veheti át. A Wikidata tekintélyes forrásnak számít a modellek számára: amit ott talál, azt nehezebben kérdőjelezi meg, mint egy átlagos oldalon látott adatot. Éppen ezért a Wikidata-entitás karbantartása nem egyszeri feladat: érdemes félévente ellenőrizni, hogy a szerkesztett adatok még mindig pontosak-e.
Az ellentmondásos eset — amikor a Wikidata mást mutat, mint a weboldal Organization sémája — az entitásdimenzió egyik leglassabban javítható problémája. Az AI-modellek a tanítás és az élő lekérdezés különböző pillanatait tükrözik: az egyik forrásból a régi adat él tovább, a másikból az újabb. Amíg mindkét forrás pontosan ugyanazt mondja, ez a zavar fel sem merül. Hogy az Organization séma és a Wikidata hogyan dolgozik együtt, azt a módszertan oldalon a strukturáltadat-dimenzió tárgyalja részletesen.
Hogyan hozz létre Wikidata-entitást a cégednek?
A folyamat technikai tudás nélkül is elvégezhető, de igényel néhány előkészületet.
Első lépés: ellenőrzés. Mielőtt új elemet hoznál létre, a Wikidata keresőjében meggyőződhetsz arról, hogy a cégnek nincs-e már meglévő eleme — akár hiányosan kitöltve. Egy meglévő, pontatlan elem kiegészítése sokkal hatékonyabb, mint egy párhuzamos, új elem indítása, amely csak növeli a zűrzavart.
Második lépés: forrásgyűjtés. Az entitásállításokhoz igazolható forrás kell. A leghasznosabbak: a cégbírósági cégkivonat (hatósági forrás), egy megjelenés valamilyen sajtóban vagy szakmai portálon, és maga a cég weboldala (URL). Minél megbízhatóbb a hivatkozott forrás, annál kisebb az esélye, hogy az elem törlési kérelmet kap.
Harmadik lépés: az elem feltöltése. Legalább ezeket az alapmezőket töltsd ki: a cég neve (label) magyar és angol nyelven; rövid leírás (description) — pl. „magyarországi logisztikai vállalat”; az entitás típusa (P31: business, vagy konkrétabb alosztály); a székhely (P131); a weboldal (P856). Ha van, add meg a cégjegyzékszámot (P3220 a magyarországi azonosítóra) és az alapítás évét (P571).
Negyedik lépés: sameAs kapcsolat a weboldalon. Ha az entitás már él a Wikidatán, a weboldalad Organization sémájában érdemes sameAs hivatkozást felvenni a Wikidata-elem URL-jével. Ez kétirányú kapcsolatot teremt: a modell a weboldal sémájából a Wikidatára, a Wikidatából pedig vissza a weboldalra mutat. Ez az egyik leghatékonyabb módja annak, hogy az AI egyértelműen azonosítsa a szervezetet — és ez az oka, hogy a GEO-pontszámban az entitásdimenzió explicit ellenőrző pontként tartalmazza a sameAs mező meglétét. Ugyanakkor fontos leszögezni: a Wikidata-entitás megléte az AI-ajánlás szempontjából szükséges előfeltétel, nem elégséges feltétel. Az AI nem azért fogja megnevezni a cégedet, mert ott vagy a Wikidatán — hanem azért, mert az összes releváns jel egyszerre erős: a külső jelenlét, a vélemények, a tartalom és az entitásazonosítás együtt mozog.
Ha eddig nem foglalkoztál az entitásdimenzióval, érdemes az ingyenes, gyors mérésekkel kezdeni: megnézni, hogy az AI ma hogyan találja meg a cégedet, majd ebből kiindulva eldönteni, hogy a Wikidata-entitás hol illeszkedik a sorrendbe. Hogy ezt ingyen, saját eszközökkel hogyan mérd fel, arról a saját AI-megjelenést ingyen mérő cikkem ad konkrét útmutatót.
Gyakori kérdések
Szükséges-e Wikipedia-cikk ahhoz, hogy Wikidata-entitást hozzak létre?
Nem feltétlenül. Bár sok Wikidata-elem mögött van Wikipedia-cikk, maga az entitás létrehozható anélkül is. Fontos azonban, hogy az entitásra legyen valamilyen igazolható, külső forrás — újságcikk, cégjegyzék-bejegyzés, vagy más harmadik fél által megjelent adat. Teljesen forrás nélküli elemeket a Wikidata közössége törölheti.
Megtalálják-e az AI-modellek a Wikidata-adatokat?
Igen. A nagy nyelvi modellek — ChatGPT, Gemini, Perplexity — tanítóadataikba belefoglalják a Wikidata struktúráját, és az élő keresőintegrációk (pl. Perplexity, Gemini grounding) aktívan lekérdezik a tudásgráfokat. Egy pontosan kitöltött Wikidata-entitás ezért erősíti az AI általi azonosíthatóságot, különösen az entitás- és NAP-ellenőrzés dimenzióban.
Mi történik, ha a Wikidata-entitáson hibás adatok szerepelnek?
Az AI-modellek képesek a hibát átvenni és terjeszteni. Ha a Wikidata-n rossz cím, régi telefonszám vagy egy másik céggel összekevert cégnév áll, az AI-válaszban ez az adat jelenhet meg — és a felhasználó a hibás adatot látja hitelesként. Érdemes az entitás létrehozása után rendszeresen ellenőrizni, hogy nincs-e vandalizmus vagy téves szerkesztés.
Milyen alapadatokat kell kitöltenem egy új Wikidata-elemben?
Legalább ezeket: a cég nevét (label) magyar és angol nyelven, egy rövid leírást (description), az entitás típusát (P31), a székhelyet (P131) és a weboldalt (P856). Ha van, érdemes megadni a cégjegyzékszámot (P3220 a magyarországi azonosítóra) és az alapítás évét (P571) is.
Mikor nem sürgős a Wikidata-entitás egy magyar cégnek?
Kis, erősen helyi, egyedi nevű vállalkozásoknál, ahol az AI a Google Cégprofilból és a weboldalból egyértelműen azonosítani tudja a szervezetet, és nincs névkonfliktus. Ilyenkor a Wikidata nem árt, de az elérhetőség, a strukturált adat és a külső vélemények hamarabb hoznak változást.
Források
- Wikidata — Bevezetés: mi a Wikidata és hogyan működik a nyílt tudásbázis
- Schema.org — Organization típus: hogyan kapcsolódik az entitás-séma a Wikidata sameAs mezőhöz
- Google — LocalBusiness strukturált adat: az entitás-azonosítás és NAP-konzisztencia követelményei
- MI-Térkép módszertan — a 7 dimenzió és az entitás-konzisztencia szerepe az AI-láthatóságban