Menü

Ha az AI nem látja a weboldalad, az ügyfeleid sem fogják: 1000 top magyar céget teszteltünk

Nagyszabású kutatás keretében feltérképeztük Magyarország 1000 legnagyobb bevételű vállalatának láthatóságát a leggyakrabban használt mesterséges intelligencia alapú nyelvi modellekben, azaz a ChatGPT, a Gemini és a DeepSeek rendszereiben. A cél egyszerű volt: megnézni, mi történik, ha egy átlagos felhasználó ezeken a platformokon keres rá egy hazai nagyvállalatra.

Milliárdos cégek, amelyek be sem léptek a webre

Azt gondolná az ember, hogy egy milliárdos bevételű cég ma már nem engedheti meg magának az online jelenlét hiányát. A kutatás azonban rögtön az elején rávilágított egy meglepő tényre: a vizsgált minta 10 százalékánál a vállalatoknak egyszerűen nincs érdemi, feldolgozható hivatalos weboldala. Ez 100 hazai, komoly forgalmat bonyolító céget jelent, akik a weben legfeljebb egy Facebook profillal, esetleg egy céginformációs adatbázis generált aloldalával, üres domainnel vagy egy "feltöltés alatt" álló hibaoldallal vannak jelen. Számukra az új technológiai korszak diagnózisa kíméletlen: az LLM chatbotok számára teljesen láthatatlanok.

A "Fantomcég" jelenség: Amikor az AI teljesen mást lát, mint te

Képzeld el a következő helyzetet: van egy jól működő, stabil bevételekkel rendelkező céged. Egy potenciális ügyfél rákérdez a ChatGPT-nél, Gemininél vagy a DeepSeeknél, hogy pontosan mivel is foglalkoztok. A gép pedig olyan választ ad, aminek köze sincs a valósághoz. Ezt nevezzük "fantomcég" jelenségnek.

Az egyezést egy 1-től 10-ig terjedő skálán értékeltük a "Judge" pontszám segítségével. Ha egy modell 4 vagy annál kevesebb pontot kapott, azt fantomcégnek minősítettük, hiszen a leírása érdemben hibás vagy teljesen félrevezető volt.

Mivel az elemzésünk alapját az a 1000 cég és abból a 902 valós weboldallal rendelkező magyar cég képezte, amelyeknél értékelhető weboldal-tartalmat tudtunk kinyerni, az alábbi arányok és darabszámok rendkívül beszédesek a hazai piacra nézve.

Nyelvi modell Fantomcég arány
(Judge pontszám <= 4)
Érintett cégek száma
ChatGPT 44.2 % 399 cég
Gemini 64.7 % 584 cég
DeepSeek 75.7 % 683 cég

Mit is jelent ez a gyakorlatban? A vizsgált magyar vállalatok közül a ChatGPT legalább a 45 százaléknál súlyosan téves képet fest a cégről. A Gemininél ez a hibaar ány már a kétharmadot is eléri, a DeepSeek pedig a vállalatok háromnegyedénél egy teljesen alternatív valóságot generál.

A húzóágazat kihagyása: Amikor a lényeg vész el

A probléma nem áll meg az általános pontatlanságnál. Megnéztük azt is, mi a helyzet a cégek tényleges fő szolgáltatásaival, azaz a húzóágazatokkal. Minden értékelhető cégnél kiszűrtük a valós weboldalak leggyakoribb, tartalmas kulcsszavait, és ellenőriztük, hogy az AI teljes leírásában ezeknek legalább a fele szerepel-e. Ha hiányoztak, akkor a modell lényegében kihagyta a vállalat profiljának az alapját.

Nyelvi modell Kihagyta a fő húzóágazatot
Gemini 63.7 %
ChatGPT 68.4 %
DeepSeek 74.3 %

A számok itt is könyörtelenek. A cégek mintegy kétharmadánál az AI egyszerűen meg sem említi azt a terméket vagy szolgáltatást, amit az adott vállalat a saját weboldalán a legnyomatékosabban kommunikál. Vagyis a top magyar cégek durván 64 és 74 százaléka között az LLM nem azonosítja a legfontosabb tevékenységet. A húzóágazat kihagyása ráadásul még gyakoribb hiba, mint a teljesen kitalált leírás.

Összességében, ha rangsorolnunk kell a modelleket a hibázási hajlamuk szerint a legrosszabbtól a legjobbig haladva, akkor a sorrend: DeepSeek, Gemini, majd ChatGPT. Bár a ChatGPT érdemben megbízhatóbb a másik két modellnél a hazai cégek leírásában, a tény, hogy az esetek közel felében súlyosan téves képet rajzol a valós tevékenységről, azt mutatja, hogy jelenleg egyetlen cég sem dőlhet hátra nyugodtan. 

Budapest kontra vidék: Vízfejű a mesterséges intelligencia is?

Gyakran halljuk, hogy Magyarország vízfejű, de vajon a mesterséges intelligencia is főváros-központú? A válasz röviden: igen, méghozzá nagyon is. A kutatásunkban külön megvizsgáltuk, hogy a modellek hogyan teljesítenek a budapesti, a Pest megyei és a vidéki vállalatok esetében.

A "főváros-hatás" mindhárom vizsgált LLM-nél statisztikailag kimutatható, de a mértéke óriási eltéréseket mutat. Egy budapesti cég leírásakor a modellek jellemzően 1–1.5 ponttal magasabb Judge-értéket kapnak a 10-es skálán, mint egy vidéki vállalatnál, ráadásul feleakkora eséllyel adnak teljesen hamis, fantomcég-szerű választ.

Nézzük meg a pontos számokat régiós bontásban (Átlag pont / Fantomcég arány):

Régió ChatGPT DeepSeek Gemini
Budapest 5.40 / 38.3 % 5.04 / 34.0 % 5.19 / 36.2 %
Pest megye 5.60 / 25.6 % 4.60 / 53.5 % 5.40 / 32.6 %
Vidék (18 megye) 5.00 / 47.1 % 3.69 / 79.8 % 3.92 / 68.6 %


A beszédes különbségek: Ki bírja a vidéki terepet?

A táblázatból rögtön kitűnik, hogy a ChatGPT a legkiegyensúlyozottabb játékos.
Bár “csupán" fél ponttal ír pontosabban a budapesti cégekről, mint a vidékiekről, a modell vidéken így is közepesen használható marad az 5.00-s átlagával. A 47 százalékos vidéki hibaarány még mindig magas, jócskán alulmúlja a versenytársakét.

A DeepSeek és a Gemini ugyanis drámaian elvérzik, amint elhagyják a főváros vonzáskörzetét. A DeepSeek a vidéki cégek 80 százalékáról ad súlyosan pontatlan leírást, szemben a Pest megyei 54 és a budapesti 34 százalékkal. A Gemini is hasonlóan bezuhan: 69 százalékos fantomcég-arányt produkál vidéken, míg Budapesten ez csak 36 százalék. Mindkét modell vidéki pontátlaga a "félrevezető" sávba, 3.7 és 3.9 köré esik. A gyakorlati következtetés tehát az, hogy vidéki cégek kutatására egyértelműen a ChatGPT a legmegbízhatóbb, a másik két modellt pedig komoly fenntartásokkal érdemes csak használni.

A meglepetések: Pest megye és a győri iparvidék paradoxona

Az adatok mélyebb elemzése két nagyon érdekes anomáliát is felszínre hozott.

Egyrészt Pest megye néhol még Budapestet is felülmúlja a pontosságban. A ChatGPT és a Gemini is magasabb átlagot hozott a Pest megyei cégekre, mint a fővárosiakra. Ennek a legvalószínűbb oka, hogy ebben a régióban nagyobb arányban találhatók olyan közepes méretű gyártók és kereskedelmi vállalatok, amelyek saját, strukturált szakmai weboldallal rendelkeznek, ellentétben a budapesti, sokszor jóval vegyesebb képet mutató vállalati körrel.

Másrészt a vidéki megyék közötti szórás is tartogatott meglepetéseket. Azt gondolnánk, hogy az iparilag erős, nagy nemzetközi cégekkel (például Audi, Rába) teletűzdelt Győr-Moson-Sopron megye jól fog szerepelni. Érdekes módon azonban pont ez a régió produkálta a legalacsonyabb ChatGPT-átlagot. Miért? Mert a megye cégei között rengeteg az olyan ipari beszállító (B2B), amelyek webes jelenléte vagy minimális, vagy az AI könnyedén összekeveri a magyar leányvállalatot a nemzetközi anyacéggel. Ezzel szemben olyan megyék, mint Tolna, Borsod-Abaúj-Zemplén vagy Zala, sokkal jobban teljesítettek a modelleknél.

Iparági bontás: Melyik szektor az LLM-ek erőssége, és melyik okozza a legnagyobb kihívást?

A kutatás során a több mint 120 eredeti nemzetgazdasági ágat 17 fő kategóriába vontuk össze. Ebből nagyon szépen kirajzolódik, hogy a mesterséges intelligencia nem egyformán okos minden területen. Vannak szektorok, ahol kifejezetten otthonosan mozog, máshol viszont teljesen sötétben tapogatózik.

Az AI kedvencei: Egészségügy és szolgáltatások

Az abszolút győztes az egészségügy. Meglepő lehet, de ezen a területen mindhárom modell kiemelkedően jól teljesített, 5.83-as átlagot hozva a 10-es skálán. A Gemini például egyetlen fantomcéget sem generált ebben a kategóriában, a hibaszázaléka nulla volt. Ennek valószínűleg az az oka, hogy a listán szereplő egészségügyi cégek nagyrészt jól ismert kórházak, klinikák és gyógyszerforgalmazók, amelyekről bőséges anyag áll rendelkezésre a modellek tanításához.

Szintén barátságos terepnek bizonyult az infokommunikáció és a közszolgáltatás, ideértve a vízműveket, hulladékkezelőket és városüzemeltetőket. Ezek a cégek gyakran monopolhelyzetben vannak, erős hivatalos weboldallal és rengeteg sajtóanyaggal rendelkeznek, így az AI felismeri és magabiztosan azonosítja őket.

A fekete lyuk: Faipar és a nehézipar

A legnagyobb kihívást egyértelműen a faipar jelenti. Itt a modellek teljesen elvéreznek: a Gemini a cégek 87 százalékáról, a DeepSeek 90 százalékáról adott súlyosan pontatlan leírást. Még a legügyesebb ChatGPT is 55 százalékos fantomcég-arányt hozott össze ezen a területen. Ez szorosan összefügg a korábban említett vidék-effektussal, hiszen ezek a cégek jellemzően közepes méretű vidéki szereplők, ritkán van reprezentatív vagy nemzetközi szintű webes jelenlétük.

Hasonlóan siralmas a helyzet a nehéziparban, mint a gépipar, járműipar, vegyipar vagy az építőipar. Ezekben a szektorokban figyeltük meg a generikus beszállító szindrómát. Ha egy magyar cég egy speciális alkatrészre specializálódott, mondjuk fékbetétet vagy kipufogócsövet gyárt, az AI ezt nem tudja megkülönböztetni, és egyszerűen egy általános autóipari beszállító sablont húz rá a vállalatra.

Nézzük meg a legjobban és legrosszabbul teljesítő szektorokat egy gyors áttekintő táblázatban a három modell átlaga alapján:

Iparág 3-LLM Judge átlag
(1-10 skála)
Legjobban teljesítő modell Legrosszabbul teljesítő modell
Egészségügy 5.83 Gemini (6.00) DeepSeek (5.60)
Infokommunikáció 5.11 ChatGPT (5.43) DeepSeek (4.71)
Közszolgáltatás 4.78 ChatGPT (5.56) DeepSeek (3.71)
Gépipar 4.11 ChatGPT (4.59) DeepSeek (3.86)
Vegyipar / Műanyagipar 4.02 ChatGPT (5.07) Gemini (3.43)
Faipar 3.65 ChatGPT (4.55) Gemini (3.16)

Érdekességek a középmezőnyből

A kereskedelem és az élelmiszeripar, ahová a minta legnagyobb része tartozik, a középmezőnyben végzett. Itt a ChatGPT még elfogadható, 5.2 és 5.3 körüli átlagot hozott, de a DeepSeek és a Gemini 60-80 százalékban félrevezető leírást adott. Ennek fő oka, hogy a modellek jellemzően a legismertebb márkákra fókuszálnak a kevésbé ismert regionális kereskedők tényleges profilja helyett.

A legnagyobb modell-specifikus eltérés a turizmusban mutatkozott meg. Míg a ChatGPT a második legjobb teljesítményét nyújtotta ebben a szektorban 5.74-es átlaggal, addig a Gemini 4.13-as pontszámmal már a kihívó kategóriák felé sodródott. Ebből arra lehet következtetni, hogy az OpenAI tanítóadataiban aránytalanul erős a magyar vendéglátó és szálloda szektor lefedettsége a többi modellhez képest.
Globálisan nézve amúgy nem sok kérdés maradt: a 17 vizsgált iparágból 15-ben a ChatGPT hozta a legmagasabb pontszámot. 

Schema.org: A technikai SEO tényleg számít?

Biztosan te is sokat hallod a fejlesztőktől vagy a SEO szakemberektől, hogy strukturált adatokra és Schema markupra van szükség a weboldalon. A kérdés az, hogy ettől a mesterséges intelligencia tényleg jobban megérti-e a cégedet? A kutatásunkban megnéztük, hogy a Schema (például az Organization vagy a LocalBusiness adatok) megléte érdemben javítja-e az AI találatait.

A JINA kinyerhetőség: Itt van a legnagyobb ugrás

A strukturált adatok megléte a legerősebb befolyásoló tényező abban, hogy egy gép egyáltalán el tudja-e olvasni az oldaladat. A schemával ellátott oldalakról a JINA.ai gyakorlatilag mindig, az esetek 98.6 százalékában képes volt tartalmat kinyerni. Ezzel szemben a schema nélküli cégeknél ez az arány jelentősen visszaesett.

Ez az eredmény teljesen logikus: a strukturált markup használata önmagában is azt feltételezi, hogy a weboldal modern, jól karbantartott és barátságos a botok számára. Ahol ez a technikai háttér hiányzik, ott a gépi adathalászok az esetek több mint negyedében teljesen vakon maradnak, és semmilyen érdemi adatot nem tudnak szerezni.

Pontosabb lesz tőle a ChatGPT?

Itt jön a kutatás egyik legnagyobb meglepetése. Azt várnánk, hogy ha az oldal gépi olvasásra van optimalizálva, az AI pontosabban fog válaszolni a cégről. A valóság viszont az, hogy a hatás statisztikailag a nullával egyenlő.

Nézzük meg a modellek átlagos Judge pontszámait (az 1-10-es pontossági skálán) a két csoportban:

Nyelvi modell Átlag pontszám (Schema=TRUE) Átlag pontszám (Schema=FALSE)
ChatGPT 5.06 5.06
DeepSeek 3.81 3.81
Gemini 4.15 4.00

Jól látható, hogy mindhárom modellnél az átlag gyakorlatilag teljesen megegyezik a schemával rendelkező és az azzal nem rendelkező cégek esetében. A Gemininél ugyan látható egy minimális, 0.15 pontos eltérés a strukturált adatokat használó oldalak javára, de ez az érték messze elmarad a statisztikai szignifikancia küszöbétől.

Mi a tanulság?

A schema jelenléte tehát nem javítja érdemben az LLM-ek válaszainak pontosságát. Ennek prózai oka van: a ChatGPT, a DeepSeek és a Gemini a kérdés pillanatában nem olvassa el a weboldaladat valós időben. Ők a korábban betanított adataikból merítenek. Ha a céged benne van ebben a hatalmas adathalmazban, akkor a modell "ismerni" fog. Ha nincs, akkor hiába pakolod tele holnap az oldaladat kódokkal, az AI nem fogja varázsütésre tudni, hogy mivel foglalkozol. A tanítóadat hiányát a technikai SEO önmagában nem oldja meg.

Miért érdemes mégis foglalkozni a strukturált adatokkal? Nem azért, mert a nyelvi modellek jobban látják tőle a céget, hanem azért, mert a schema egyértelmű jelzést ad arról, hogy az oldalad nyitott a gépi feldolgozásra. Ez gyakorlatilag azt garantálja, hogy amikor egy modern AI eszköz (például a Perplexity vagy egy egyedi keresőrendszer) menet közben próbálja leolvasni az oldaladat, akkor sikerrel fog járni, és képes lesz behúzni az információkat.

Multik kontra magyar cégek: A nagy ChatGPT paradoxon

A listán szereplő vállalatokat automatikus osztályozással két csoportra bontottuk: külföldi tulajdonú multinacionális leányvállalatokra és tisztán magyar tulajdonú cégekre. Az eredeti adatok alapján a top hazai cégek nagyjából 36 százaléka valójában multi, míg 64 százaléka magyar. Ha ezt a 902 értékelhető weboldallal rendelkező cégre vetítjük, akkor durván 332 multiról és 570 magyar vállalatról beszélünk. A multik weboldala egyébként valamivel stabilabb, mintegy 4.6 százalékpontnyi előnyük van a kinyerhetőség terén.

A fő kérdés persze az, hogy a nyelvi modellek jobban szerepelnek-e a nemzetközi hátterű cégeknél. Elsőre azt gondolnánk, hogy egy globális márkát sokkal pontosabban le tud írni az AI, mint egy vidéki magyar középvállalatot. Itt jött azonban a kutatás legellenintuitívabb eredménye.

A számok: Ki miben erős?

Nézzük meg, hogyan teljesítettek a modellek a két szegmensben. A táblázat az átlagos "Judge" pontszámot (1-10 skálán) és a súlyosan hibás, azaz fantomcég leírások arányát mutatja.

Nyelvi modell Multi cégek (Átlag pont / Fantomcég arány) Magyar cégek (Átlag pont / Fantomcég arány)
ChatGPT 4.76 / 53.4 % 5.23 / 40.9 %
Gemini 4.36 / 55.7 % 3.89 / 70.3 %
DeepSeek 4.07 / 67.4 % 3.66 / 80.8 %

A ChatGPT esetében a helyzet teljesen fordított az elvárthoz képest: jobban teljesít a magyar cégekre, mint a multikra. A hazai csoportban 5.23-as átlagot hozott, míg a multiknál csak 4.76-ot.

Miért pontozódik le a ChatGPT a multiknál?

Ennek a furcsa jelenségnek nagyon izgalmas technikai oka van. A multik esetében a letöltőrobot (JINA) gyakran a globális anyacég nemzetközi honlapját olvassa be, például egy hazai leányvállalat specifikus tartalma helyett az angol nyelvű központét. A ChatGPT eközben viszont pontosan tudja, hogy mondjuk egy multicég kecskeméti gyáráról van szó, és erről ír egy specifikus magyar összefoglalót.

Az értékelő algoritmus ezután összeveti a ChatGPT rendkívül pontos, lokális magyar cégleírását a weboldalról letöltött globális, általános tartalommal, és mivel a kettő eltér, alacsony pontszámot ad. Ez tehát nem a modell hibája, hanem a kiértékelési módszer sajátossága. A ChatGPT sokszor specifikusabb és okosabb, mint amit maga a scraper biztosítani tud. Ez azt is jelenti, hogy ha élesben használod a ChatGPT-t egy multinacionális leányvállalat kutatására, jó eséllyel sokkal pontosabb választ kapsz, mint amit ez a teszt sugall.

A DeepSeek és a Gemini globális "vaksága"

A DeepSeek és a Gemini ezzel szemben azt a mintát hozza, amit papírforma szerint vártunk: jobban teljesítenek a multikon. Ennek oka egyszerű. Az ő tudásuk nagyrészt a globális anyacégekre korlátozódik. Amikor a robot a nemzetközi tartalmat tölti le, a modellek pedig ugyanezt a globális tudást öntik ki magukból, a szöveges átfedés nagy lesz, így hamis megfelelőség jön létre.

Amikor viszont egy magyar tulajdonú középvállalatot kell bemutatniuk, amiről a nemzetközi betanítási adataikban szinte semmi sincs, mindkét modell elbukik. A magyar tulajdonú cégek esetében a DeepSeek 80.8 százalékos, a Gemini pedig 70.3 százalékos fantomcég-arányt produkál.

Az egyértelmű győztes ezen a téren is a ChatGPT. A hazai cégek több mint felét legalább 6 pontra értékelte a rendszer az ő válaszai alapján, miközben a Gemini csak 20 százalékot, a DeepSeek pedig alig 11 százalékot tudott ebbe az elfogadható tartományba tornázni. A tanulság világos: ha magyar tulajdonú cégeket akarsz kutatni, csak a ChatGPT jöhet szóba. A másik két modell 70-80 százalékos hibaaránya miatt komolyabb üzleti kutatásra jelenleg alkalmatlan ebben a szegmensben.

A halálos vakvágány: Mennyire bízhatunk a kapcsolati adatokban?

A felhasználói élmény szempontjából van egy különösen veszélyes helyzet, amit halálos vakvágánynak neveztünk el. Ez az, amikor a mesterséges intelligencia nem azt mondja, hogy egy adat "nem ismert", hanem magabiztosan megad egy konkrét, de teljesen hibás telefonszámot, e-mail címet vagy weboldalt. Te pedig gyanútlanul rácsörögsz a konkurenciára, vagy egy nem létező címre küldöd az árajánlat kérésedet.

A kutatás során a JINA által megerősített valós weboldal-adatokat tekintettük alapnak, és ehhez mértük a modellek válaszait. Lássuk a hibás adatok arányát, vagyis azt, hogy milyen eséllyel visz tévútra az AI a megerősített esetekben.

Nyelvi modell Hibás telefon Hibás e-mail Hibás weboldal Hibás irányítószám Átlagos hibaarány
ChatGPT 26.6 % 18.3 % 23.9 % 25.8 % 23.7 %
DeepSeek 42.4 % 28.3 % 40.3 % 40.6 % 37.9 %
Gemini 46.7 % 24.7 % 38.7 % 63.1 % 43.3 %

 Az adatokból tisztán látszik, hogy a ChatGPT a legkisebb kockázatú, de nagyjából még ő is minden negyedik kapcsolati adatnál téved. A Gemini és a DeepSeek viszont az esetek majdnem felében rossz adatot ad. A Gemininél különösen ijesztő a 63 százalék körüli irányítószám-hibaarány, ami azt jelenti, hogy a modell sokszor egy teljesen random városhoz rendelt kódot ír ki.

A legdöbbenetesebb lelet: A DeepSeek tankönyvi telefonszámai

Nyelvi modell Nyilvánvalóan kitalált sablon számok aránya
ChatGPT 2.8 %
Gemini 3.4 %
DeepSeek 44.9 %

A DeepSeek által kiírt telefonszámok közel fele szó szerint tankönyvi mintaérték. A leggyakrabban a "+36 1 234 5678" formátumot adta meg, nem kevesebb mint 103 alkalommal. Ez a gyakorlatban azt jelenti, hogy amikor a DeepSeek modelltől elkéred egy magyar cég telefonszámát, minden második alkalommal egy kitöltendő űrlap mintaértékét kapod meg valós adatként. Nem véletlen, hogy a modell tényleges telefonegyezési rátája alig 0.8 százalék lett a vizsgálatban.

Kitalált kapcsolatok a semmiből

Megnéztük azokat a cégeket is, ahol még a weboldal-letöltő robot sem talált semmilyen telefonszámot vagy e-mail címet az oldalon. Vajon mit lép erre az AI?

A ChatGPT a legbátrabb a hallucinálásban: a vak esetek mintegy 61 százalékában így is kitalál egy telefonszámot, és 70 százalékban egy e-mail címet. Bár ez kockázatosnak hangzik, összességében mégis ő a leghasználhatóbb. Amikor ugyanis konkrét adatot ad, az nagyjából 51 százalékos eséllyel helyes. Ezzel szemben a DeepSeek és a Gemini is kitalál adatokat a semmiből, de szinte soha nem találják el a valóságot.

Mi a helyzet a weboldalakkal?

A weboldal URL-eknél elvileg könnyebb dolga van a gépeknek, hiszen a domain név többnyire levezethető magából a cégnévből. Ennek ellenére a ChatGPT nagyjából minden negyedik cégnél rossz URL-re irányítja a felhasználót. A Gemini az esetek mintegy 39 százalékában, a DeepSeek pedig 40 százalékában ad meg hibás címet. Ezek a rossz linkek sokszor a konkurencia oldalára, elavult domainekre vagy teljesen nem létező oldalakra visznek, ami komoly üzleti kockázat.

Bevétel vs. láthatóság: A milliárdok nem védenek meg az AI hallucinációjától

Gondolhatnád, hogy ha a céged tíz- vagy százmilliárdos forgalmat bonyolít és a magyar gazdaság egyik motorja, akkor a mesterséges intelligencia is pontosan tudni fogja, kik vagytok. A kutatásunk egyik legkegyetlenebb tanulsága, hogy a bevétel önmagában egyáltalán nem véd meg a hallucinációtól.

Kigyűjtöttük a 20 leggyengébben és a 20 legjobban szereplő vállalatot a modellek átlagos pontszámai alapján, és összevetettük ezt az árbevételükkel. Az eredmény egy hatalmas paradoxonra világított rá.

A paradoxon: Amikor a gazdasági óriások elvéreznek

Nézzük a lista legvégét. A 20 leggyengébben teljesítő cég közül 15 milliárdos árbevételű, 11 pedig a 10 milliárd forintos határt is átlépi.

Például egy vidéki autóalkatrész-gyár 300 milliárd forintos forgalmat bonyolít és több mint ezer embert foglalkoztat, az LLM-ek mégis szinte semmit nem tudnak róla. Tradícionális magyar cégekkel szintén előfordul ugyanez.

Miért? Mert ezek a vállalatok zömmel B2B beszállítók, nincs körülöttük hatalmas PR-zaj, és sokszor saját magyar weboldaluk sincs, csak a globális anyacégük domainjét használják. Az AI számára a magyar GDP gerincét adó autóipari és gépipari beszállítói réteg gyakorlatilag láthatatlan.

A sztárok: A láthatóság diadala

A top 20-as listát ezzel szemben a B2C, azaz közvetlenül a fogyasztóknak értékesítő nagy márkák és a közszolgáltatók dominálják.

Ezek a cégek kiemelkedő, 7.0 és 8.0 közötti átlagpontszámokat kaptak az AI-tól. Nem feltétlenül azért, mert ők a legnagyobb árbevételűek a magyar piacon, hanem mert például:

  • Saját, aktív tartalommal rendelkező magyar nyelvű weboldaluk van.
  • A sajtó rendszeresen ír róluk.
  • Külön szócikkük van a Wikipédián.

A hivatalos jogi nevük zömmel megegyezik az ismert márkanevükkel.

Jellemző A 20 leggyengébben szereplő cég profilja A 20 legjobban szereplő cég profilja
Tipikus profil Autóipari beszállító külföldi anyacéggel, magyar weboldal nélkül. B2C kiskereskedelmi lánc vagy közszolgáltató, erős magyar webjelenléttel.
AI pontszám (Judge) 1.00 – 2.00 7.00 – 8.00
Domain Globális .com cím vagy teljesen hiányzó weboldal. Kifejezetten .hu domain, folyamatosan frissülő magyar tartalommal.
Sajtóvisszhang Zártkörű, fókuszált szakmai lapok. Tömegmédia, nagy hazai hírportálok.

A végső következtetés tehát az, hogy az LLM-ek a cégeket nem a valós gazdasági súlyuk, hanem a digitális közismertségük arányában térképezik fel. Ez jó hír a kis cégeknek, hiszen egy erős digitális stratégiával láthatóvá válhatnak, de komoly figyelmeztetés a magyar ipar nagyjainak: a PR-deficit az AI-korszakban súlyos üzleti hátránnyá válhat.

A mesterséges szimpátia index: Kiket szeret az AI?

Tudtad, hogy a mesterséges intelligenciának is vannak kedvencei? A kutatásunkban a modelleknek egy 0-tól 5-ig terjedő skálán kellett értékelniük, mennyire ajánlanák az adott vállalatot. Az AI átlagosan 3.97-re értékelte a magyar top cégeket, ami alapvetően jóindulatú hozzáállást mutat. Azonban a felszín alatt óriási különbségek vannak abban, hogy melyik modell hogyan osztogatja a pontokat.

A modellek eltérő személyisége

A három vizsgált nyelvi modell teljesen más logikát követ, amikor "szimpátiáról" van szó.

Nyelvi modell Átlagos ajánlás (0-5) 5-ös értékelés aránya 0-s értékelés aránya
ChatGPT 4.61 76.1 % 2.7 %
DeepSeek 3.84 18.1 % 0.0 %
Gemini 3.46 11.9 % 13.7 %

A számokból jól látszik, hogy a ChatGPT mindenkire lelkesedik, a cégek több mint háromnegyedének fenntartás nélkül megadja a maximális pontszámot. A DeepSeek képviseli az óvatos középutat: ritkán ad nagyon rosszat, de az 5-össel is fukarkodik. A Gemini viszont egy kifejezetten szigorú bíró, a "nem ajánlanám" (0-s) kategória szinte kizárólag az ő értékeléseiből adódik össze.

A hype hatás: Magas ajánlás nulla tudással

Kik kerültek a leginkább szeretett cégek top 15-ös listájára? Szinte kivétel nélkül globális márkák magyar leányvállalatai. Az érdekesség az, hogy az AI a márkanevet ismeri, és a jól hangzó 5-ös választ automatikusan odaadja nekik, miközben a konkrét magyar leányvállalat működéséről sokszor szinte semmit nem tud.

A rejtett gyöngyszemek és az etikai szűrő

A skála másik végén a "bűntetett" cégek listáját találjuk, amelyeket a modellek 1-es vagy 2-es átlaggal sújtottak. Itt szinte csak vidéki KKV-k szerepelnek. Az AI nem utálja őket, egyszerűen csak nem tud róluk semmit, és ezt - különösen a Gemini - egy alacsony ajánlási pontszámmal fejezi ki.
Van egy másik kategória is, amikor az AI jól ismeri a céget, mégsem hajlandó ajánlani. Erre a legjobb példa egy dohányipari cég. A modellek 4.7-es Judge pontszámmal jól le tudják írni a vállalatot, de az ajánlás csak 2.50. Ez nem tévedés, hanem a beépített etikai szűrő működése a dohányiparral szemben.

Az AI szimpátia ökölszabályai

Az adatokból nagyon élesen kirajzolódik, hogy az AI milyen mintázatok alapján osztja a bizalmat. Összegyűjtöttük ezt egy egyszerű táblázatba:

Ha a cég... Akkor az AI reakciója...
Globális márka magyar leányvállalata 5-ös ajánlás, hiába alacsony a tényleges tudás (hype csapda).
Jól ismert budapesti B2C szereplő 5-ös ajánlás és magas tényleges tudás.
Vidéki mezőgazdasági vagy kereskedelmi KKV 1-3 közötti ajánlás, akkor is, ha milliárdos forgalmú.
Dohány-, fegyver- vagy szerencsejáték ipar Alacsony ajánlás etikai okokból, akár magas tudás mellett is.

A gyakorlati veszély hatalmas: ha egy döntéshozó megkérdezi az AI-t, hogy melyik magyar céget ajánlja partnernek, a rendszer simán átlépi a stabil, nagyforgalmú vidéki vállalatokat. Helyettük lelkesen javasol majd olyan multikat, amelyekről a valóságban fogalma sincs. Ez már nem egyszerű hallucináció, hanem rendszerszintű preferenciatorzítás.

A skizofrén AI: Amikor három gép háromféle valóságot lát

A kutatás egyik legmegdöbbentőbb felismerése, hogy a három modell ritkán ért egyet ugyanarról a magyar cégről. Ha egy döntéshozó egymás mellé teszi a ChatGPT, a DeepSeek és a Gemini válaszait, sokszor úgy érezheti, hogy párhuzamos univerzumokba került. Ha a pontossági értékeléseket nézzük, az esetek 60 százalékában a három AI minőségileg eltérő választ ad. Nem csupán apró nüanszokról van szó, hanem komoly minőségi szakadékokról.

Nézzük meg, hogyan oszlanak meg a modellek közötti értékelési (Judge) különbségek:

Értékelési eltérés a 3 modell között Cégek aránya
0-1 pont (Gyakorlati egyetértés) 39.3 %
2 pont (Mérsékelt eltérés) 21.7 %
3-4 pont (Komoly eltérés) 29.5 %
5 vagy több pont (Teljes skizofrénia) 9.5 %

 A teljes skizofrénia kategóriája azt jelenti, hogy 9 pontnyi különbség is előfordult a modellek értékelése között ugyanarra a vállalatra. 

Keresd a weboldalt, ha tudod

A helyzet a weboldalak konzisztenciája terén a legdrámaibb. Itt már nem szubjektív leírásokról beszélünk, hanem egy konkrét, tényszerű adatról.

Weboldal egyezés a modellek között Cégek aránya
Legalább 1 modell eltérő linket ad 80.8 %
Mind a 3 modell teljesen más linket ad 49.9 %

Minden második cégnél a három AI három teljesen különböző domaint adott meg. Az egyik szerint a cég a valami.hu címen található, a másik egy .com végződést generált, a harmadik pedig egy teljesen más nevet talált ki. Mindössze az esetek 19.2 százalékában fordult elő, hogy mindhárom rendszer ugyanazt a helyes címet dobta ki.

A tartalom vizsgálata is hasonlóan siralmas eredményt hozott. Egyetlen olyan cég sincs a vizsgált listán, ahol a három modell leírása legalább 35 százalékban átfedne egymással. Ez azt bizonyítja, hogy az algoritmusok nem ugyanazt a cégprofilt mondják el más szavakkal, hanem teljesen más tényeket emelnek ki a semmiből.

Három gép, három személyiség

A konzisztencia hiánya mögött valójában három markánsan más beépített viselkedésminta, mondhatni "személyiség" áll.

  • A magabiztos mesemondó: A ChatGPT stílusa magabiztos, úgy tesz, mintha mindent tudna. Képes konfabulálni, azaz optimistán kitalál részleteket olyankor is, amikor valójában nincs adata. Az ajánlásoknál is nagyon bőkezű, 76 százalékban maximális pontot ad a cégeknek.
  • Az óvatos középutas: A DeepSeek igyekszik elkerülni a szélsőségeket. Szigorúbb az értékeléseknél, ritkán ad kiemelkedően jót vagy végzetesen rosszat. Ugyanakkor ő az, aki előszeretettel tölti ki az űrt tankönyvi sablonokkal, ha nincs valódi adata.
  • A szigorú elutasító: A Gemini kifejezetten távolságtartó. Ha bizonytalan, sokkal hamarabb visszahúzódik, és szinte megtagadja a normális választ, amit a magas, 13.7 százalékos nulla pontos ajánlási aránya is jól mutat.

Az AI által kiadott céginformáció tehát jelenleg nem egy objektív, megbízható tudás, hanem egy modellfüggő előadás. Hogy egy felhasználó éppen melyik "mesét" hallja, az kizárólag attól függ, hogy melyik modellt használja. 

A végső ítélet: Mennyire gyenge az AI teljesítménye a valóságban?

Térjünk rá a legfontosabb kérdésre. Ha összegezzük a 902 valid, JINA által megerősített weboldallal rendelkező cég adatait, mekkora a valós hibaarány?

A fő és egyben legszomorúbb szám a 74.3 százalék. A vizsgált cégek közel háromnegyedénél a három modell átlagos válasza az 1-től 10-ig terjedő skálán 5-ös vagy annál gyengébb pontszámot ért el. Ez a gyakorlatban azt jelenti, hogy a modellek által generált céginformáció legalább fele pontatlan, félrevezető vagy teljesen kitalált volt.

Ha külön-külön nézzük meg, hogy a modellek mekkora arányban buktak el ezen az 5 pontos, közepes lécen, az alábbiakat látjuk:

Nyelvi modell Gyengén teljesítő cégek aránya (5 vagy annál kevesebb pont)
ChatGPT 53.7 %
Gemini 73.9 %
DeepSeek 85.2 %

Az adatokból kiderül, hogy még a mezőny magasan legjobbja, a ChatGPT is a cégek több mint felénél csak a válaszok felét vagy annál is kevesebbet adja meg helyesen. Ráadásul tíz magyar cégből kilencnél (92.9 százalék) legalább az egyik AI gyengén teljesít, és minden harmadik vállalatnál mind a három modell együttesen elvérzik. A minőségi eloszlás is beszédes: a válaszok 75.1 százaléka a nagyon gyenge és a közepes (3-5 pontos) tartományban rekedt meg.

A kutatás legfontosabb, üzletileg is húsbavágó üzenete tehát a következő: a magyar top ezer vállalat kétharmadánál, háromnegyedénél az LLM-ek válaszai részben vagy egészben kitalált információt tartalmaznak.

A mesterséges intelligencia fantasztikus eszköz, de ha a cégednek nincs erős, gépek által is jól olvasható digitális lábnyoma, a jelenlegi modellek kíméletlenül be fognak árazni, vagy rosszabb esetben teljesen félretájékoztatják a potenciális partnereidet.

Ha az AI nem látja a weboldalad, az ügyfeleid sem fogják.

blog

Gyakran ismételt kérdések

Mert a ChatGPT, a Gemini és a DeepSeek nem valós időben olvassa a weboldaladat, a betanítási adataikból dolgoznak, amelyek egy korábbi időpillanatot tükröznek. Ha a céged nem szerepelt kellő mélységben és gyakorisággal ezekben a forrásokban (sajtócikkek, szakmai anyagok, Wikipédia-szócikk stb.), a modell egyszerűen nem tud rólad eleget. Egy meglévő weboldal tehát szükséges, de önmagában nem elégséges feltétel az AI-láthatósághoz.

A kutatás meglepő eredménye szerint a schema jelenléte érdemben nem javítja az LLM-ek válaszainak pontosságát, a Judge pontszámok szinte teljesen megegyeztek a schemával rendelkező és az azzal nem rendelkező cégeknél. A strukturált adatok azonban más szempontból továbbra is fontosak: garantálják, hogy modern, valós idejű AI-eszközök (pl. Perplexity) képesek legyenek feldolgozni az oldalt, ha éppen azt böngészik.

A három vizsgált modell közül a ChatGPT teljesített a legjobban: 17 iparágból 15-ben ez hozta a legmagasabb pontszámot, vidéki cégeknél is messze a legkiegyensúlyozottabb maradt, és a kapcsolati adatoknál is a legkisebb hibaarányt produkálta. Ez sem jelent garanciát, a cégek több mint felénél a ChatGPT is gyengén teljesített, de komoly üzleti döntéseknél egyértelműen ezt érdemes előnyben részesíteni a másik két modellel szemben.

A kutatás alapján a legjobban teljesítő vállalatok jellemzően négy dologban erősek: saját, rendszeresen frissített magyar nyelvű weboldaluk van, a sajtó rendszeresen ír róluk, szerepelnek a Wikipédián, és a hivatalos nevük megegyezik az ismert márkanevükkel. Az AI-láthatóság tehát nem egyszeri technikai feladat, hanem folyamatos digitális jelenlét és tartalomstratégia kérdése, pontosan az, amiben egy tapasztalt digitális ügynökség a legtöbbet tud segíteni.

Ajánlott cikkek

Mutass többet!