Ismerős az az érzés, amikor egy bonyolult kérdést teszel fel egy AI csevegőnek, és teljesen mellé lő a válasz, mert félreértette, mit akarsz? Az NVIDIA kutatói most olyan áttörést értek el, ami ezt a hibát végleg megszüntetheti.
Mi a baj a mai AI keresőkkel?
A legtöbb mai AI rendszer valójában csak okos kulcsszó-kereső. A kérdésedet számokká alakítja (embeddingekké hívják), aztán hasonló számú dokumentumokat keres. Olyan ez, mint egy könyvtáros, aki csak a szóismétléseket számolja.
Egyszerű feladatoknál beválik, például "Mi Franciaország fővárosa?". De ha azt kérdezed: "Mennyibe kerülne Tesla összes szupertöltője dupla áramár mellett?", már megbotlik. Itt kell:
- Értenie a költségszámítást, energiát és feltételezést.
- Számológépet használnia.
- Több forrásból húznia adatot.
- Logikusan végiggondolnia a lépéseket.
A hagyományos keresés ezt nem bírja.
Itt a "gondolkodó" kereső
Az NVIDIA megoldása egyszerű zsenialitás: adjunk az AI-nak olyan agyat, ami lépésről lépésre gondolkodik. Ők "agentic retrieval"-nek hívják, én stratégiai keresőnek.
Így működik a gyakorlatban:
1. Lépés: Kérdés-elemzés
Nem rohan egyből keresni. Először megáll: "Ez egyszerű vagy összetett? Kell-e speciális eszköz?"
2. Lépés: Legjobb stratégia választása
Attól függően dönt: mély technikai szövegek? Széles webes keresés, aztán szűkítés? Mint szakértők csapata különböző problémákra.
3. Lépés: Többlépcsős megoldás
Bonyolultnál darabokra bontja. Először Tesla energiafogyasztása, aztán áramár-trendek, végül számítás.
Lenyűgöző eredmények
A tesztek egyértelműek: 40-60%-kal veri a hagyományosat minden benchmarkon. Ez nem kis lépés – ez a különbség a hasznos és a idegesítő válasz között.
Különösen jó nyílt modellekkel: Llama-szerűekkel 95%-os GPT-4-szintet éri el, töredék áron.
Hátrányok (mert semmi sem tökéletes)
Lassabb 20-30%-kal. Milliszekundumok, de észrevehető. bonyolultabb futtatni, több számítási erő kell. Szerintem viszont: komplex kérdésnél jobb várni 100 milliszekundumot a jó válaszért, mint gyors hibáért.
Mit jelent ez neked?
Ez nem csak papírforma – NVIDIA már elérhetővé tette fejlesztőknek. Képzeld el:
- Ügyfélszolgáli botok, amik értik a bonyolultat.
- Kutatási asszisztensek többlépcsős elemzésekhez.
- Oktató AI-k, amik lépésről lépésre bontanak.
Korai verziók már kipróbálhatók Hugging Face-en. Ez most történik.
Merre tovább? Az én gondolataim
Ez alapvető változás: a mintafelismerésből a valódi gondolkodás felé. Mint a sima számológépből okostelefonba.
Izgalmas, ha több AI-ügynök dolgozik össze, mint szakértői csapat. Öt év múlva a mai keresők olyanok lesznek, mint a tárcsás internet: működik, de primitív.
Forrás: https://huggingface.co/blog/nvidia/nemo-retriever-agentic-retrieval