Az OpenAI azt állítja, bizonyítékot talált arra, hogy a DeepSeek nevű kínai AI-start-up az amerikai cég saját, szabadalmaztatott modelljeit használta fel a nyílt forráskódú mesterséges intelligenciája képzéséhez, miközben egyre nagyobb az aggodalom a szellemi tulajdon lehetséges megsértése miatt.
A San Franciscó-i székhelyű ChatGPT gyártója a Financial Timesnak azt mondta, bizonyítékot látott a „desztillációra”, ami a gyanú szerint a DeepSeektől származik. A technikát a fejlesztők arra használják, hogy a kisebb modellek jobb teljesítményt érjenek el a nagyobb, jobb képességű modellek kimeneteinek felhasználásával, így sokkal alacsonyabb költséggel érhetnek el hasonló eredményeket bizonyos feladatokban.
A desztilláció bevett gyakorlat az iparágban, de az aggodalom az volt, hogy a DeepSeek esetleg azért csinálja, hogy saját rivális modelljét építse, ami sérti az OpenAI szolgáltatási feltételeit. „A probléma az, amikor [kiveszed a platformból, és] azért csinálod, hogy saját modellt hozz létre a saját céljaidra” – mondta egy, az OpenAI-hoz közel álló személy.
Az OpenAI elutasította a további kommentálást vagy a bizonyítékok részletezését. A szolgáltatási feltételei szerint a felhasználók nem „másolhatják” a szolgáltatásait, és nem használhatják a kimenetet „az OpenAI-jal versengő modellek fejlesztésére”.
A DeepSeek R1 érvelési modellje meglepte a piacokat, a befektetőket és a szilícium-völgyi technológiai vállalatokat, mivel a modell magas helyezéseket, a vezető amerikai modellekhez hasonló eredményeket ért el a teszteken.
Az Nvidia részvényei 17 százalékkal estek hétfőn, 589 milliárd dollárt letörölve piaci értékéből, mivel attól tartanak, hogy a drága AI-hardverekbe való nagy beruházásokra talán nincs is szükség. Kedden más technológiai részvényekkel együtt 9 százalékkal erősödtek.
A DeepSeek érvelni tudó algoritmusát ugyanis állítólag 6 millió dollárból fejlesztették, és ha tényleg ennyiből össze lehet ezt hozni, az súlyos kérdéseket vet fel a 100 milliárd dolláros AI-fejlesztési programokkal kapcsolatban is. A DeepSeek az indulása után nem sokkal közölte, hogy máris súlyos támadás érte őket. Donald Trump szerint az olcsó kínai AI-modell berobbanása figyelmeztető jel az amerikai cégeknek.
Az OpenAI és partnere, a Microsoft tavaly olyan, a DeepSeekének vélt fiókokat vizsgált meg, amik az OpenAI alkalmazásprogramozási felületét (API) használták, és blokkolták a hozzáférésüket a szolgáltatási feltételeket sértő desztilláció gyanújával – mondta a Financial Timesnak egy másik, közvetlen ismeretekkel rendelkező forrás. A Microsoft nem kívánt nyilatkozni, az OpenAI pedig nem reagált a részletekkel kapcsolatos megkeresésre. A DeepSeek sem válaszolt, bár Kínában épp holdújév van.
Korábban Trump AI- és kriptoügyi elnök megbízottja, David Sacks azt mondta, „lehetséges”, hogy szellemi tulajdonjogok ellopására került sor. „A mesterséges intelligenciában létezik egy technika, amit desztillációnak hívnak… amikor az egyik modell egy másik modellből tanul [és] mintegy kiszívja a tudást az anyamodellből” – mondta a Fox Newsnak Sacks, aki szerint „komoly bizonyítékok vannak arra, hogy a DeepSeek az OpenAI modelljeiből desztillálta le a tudást, és nem hiszem, hogy az OpenAI nagyon örül ennek”, bár bizonyítékot ő sem adott.
A DeepSeek azt állítja, csak 2048 Nvidia H800-as grafikus kártyát használt, és 5,6 millió dollárt költött a 671 milliárd paramétert tartalmazó V3-as modelljének betanítására, ami töredéke annak, amit az OpenAI és a Google költött hasonló méretű modellek betanítására. Egyes szakértők szerint a modell olyan válaszokat generált, amik arra utalnak, hogy az OpenAI GPT-4 kimenetein képezték ki, ami sérti a GPT-4 szolgáltatási feltételeit.
Ipari bennfentesek szerint a kínai és az amerikai AI-laboratóriumokban bevett gyakorlat, hogy az OpenAI-hoz hasonló cégek kimeneteit használják fel, mivel ezek a cégek embereket alkalmaznak, hogy megtanítsák a modelljeiknek, hogyan kell emberibbnek tűnő válaszokat produkálniuk. A bennfentesek szerint ez drága és munkaigényes, és a kisebb szereplők gyakran átveszik ezt a munkát.
„Nagyon gyakori gyakorlat, hogy a start-upok és az akadémikusok az emberhez igazodó kereskedelmi LLM-ek [nagy nyelvi modellek], például a ChatGPT kimeneteit használják fel egy másik modell betanításához” – mondta Ritwik Gupta, a Kaliforniai Egyetem (Berkeley) mesterséges intelligenciával foglalkozó doktorjelöltje. „Ez azt jelenti, hogy ezt az emberi visszajelzési lépést ingyen kapjuk. Számomra nem meglepő, hogy a DeepSeek állítólag ugyanezt tette. Ha így lenne, akkor nehéz lehet pontosan megállítani ezt a gyakorlatot” – mondta.
A gyakorlat rávilágít arra, milyen nehézségekbe ütköznek azok a cégek, amik meg akarják védeni a technikai előnyeiket. „Tudjuk, hogy a kínai székhelyű vállalatok és mások is folyamatosan próbálják átvenni a vezető amerikai AI-vállalatok modelljeit” – közölte az OpenAI, hozzátéve: „A szellemi tulajdonunk védelme érdekében ellenintézkedéseket teszünk, beleértve egy gondos folyamatot, amivel kiválasztjuk, hogy mely határképességeket vesszük fel a kiadott modellekbe, és úgy véljük… kritikusan fontos, hogy szorosan együttműködjünk az amerikai kormánnyal, hogy a legjobban megvédjük a legképzettebb modelleket az ellenfelek és a versenytársak azon törekvéseitől, hogy elvegyék az amerikai technológiát.”
Az ügy azért is érdekes, mert az OpenAI-t újságok és más tartalomkészítők (többek között a New York Times és híres szerzők) azzal vádolják, hogy a modelljeit engedély nélkül képezte ki az ő cikkeiken és könyveiken, emiatt be is perelték a céget. De egyéb aggályok is vannak a mesterséges intelligencia használatával kapcsolatban.