Proč umělá inteligence stále vymýšlí stejné smyšlené jméno? Vědecké vysvětlení fenomé

Výzkum odhalil fascinující záhadu - populární AI systémy neustále generují stejná fiktivní jména. Příčinou není náhoda, ale specifická statistická vlastnost jejich tréninkových dat.

Kdo pracuje s moderními AI asistenty jako ChatGPT nebo jinými chatboty, možná si všiml zvláštního jevu: když je požádáte o vymyšlené jméno či postavu, systém se znovu a znovu vrací k těm stejným kombinacím. Není to chyba, ale fascinující důsledek toho, jak AI modely ve skutečnosti fungují.

Zatímco používáme AI každodenně, málokdo chápeme mechanismus, který stojí za těmito konzistentními volbami. Výzkumníci nyní odhalili, že jde o čistě statistické chování. Když je model trénován na obrovských souborech dat obsahujících miliardy textů, postupně se učí pravděpodobnostní vztahy mezi slovy. Pokud se určité jméno nebo jejich kombinace v tréninkovacích datech vyskytuje častěji než jiné, model je při generování nového textu preferuje - jednoduše proto, že jsou „pravděpodobnější".

Představte si to jako piktogram lidské řeči: když se něco na internetu vyskytuje nejčastěji, AI to považuje za nejbezpečnější a nejlogičtější volbu. Konkrétně se jedná o fenoménu, který odborníci nazývají mode collapse - když neuronová síť místo vytváření různorodého obsahu upadá do opakování stejných výstupů. V praktickém smyslu to znamená, že si AI vytvořila jakousi „preferenční listinu" jmen, která jsou podle jejího trénování nejčastějším výskytem.

Zajímavým pozorováním je, že tato preferovaná jména nejsou nutně ta nejběžnější v reálném životě. Jde spíše o specifický mix: jména, která se často vyskytují v příbězích, filmech, knihách a diskuzích na internetu. To vysvětluje, proč se AI například vrací k určitým „hollywoodským" jménům či kombinacím, které vidíme v mediálních dílech.

Pro vývojáře a uživatele to má praktické důsledky. Chcete-li dosáhnout autentičtějších a rozmanitějších výstupů, existují techniky jako je úprava takzvaného temperature parametru - to do určité míry zmírňuje tendenci AI vybírat si pouze nejpravděpodobnější možnosti. Zvýšením této hodnoty můžete dosáhnout kreativnějších, i když někdy nesmysluplnějších odpovědí.

Toto zjištění je důležitým krokem v chápání vnitřního fungování umělé inteligence a zároveň připomíná nám, jak moc jsou dnešní AI systémy vázány na data, na kterých byly trénovány. Nejde o vědomé rozhodování nebo cílené chování, ale o matematickou realitu probabilistických modelů, které naučené se chovat jako lidé - s veškerými jejich předsudky i omezením.

Zdroj: Forbes Innovation

Rubrika: Business