Najboljših 5 ta teden

Sorodni članki

CriticGPT: umetna inteligenca, ki preverja umetno inteligenco

OpenAI je nedavno predstavil novo inovativno orodje, imenovano CriticGPT.

CriticGPT je orodje, namenjeno analiziranju kod in in pregledu delovanja njihove družine modelov GPT-4. Opozarja na morebitne napake, ki bi sicer lahko ostale neopažene.

Generativni modeli umetne inteligence, kot je GPT-4, se učijo na ogromnih količinah podatkov, nato pa gredo skozi proces izboljšave, imenovan Reinforcement Learning from Human Feedback (RLHF).

CriticGPT, usposobljen z RLHF, kritizira vnose z namernimi napakami GPT, ki jih vstavijo trenerji AI. Raziskovalci so CriticGPT usposobili za nabor vzorcev kod z namerno vstavljenimi napakami in ga naučili prepoznati ter označiti različne napake pri kodiranju. V podjetju OpenAI so ugotovili, da ko ljudje dobijo pomoč od CriticGPT pri pregledu kode ChatGPT, so v 60% primerov boljši od tistih brez pomoči.

Kljub temu pa ima tako kot vsi modeli AI tudi ta model omejitve. Model je bil učen na razmeroma kratkih odgovorih ChatGPT, ki ga morda ne bodo v celoti pripravili na ocenjevanje daljših, bolj zapletenih nalog. Poleg tega CriticGPT zmanjša “halucinacije”, vendar jih ne odpravi v celoti, in trenerji lahko še vedno delajo napake na podlagi teh lažnih rezultatov.

Raziskovalci priznavajo tudi, da je CriticGPT najbolj učinkovit pri prepoznavanju napak, ki jih je mogoče natančno določiti na eni določeni lokaciji znotraj kode, tudi če so dejanske napake razpršene po številnih delih odgovora. To predstavlja izziv za prihodnje različice modela.

Najbolj popularno