GPT-4 præsterer bedre end den gennemsnitlige person på en test af logisk ræsonnement, undersøgelsespåstande

Følgende artikel hjælper dig med: GPT-4 præsterer bedre end den gennemsnitlige person på en test af logisk ræsonnement, undersøgelsespåstande

Ilya Pestov, en velkendt russisk AI-forsker, sendte en besked på hans Telegram kanal om hvor godt det neurale netværk håndterer logiske tests. Ilya skabte engang @psylogicbot logisk tænkning test, som blev taget af cirka 12 tusinde mennesker. Du kan tjekke statistikken efter at have taget testen.

@Midjourney / Abdalla(hamoXX)#7378

Han skrev, at ChatGPT også blev testet, men resultaterne lod meget tilbage at ønske. Han fik for nylig adgang til den smartere og mere opdaterede version af GPT-modellen – GPT-4 – og besluttede at tjekke, om den ville få lignende resultater.

Forsøget blev udført som følger: Forskeren lavede en tekst, der beskrev den opgave, som det neurale netværk skulle udføre. Forskeren postede alt i kommentarerne: Spørgsmålet var: “Jeg vil give dig et logisk puslespil og fire mulige svar; vælg det ene rigtige svar blandt dem.” Derefter oprettede Ilya en ny dialog for hvert testspørgsmål og sendte GPT-4-beskrivelsen sammen med spørgsmålsteksten. Botten modtog svaret uden nogen rettelser eller hints.

Der er 25 spørgsmål i alt, hvor der gives et point for hvert korrekt svar. Ifølge statistikker scorer brugerne 13,6 point i gennemsnit, med en median på højst 14. Hvor meget fik GPT-4? Det lykkedes at få 16 point!

Endnu en gang overgår det neurale netværk den gennemsnitlige person i logisk ræsonnement. Det vil sige, at den overgår flertallet af de testede. Og dette er efter at have taget højde for:

  • Testen blev gennemført på russisk, mens modellen er finjusteret til engelsk;
  • GPT-4, som bruges i chat, er mindre intelligent end sin forgænger (en bivirkning af etiske restriktioner).
🔥 Anbefalede:  10 największych kryptowalut, które według oczekiwań zapewnią wysokie zwroty w 2023 r

Separat vil vi poste et fremragende svar på spørgsmål 22, hvor neuronen brugte førsteordens logik til at udlede resultatet matematisk. Selvom dette blev dækket i anvendt matematik, er det ikke et universitetskursus, alle tager.

Separat vil vi poste et fremragende svar på spørgsmål 22, hvor neuronen brugte førsteordens logik til at udlede resultatet matematisk.  Vi vidste også alle, hvordan man gjorde det i anvendt matematik, men det var et ekstra kursus på universitetet.

Tror du stadig på, at neurale netværk er et modefænomen? Prøv først at overgå GPT-4 (og del dine resultater i kommentarerne).

Læs mere om AI: