Følgende artikel hjælper dig med: OpenAI frigiver en kraftfuld ChatGPT AI chatbot
ChatGPT, i modsætning til GPT-3, er en model, der er blevet omhyggeligt lært at føre en interaktiv chat og opretholde strømmen af diskursen. Den model, der blev brugt til at træne ChatGPT, som blev trænet i begyndelsen af 2022, er fra GPT-3.5 serie.
Dialogformatet gør det muligt for ChatGPT at svare på yderligere forespørgsler, anerkende dens fejl, tilbagevise falske antagelser og afvise irrelevante anmodninger. Chatbotten er meget intelligent og kan oprette breve, komme med sjove vittigheder og svare på henvendelser.

Ligesom InstructGPT brugte OpenAI Reinforcement Learning from Human Feedback (RLHF) til at træne denne model med et par mindre variationer i dataindsamlingsarrangementet. OpenAI bruger overvåget finjustering til at træne en indledende model ved at lade menneskelige AI-trænere fungere som både brugeren og AI-assistenten i chats. Det gav underviserne adgang til eksempler på skriveanbefalinger for at hjælpe dem med at skabe deres svar.
Mange mennesker sidder fast i en forbandet-så-gal ChatGPT-løkke 🔁
— Elon Musk (@elonmusk) 1. december 2022
Nogle eksempler på dialog er vist på billederne.


Det var nødvendigt at indsamle sammenligningsdata, som bestod af to eller flere modelsvar klassificeret efter kvalitet, for at udvikle en belønningsmodel for forstærkende læring. Udviklere optog diskussioner, som AI-trænere førte med chatbot’en for at indsamle disse oplysninger. Skaberne valgte tilfældigt en modelskrevet erklæring, prøvede en række potentielle konklusioner og bad AI-trænere om at rangere dem. Den kan justere modellen ved hjælp af proksimal politikoptimering ved at bruge disse belønningsmodeller.

Tal med denne chatbot lige her. Serverne er dog fulde i øjeblikket.
Læs mere om GPT-3: