Følgende artikel hjælper dig med: Meta udgiver LLaMA: A State-of-the-Art Foundational Language Model for AI Research

Meta har frigivet en ny stor sprogmodel kaldet LLaMA (Large Language Model Meta AI) til støtte for AI-forskere. Modellen vil sætte flere i forskningsmiljøet i stand til at studere sprogmodeller og give lettere adgang til dette vigtige felt.
LLaMA fås i flere størrelser (7B, 13B, 33B og 65B parametre). Ved at træne mindre fundamentmodeller som LLaMA kan forskere bruge mindre computerkraft og ressourcer til at teste nye tilgange og udforske nye use cases. Meta skrev, at LLaMA er ideel til at finjustere en række opgaver, da den træner på et stort sæt umærkede data. Meta hævder at være forpligtet til ansvarlig AI-praksis og deler en LLAMA-model kort der beskriver, hvordan modellen blev bygget.
For at udvikle LLaMA valgte Meta tekster fra de 20 mest udbredte sprog med fokus på sprog, der bruger latinske og kyrilliske alfabeter. Denne store sprogmodel genererer tekst ved at tage en sekvens af ord som input og forudsige det næste ord rekursivt, svarende til andre modeller i denne kategori.
“Som en fundamentmodel er LLaMA designet til at være alsidig og kan anvendes til mange forskellige use cases, kontra en finjusteret model, der er designet til en specifik opgave. Ved at dele koden til LLaMA kan andre forskere nemmere teste nye tilgange til at begrænse eller eliminere disse problemer i store sprogmodeller.”
Meta skrev.
Virksomheden indrømmer, at det stadig er nødt til at håndtere risikoen for bias, giftige kommentarer og hallucinationer i store sprogmodeller, herunder LLaMA.
Meta frigiver modellen under en ikke-kommerciel licens fokuseret på forskningsbrugssager “for at bevare integriteten og forhindre misbrug.” Personer og organisationer, der søger adgang til modellen, vil blive vurderet fra sag til sag. Støtteberettigede parter omfatter akademiske forskere, regerings- og civilsamfundsorganisationer og industriforskningslaboratorier over hele verden.
Du kan læse et helt papir om LLaMA her. Hvis du er berettiget, kan du også ansøge at teste sprogmodellen.
Læs mere: