Meta uwalnia pierwsze dwa duże modele wielokrotnie głosowe „LAMA-4-herdów” (dla tekstu, wideo, obrazów i dźwięku) W poście na blogu Zwany. Scout LLAMA 4 obejmuje 17 miliardów działań, o łącznej wartości 100,9 miliarda parametrów, zapewniającą okna kontekstowe 16 ekspertów i 10 milionów tokenów. Jest to najlepszy model wielomodelowy na świecie, silniejszy niż wszystkie modele wielbłądów z poprzedniej generacji i nadaje się do pojedynczego GPU H100 NVIDIA. Mija głośno Yuan W oparciu o wiele testów porównawczych, lepsze wyniki niż Gemma 3, Gemini 2.0 Flash-Lite i Mistral 3.1.
Llama 4 Maverick zapewnia również 17 miliardów aktywnych parametrów, ale ma łącznie 400 miliardów parametrów i okno kontekstowe 128 ekspertów i 1 milion tokenów. LLAMA 4 Maverick przewyższa GPT-4O i GEMINI 2.0 Flash i zapewnia porównywalne wyniki wnioskowania i kodowania Meta poprzez wnioskowanie i kodowanie.
Trzeci model, Llama 4 Beemoth, jest obecnie na etapie podglądu i otrzymał 288 miliardów działań z Meta, z w sumie 2 bilionów parametrów zwanych „najmądrzejszym modelem nauczyciela destylacji” – Models Scout i Maverick, można pobrać z Llama.com i Llama.com i od twarzy żebrowania. (UBI)
(TagStotranslate) Oprogramowanie
Source link