На цих вихідних компанія Meta випустила дві нові моделі штучного інтелекту Llama 4 – Scout і Maverick. Вони заявили, що Maverick перевершує GPT-4o та Gemini 2.0 Flash у популярних тестах. Однак виявилося, що статистика від Meta може бути обманливою. У пресрелізі Meta підкреслила успішність моделей у рейтингу LMArena, але пізніше виявилося, що тестувалася експериментальна версія, оптимізована для розмов. Користувачі висловили обурення, а LMArena вирішила оновити правила, щоб уникнути подібних ситуацій у майбутньому.