LATEST MODEL

Llama 4 Behemoth

Meta Released April 2025

Meta's flagship multimodal model with massive MoE architecture (288B active parameters)

Llama 4 Behemoth

Meta • April 2025

Latest

Training Data

Up to August 2024

Llama 4 Behemoth

April 2025

Parameters

~2 trillion (288B active)

Training Method

Mixture of Experts

Context Window

1,000,000 tokens

Knowledge Cutoff

August 2024

Key Features

Open Source • Massive MoE Architecture • Multimodal

Capabilities

Reasoning: Outstanding

STEM: Outstanding

Complex Tasks: Outstanding

What's New in This Version

Massive MoE model with 16 experts designed for complex reasoning tasks

Meta's flagship multimodal model with massive MoE architecture (288B active parameters)

What's New in This Version

Massive MoE model with 16 experts designed for complex reasoning tasks

Technical Specifications

Parameters ~2 trillion (288B active)

Context Window 1,000,000 tokens

Training Method Mixture of Experts

Knowledge Cutoff August 2024

Training Data Up to August 2024

Key Features

Open Source Massive MoE Architecture Multimodal

Capabilities

Reasoning: Outstanding

STEM: Outstanding

Complex Tasks: Outstanding

Other Meta Models

Explore more models from Meta

Llama 4 Maverick

Meta's balanced multimodal MoE model with 128 experts for general use

April 2025 400 billion (17B active)

Llama 4 Scout

Meta's efficient multimodal model with industry-leading 10M token context

April 2025 109 billion (17B active)

Llama 3.1 405B

Meta's largest and most capable open-source model

July 2024 405 billion

Official Documentation Compare with Other Models View Timeline All Meta Models