Meta, 차세대 AI 모델 ‘LLaMA 4’ 시리즈 전격 공개…“GPT-4 넘본다”

Meta, 차세대 AI 모델 ‘LLaMA 4’ 시리즈 전격 공개…“GPT-4 넘본다”

meta - llama4 3가지 모델

2025년 4월 5일, Meta(구 페이스북)가 새로운 인공지능(AI) 모델 시리즈인 LLaMA 4를 공개하며 생성형 AI 시장의 선두주자들과의 정면 승부를 예고했다. 이번 시리즈는 총 3종으로 구성되며, 성능, 확장성, 멀티모달 처리 능력에서 모두 획기적인 진보를 이뤘다는 평가를 받고 있다.

Meta는 이번에 LLaMA 4 Scout, Maverick, Behemoth라는 세 가지 버전을 선보였다. 이들은 모두 MoE(Mixture of Experts) 아키텍처를 기반으로 하며, 특정 토큰마다 일부 전문가(Experts)만을 활성화함으로써 연산 효율성과 정확도를 동시에 확보했다.

llama4 - maverick 벤치마크

1 – LLaMA 4 Scout

‘LLaMA 4 Scout’는 총 1,090억 개의 파라미터 중 170억 개만을 활성화하여 작동하는 고효율 경량 모델이다. 총 16개의 전문가(Experts) 모듈로 구성되며, 최대 1,000만 토큰에 이르는 긴 컨텍스트를 처리할 수 있는 것이 특징이다.

특히 단일 NVIDIA H100 GPU에서도 작동 가능할 정도로 가볍고 최적화된 구조를 갖추고 있으며, 텍스트와 이미지를 동시에 이해하는 멀티모달 기능을 기본 탑재했다. 성능 면에서도 Gemma 3, Mistral 3.1 등의 최신 모델들을 능가하는 벤치마크 성과를 기록하며, 경량 AI 모델 시장에서의 경쟁력을 입증하고 있다.

llama4 - scout 벤치마크

2- LLaMA 4 Maverick

성능과 효율의 균형을 강조한 ‘LLaMA 4 Maverick’은 총 4,000억 개의 파라미터 중 170억 개만 활성화하며, 128개의 전문가 모듈을 포함하고 있다. GPT-4o, Gemini 2.0 Flash 등과 비교해 코딩 및 추론 작업에서 동급 이상의 성능을 발휘하며, DeepSeek V3와 유사한 정확도를 절반 이하의 파라미터 수로 달성해 기술 효율성 면에서도 높은 평가를 받고 있다.

챗봇 인터랙션 품질을 평가하는 LM Arena 벤치마크에서 ELO 점수 1417점을 기록하며, 사용자와의 상호작용에서 뛰어난 자연스러움과 인지 능력을 선보였다.

llama4 - behemoth 벤치마크

3- LLaMA 4 Behemoth

현재 훈련 단계에 있는 ‘LLaMA 4 Behemoth’는 약 2조 개의 파라미터를 기반으로 하며, 이 중 2,880억 개가 활성화된다. 총 16개의 전문가로 구성되어 있으며, 메타는 이 모델이 향후 GPT-4.5, Claude 3.7 등과의 경쟁을 목표로 STEM 분야(과학, 기술, 공학, 수학)에 최적화된 성능을 발휘할 수 있도록 설계 중이라고 밝혔다.

Behemoth는 초거대 연산 환경에서도 안정적이고 효율적인 작동을 목표로 개발 중이며, 향후 메타의 AI 전략에서 핵심 역할을 담당할 것으로 전망된다.

llama4 - 멀티모달 기능

LLaMA 4 시리즈는 메타가 채택한 최신 MoE(Mixture of Experts) 아키텍처를 기반으로 설계되었다. 이 구조는 각 입력 토큰마다 필요한 전문가 모듈만을 선택적으로 활성화함으로써, 연산 자원과 메모리 사용을 최소화하면서도 고성능 처리 능력을 동시에 확보하는 것이 특징이다.

특히 LLaMA 4는 텍스트뿐만 아니라 이미지까지 동시에 이해할 수 있는 멀티모달 처리 기능을 네이티브로 탑재했다. 이를 통해 다양한 입력 형태를 자연스럽게 처리할 수 있으며, 학습된 언어 수만 200개 이상에 달해 글로벌 다국어 환경에서도 탁월한 이해도를 보여준다.

또한 메타의 LLaMA 4 모델은 단순히 기술적 완성도에 그치지 않고, 실제 다양한 산업 현장에서의 적용 가능성에서도 높은 실용성을 보이고 있기에, 기술적 완성도와 실질적인 비즈니스 활용성 모두를 만족시키며, 차세대 AI 모델의 방향성을 제시하고 있다는 평가를 받고 있다.

RECENT POSTING