OpenAI GPT OSS 모델 소개 : 오픈소스 AI의 새로운 시대

OpenAI GPT OSS 모델 소개 : 오픈소스 AI의 새로운 시대

GPT OSS - 섬네일

최근 AI 업계에서는 중국 기업들의 오픈소스 모델들이 연이어 공개되면서 큰 화제가 되고 있는데요. DeepSeek, Qwen, Moonshot AI 같은 기업들이 강력한 성능의 모델을 Apache 2.0 라이선스로 공개하면서 오픈소스 AI 생태계를 주도하고 있었죠.

이런 상황에서 OpenAI가 2025년 8월에 GPT-2 이후 처음으로 오픈 웨이트 모델인 GPT OSS를 발표했는데요. 무려 5년 만에 공개한 오픈 모델이라는 점에서 많은 개발자들과 기업들의 관심을 받고 있습니다.

특히 이번에 공개된 gpt-oss-120b와 gpt-oss-20b 모델은 Apache 2.0 라이선스로 제공되어 상업적 활용이 자유롭고, 추론(reasoning) 능력이 뛰어나다는 평가를 받고 있는데요. 그렇기에 이번 포스팅에서는 OpenAI GPT OSS 모델의 특징과 활용 방법에 대해서 자세히 알아보려고 합니다.

1. OpenAI GPT OSS란?

OpenAI GPT OSS란

OpenAI GPT OSS는 OpenAI가 2025년 8월 5일에 공개한 오픈 웨이트 언어 모델 시리즈인데요. GPT-2 이후 약 5년 만에 공개된 오픈 모델이라는 점에서 상당히 의미가 큽니다.

GPT OSS 120B 20B

이번에 공개된 모델은 두 가지 버전으로 제공되는데요. gpt-oss-120b는 1170억 개의 파라미터를 가진 대형 모델이고, gpt-oss-20b는 210억 개의 파라미터를 가진 소형 모델입니다. 이름에서 알 수 있듯이 뒤의 숫자가 모델의 크기를 나타내고 있죠.

가장 주목할 만한 점은 이 모델들이 Apache 2.0 라이선스로 공개되었다는 것인데요. 이는 누구나 자유롭게 사용, 수정, 배포할 수 있으며 상업적 활용도 제한 없이 가능하다는 의미입니다. Meta의 Llama 모델처럼 월간 활성 사용자 7억 명 이상일 때 별도 라이선스가 필요한 제약도 없죠.

OpenAI의 CEO 샘 알트먼은 이번 공개에 대해 “수십억 달러의 연구 결과를 전 세계에 제공하여 더 많은 사람들이 AI를 활용할 수 있도록 하게 되어 기쁘다”고 밝혔는데요. 실제로 중국 기업들의 오픈소스 모델에 대응하고, 트럼프 행정부의 오픈소스 정책에 부응하는 전략적 선택으로 보입니다.

2. GPT OSS 모델의 주요 특징

gpt oss - moe

GPT OSS 모델의 가장 큰 특징은 MoE(Mixture of Experts) 아키텍처를 사용한다는 점인데요. 이는 전체 파라미터 중 일부만 활성화하여 효율적인 추론이 가능하도록 하는 기술입니다.

예를 들어 gpt-oss-120b 모델은 전체 1170억 개의 파라미터 중에서 토큰당 51억 개만 활성화하고, gpt-oss-20b는 210억 개 중 36억 개만 활성화하는데요. 이렇게 하면 메모리 사용량과 연산량을 크게 줄일 수 있어서 더 작은 하드웨어에서도 실행이 가능하게 됩니다.

gpt oss 가용성

특히 gpt-oss-120b는 단일 H100 GPU(80GB VRAM)에서 실행 가능하고, gpt-oss-20b는 16GB 메모리를 가진 일반 소비자 하드웨어나 노트북에서도 돌릴 수 있다는 점이 인상적인데요. 개인 개발자나 소규모 기업들도 부담 없이 사용할 수 있게 된 것이죠.

GPT OSS 벤치마크

성능 면에서도 상당히 뛰어난 결과를 보여주고 있는데요. OpenAI의 벤치마크에 따르면 gpt-oss-120b는 OpenAI의 유료 모델인 o4-mini와 비슷한 수준의 성능을 보이고, gpt-oss-20b는 o3-mini와 유사한 성능을 달성했다고 합니다. 특히 코딩, 수학, 추론 작업에서 강점을 보이고 있죠.

또한 이 모델들은 128,000 토큰의 컨텍스트 길이를 지원하는데요. 이는 대략 소설 300-400페이지 분량의 텍스트를 한 번에 처리할 수 있다는 의미입니다. 긴 문서 분석이나 복잡한 대화 맥락을 유지하는 데 유용하겠네요.

개인적으로는 4비트 양자화(MXFP4)가 기본적으로 적용되어 있다는 점도 좋은 것 같은데요. 이를 통해 모델 크기를 줄이면서도 성능 저하를 최소화했다고 하니, 실제 배포 환경에서 매우 실용적일 것 같습니다.

3. 오픈 웨이트 vs 오픈소스의 차이점

오픈 웨이트 모델

GPT OSS를 이야기할 때 주의해야 할 점이 하나 있는데요. 이 모델은 엄밀히 말하면 ‘오픈소스’가 아니라 ‘오픈 웨이트’ 모델이라는 것입니다.

오픈 웨이트 모델은 학습이 완료된 모델의 가중치(weights), 즉 파라미터만 공개하는 것인데요. 반면 진정한 오픈소스 모델은 학습 코드, 데이터셋, 학습 방법론까지 모두 공개해야 합니다.

OpenAI는 GPT OSS의 가중치와 사용 방법은 공개했지만, 어떤 데이터로 어떻게 학습시켰는지, 내부 아키텍처의 세부 사항은 공개하지 않았는데요. 예를 들어 MoE 아키텍처에서 64개의 전문가 중 12개를 활성화한다는 것은 알려줬지만, 어떤 라우팅 메커니즘을 사용하는지는 비공개입니다.

이런 접근 방식에 대해 일부 전문가들은 “OpenAI가 핵심 기술은 보호하면서도 유용한 모델을 제공하는 균형을 잘 잡았다”고 평가하는데요. 실제로 Meta의 Llama나 Mistral 같은 다른 기업들도 비슷한 방식을 취하고 있죠.

하지만 사용자 입장에서는 Apache 2.0 라이선스 덕분에 자유롭게 수정하고 상업적으로 활용할 수 있다는 점이 더 중요할 수 있는데요. 특히 기업들이 자체 하드웨어에서 완전히 프라이빗하게 실행할 수 있다는 점은 큰 장점이 되겠네요.

4. GPT OSS 활용 방법과 전망

GPT OSS 모델은 Hugging Face, GitHub 등에서 다운로드할 수 있는데요. LM Studio, Ollama 같은 로컬 실행 도구를 통해 개인 PC에서도 쉽게 사용할 수 있습니다.

특히 gpt-oss-20b 모델의 경우 32GB RAM을 가진 맥북에서도 충분히 실행 가능하다고 하니, 개인 개발자들이 테스트하기에 좋을 것 같네요. 더 큰 모델인 gpt-oss-120b도 클라우드 서비스를 통해 쉽게 접근할 수 있는데요. Azure, AWS, Databricks 등 주요 클라우드 플랫폼에서 이미 지원을 시작했습니다.

활용 분야로는 코드 생성, 문서 분석, 챗봇 개발, 데이터 처리 자동화 등이 있는데요. 특히 추론 능력이 뛰어나기 때문에 복잡한 문제 해결이나 단계별 사고가 필요한 작업에 적합하다고 합니다.

기업 입장에서는 데이터를 외부로 보내지 않고 자체 인프라에서 실행할 수 있다는 점이 큰 매력인데요. 금융, 의료, 법률 같은 규제가 엄격한 산업이나 정부, 군사 기관에서도 활용할 수 있게 된 것이죠.

앞으로의 전망을 보면, OpenAI의 이번 공개가 오픈소스 AI 생태계에 큰 변화를 가져올 것 같은데요. 중국 기업들이 주도하던 오픈소스 AI 시장에 미국 기업도 본격적으로 참여하게 되면서 경쟁이 더욱 치열해질 것으로 예상됩니다.

개인적으로는 이런 경쟁이 결국 사용자들에게 더 좋은 모델과 도구를 제공하는 결과로 이어질 것 같은데요. 특히 Apache 2.0 라이선스라는 점에서 많은 스타트업과 개발자들이 혁신적인 애플리케이션을 만들 수 있는 기반이 마련되었다고 생각합니다.

맺음말

오늘은 OpenAI가 공개한 GPT OSS 모델의 특징과 활용 방법에 대해서 알아보았습니다.

5년 만에 공개된 OpenAI의 오픈 웨이트 모델이라는 점에서 의미가 크고, Apache 2.0 라이선스로 자유로운 상업적 활용이 가능하다는 점이 특히 인상적인데요. MoE 아키텍처와 4비트 양자화를 통해 효율성을 높였고, 일반 소비자 하드웨어에서도 실행 가능하도록 최적화했다는 점도 좋은 것 같네요.

물론 완전한 오픈소스는 아니라는 한계가 있지만, 실용적인 관점에서 보면 충분히 유용한 모델이라고 생각되는데요. 특히 데이터 보안이 중요한 기업들이나 로컬에서 AI를 활용하고 싶은 개발자들에게는 매우 좋은 선택지가 될 것 같습니다.

앞으로 GPT OSS를 활용한 다양한 애플리케이션들이 등장할 것으로 기대되는데요. 오픈소스 AI 생태계가 더욱 활성화되면서 AI 기술의 민주화가 한층 더 진전될 것 같아 기대가 되네요.

RECENT POSTING