MiniMax M3, 오픈소스인데 Opus를 넘본다 (성능·가격 정리)

MiniMax M3를 두고 “오픈소스가 드디어 폐쇄형을 위협한다”는 평가가 나옵니다. 중국 MiniMax가 내놓은 이 오픈웨이트 모델은 100만 토큰 컨텍스트에 파격적인 가격을 들고 나왔습니다. 결론부터 말씀드리면 가격은 진짜고 성능 주장은 조금 걸러 들어야 합니다.

화제의 실체가 무엇인지, 한국에서 쓸 만한지 균형 있게 정리했습니다.


MiniMax M3가 주목받는 이유

MiniMax M3는 코딩과 에이전트 작업, 멀티모달 추론을 한 모델에 결합한 오픈웨이트 모델입니다. the decoder 보도에 따르면 2026년 6월 1일 공개됐고 가중치와 기술 보고서도 곧 풀릴 예정입니다.

가장 큰 무기는 컨텍스트입니다. 최대 100만 토큰을 처리하고 최소 51만 2천 토큰을 보장합니다. 대규모 코딩 프로젝트나 긴 문서 분석에서 강점을 보이는 구조입니다.

이걸 가능하게 한 게 MSA라는 새 아키텍처입니다. MiniMax 스파스 어텐션의 약자인데 100만 토큰 컨텍스트를 쓸 만한 가격에 구현한 핵심으로 꼽힙니다.

MiniMax M3 핵심 사양과 가격 인포그래픽


MiniMax M3 성능은 어디까지 왔나

여기서는 신중하게 봐야 합니다. MiniMax M3 벤치마크 성적은 화려하지만 대부분 제조사 자체 발표이기 때문입니다.

MiniMax는 SWE-Bench Pro 같은 코딩 벤치마크에서 GPT 5.5와 Gemini 3.1 Pro를 능가하고 Opus 4.7에 근접한다고 밝혔습니다. 일부 항목에서는 Opus 4.7을 앞섰다고도 합니다. 다만 TechTimes 분석은 이 수치들이 아직 독립적으로 검증되지 않았다고 지적합니다.

공개된 수치 자체는 구체적입니다. 외부 정리 기준 SWE-Bench Pro 59점, 터미널 벤치 2.1에서 66점, 브라우즈컴프에서 83.5점을 기록했습니다. 오픈웨이트 모델치고는 분명 높은 수준입니다. 다만 같은 벤치마크라도 측정 환경에 따라 점수가 출렁이는 만큼 절대 순위보다 대략의 체급으로 읽는 게 안전합니다.

제조사가 공개한 자율 작업 사례도 인상적입니다. GPU 커널 최적화를 단 한 번 지시했더니 24시간 동안 스스로 반복하며 성능을 9배 넘게 끌어올렸다고 합니다. 흥미로운 시연이지만 마케팅용 사례라는 점은 감안해야 합니다.

항목 내용
모델 유형 오픈웨이트 (가중치 공개 예정)
컨텍스트 최대 100만 토큰
입력 단가 100만 토큰당 0.30달러 (프로모션)
출력 단가 100만 토큰당 1.20달러 (프로모션)

정리하면 성능은 “검증 대기 중인 상위권”이고 사양과 가격은 “확실한 강점”입니다. 이 둘을 분리해서 보는 게 M3를 제대로 읽는 방법입니다.


가격이 진짜 무기다

성능 논쟁과 별개로 가격은 명확한 강점입니다. OpenRouter 기준 정가는 100만 입력 토큰당 0.60달러, 출력 2.40달러입니다.

지금은 50% 프로모션으로 입력 0.30달러, 출력 1.20달러까지 내려갔습니다. 최상위 폐쇄형 모델과 비교하면 한 자릿수 분의 일 수준입니다. 같은 작업을 훨씬 싸게 돌릴 수 있다는 뜻입니다.

토큰 양도 넉넉합니다. 영상 기준 월 20달러 플랜에 약 17억 토큰이 제공됩니다. 코딩처럼 토큰을 많이 먹는 작업에서 이 가성비는 무시하기 어렵습니다.

물론 프로모션 가격이라는 점은 기억해야 합니다. 할인이 끝나면 정가로 돌아가니 장기 비용은 정가 기준으로 잡아두는 게 현실적입니다. 그래도 정가마저 폐쇄형 최상위 모델보다 한참 낮아 가격 경쟁력 자체는 흔들리지 않습니다.


한국에서 어떻게 쓰나

한국 개발자에게 가장 큰 의미는 접근성입니다. 오픈웨이트라 가중치가 공개되면 직접 받아 로컬에서 돌리거나 입맛대로 손볼 수 있습니다.

당장 쓰려면 OpenRouter가 편합니다. 별도 가입 없이 여러 모델을 한 곳에서 호출하는 중계 서비스라 MiniMax M3도 바로 붙여 쓸 수 있습니다. API 키 하나로 기존 코딩 도구에 연결하는 식입니다.

비교 대상이 궁금하다면 폐쇄형 진영의 기준점인 Claude Opus 4.8 가이드와 함께 보시면 좋습니다. M3가 겨냥하는 상대가 바로 이런 모델들입니다. 한국어 처리 품질은 직접 짧은 작업으로 시험해 보고 판단하시길 권합니다.

오픈소스 AI 모델이 폐쇄형 모델에 도전하는 개념 일러스트


그래서 갈아탈 만한가

냉정하게 정리하면 이렇습니다. 비용을 크게 줄이고 싶은 코딩 작업이라면 MiniMax M3는 지금 시험해 볼 가치가 충분합니다. 가격과 긴 컨텍스트라는 장점이 뚜렷하기 때문입니다.

다만 핵심 업무를 통째로 옮기는 건 이릅니다. 벤치마크가 독립 검증을 통과하고 한국어 실사용 후기가 쌓일 때까지 지켜보는 게 안전합니다. 보조 모델로 먼저 써보며 감을 잡는 접근을 권합니다.

오픈웨이트 모델이 폐쇄형의 아성을 흔드는 흐름 자체는 분명합니다. M3는 그 흐름을 가장 공격적으로 보여준 사례입니다.


자주 묻는 질문

Q. MiniMax M3는 무료로 쓸 수 있나요?

오픈웨이트라 가중치가 공개되면 직접 받아 로컬에서 무료로 구동할 수 있습니다. API로 쓸 경우 일부 도구에서는 무료로 제공되기도 하지만 OpenRouter 등에서는 사용량만큼 요금이 발생합니다.

Q. MiniMax M3 가격은 얼마인가요?

OpenRouter 기준 정가는 100만 입력 토큰당 0.60달러, 출력 2.40달러입니다. 현재는 50% 프로모션으로 입력 0.30달러, 출력 1.20달러 수준입니다. 폐쇄형 최상위 모델보다 훨씬 저렴합니다.

Q. MiniMax M3 벤치마크는 믿을 만한가요?

신중하게 봐야 합니다. GPT 5.5나 Opus 4.7을 능가한다는 수치는 대부분 MiniMax 자체 발표이며 독립 검증은 아직 진행 중입니다. 참고 지표로 보되 핵심 업무 전환은 외부 검증 이후를 권합니다.

Q. MiniMax M3의 컨텍스트 윈도우는 얼마나 되나요?

최대 100만 토큰을 처리하며 최소 51만 2천 토큰을 보장합니다. MSA 아키텍처 덕분에 이 긴 컨텍스트를 비교적 저렴한 비용으로 구현했습니다. 대규모 코드베이스나 긴 문서 작업에 유리합니다.

Q. 한국에서 MiniMax M3를 쓰려면 어떻게 하나요?

가장 간단한 방법은 OpenRouter를 통해 호출하는 것입니다. API 키 하나로 기존 코딩 도구에 연결할 수 있습니다. 가중치가 공개된 뒤에는 직접 내려받아 로컬 환경에서 구동하는 것도 가능합니다.


📺 출처: WorldofAI — “MiniMax M3 IS INSANE! BEST Opensource AI Model!”

MiniMax M3는 오픈웨이트 모델이 가격과 컨텍스트에서 어디까지 갈 수 있는지 보여준 사례입니다. 성능 주장은 검증을 기다리되 가성비만큼은 지금 체감할 수 있습니다. 비용 부담 큰 코딩 작업의 보조 카드를 찾는 분께 시험을 권합니다.