Gemini 3.5 Flash 완전 정리: 무료 사용법, API 가격, Pro보다 빠른 이유 [2026]

Gemini 3.5 Flash 완전 정리: 무료 사용법, API 가격, Pro보다 빠른 이유 [2026]

Gemini 3.5 Flash는 2026년 5월 19일 Google I/O에서 공개됐습니다. 핵심 특징과 무료 사용법, 개발자를 위한 API 비용 계산까지 한 번에 정리합니다.

Gemini 3.5 Flash란 무엇인가요?

Gemini 3.5 Flash는 구글이 선보인 Gemini 3.5 계열의 첫 번째 모델입니다. Flash 계열은 원래 ‘빠르지만 Pro보다 성능이 낮다’는 포지션이었습니다. 3.5 버전에서 그 공식이 깨졌습니다. 코딩과 에이전트 태스크 벤치마크에서 Gemini 3.1 Pro를 앞섰고 응답 속도는 기존 프론티어 모델 대비 4배 빠릅니다.

단순히 빠른 게 아닙니다. 텍스트, 이미지, 오디오, 동영상을 모두 입력으로 받습니다. 기본적으로 추론(Dynamic Thinking)이 켜진 상태로 동작합니다. 개인 AI 에이전트인 Gemini Spark도 이 모델을 기반으로 구동됩니다.

Gemini 3.5 Flash 핵심 특징

코딩과 에이전트 성능에서 Pro를 제쳤습니다

벤치마크 수치를 보면 Flash가 Pro를 능가한 이유가 명확해집니다.

벤치마크 Gemini 3.5 Flash Gemini 3.1 Pro
Terminal-Bench 2.1 (에이전트) 76.2% 71.4%
MCP Atlas (멀티스텝 코딩) 83.6% 79.1%
CharXiv Reasoning (차트 이해) 84.2% 80.8%
MMMU-Pro (멀티모달) 1위 2위

코딩 보조, 자동화 에이전트, 복잡한 문서 분석처럼 반복 추론이 필요한 작업에서 특히 차이가 납니다.

100만 토큰 컨텍스트 창

입력 토큰 한도가 1,048,576개입니다. 긴 논문 전체, 수백 페이지 코드베이스, 한 시간짜리 영상 스크립트를 통째로 넣고 분석할 수 있습니다. 출력은 최대 65,536토큰입니다.

Gemini 3.5 Flash 사용법에 도움이 되는 기본 기능 구성

텍스트뿐 아니라 이미지, 오디오, 동영상을 입력으로 쓸 수 있습니다. 함수 호출, 구조화 출력, 코드 실행도 기본으로 지원합니다. 별도 설정 없이 바로 에이전트를 만들 수 있는 환경이 갖춰져 있습니다.

Gemini 3.5 Flash 무료 사용법: 단계별 가이드

Gemini 3.5 Flash는 세 가지 경로로 이용할 수 있습니다.

Gemini 앱에서 시작하기

  1. gemini.google.com에 접속하거나 모바일 Gemini 앱을 설치합니다.
  2. 구글 계정으로 로그인 후 채팅을 시작합니다.
  3. 모델 선택 메뉴에서 Gemini 3.5 Flash를 선택합니다. (무료 계정에서도 선택 가능)
  4. 텍스트, 이미지, 파일을 자유롭게 첨부해 사용합니다.

무료 계정에서도 이용할 수 있지만 사용량이 많아지면 속도가 제한될 수 있습니다. 상시 빠른 속도가 필요하다면 Google AI Pro 구독($19.99/월)을 고려하세요.

Google AI Studio에서 테스트하기

  1. aistudio.google.com에 접속합니다.
  2. 모델 드롭다운에서 gemini-3.5-flash를 선택합니다.
  3. API 키 없이도 브라우저에서 바로 테스트할 수 있습니다.

AI Studio는 하루 1,500회 요청까지 무료로 제공됩니다. 단, 무료 티어에서는 입력 데이터가 모델 개선에 활용될 수 있습니다.

Google AI Studio API 연동하기

API 모델 ID: gemini-3.5-flash

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-3.5-flash:generateContent" \
  -H "x-goog-api-key: YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"contents":[{"parts":[{"text":"안녕하세요"}]}]}'

Gemini 3.5 Flash API 가격과 실제 비용 계산

공식 API 가격은 다음과 같습니다.

항목 가격
입력 (1M 토큰당) $1.50
출력 (1M 토큰당) $9.00
캐시된 입력 (1M 토큰당) $0.15

실제 비용 환산 예시

일반적인 챗봇 응답 1회에 입력 약 500토큰, 출력 약 300토큰이 소요된다고 가정합니다.

  • 입력 500토큰 → $0.00000075
  • 출력 300토큰 → $0.0000027
  • 1회 호출 비용 ≈ $0.0000035 (약 0.005원)
  • 월 10만 회 API 호출 시 총 비용 ≈ 약 $3.5 (약 4,900원)

Gemini 3.1 Pro 대비 입력 40%, 출력 40% 저렴합니다. Gemini 3 Flash($0.50/$3.00)와 비교하면 3배 비싸지만 에이전트, 코딩 성능이 Pro급으로 올라왔습니다. 복잡한 태스크에는 오히려 경제적인 선택입니다.

Gemini 3.5 Flash vs 경쟁 모델 비교

항목 Gemini 3.5 Flash Gemini 3.1 Pro Claude 3.7 Sonnet GPT-4.1
응답 속도 매우 빠름 (4배↑) 중간 중간 중간
코딩 성능 Pro급 상위 상위 상위
컨텍스트 창 1M 토큰 1M 토큰 200K 토큰 1M 토큰
입력 가격 ($/1M) $1.50 $2.50 $3.00 $2.00
멀티모달 입력 텍스트, 이미지, 오디오, 영상 동일 텍스트, 이미지 텍스트, 이미지
무료 이용 ✅ (Gemini 앱, AI Studio) 제한적 ✅ (Claude.ai) ✅ (ChatGPT Free)

에이전트 자동화나 반복적인 코딩 보조가 주목적이라면 Gemini 3.5 Flash가 현재 가장 비용 효율적인 선택입니다.

어떤 분께 맞을까요?

Gemini 3.5 Flash가 잘 맞는 경우:

  • 코딩 보조 도구나 자동화 에이전트를 개발 중인 개발자
  • API 비용을 낮추면서도 Pro급 추론이 필요한 팀
  • 긴 문서나 코드베이스 전체를 한 번에 분석해야 하는 연구자, 기획자
  • Gemini Spark처럼 상시 동작하는 개인 AI 에이전트를 써보고 싶은 분

다른 선택을 권하는 경우:

  • 단순 글쓰기, 번역 등 경량 태스크라면 무료 Gemini 1.5 Flash로 충분합니다.
  • 출력 품질보다 속도를 최우선으로 한다면 Gemini 3 Flash($0.50/$3.00)가 여전히 저렴합니다.

자주 묻는 질문

Q. Gemini 3.5 Flash는 완전 무료로 쓸 수 있나요?

Gemini 앱에서는 무료 계정으로도 이용할 수 있습니다. 사용량이 많아지면 응답 속도가 제한됩니다. Google AI Studio에서 API를 이용할 경우 하루 1,500회까지 무료입니다. 초과분은 $1.50/1M 토큰 요금이 부과됩니다.

Q. Gemini 3.5 Flash vs Gemini 3.1 Pro 중 어떤 것을 선택해야 하나요?

코딩과 에이전트 태스크는 3.5 Flash가 앞서고 가격도 40% 저렴합니다. 범용 추론이나 창의적 글쓰기에서 3.1 Pro와의 차이는 미미합니다. 대부분의 용도에서 3.5 Flash가 더 실용적입니다.

Q. 제미나이 3.5 플래시 한국어 성능은 어떤가요?

공식 벤치마크는 영어 중심입니다. 1M 토큰 컨텍스트와 향상된 추론 능력은 한국어에도 동일하게 적용됩니다. 한국어 문서 요약, 번역, 코드 생성 모두 3.1 Pro와 동등하거나 나은 수준으로 평가받고 있습니다.

Q. Gemini 3.5 Pro는 언제 출시되나요?

구글은 Google I/O 2026에서 3.5 Pro가 내부적으로 사용 중이라고 밝혔습니다. 2026년 6월 중 일반 공개 예정입니다.

Q. Gemini Spark와 Gemini 3.5 Flash의 관계는 무엇인가요?

Gemini Spark는 Gemini 3.5 Flash를 기반으로 구동되는 개인 AI 에이전트입니다. 노트북, 스마트폰을 닫아도 24시간 동작합니다. 이메일 요약, 일정 브리핑 등을 자율적으로 처리합니다. Google AI Ultra 구독자에게 우선 제공될 예정입니다.

마무리

Gemini 3.5 Flash는 ‘Flash는 Pro보다 성능이 낮다’는 고정관념을 깬 모델입니다. 코딩과 에이전트 자동화에서 Pro급 성능을 내면서 가격은 40% 낮고 속도는 4배 빠릅니다. 무료로 시작해 필요하면 유료 API로 전환할 수 있어 부담 없이 테스트해 보실 수 있습니다.

👉 Gemini 3.5 Flash 지금 바로 써보기 — Gemini 앱


관련 글: Claude 요금제 완전 정리: Sonnet, Opus, API 가격 비교 2026