결론부터: Gemini 3.5 Flash, 빨라졌지만 무료 사용자는 사실상 좁아졌어요
2026년 5월 19일 구글 I/O에서 공개된 Gemini 3.5 Flash는 이전 모델보다 출력 속도가 4배 빨라지고 인프라 비용은 절반 이하로 낮아진 모델입니다. 표면만 보면 혜택처럼 보이지만, API 요금은 입력 기준 백만 토큰당 $1.50, 출력 기준 $9.00으로 이전 버전 대비 3~6배 인상됐어요. 무료 계정에는 일일·월간 토큰 한도 강화가 동시에 적용되면서 “사실상 무료 사용자를 차단하는 정책”이라는 비판이 빠르게 확산됐습니다.
이 글에서 다룰 내용: ① Gemini 3.5 Flash의 실제 스펙과 요금 구조 ② 무료 사용자 차단 논란의 배경과 구조적 맥락 ③ 향후 AI 시장에서 이 정책이 만들어낼 분기점

Gemini 3.5 Flash, 스펙은 화려한데 요금표가 말을 바꿔요

Gemini 3.5 Flash의 핵심 수치는 인상적입니다. 구글은 Google I/O 2026 공식 발표에서 기존 Gemini 2.5 Flash 대비 출력 속도 4배 향상, 인프라 운영 비용 50% 이상 절감을 달성했다고 밝혔어요. 멀티모달 처리 능력도 강화됐고, 코딩·수학 추론 벤치마크에서도 GPT-5.5, Claude Opus 4.7과 견줄 만한 수준이라는 평가가 나왔습니다.
문제는 요금 구조입니다.
API 요금, 숫자로 보면 충격이 더 커요
| 항목 | 이전 버전 (Gemini 2.5 Flash) | Gemini 3.5 Flash | 변동률 |
|---|---|---|---|
| 입력 (백만 토큰) | $0.50 | $1.50 | +200% |
| 출력 (백만 토큰) | $1.50 | $9.00 | +500% |
출력 토큰 요금만 따지면 5배 인상입니다. 텍스트 생성을 주력으로 쓰는 스타트업이나 개인 개발자에게 출력 토큰 비중이 훨씬 크다는 점을 감안하면 실질 부담은 수치보다 더 크게 체감돼요. 구글은 “성능 대비 비용 효율이 높아졌다”는 논리를 내세우지만, 절대 요금이 오른 현실 앞에서 이 논리는 쉽게 받아들여지지 않습니다.
‘무료 사용자 차단’이라는 말이 나온 이유

무료 계정 사용자도 Gemini 3.5 Flash를 쓸 수 있다는 점에서 구글은 “무료 제공은 유지됐다”고 주장합니다. 하지만 동시에 적용된 일일 토큰 한도 강화가 논란의 핵심이에요.
한도 강화가 만드는 ‘유리 천장’
기존 Gemini 2.5 시리즈까지는 무료 계층에서도 비교적 여유로운 사용이 가능했고, AI 커뮤니티 안에서 구글은 “무료 한도만큼은 업계 최고”라는 평가를 받아왔습니다. 나무위키 등 커뮤니티에서도 구글을 “쌀숭이 최적화 회사”라고 표현할 만큼 무료 정책이 아이덴티티처럼 자리잡고 있었어요.
Gemini 3.5 Flash부터는 이 공식이 흔들렸습니다. 대규모·고빈도 사용자 — 예컨대 장문 번역을 하루에 20회 이상 돌리거나, 코드 생성을 연속으로 요청하는 개발자들 — 는 무료 한도에 빠르게 도달하게 됐어요. 한도 초과 시 유료 Gemini Advanced(월 $19.99)로 업그레이드하라는 안내가 뜨는 구조는 사실상 사용 압박을 통한 유료 전환 유도로 읽힐 수밖에 없습니다.
OpenAI와 Anthropic도 최근 컴퓨팅 비용 부담을 이유로 무료 tier 사용량을 줄이거나 요금을 올리는 추세이긴 합니다. 하지만 구글의 경우 “무료 개방성”을 경쟁 우위로 삼아왔기에 이번 정책 변화가 더 큰 배신감으로 받아들여지는 겁니다.
만년 3위 딱지를 떼고 싶은 구글의 딜레마

Gemini 3.5 Flash 출시 직전까지 구글 AI는 씁쓸한 상황이었습니다. Gemini 3.1 Pro는 벤치마크 수치는 높지만 실제 사용 경험이 뒤처진다는 악평이 이어졌고, 정작 사용자들 사이에서는 구버전인 Gemini 2.5 Pro가 “가장 신뢰할 수 있는 모델”로 통하는 역설적인 상황이 이어졌어요.
구글이 이번에 무엇을 증명하려 했는가
Google I/O 2026 행사 며칠 전부터 AI 평가 플랫폼 LMSYS Arena에 ‘cheetah’라는 코드명의 미공개 모델이 등장했습니다. 이 모델은 GPT-5.5와 Claude Opus 4.7에 뒤지지 않는 점수를 기록했고, 이것이 Gemini 3.5 계열임이 밝혀지면서 기대감이 폭발했어요. 실제로 공식 출시 후 멀티모달·코딩·수학 추론 부문에서 상위권 성적을 냈습니다.
구글 입장에서 이번 업데이트는 단순 기능 개선이 아니라 “AI 3사 중 만년 3위”라는 이미지 탈출 시도였어요. 문제는 성능 도약과 요금 현실화를 동시에 단행하다 보니, 사용자 커뮤니티에서는 “드디어 좋아졌더니 이제 돈 받겠다는 거냐”는 반응이 나오는 겁니다.
| 비교 항목 | OpenAI GPT-5.5 | Anthropic Claude Opus 4.7 | Google Gemini 3.5 Flash |
|---|---|---|---|
| 무료 tier 제공 | 제한적 | 제한적 | 제공 (한도 강화) |
| API 출력 요금(백만 토큰) | 약 $15 (추정치) | 약 $15 (추정치) | $9.00 |
| 속도 개선 | 중간 | 중간 | 이전 대비 4배 |
| 최근 무료 정책 변화 | 사용량 제한 | 사용량 제한 | 한도 강화 |

이번 변화가 가리키는 곳
주목할 점은 이번 Gemini 3.5 Flash 요금 개편이 단순한 가격 조정이 아니라 AI 업계 전체의 무료 모델 종언(終焉)을 알리는 신호탄에 가깝다는 것입니다.
구글·OpenAI·Anthropic 3사 모두 2025~2026년을 거치며 동일한 방향으로 움직이고 있어요. 무료 한도를 통해 사용자 기반을 확보한 뒤, 헤비 유저를 유료로 전환하는 ‘프리미엄 깔때기’ 전략이 본격화됐습니다. 구글의 경우 Gemini Advanced 월 $19.99 구독이 이 깔때기의 출구입니다.
향후 1~2년 안에 두 가지 시나리오 중 하나가 현실화될 가능성이 높습니다. 첫째, 무료 사용자 이탈이 빠르게 늘어 오픈소스 모델(Meta Llama 계열 등)로의 대규모 이동이 일어나는 경우. 둘째, 유료 전환율이 일정 수준(업계 평균 전환율 약 3~5% 추정)을 넘으면 구글이 이 정책을 표준으로 굳히는 경우. 어느 쪽이든 “AI는 무료로 쓸 수 있다”는 인식은 2026년이 사실상 마지막 해가 될 공산이 큽니다.
자주 묻는 질문
Gemini 3.5 Flash, 무료로 아예 못 쓰나요?
무료 계정으로도 기본 사용은 가능합니다. 다만 일일·월간 토큰 한도가 강화되어 장문 작업이나 반복 요청이 많은 경우 한도에 빠르게 도달할 수 있어요. 가벼운 일상 사용이라면 무료로 충분하지만 업무용·개발용으로는 제약이 생깁니다.
API 요금이 오른 게 개인 사용자에게도 영향을 주나요?
Gemini 앱 직접 사용에는 API 요금이 적용되지 않아요. API 요금 인상은 Gemini를 서비스에 연동하는 개발자나 기업에 직접 영향을 줍니다. 다만 이 비용이 서비스 요금에 반영될 경우 간접적으로 소비자 가격에도 영향을 미칠 수 있습니다.
정리
1. Gemini 3.5 Flash는 속도 4배·인프라 비용 절반이라는 기술적 도약을 이뤘지만, API 출력 요금은 이전 대비 500% 인상되어 개발자·기업 사용자의 실질 부담이 커졌습니다. 2. 무료 사용자에게는 토큰 한도 강화가 동시 적용되어, 구글의 최대 강점이었던 ‘넉넉한 무료 정책’이 사실상 후퇴했다는 평가를 받고 있어요. 3. 이번 변화는 AI 3사 모두가 공통으로 향하는 ‘무료 → 유료 전환 압박’ 구조의 일환으로, 오픈소스 모델로의 이탈 가속화 또는 유료 AI 구독 대중화라는 두 갈림길에 업계가 서 있습니다.
Gemini 3.5 Flash를 실제로 사용해 보고 자신의 사용 패턴이 무료 한도 안에 드는지 확인해 보세요. 월 사용량이 한도에 자주 걸린다면 지금이 유료 플랜 전환 시점을 검토할 타이밍입니다.


