크롬 내장 AI: Gemini Nano로 구현하는 디바이스 내 지능

구글 크롬이 Prompt API를 통해 경량 LLM인 Gemini Nano를 브라우저에 직접 탑재했습니다. 본 기사는 기술 아키텍처, 개발자용 API, 제한 사항 및 향후 가능성에 대해 다룹니다.

크롬의 Gemini란?

Google I/O 2025에서 구글은 Gemini AI를 크롬 데스크톱 빌드(Beta, Dev, Canary)에 통합했다고 발표했으며, 이는 AI Pro / Ultra 구독자가 Windows 및 macOS 환경에서 영어로 이용할 수 있습니다 (Verge의 Google I/O 2025 관련 보도 참조).
사용자는 툴바의 새 아이콘을 통해 대화 UI를 실행할 수 있으며, 현재 페이지 콘텐츠를 “읽어” 요약, 명확화, 비교 또는 웹페이지에서 직접 데이터 추출이 가능합니다 (Verge 보도, 그리고 Gemini의 행위형 기능에 관한 추가 Verge 기사 참고).

현재 Gemini는 한 탭씩만 처리하지만, 2025년 후반에는 여러 탭 동시 쿼리 지원이 예정되어 있습니다 (Verge 보도). 또한 유튜브 영상에서 도구 또는 레시피 추출에 유용한 실시간 음성 상호작용도 제공합니다 (agentic 기능 관련 Verge 기사).

기술 스택 & Prompt API

Gemini Nano: 로컬 LLM

크롬은 첫 사용 시 자동으로 Gemini Nano를 다운로드하며, 이 소형 모델은 WebAssembly/WebGPU를 활용해 클라우드 호출 없이 브라우저 내에서 완전히 실행됩니다 (web.dev 기술 가이드 참조).
주로 요약, 분류, 재작성 등의 작업에 최적화되어 있으며, 대규모 추론이나 정확한 사실 질의에는 적합하지 않다고 Thinktecture Labs 분석에서 설명합니다.

Gemini Nano는 도메인 간 공유되므로, 한 번 설치되면 그 기기 내의 모든 AI 활성화 웹페이지와 확장 프로그램이 혜택을 받습니다 (web.dev 문서 참고).

Prompt API (`window.ai.languageModel`)

실험적 Prompt API를 통해 개발자는 JavaScript로 Gemini Nano를 호출할 수 있습니다 (Thinktecture Labs 설명).

핵심 메서드:

const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("Your prompt here");            // 비스트리밍
const stream = session.promptStreaming("Long prompt…");              // 스트리밍 응답

온도(temperature) 및 topK 조절로 창의적인 출력 제어가 가능합니다.

해당 API는 얼리 프리뷰 프로그램(EPP) 참가자 및 크롬 확장 프로그램의 오리진 트라이얼을 통해 제공됩니다.

⸻

요구 사항 및 설정

지원 플랫폼: Windows 10/11, macOS 13(벤투라) 이상, Linux; Android, iOS, ChromeOS는 미지원.
하드웨어: 모델 다운로드 및 추론을 위해 최소 22GB 여유 디스크 공간과 4GB VRAM 이상의 GPU 필요.

설정 단계:

크롬 캐나리 또는 베타(버전 127 이상) 설치.
플래그 활성화: #prompt-api-for-gemini-nano 및 #optimization-guide-on-device-model (우회 옵션 포함).
chrome://components 방문하여 On-Device Model 구성요소 업데이트.
개발자 콘솔에서 window.ai 접근 테스트.

⸻

개발자 활용 사례 및 성능

요약기, 번역기, 작가, 재작성기 API 등이 내장 AI 스택을 통해 제공됩니다.
예: 서버 왕복 없이 자동 캘린더 입력, 원치 않는 콘텐츠 흐림 처리, 연락처 추출 같은 맞춤형 크롬 확장 제작 가능.
오프라인 우선, 프라이버시 친화적이며 도메인 간 공유 가능: 추가 비용 및 네트워크 의존도 없음.

성능은 하드웨어 사양에 좌우되며, 대용량 문서는 Gemini Nano의 컨텍스트 창 크기를 초과할 수 있습니다. Chunked Augmented Generation (CAG)와 같은 도구가 지능적인 프롬프트 분할로 이를 보완합니다.

⸻

제한 사항 및 개인정보 보호

Gemini Nano는 사실 정확성에 최적화되어 있지 않아 메타데이터나 정확한 지식은 신뢰하기 어렵습니다.
현재 인터페이스는 단일 탭 컨텍스트만 지원하며, 다중 탭 지원은 예정 중입니다.
미니 윈도우 UI는 긴 답변을 자를 수 있으며, 답변이 간결하지 않으면 사용성이 다소 불편할 수 있습니다.

프라이버시 보장은 로컬 실행에 기반하지만, 모델 저장 및 추론 컨텍스트의 크롬 내부 처리에 대한 신뢰가 필요합니다.

⸻

비교 표

기능	상태	비고
Gemini Nano 모델	크롬 내 로컬 LLM	최초 사용 시 Prompt API 통해 다운로드
Prompt API (`window.ai`)	실험 단계 (크롬 127/128+)	스트리밍 및 비스트리밍 프롬프트 지원
요약/작가/재작성 API	문서/얼리 프리뷰 통해 이용 가능	웹 및 확장 프로그램 내 활용
하드웨어 요구 사항	22GB 이상 디스크, 4GB VRAM 필요	기기 호환성 제한 요인
사실 정확성 및 대용량 컨텍스트	제한적	CAG 도구로 기능 확장 가능
다중 탭 쿼리	예정 중	현재는 단일 탭 전용

마무리 생각

Gemini Nano가 탑재된 크롬 내장 AI는 기술적 이정표로, 프라이버시와 오프라인 기능을 갖춘 GPT 스타일 기능을 브라우저 내에서 직접 제공합니다. 아직 초기 단계지만, 개발자는 Prompt API를 통해 최소 지연 및 반복 비용 없이 혁신적 활용 사례를 실험할 수 있습니다.

Mariner, Agent Mode와 같은 프로젝트가 진화하면 다중 탭 지원, 행위형 작업, 더 깊은 웹 상호작용 기능이 추가될 것으로 기대합니다.

개발자용 조언: Prompt API부터 시작해 얼리 프리뷰 프로그램에 참여하고, 디바이스 내 기능과 클라우드 백업을 결합한 견고한 하이브리드 애플리케이션 개발을 권장합니다.

크롬 내장 AI: Gemini Nano로 구현하는 디바이스 내 지능

크롬 내장 AI: Gemini Nano로 구현하는 디바이스 내 지능

크롬의 Gemini란?

기술 스택 & Prompt API

Gemini Nano: 로컬 LLM

Prompt API (window.ai.languageModel)

요구 사항 및 설정

설정 단계:

개발자 활용 사례 및 성능

제한 사항 및 개인정보 보호

비교 표

마무리 생각

Categories

Prompt API (`window.ai.languageModel`)