Chrome se Ingeboude KI: Gemini Nano Ontsluit Intelligensie op die Toestel

Google Chrome het Gemini Nano—'n liggewig LLM—direk in die blaaier via die Prompt API bygevoeg

Chrome se Ingeboude KI: Gemini Nano Ontsluit Intelligensie op die Toestel

Google Chrome het Gemini Nano—'n liggewig LLM—direk in die blaaier via die Prompt API bygevoeg. Hierdie artikel ondersoek die tegniese argitektuur, ontwikkelaar-API's, beperkings en toekomstige potensiaal daarvan.


Wat Is Gemini in Chrome?

By Google I/O 2025 het Google die integrasie van Gemini KI in Chrome desktop-weergawe (Beta, Dev, Canary) aangekondig, toeganklik vir KI Pro / Ultra intekenare in Engels op Windows en macOS (soos uiteengesit in 'n Verge-verslag oor Google I/O 2025).
Gebruikers interaksie vind plaas via 'n nuwe ikoon in die werkbalk, wat 'n klets-koppelvlak oopmaak wat die huidige bladsyinhoud "sien"—ideaal om samevattings te maak, te verduidelik, te vergelyk of data direk vanaf die webblad te onttrek (soos gedetailleer in 'n Verge-verslag oor Google I/O 2025) en (volgens 'n ander Verge-artikel oor agente-features](https://www.theverge.com/google/673659/gemini-google-chrome-integration-agentic-era?utm_source=chatgpt.com)).

Gemini hanteer tans net een oortjie op 'n slag, maar ondersteuning vir navrae oor meerveelselle gelyktydig word later in 2025 beplan (soos uiteengesit in 'n Verge-verslag oor Google I/O 2025). Dit bied ook lewendige steminteraksies, nuttig om gereedskap of resepte in YouTube-video's te identifiseer (volgens 'n ander Verge-artikel oor die agentic features).


Tegniese Stapel & Prompt API

Gemini Nano: Die Plaaslike LLM

Chrome laai Gemini Nano outomaties af by die eerste gebruik; hierdie klein model loop heeltemal binne die blaaier met WebAssembly/WebGPU sonder enige wolkkontakte, soos verduidelik in 'n tegniese gids op web.dev.
Dit is geoptimaliseer vir samevatting, klassifikasie, herskrywing, ensovoorts, maar nie vir grootskaalse redenasie of presiese feitelike navrae nie, volgens analise deur Thinktecture Labs.

Gemini Nano word gedeel oor oorspronge, dus sodra dit geïnstalleer is, bevoordeel dit alle KI-gefasiliteerde webblaaie en uitbreidings op daardie toestel, soos verder in die web.dev dokumentasie beskryf.

Prompt API (window.ai.languageModel)

Die eksperimentele Prompt API stel ontwikkelaars in staat om Gemini Nano via JavaScript aan te roep, soos verduidelik deur Thinktecture Labs.

Kernmetodes:

const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("Jou prompt hier");            // nie-stromende antwoord
const stream = session.promptStreaming("Lang prompt…");              // stroomreaksie

Ontwikkelaars kan temperature en topK aanpas vir kreatiewe uitsette.

Dit is beskikbaar vir deelnemers van die Vroeë Voorskouprogram (Early Preview Program, EPP) en in Chrome-uitbreidings via 'n oorsprongproef.

Vereistes & Opstelling

  • Platforms: Windows 10/11, macOS 13 (Ventura)+, Linux; nie ondersteun op Android, iOS, of ChromeOS nie.
  • Hardeware: ≥ 22 GB vrye skyfspasie en 'n GPU met ≥ 4 GB VRAM benodig vir modellering aflaai en inferensie.

Opstellingstappe:

  1. Installeer Chrome Canary of Beta (weergawe 127+).
  2. Skakel vlae aan: #prompt-api-for-gemini-nano en #optimization-guide-on-device-model (met omseilopsie).
  3. Gaan na chrome://components, en werk die On-Device Model-komponent op.
  4. Gebruik die ontwikkelaar-konsol om window.ai toegang te toets.

Ontwikkelaargebruiksg gevalle & Prestasie

  • Samevatter-, Vertaler-, Skribent- en Herskrywer-API's is beskikbaar deur die ingeboude KI-stapel.
  • Gebruikslate sluit in pasgemaakte Chrome-uitbreidings—byvoorbeeld, outomatiese kalenderinskrywings, versoenings van ongewenste inhoud, of kontakonttrekking—sonder bedienerrondreis.
  • Aflyn-eerstens, privaatheidvriendelik, deelbaar oor oorspronge: geen ekstra koste en geen netwerkafhanklikheid nie.

Prestasie word beïnvloed deur hardeware; groot dokumente kan Gemini Nano se konteksvenster oorskry. Instrumente soos Chunked Augmented Generation (CAG) hanteer hierdie beperkings deur intelligente promptfragmentering.

Beperkings en Privaatheid

  • Gemini Nano is nie geoptimaliseer vir feitelike akkuraatheid nie, dus kan metadata of presiese kennis onbetroubaar wees.
  • Huidige koppelvlak ondersteun net eentoeligting-konteks (meerveelselondersteuning kom later).
  • Mini-venster-UI kan lang antwoorde inkort; gebruikerservaring kan ongemaklik wees as antwoorde nie bondig is nie.

Privaatheidsversekerings rus op plaaslike uitvoering, maar jy moet steeds vertroue hê in Chrome se hantering van modelberging en inferensiekontekste.

Vergelykingstabel

Kenmerk Status Notas
Gemini Nano-model Plaaslike LLM in Chrome Aflaai by eerste gebruik via Prompt API
Prompt API (window.ai) Eksperimenteel (Chrome 127/128+) Ondersteun stroom- en nie-stroom-prompt
Samevatter / Skribent / Herskrywer API's Beskikbaar via dokumentasie / Vroeë Voorskou Gebruik binne web of uitbreidings
Hardewarevereistes Vereis ≥22 GB skyf & 4 GB VRAM Beperk toestelkompatibiliteit
Feitelike akkuraatheid & groot konteks Beperk CAG-instrumente beskikbaar om vermoëns uit te brei
Meerveelselnavrae Beplan Slegs eentoeligting tans

Finale Gedagtes

Chrome se ingeboude KI aangedryf deur Gemini Nano is 'n tegniese mylpaal—dit lewer GPT-styl funksies direk in die blaaier met privaatheid, aflynvermoë en breë uitbreidbaarheid. Al is dit nog in 'n vroeë stadium, kan ontwikkelaars eksperimenteer met die Prompt API om innoverende gebruiksg gevalle met minimale vertraging en geen herhalende koste te skep.

Verwag toekomstige verbeterings—insluitend ondersteuning vir meerveelselle, agentik aksies en dieper web-interaksievermoëns—soos projekte soos Mariner en Agent Mode volwasse raak.

Vir ontwikkelaars: begin met die Prompt API, sluit aan by die Vroeë Voorskouprogram, en koppel toestelgebaseerde vermoëns saam met wolkgebaseerde rugsteun vir robuuste hibriede toepassings.

Categories