Chrome’un Dahili Yapay Zekası: Gemini Nano Cihaz Üstü Zekayı Açıyor

Google Chrome, Prompt API aracılığıyla doğrudan tarayıcıya hafif bir LLM olan Gemini Nano’yu ekledi. Bu makale teknik mimarisini, geliştirici API’lerini, sınırlamalarını ve gelecekteki potansiyelini inceliyor.

Chrome’da Gemini Nedir?

Google I/O 2025 etkinliğinde Google, Gemini AI’nin Chrome masaüstü sürümlerine (Beta, Dev, Canary) entegrasyonunu duyurdu; bu özellik, AI Pro / Ultra aboneleri tarafından Windows ve macOS üzerinde İngilizce dilinde kullanılabiliyor (detaylar için The Verge Google I/O 2025 haberi).
Kullanıcılar, yeni bir araç çubuğu simgesiyle etkileşim kuruyor; bu simge mevcut sayfa içeriğini “gören” bir sohbet kullanıcı arayüzünü başlatıyor — sayfa içeriğinin özetlenmesi, açıklanması, karşılaştırılması veya doğrudan verilerin çıkarılması için ideal (detaylar için The Verge Google I/O 2025 haberi) ve (başka bir The Verge makalesine göre agentik özellikler).

Gemini şu anda aynı anda sadece bir sekmeyi işliyor ancak çoklu sekmelerin eşzamanlı sorgulanması 2025 içinde planlanıyor (detaylar için The Verge Google I/O 2025 haberi). Ayrıca Canlı sesli etkileşimler de sunuyor; bu özellik YouTube videolarındaki araçları veya tarifleri tanımlamak için kullanışlı (başka bir The Verge makalesine göre agentik özellikler).

Teknik Yığın ve Prompt API

Gemini Nano: Yerel LLM

Chrome, ilk kullanımda otomatik olarak Gemini Nano’yu indirir; bu küçük model, tamamen WebAssembly/WebGPU kullanarak tarayıcı içinde çalışır ve bulut çağrısı yapmaz (web.dev teknik rehberi detaylarında belirtildiği gibi).
Özellikle özetleme, sınıflandırma, yeniden yazma gibi işlemler için optimize edilmiştir ve büyük ölçekli çıkarım veya kesin gerçek sorguları için uygun değildir (Thinktecture Labs analizine göre: Thinktecture Labs incelemesi).

Gemini Nano, kaynaklar arasında paylaşılır, bu nedenle bir kere yüklendikten sonra o makinedeki tüm yapay zeka özellikli web sayfaları ve uzantılar tarafından kullanılabilir (detaylar için web.dev dokümantasyonu).

Prompt API (`window.ai.languageModel`)

Deneysel olan Prompt API, geliştiricilerin JavaScript aracılığıyla Gemini Nano’yu çağırmasını mümkün kılar (Thinktecture Labs tarafından açıklanan şekilde).

Ana yöntemler:

const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("Buraya komutunuzu yazın");            // akışsız yanıt
const stream = session.promptStreaming("Uzun komut…");                     // akışlı yanıt

Geliştiriciler, yaratıcı çıktılar için temperature ve topK parametrelerini ayarlayabilirler.

Erken Önizleme Programı (EPP) katılımcıları ve Chrome Uzantıları için origin trial aracılığıyla kullanılabilir.

⸻

Gereksinimler ve Kurulum

Platformlar: Windows 10/11, macOS 13 (Ventura)+, Linux; Android, iOS veya ChromeOS desteklenmez.
Donanım: Model indirimi ve çıkarımı için en az 22 GB boş disk alanı ve ≥4 GB VRAM’e sahip GPU gereklidir.

Kurulum adımları:

Chrome Canary veya Beta sürümünü (127 ve üzeri) yükleyin.
#prompt-api-for-gemini-nano ve #optimization-guide-on-device-model bayraklarını etkinleştirin (baypas seçeneği ile).
chrome://components adresine gidip On-Device Model bileşenini güncelleyin.
Geliştirici konsolunu kullanarak window.ai erişimini test edin.

⸻

Geliştirici Kullanım Senaryoları ve Performans

Özetleme, Çeviri, Yazma, Yeniden Yazma API’leri, dahili yapay zeka yığını aracılığıyla kullanılabilir.
Kullanım örnekleri: Özel Chrome Uzantıları —örneğin, takvim girdileri otomatik doldurma, istenmeyen içerik bulanıklaştırma veya kişi çıkarımı— sunucu turu olmaksızın.
Çevrimdışına öncelik veren, gizlilik odaklı, kaynaklar arasında paylaşılabilir: ekstra maliyet yok, ağ bağımlılığı yok.

Performans donanıma bağlıdır; büyük belgeler Gemini Nano’nun bağlam penceresini aşabilir. Chunked Augmented Generation (CAG) gibi araçlar, bu sınırlamaları akıllı komut kırma yöntemleriyle aşar.

⸻

Sınırlamalar ve Gizlilik

Gemini Nano gerçek doğruluk için optimize edilmemiştir; meta veriler veya kesin bilgiler güvenilir olmayabilir.
Şu anki arayüz sadece tek sekme bağlamını destekler (çoklu sekme desteği yakında).
Mini pencere UI uzun yanıtları kısaltabilir; kullanıcı deneyimi, yanıtlar öz olmadığında hantallaşabilir.

Gizlilik vaatleri yerel yürütüme dayanmasına rağmen, model depolama ve çıkarım bağlamları için Chrome’a güvenmeniz gereklidir.

⸻

Karşılaştırma Tablosu

Özellik	Durum	Notlar
Gemini Nano modeli	Chrome’da yerel LLM	İlk kullanımda Prompt API üzerinden indirilir
Prompt API (window.ai)	Deneysel (Chrome 127/128+)	Akışlı ve akışsız komutları destekler
Özetçi / Yazar / Yeniden Yazıcı API’leri	Doküman / Erken Önizleme ile kullanılabilir	Web ve uzantılarda kullanılabilir
Donanım gereksinimleri	≥22 GB disk, 4 GB VRAM gerekir	Cihaz uyumluluğunu sınırlar
Gerçek doğruluk & büyük bağlam	Sınırlı	Özellikleri genişletmek için CAG araçları mevcut
Çoklu sekme sorgulama	Planlanıyor	Şu an sadece tek sekme destekleniyor

Son Düşünceler

Gemini Nano destekli Chrome’un dahili yapay zekası, GPT tarzı özellikleri gizlilik, çevrimdışı çalışma ve genişletilebilirlikle doğrudan tarayıcıya getiren teknik bir dönüm noktasıdır. Henüz erken aşamada olsa da geliştiriciler, Prompt API ile minimum gecikme ve sürekli maliyeti olmadan yenilikçi kullanım senaryoları geliştirebilirler.

Mariner ve Agent Mode gibi projeler olgunlaştıkça çoklu sekme desteği, etken eylemler ve daha derin web etkileşimleri gibi gelişmeler bekleyebilirsiniz.

Geliştiriciler için öneri: Prompt API ile başlayın, Erken Önizleme Programına katılın ve sağlam hibrit uygulamalar için cihaz üstü yetenekleri bulut tabanlı yedekleme ile eşleştirin.

Chrome’un Dahili Yapay Zekası: Gemini Nano Cihaz Üstü Zekayı Açıyor

Chrome’un Dahili Yapay Zekası: Gemini Nano Cihaz Üstü Zekayı Açıyor

Chrome’da Gemini Nedir?

Teknik Yığın ve Prompt API

Gemini Nano: Yerel LLM

Prompt API (window.ai.languageModel)

Gereksinimler ve Kurulum

Kurulum adımları:

Geliştirici Kullanım Senaryoları ve Performans

Sınırlamalar ve Gizlilik

Karşılaştırma Tablosu

Son Düşünceler

Categories

Prompt API (`window.ai.languageModel`)