Chrome’un Dahili Yapay Zekası: Gemini Nano Cihaz Üstü Zekayı Açıyor
Google Chrome, Prompt API aracılığıyla doğrudan tarayıcıya hafif bir LLM olan Gemini Nano’yu ekledi. Bu makale teknik mimarisini, geliştirici API’lerini, sınırlamalarını ve gelecekteki potansiyelini inceliyor.
Chrome’da Gemini Nedir?
Google I/O 2025 etkinliğinde Google, Gemini AI’nin Chrome masaüstü sürümlerine (Beta, Dev, Canary) entegrasyonunu duyurdu; bu özellik, AI Pro / Ultra aboneleri tarafından Windows ve macOS üzerinde İngilizce dilinde kullanılabiliyor (detaylar için The Verge Google I/O 2025 haberi).
Kullanıcılar, yeni bir araç çubuğu simgesiyle etkileşim kuruyor; bu simge mevcut sayfa içeriğini “gören” bir sohbet kullanıcı arayüzünü başlatıyor — sayfa içeriğinin özetlenmesi, açıklanması, karşılaştırılması veya doğrudan verilerin çıkarılması için ideal (detaylar için The Verge Google I/O 2025 haberi) ve (başka bir The Verge makalesine göre agentik özellikler).
Gemini şu anda aynı anda sadece bir sekmeyi işliyor ancak çoklu sekmelerin eşzamanlı sorgulanması 2025 içinde planlanıyor (detaylar için The Verge Google I/O 2025 haberi). Ayrıca Canlı sesli etkileşimler de sunuyor; bu özellik YouTube videolarındaki araçları veya tarifleri tanımlamak için kullanışlı (başka bir The Verge makalesine göre agentik özellikler).
Teknik Yığın ve Prompt API
Gemini Nano: Yerel LLM
Chrome, ilk kullanımda otomatik olarak Gemini Nano’yu indirir; bu küçük model, tamamen WebAssembly/WebGPU kullanarak tarayıcı içinde çalışır ve bulut çağrısı yapmaz (web.dev teknik rehberi detaylarında belirtildiği gibi).
Özellikle özetleme, sınıflandırma, yeniden yazma gibi işlemler için optimize edilmiştir ve büyük ölçekli çıkarım veya kesin gerçek sorguları için uygun değildir (Thinktecture Labs analizine göre: Thinktecture Labs incelemesi).
Gemini Nano, kaynaklar arasında paylaşılır, bu nedenle bir kere yüklendikten sonra o makinedeki tüm yapay zeka özellikli web sayfaları ve uzantılar tarafından kullanılabilir (detaylar için web.dev dokümantasyonu).
Prompt API (window.ai.languageModel
)
Deneysel olan Prompt API, geliştiricilerin JavaScript aracılığıyla Gemini Nano’yu çağırmasını mümkün kılar (Thinktecture Labs tarafından açıklanan şekilde).
Ana yöntemler:
const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("Buraya komutunuzu yazın"); // akışsız yanıt
const stream = session.promptStreaming("Uzun komut…"); // akışlı yanıt
Geliştiriciler, yaratıcı çıktılar için temperature ve topK parametrelerini ayarlayabilirler.
Erken Önizleme Programı (EPP) katılımcıları ve Chrome Uzantıları için origin trial aracılığıyla kullanılabilir.
⸻
Gereksinimler ve Kurulum
- Platformlar: Windows 10/11, macOS 13 (Ventura)+, Linux; Android, iOS veya ChromeOS desteklenmez.
- Donanım: Model indirimi ve çıkarımı için en az 22 GB boş disk alanı ve ≥4 GB VRAM’e sahip GPU gereklidir.
Kurulum adımları:
- Chrome Canary veya Beta sürümünü (127 ve üzeri) yükleyin.
- #prompt-api-for-gemini-nano ve #optimization-guide-on-device-model bayraklarını etkinleştirin (baypas seçeneği ile).
- chrome://components adresine gidip On-Device Model bileşenini güncelleyin.
- Geliştirici konsolunu kullanarak window.ai erişimini test edin.
⸻
Geliştirici Kullanım Senaryoları ve Performans
- Özetleme, Çeviri, Yazma, Yeniden Yazma API’leri, dahili yapay zeka yığını aracılığıyla kullanılabilir.
- Kullanım örnekleri: Özel Chrome Uzantıları —örneğin, takvim girdileri otomatik doldurma, istenmeyen içerik bulanıklaştırma veya kişi çıkarımı— sunucu turu olmaksızın.
- Çevrimdışına öncelik veren, gizlilik odaklı, kaynaklar arasında paylaşılabilir: ekstra maliyet yok, ağ bağımlılığı yok.
Performans donanıma bağlıdır; büyük belgeler Gemini Nano’nun bağlam penceresini aşabilir. Chunked Augmented Generation (CAG) gibi araçlar, bu sınırlamaları akıllı komut kırma yöntemleriyle aşar.
⸻
Sınırlamalar ve Gizlilik
- Gemini Nano gerçek doğruluk için optimize edilmemiştir; meta veriler veya kesin bilgiler güvenilir olmayabilir.
- Şu anki arayüz sadece tek sekme bağlamını destekler (çoklu sekme desteği yakında).
- Mini pencere UI uzun yanıtları kısaltabilir; kullanıcı deneyimi, yanıtlar öz olmadığında hantallaşabilir.
Gizlilik vaatleri yerel yürütüme dayanmasına rağmen, model depolama ve çıkarım bağlamları için Chrome’a güvenmeniz gereklidir.
⸻
Karşılaştırma Tablosu
Özellik | Durum | Notlar |
---|---|---|
Gemini Nano modeli | Chrome’da yerel LLM | İlk kullanımda Prompt API üzerinden indirilir |
Prompt API (window.ai) | Deneysel (Chrome 127/128+) | Akışlı ve akışsız komutları destekler |
Özetçi / Yazar / Yeniden Yazıcı API’leri | Doküman / Erken Önizleme ile kullanılabilir | Web ve uzantılarda kullanılabilir |
Donanım gereksinimleri | ≥22 GB disk, 4 GB VRAM gerekir | Cihaz uyumluluğunu sınırlar |
Gerçek doğruluk & büyük bağlam | Sınırlı | Özellikleri genişletmek için CAG araçları mevcut |
Çoklu sekme sorgulama | Planlanıyor | Şu an sadece tek sekme destekleniyor |
Son Düşünceler
Gemini Nano destekli Chrome’un dahili yapay zekası, GPT tarzı özellikleri gizlilik, çevrimdışı çalışma ve genişletilebilirlikle doğrudan tarayıcıya getiren teknik bir dönüm noktasıdır. Henüz erken aşamada olsa da geliştiriciler, Prompt API ile minimum gecikme ve sürekli maliyeti olmadan yenilikçi kullanım senaryoları geliştirebilirler.
Mariner ve Agent Mode gibi projeler olgunlaştıkça çoklu sekme desteği, etken eylemler ve daha derin web etkileşimleri gibi gelişmeler bekleyebilirsiniz.
Geliştiriciler için öneri: Prompt API ile başlayın, Erken Önizleme Programına katılın ve sağlam hibrit uygulamalar için cihaz üstü yetenekleri bulut tabanlı yedekleme ile eşleştirin.