ה-AI המובנה של Chrome: Gemini Nano מפעיל אינטיליגנציה במכשיר

Google Chrome הוסיף את Gemini Nano — LLM קל משקל — ישירות לדפדפן דרך ה-Prompt API. מאמר זה בוחן את הארכיטקטורה הטכנית, ממשקי המפתחים, המגבלות והפוטנציאל העתידי.

מהו Gemini ב-Chrome?

בכנס Google I/O 2025, חשפה גוגל את שילוב ה-Gemini AI בגרסאות שולחן העבודה של Chrome (Beta, Dev, Canary), הזמינות למנויי AI Pro / Ultra באנגלית על Windows ו-macOS (לפי דיווח ב-The Verge על Google I/O 2025).

המשתמשים מתקשרים דרך אייקון חדש בסרגל הכלים, הפותח ממשק שיחה ש"קורא" את תוכן הדף הנוכחי — אידיאלי לסיכום, הבהרה, השוואה או חילוץ מידע ישירות מדף האינטרנט (כפי שמתואר גם ב-The Verge בכיסוי נוסף).

כיום, Gemini תומך רק בכרטיסייה אחת בזמן, אך מתוכננת תמיכה בשאילתות במספר כרטיסיות בו זמנית במהלך 2025 (לפי The Verge). הוא מציע גם אינטראקציות קול חיות, שימושיות לזיהוי כלים או מתכונים בסרטוני YouTube.

ערכת טכנולוגיה ו-Prompt API

Gemini Nano: ה-LLM המקומי

Chrome מוריד אוטומטית את Gemini Nano בשימוש ראשון; זהו מודל קטן שפועל כולו בתוך הדפדפן באמצעות WebAssembly/WebGPU בלי קריאות ענן, כפי שמוסבר במדריך טכני ב-web.dev.
הוא מותאם לסיכום, סיווג, שכתוב וכדומה, אך לא לניתוח מורכב או שאילתות עובדתיות מדויקות, לפי Thinktecture Labs.

Gemini Nano משותף בין דומיינים, כך שאפשרות זו משרתת את כל דפי האינטרנט וההרחבות עם AI על המערכת בה היא מותקנת, כמפורט ב-תיעוד web.dev.

Prompt API (`window.ai.languageModel`)

ה-Prompt API הניסיוני מאפשר למפתחים להפעיל את Gemini Nano באמצעות JavaScript, כפי שמוסבר ב-Thinktecture Labs.

שיטות עיקריות:

const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("Your prompt here");            // ללא סטרימינג
const stream = session.promptStreaming("Long prompt…");              // תשובה בסטרימינג

מפתחים יכולים לכוונן temperature ו-topK להפקת תגובות יצירתיות.

ה-API זמין למשתתפי תוכנית הבהרה מוקדמת (EPP) ובסיורי הרחבות Chrome דרך origin trial.

⸻

דרישות והגדרה

פלטפורמות: Windows 10/11, macOS 13 (Ventura)+, Linux; לא נתמך ב-Android, iOS או ChromeOS.
חומרה: דרושים ≥ 22GB דיסק פנוי ו-GPU עם ≥ 4GB זיכרון וידאו להורדה והפעלה של המודל.

שלבי התקנה:

התקן את Chrome Canary או Beta (גרסה 127 ומעלה).
הפעל דגלים: #prompt-api-for-gemini-nano ו-#optimization-guide-on-device-model (כולל אפשרות עקיפה).
עבור ל-chrome://components, עדכן את רכיב המודל במכשיר.
השתמש בקונסול המפתחים כדי לבדוק גישה ל-window.ai.

⸻

מקרי שימוש למפתחים וביצועים

ממשקי Summarizer, Translator, Writer, Rewriter זמינים דרך ערכת ה-AI המובנת.
דוגמאות לשימושים: הרחבות Chrome מותאמות אישית—למשל, מילוי אוטומטי ביומנים, הטשטשת תכנים לא רצויים, חילוץ אנשי קשר—בלי צורך בפניות שרת.
פועלים במצב אופליין, ידידותי לפרטיות, משותף בין דומיינים, ללא עלות נוספת וללא תלות ברשת.

הביצועים תלויים בחומרה; מסמכים גדולים עלולים לחרוג מהקליטה של Gemini Nano. כלים כמו Chunked Augmented Generation (CAG) מסייעים בהתמודדות עם מגבלות אלו ע"י פירוק חכם של ההוראות.

⸻

מגבלות ופרטיות

Gemini Nano אינו מותאם לדיוק עובדתי – מטה-דטה או ידע מדויק עלולים להיות בלתי אמינים.
הממשק הנוכחי תומך רק בטאב יחיד (תמיכה בכמה טאבים עתידה להגיע).
ממשק מיני-החלון עשוי לקצר תגובות ארוכות; חוויית המשתמש עלולה להרגיש לא נוחה אם התגובות אינן תמציתיות.

ההבטחות לפרטיות מבוססות על ריצה מקומית, אך יש צורך באמון בניהול האחסון והריצה של המודל על ידי Chrome.

⸻

טבלת השוואה

תכונה	מצב	הערות
מודל Gemini Nano	LLM מקומי ב‑Chrome	מורדד בשימוש ראשון דרך Prompt API
Prompt API (`window.ai`)	ניסיוני (Chrome 127+)	תומך בשאילתות עם ובלי סטרימינג
Summarizer/Writer/Rewriter	זמין בתיעוד/בהבהרה מוקדמת	שימוש באתר או בהרחבות
דרישות חומרה	דרוש ≥22GB דיסק ו-4GB VRAM	מגביל תאימות מכשירים
דיוק עובדתי והקשר גדול	מוגבל	כלים כמו CAG להרחבה
שאילתות בכמה טאבים	מתוכנן	כרגע רק טאَب יחיד

מחשבות סופיות

ה-AI המובנה של Chrome המופעל על Gemini Nano הוא ציון דרך טכנולוגי — מספק פיצ'רים בסגנון GPT ישירות בדפדפן עם פרטיות, אפשרות עבודה אופליין ויכולת הרחבה רחבה. אף שזה עדיין בשלב ראשוני, מפתחים יכולים להתנסות ב-Prompt API כדי ליצור מקרי שימוש חדשניים עם השהיה מינימלית וללא עלויות חוזרות.

צפו לשדרוגים עתידיים — כולל תמיכה בריבוי טאבים, פעולות אג'נטיות ואינטראקציה עמוקה יותר עם האינטרנט — כשפרויקטים כמו Mariner ו-Agent Mode יתפתחו.

למפתחים: התחילו עם Prompt API, הצטרפו לתוכנית הבהרה מוקדמת, ושלבו יכולות במכשיר עם פתרונות ענן להפקת יישומים היברידיים עמידים.

ה-AI המובנה של Chrome: Gemini Nano מפעיל אינטיליגנציה במכשיר

ה-AI המובנה של Chrome: Gemini Nano מפעיל אינטיליגנציה במכשיר

מהו Gemini ב-Chrome?

ערכת טכנולוגיה ו-Prompt API

Gemini Nano: ה-LLM המקומי

Prompt API (window.ai.languageModel)

דרישות והגדרה

שלבי התקנה:

מקרי שימוש למפתחים וביצועים

מגבלות ופרטיות

טבלת השוואה

מחשבות סופיות

Categories

Prompt API (`window.ai.languageModel`)