الذكاء الاصطناعي المدمج في كروم: جيميني نانو يفتح آفاق الذكاء على الجهاز

أضاف متصفح جوجل كروم جيميني نانو – نموذج لغوي خفيف الوزن – مباشرة في المتصفح عبر واجهة برمجة التطبيقات Prompt API

الذكاء الاصطناعي المدمج في كروم: جيميني نانو يفتح آفاق الذكاء على الجهاز

أضاف متصفح جوجل كروم جيميني نانو — وهو نموذج لغوي خفيف الوزن — مباشرة في المتصفح عبر واجهة برمجة التطبيقات Prompt API. تستعرض هذه المقالة الهيكلية التقنية، واجهات برمجة التطبيقات للمطورين، القيود، والإمكانات المستقبلية.


ما هو جيميني في كروم؟

في Google I/O 2025، كشفت جوجل عن دمج جيميني AI في إصدارات سطح المكتب من كروم (Beta, Dev, Canary)، متاحة لمشتركي AI Pro / Ultra باللغة الإنجليزية على ويندوز وماك أو إس (كما ورد في تقرير The Verge عن Google I/O 2025).

يتفاعل المستخدمون عبر أيقونة جديدة في شريط الأدوات، تطلق واجهة محادثة "ترى" محتوى الصفحة الحالية — مثالية للتلخيص، التوضيح، المقارنة، أو استخراج البيانات مباشرة من صفحة الويب (كما ورد في نفس تقرير The Verge) و(وفقًا لمقال آخر في The Verge عن الميزات الوكيلّة) agentic features.

حالياً يدعم جيميني التعاطي مع تبويب واحد فقط في كل مرة، لكن هناك خطط لدعم استعلامات عدة تبويبات في وقت واحد خلال عام 2025 (وفقًا لتقرير The Verge السابق). كما يوفر تفاعل صوتي مباشر، مفيد لتحديد أدوات أو وصفات في فيديوهات يوتيوب (وفقًا لمقال The Verge حول الميزات الوكيلّة).


البنية التقنية وPrompt API

جيميني نانو: النموذج اللغوي المحلي

يقوم كروم أوتوماتيكياً بتنزيل جيميني نانو عند أول استخدام؛ هذا النموذج الصغير يعمل بالكامل داخل المتصفح باستخدام WebAssembly/WebGPU دون الحاجة لإجراء مكالمات سحابية، كما يوضح الدليل الفني على web.dev.
النموذج مُحسّن لـ التلخيص، التصنيف، إعادة الصياغة، وليس مخصصاً للاستدلال المعقد أو الاستعلامات الدقيقة وفقًا لتحليل Thinktecture Labs.

جيميني نانو مشترك عبر المصادر (origins)، لذا بعد تثبيته يستفيد منه جميع صفحات الويب والامتدادات المدعومة بالذكاء الاصطناعي على نفس الجهاز (كما هو مفصل في توثيق web.dev).

Prompt API (window.ai.languageModel)

تتيح واجهة برمجة التطبيقات التجريبية Prompt API للمطورين استدعاء جيميني نانو عبر جافاسكريبت كما شرحته Thinktecture Labs.

الطرق الأساسية:

const session = await self.ai.languageModel.create({ systemPrompt });
const result = await session.prompt("ضع موجهك هنا");            // بدون بث مباشر
const stream = session.promptStreaming("موجه طويل…");             // رد متدفق

يمكن للمطورين ضبط درجة الإبداع (temperature) وtopK لتعزيز الإخراج الإبداعي.

هي متاحة لمشتركي برنامج العرض المبكر (Early Preview Program) وفي امتدادات كروم عبر تجربة أصلية (origin trial).

المتطلبات والإعداد

  • المنصات: ويندوز 10/11، ماك أو إس 13 (Ventura) وما فوق، لينكس؛ غير مدعوم على أندرويد، iOS، أو ChromeOS.
  • المعدات: مطلوب ≥ 22 جيجابايت مساحة خالية على القرص، وGPU بسعة ≥ 4 جيجابايت VRAM لتنزيل النموذج والتنفيذ.

خطوات الإعداد:

  1. تثبيت كروم كاناري أو بيتا (الإصدار 127 فما فوق).
  2. تفعيل الأعلام: #prompt-api-for-gemini-nano و#optimization-guide-on-device-model (مع خيار التجاوز).
  3. زيارة chrome://components وتحديث مكون النموذج على الجهاز.
  4. استخدام وحدة تحكم المطور لاختبار الوصول إلى window.ai.

استخدامات المطورين والأداء

  • واجهات برمجة التطبيقات للتلخيص، الترجمة، الكتابة، إعادة الصياغة متاحة عبر كومة الذكاء الاصطناعي المدمجة.
  • استخدامات متنوعة مثل امتدادات كروم المخصصة — كملء جداول التقويم تلقائياً، طمس المحتوى غير المرغوب، أو استخراج جهات الاتصال — دون الحاجة للرجوع إلى الخادم.
  • تعمل دون اتصال، تحترم الخصوصية، قابلة للمشاركة عبر المصادر: بدون تكاليف إضافية أو اعتماد على الشبكة.

الأداء يعتمد على العتاد؛ الملفات الكبيرة قد تتجاوز نطاق سياق جيميني نانو. أدوات مثل Chunked Augmented Generation (CAG) تعالج هذه القيود بتقسيم موجهات الطلبات بشكل ذكي.

القيود والخصوصية

  • جيميني نانو غير مهيأ للدقة المعرفية الكاملة، لذا قد تكون البيانات الوصفية أو المعرفة الدقيقة غير موثوقة.
  • الواجهة الحالية تدعم سياق تبويب واحد فقط (دعم تبويبات متعددة قادم مستقبلاً).
  • الواجهة المصغّرة قد تقطع الردود الطويلة؛ قد يشعر المستخدم بأن التجربة غير سلسة إذا لم تكن الردود موجزة.

الوعود المتعلقة بالخصوصية تعتمد على التنفيذ المحلي، لكن يجب الوثوق بكيفية تعامل كروم مع تخزين النموذج وسياقات الاستنتاج.

جدول المقارنة

الميزة الحالة الملاحظات
نموذج جيميني نانو نموذج لغوي محلي في كروم يتم التنزيل عند الاستخدام الأول عبر Prompt API
واجهة برمجة التطبيقات Prompt تجريبية (في كروم 127/128+) تدعم الطلبات المتدفقة وغير المتدفقة
APIs التلخيص/الكتابة/إعادة الصياغة متاحة عبر الوثائق/العرض المبكر للاستخدام داخل الويب أو الامتدادات
متطلبات العتاد يتطلب ≥ 22 جيجابايت قرص و4 جيجابايت VRAM يقيد التوافق مع الأجهزة
الدقة المعرفية والسياق الكبير محدودة أدوات CAG متاحة لتمديد القدرات
استعلامات متعددة التبويبات مخطط لها حالياً تبويب واحد فقط

الأفكار النهائية

الذكاء الاصطناعي المدمج في كروم المدعوم بجيميني نانو يعد خطوة تقنية مهمة — يوفر ميزات شبيهة بـ GPT مباشرة في المتصفح مع خصوصية وقدرة للعمل دون اتصال وقابلية توسعية واسعة. رغم أنه في المراحل الأولى، يمكن للمطورين التجربة باستخدام Prompt API لإنشاء حالات استخدام مبتكرة مع تأخير منخفض وبدون تكاليف مستمرة.

توقع تحسينات مستقبلية تشمل دعم التبويبات المتعددة، الأفعال الوكيلّة، وتفاعلات أعمق مع الويب مع نضوج مشاريع مثل Mariner وAgent Mode.

للمطورين: ابدأ بواجهة Prompt API، وانضم إلى برنامج العرض المبكر، وادمج قدرات الجهاز المحلي مع الدعم السحابي لتطبيقات هجينة قوية.

Categories