Yusuf Khalidd

Posted on Jun 23 • Originally published at apidog.com

كيفية تشغيل جوجل جيما 3n LLM على أندرويد: دليل الإعداد الشامل

تشغيل نماذج اللغة الكبيرة (LLMs) مباشرة على Android يغيّر طريقة بناء تطبيقات الذكاء الاصطناعي: زمن استجابة أقل، خصوصية أعلى، وإمكانية العمل دون اتصال. في هذا الدليل العملي ستثبّت Google Gemma 3n عبر AI Edge Gallery، تختبره على الجهاز، ثم تجهّزه للاستخدام داخل تطبيق أو سير عمل API.

جرّب Apidog اليوم

💡 إذا كنت تبني طبقة API حول Gemma 3n، استخدم Apidog للتحقق من الطلبات، تنسيقات الاستجابة، زمن الاستجابة، ومعالجة الأخطاء قبل ربطها بتطبيق Android.

ما هو Google Gemma 3n ومعرض AI Edge Gallery؟

Gemma 3n هو نموذج لغوي خفيف من Google مصمم للتشغيل على الأجهزة الطرفية بدل الاعتماد الكامل على السحابة. هذا يعني أن الاستدلال يمكن أن يحدث محليًا على جهاز Android، مما يقلل زمن الوصول ويحافظ على بيانات المستخدم داخل الجهاز.

Google AI Edge Gallery هو تطبيق ومجموعة أدوات تساعد المطورين على تجربة نماذج الذكاء الاصطناعي على الأجهزة الطرفية. يوفر لك:

نماذج وتجارب جاهزة للـ LLM والرؤية.
واجهة لاختبار المطالبات النصية والمهام متعددة الوسائط.
طريقة عملية لتقييم الأداء قبل دمج النموذج في تطبيقك.

لماذا تستخدم AI Edge Gallery لتشغيل LLM على الجهاز؟

استخدم AI Edge Gallery عندما تريد التحقق سريعًا من ملاءمة Gemma 3n لجهاز معين قبل كتابة تكامل مخصص داخل تطبيقك.

أهم ما يساعدك عليه:

تشغيل النموذج محليًا واختبار الاستجابة مباشرة.
مقارنة متغيرات النماذج حسب الذاكرة والسرعة.
تجربة النصوص والصور والمهام متعددة الدورات.
رصد السلوك العام للنموذج قبل بناء واجهة API أو شاشة داخل التطبيق.

الفكرة المعمارية بسيطة: نموذج محلي + وقت تشغيل محسّن + واجهة اختبار. بعد ذلك يمكنك نقل نفس منطق الاستدلال إلى تطبيقك أو تغليفه خلف طبقة API داخلية.

متطلبات النظام: هل جهازك مناسب لتشغيل Gemma 3n؟

قبل التثبيت، تحقق من الحد الأدنى التالي:

Android: 8.0 أو أحدث، أي API Level 26+.
RAM: يفضّل 4 جيجابايت أو أكثر.
التخزين: حوالي 2 جيجابايت مساحة فارغة لملفات النموذج.
المعالج: ARM64 مفضل.
تسريع العتاد: وجود GPU أو NPU يساعد في تحسين سرعة الاستدلال.

نصيحة عملية: اختبر على نفس فئة الأجهزة التي يستهدفها تطبيقك. لا تعتمد فقط على هاتف تطوير عالي المواصفات إذا كان جمهورك يستخدم أجهزة متوسطة.

الخطوة 1: تثبيت Google AI Edge Gallery من ملف APK

ملاحظة: AI Edge Gallery غير متاح على Google Play حتى الآن، لذلك ستثبته يدويًا من GitHub.

1. فعّل تثبيت التطبيقات من مصادر خارجية

على Android:

الإعدادات > الأمان > تثبيت التطبيقات غير المعروفة

في الإصدارات الأحدث، ستمنح الإذن للتطبيق الذي تستخدمه للتثبيت، مثل المتصفح أو مدير الملفات.

2. نزّل ملف APK

افتح صفحة الإصدارات:

إصدارات GitHub الخاصة بمعرض AI Edge Gallery

ثم نزّل أحدث ملف APK متاح.

3. انقل الملف إلى الجهاز

يمكنك استخدام:

تنزيل مباشر من متصفح الهاتف.
USB.
تخزين سحابي.
ADB من جهاز التطوير.

مثال باستخدام ADB بعد تنزيل الملف محليًا:

adb install ai-edge-gallery.apk

إذا كان التطبيق مثبتًا سابقًا وتريد تحديثه:

adb install -r ai-edge-gallery.apk

4. ثبّت التطبيق وافتحه

افتح ملف APK من مدير الملفات، ثم اتبع تعليمات النظام. امنح الأذونات المطلوبة مثل التخزين أو الشبكة إذا طلبها التطبيق.

عند التشغيل الأول، قد يستغرق التطبيق بعض الوقت للتهيئة وتنزيل الأصول الأولية.

الخطوة 2: تنزيل وتهيئة نموذج Gemma 3n

بعد تثبيت AI Edge Gallery، ابدأ بإضافة نموذج Gemma 3n.

افتح التطبيق.
انتقل إلى قسم إدارة النماذج.
نزّل ملف النموذج بصيغة .task من Hugging Face أو مصدر موثوق.
اختر النموذج داخل التطبيق وانتظر اكتمال التحميل.

كيف تختار متغير النموذج؟

اختر حسب قيود الجهاز وتجربة المستخدم المطلوبة:

النوع	مناسب عندما	الملاحظة
متغير أصغر	تحتاج استجابة أسرع واستهلاك ذاكرة أقل	قد تكون القدرة أقل قليلًا
متغير أكبر	تحتاج جودة أعلى في الاستجابات	يتطلب RAM وCPU/GPU أكثر

قاعدة عملية: ابدأ بالنموذج الأصغر، اختبر زمن الاستجابة والذاكرة، ثم انتقل إلى متغير أكبر فقط إذا كانت الجودة غير كافية.

أثناء التنزيل سترى مؤشرات التقدم والوقت المتوقع.

الخطوة 3: اختبار Gemma 3n داخل AI Edge Gallery

لا تنتقل مباشرة إلى التكامل داخل تطبيقك. اختبر النموذج أولًا داخل المعرض.

اختبارات أساسية

جرّب الأنواع التالية من المطالبات:

لخّص الفقرة التالية في 3 نقاط:
...

اكتب ردًا قصيرًا على رسالة دعم فني من مستخدم يواجه مشكلة في تسجيل الدخول.

استخرج الكيانات المهمة من النص التالي بصيغة JSON:
...

راقب:

هل الاستجابة منطقية؟
هل النموذج يلتزم بالتنسيق المطلوب؟
هل زمن الاستجابة مقبول؟
هل يتوقف التطبيق أو يستهلك ذاكرة عالية؟

اختبار الصور والمهام متعددة الوسائط

إذا كان السيناريو الخاص بك يعتمد على الصور:

حمّل صورة داخل ميزة "اسأل الصورة".
اطلب وصفًا أو تحليلًا بسيطًا.
جرّب مطالبات قصيرة وطويلة.
قارن زمن الاستجابة بين المهام النصية والمهام متعددة الوسائط.

قائمة تحقق قبل التكامل

استخدم هذه القائمة قبل نقل التجربة إلى تطبيقك:

[ ] النموذج يعمل على الجهاز المستهدف.
[ ] زمن الاستجابة مقبول.
[ ] لا يحدث نفاد ذاكرة أثناء الاستخدام العادي.
[ ] الاستجابات مستقرة عبر مطالبات مختلفة.
[ ] تم اختبار مدخلات قصيرة وطويلة.
[ ] تم اختبار حالات فشل، مثل مدخل فارغ أو نص كبير جدًا.

الخطوة 4: تحسين Gemma 3n للاستخدام الإنتاجي

عند الانتقال من التجربة إلى الإنتاج، ركّز على الأداء والاستقرار.

1. إدارة الذاكرة

لا تحمّل النموذج طوال الوقت إذا لم يكن مطلوبًا. صمّم دورة حياة واضحة:

فتح الميزة > تحميل النموذج > تنفيذ الاستدلال > تحرير الموارد عند الخروج

داخل تطبيق Android، يمكنك استخدام منطق مشابه:

class LocalAiSession {
    fun loadModel() {
        // تحميل النموذج عند الحاجة
    }

    fun runInference(prompt: String): String {
        // تنفيذ الاستدلال المحلي
        return ""
    }

    fun release() {
        // تحرير الذاكرة عند انتهاء الجلسة
    }
}

2. استخدم نماذج مكمّمة عند الحاجة

النماذج منخفضة الدقة مثل INT8 تقلل استهلاك الذاكرة وقد تحسن الأداء على الأجهزة المحمولة. الاختيار يعتمد على التوازن بين:

الجودة.
الحجم.
زمن الاستجابة.
استهلاك البطارية.

3. لا تحجب واجهة المستخدم

شغّل الاستدلال في مسار خلفي بدل Main Thread.

مثال عام في Kotlin Coroutines:

viewModelScope.launch {
    val result = withContext(Dispatchers.Default) {
        localAiSession.runInference(prompt)
    }

    uiState.value = uiState.value.copy(answer = result)
}

4. راقب الحرارة والبطارية

الاستدلال المتكرر قد يرفع حرارة الجهاز. للإنتاج:

قلل عدد الطلبات المتزامنة.
أضف حدًا لطول المدخلات.
أوقف المهام الثقيلة عندما يكون الجهاز في وضع توفير الطاقة.
وفّر خيارًا لتعطيل ميزات AI على الأجهزة الضعيفة.

الخطوة 5: التكامل والاختبار مع Apidog

إذا كنت تغلف Gemma 3n خلف API محلي أو خادم وسيط، فاختبر العقد بوضوح. يساعدك Apidog على:

إرسال طلبات مشابهة للطلبات الحقيقية من تطبيق Android.
التحقق من بنية JSON.
اختبار حالات الخطأ.
مراقبة زمن الاستجابة.
محاكاة خدمات غير جاهزة عبر Mock Server.

مثال لعقد API بسيط حول الاستدلال:

POST /ai/generate
Content-Type: application/json

{
  "prompt": "لخّص النص التالي في نقطتين",
  "maxTokens": 256
}

استجابة متوقعة:

{
  "output": "النص الملخص...",
  "latencyMs": 1430
}

اختبر أيضًا حالات الخطأ:

{
  "error": {
    "code": "MODEL_NOT_LOADED",
    "message": "النموذج غير جاهز بعد"
  }
}

يمكنك استخدام Mock Server في Apidog لمحاكاة سير عمل هجين: جزء من الذكاء الاصطناعي يعمل على الجهاز، وجزء آخر عبر خدمة بعيدة. هذا مفيد عندما تريد تطوير واجهة المستخدم قبل اكتمال طبقة الاستدلال الفعلية.

ماذا بعد لـ Gemma 3n و Edge Gallery؟

يتطور نظام Gemma 3n و AI Edge Gallery بسرعة. من التحسينات المتوقعة:

دعم iOS: أعلنت Google عن توفر مستقبلي لنظام iOS.
ضغط أفضل للنماذج: أحجام أصغر وسرعة أعلى دون التضحية الكبيرة بالجودة.
ميزات متعددة الوسائط أغنى: دعم أفضل للنصوص والصور والصوت والفيديو.
تدفقات ضبط دقيقة مخصصة: لتخصيص النموذج حسب المجال أو حالة الاستخدام.

هذه التحسينات ستجعل بناء تطبيقات AI محلية أكثر عملية، خصوصًا للتطبيقات التي تحتاج خصوصية أو زمن استجابة منخفض.

الخلاصة: تشغيل Gemma 3n محليًا على Android

باستخدام AI Edge Gallery، يمكنك تجربة Gemma 3n على Android بسرعة قبل دمجه في تطبيقك. ابدأ بتثبيت APK، نزّل نموذج .task مناسبًا، اختبر المطالبات والموارد، ثم حسّن الذاكرة وزمن الاستجابة قبل الإنتاج.

إذا كنت تبني API حول النموذج أو تدمجه مع خدمات خلفية، استخدم Apidog لاختبار الطلبات، توثيق العقد، ومحاكاة الحالات قبل إطلاق الميزة للمستخدمين.

DEV Community