نموذج LLaMa يتفوق على ChatGPT
كتبت: سندس أشرف
أعلنت شركة “Meta Platforms Inc” يوم الجمعة 24 فبراير أنها سوف تصدر نموذجًا لغويًا رئيسيًا جديدًا يسمى “LLaMA“، وهو اختصار لنموذج اللغة الكبيرة Meta الذكاء الاصطناعي، للباحثين والمؤسسات التابعة للحكومة والمجتمع المدني والأوساط الأكاديمية.
–ما هو LLaMA ؟
هو نموذج أساسي للغة كبيرة من أحدث طراز مصمم لمساعدة الباحثين على تطوير عملهم في هذا المجال الفرعي للذكاء الاصطناعي “AI”، وتعمل النماذج الأصغر والأكثر أداءً مثل LLaMA على تمكين الآخرين في مجتمع البحث الذين ليس لديهم إمكانية الوصول إلى كميات كبيرة من البنية التحتية لدراسة هذه النماذج ، مما يؤدي إلى إضفاء المزيد من الديمقراطية على الوصول في هذا المجال المهم سريع التغير.
–كيف تختلف LLaMA عن Chat GPT ؟
يختلف LLaMa عن ChatGPT فهي ليست روبوت محادثة يمكن لأي شخص التحدث إليه أو طرح الأسئلة أو إعطاء الأوامر، وبدلاً من ذلك إنها أداة بحث تقول Meta إنها تشاركها على أمل “إضفاء الطابع الديمقراطي على الوصول في هذا المجال المهم سريع التغير”، بمعنى آخر لمساعدة الخبراء على حل مشاكل نماذج لغة الذكاء الاصطناعي، من التحيز والسمية إلى ميلهم إلى تكوين المعلومات ببساطة.
–أهمية نموذج LLaMa وما هو الغرض منه :
تؤدي هذه الخطوة إلى زيادة المنافسة في عالم الذكاء الاصطناعي، حيث تتنافس شركات التكنولوجيا الكبرى على دمج هذه التكنولوجيا في منتجاتها وتريد أيضًا إقناع المستثمرين بها.
تستخدم نماذج اللغة الكبيرة لتبسيط المعلومات وإنشاء المحتوى، ويمكنهم الإجابة على الأسئلة بجمل تبدو كما لو كانت مكتوبة من قبل البشر.
وكتبت الشركة في منشور لها: “نعتقد أن مجتمع الذكاء الاصطناعي بأكمله ‘الباحثون الأكاديميون، والمجتمع المدني، وصانعو السياسات، والصناعة’ يجب أن يعملوا معًا لتطوير مبادئ توجيهية واضحة حول الذكاء الاصطناعي المسؤول بشكل عام ونماذج اللغة الكبيرة المسؤولة بشكل خاص”.
واضافت “نتطلع إلى رؤية ما يمكن أن يتعلمه المجتمع ويبنى باستخدام “LLaMA” كنموذج أساسي.
تم تصميم LLaMA ليكون متعدد الاستخدامات ويمكن تطبيقه على العديد من حالات الاستخدام المختلفة، مقابل نموذج دقيق مصمم لمهمة محددة.
من خلال مشاركة رمز “LLaMA” يمكن للباحثين الآخرين اختبار الجديد بسهولة أكبر مناهج للحد من هذه المشكلات أو القضاء عليها في نماذج اللغة الكبيرة”.
وأضاف زوكربيرج في المنشور “لقد أظهرت LLaMA الكثير من الوعد في إنشاء نص وإجراء محادثات وتلخيص المواد المكتوبة ومهام أكثر تعقيدًا مثل: حل نظريات الرياضيات أو توقع هياكل البروتين، تلتزم Meta بهذا النموذج المفتوح من البحث وسنوفر نموذجنا الجديد إلى مجتمع أبحاث الذكاء الاصطناعي”.
يتم تدريب LLaMA من Meta على 20 لغة مع التركيز على اللغات التي تستخدم الحروف الهجائية اللاتينية والسيريالية.
وقال “جيل لوريا” كبير محللي البرمجيات في “D.A”:
“يبدو إعلان ميتا وكأنه خطوة لاختبار قدراتها الذكاء الاصطناعي التوليدية حتى يتمكنوا من تنفيذها في منتجاتهم في المستقبل”.
كما أضاف: “الذكاء الاصطناعي التوليدية هو تطبيق ذكاء اصطناعي جديد تتمتع Meta بخبرة أقل، ولكنها مهمة بشكل واضح لمستقبل أعمالها”.
-تدعي Meta أن LLaMA يتطلب قوة حوسبة أقل بكثير من النموذج السابق، ويمكن أن يتفوق على المنافسين الذين يتحققون من المزيد من المعلمات، ويمكن أن يتفوق إصدار LLaMA الذي يحتوي على 13 مليار معلمة على GPT-3، وهو سلف جديد للنموذج على ChatGPT.
كتب باحثو الشركة في ورقة بحثية أنه: “يتفوق LLaMA-13B على GPT-3 في معظم المعايير، على الرغم من كونه أصغر بعشر مرات”.
وأضاف باحثو الشركة في ورقة بحثية: “نعتقد أن هذا النموذج سيساعد في إضفاء الطابع الديمقراطي للوصول إلى نماذج اللغة الكبيرة “LLM” ودراستها، حيث يمكن تشغيلها على وحدة معالجة رسومات “GPU” واحدة”.
والجدير بالذكر أنه ظهر GPT-3 لأول مرة في عام 2020 ثم ظهر الإصدار الأحدث لبرنامج ChatGPT الخاص بـ OpenAI.
في الماضي أطلقت Meta برامج الدردشة الخاصة بها، لكنها فشلت في جذب الإثارة مثل ChatGPT من OpenAI، والتي ربما وصلت مؤخرًا إلى 100 مليون مستخدم، لذلك فمن المحتمل أن الشركة تريد أن تأخذ وقتها قبل إطلاق LLaMA للجمهور.
يأتي نموذج Meta LLaMA بأربعة إصدارات تعمل على أكثر من 7 مليارات أو 13 مليارًا أو 33 مليارًا أو 65 مليار معيار. وهو أقل بكثير من GPT-3 الخاص بـ OpenAI، والذي يعمل على 175 مليار معيار.
وعلى الرغم من ذلك تقول Meta إن LLaMA كانت قادرة على التفوق في الأداء على نماذج اللغة الكبيرة الحالية من خلال تدريبها على المزيد من البيانات، والمعروفة باسم الرموز المميزة.
يمكن للباحثين التقديم للحصول على نموذج Meta LLaMA من خلال موقع ويب الشركة.
كما تدعي Meta أيضًا أن نموذج LLaMA الذي يحتوي على 65 مليار معلمة “تنافسي” مع “Chinchilla 70B و PaLM-540B” من Google، من المتوقع أن يعزز نموذج LLaMA هذا قدرات Meta في مجال الذكاء الاصطناعي التوليدية.
ويشير الإعلان إلى أن الذكاء الاصطناعي أصبح مجالًا استثماريًا واعدًا في صناعة التكنولوجيا، التي يتباطأ نموها ويؤدي إلى تخفيضات في الميزانية بالإضافة إلى الحد من المخاطر التجريبية.
أصدرت Meta سابقًا نموذج اللغة الكبير OPT-175B في مايو 2021 والذي كان يستهدف أيضًا الباحثين، وأصبح هذا النموذج أساس إنشاء روبوت الدردشة Blender Bot.