أعلنت اليوم «إنسبشن»، إحدى شركات مجموعة «جي42» والمتخصصة في تطوير تقنيات الذكاء الاصطناعي، وجامعة محمد بن زايد للذكاء الاصطناعي، أول جامعة بحثية للدراسات العليا المتخصصة في بحوث الذكاء الاصطناعي على مستوى العالم من خلال معهدها «معهد النماذج التأسيسية» وبالتعاون مع "سيريبراس"، عن تدشين «شركالا»، وهو نموذج لغوي كبير باللغة الكازاخية، ويتميز بفكرته الرائدة التي تهدف إلى تمكين أكثر من 13 مليون متحدث باللغة الكازاخية عبر تزويدهم بإمكانيات الذكاء الاصطناعي التوليدي.
ويُعد «شركالا» نموذجًا متطورًا مكون من 8 مليارات بارامتر، تم تدريبه على 45 مليار كلمة، مع التركيز بشكل أساسي على اللغة الكازاخية، بينما يتضمن أيضًا اللغات الإنجليزية والروسية والتركية. وتم تطويره بالاعتماد على النموذج اللغوي الكبير"لاما "3.1 ، مع توسيع المُجزئ اللغوي بنسبة 25% لتحسين فهم اللغة الكازاخية وإنتاج النصوص بكفاءة أكبر. تم تدريب النموذج على "مجرة الكوندور"، أحد أقوى الحواسيب الفائقة للذكاء الاصطناعي في العالم، والمُخصص لعمليات التدريب والاستدلال، والذي تم تطويره بواسطة " جي42" و"سيريبراس".
وقال الدكتور أندرو جاكسون، الرئيس التنفيذي لشركة «إنسبشن»: "يعزز تدشين «شركالا» التزامنا بتلبية احتياجات المجتمعات اللغوية غير المُمثلة بشكل كافٍ من خلال تقنيات الذكاء الاصطناعي المتقدمة. وبالتعاون مع جامعة محمد بن زايد للذكاء الاصطناعي، نفخر بتقديم نموذج يُمَكِّن المتحدثين الكازاخيين ويعيد تعريف مشهد النماذج اللغوية الكبيرة باستخدام حلول للذكاء الاصطناعي تتسم بالكفاءة والشمولية والقابلية للتوسع. ومن خلال النموذج «جيس» للمتحدثين باللغة العربية والنموذج «ناندا» باللغة الهندية، والآن «شركالا»، نتوسع في القدرة على الوصول للمتحدثين الكازاخيين، ونواصل قيادة شمولية الذكاء الاصطناعي لضمان التمثيل الكامل للغات التي تعاني عدم كفاية الخدمة في منظومة الذكاء الاصطناعي. وتُقربنا هذه العلامة الفارقة من مستقبل أكثر إنصافًا حيث تُسخّر التكنولوجيا لتمكين كل صوت".
ويضع «شركالا» معيارًا جديدًا للنماذج اللغوية الكبيرة للغة الكازاخية من خلال التميز في فهم هذه اللغة وتوفير عمليات التقييم التوليدية. ويفوق النموذج أقرانه الأضخم حجمًا من خلال كفاءته في توليد الرموز اللغوية وقدراته المتطورة والرائدة في إجراء المحادثات، حيث خضع لاختبارات صارمة استنادًا إلى استفسارات منسقة بشريًا حول الثقافة والتاريخ والمعرفة الكازاخية. ويُعَد الأفضل أداءً بين النماذج مفتوحة المصدر من نفس هذا الحجم التي تركز على اللغة الكازاخية، ويفوق فيما يتعلق بقدرته التوليدية نماذج أضخم منه حجمًا قد تصل أحجامها إلى 70 مليار بارامتر.
وقال البروفيسور بريسلاف ناكوف، أستاذ ورئيس قسم معالجة اللغة الطبيعية لدى جامعة محمد بن زايد للذكاء الاصطناعي: "يسرنا في جامعة محمد بن زايد للذكاء الاصطناعي أن نتعاون مع «إنسبشن» في تطوير «شركالا»، والذي يُعَد نموذجًا لغويًا كبيرًا مبتكرًا للغة الكازاخية. يعكس هذا التعاون رؤيتنا المشتركة في ابتكار حلول ذكاء اصطناعي مؤثرة للأسواق التي لا تحظى بالخدمات الكافية. ولأنه يبني على نجاح النماذج اللغوية الكبيرة السابقة، يمثل «شركالا» قفزة هائلة للأمام فيما يتعلق بإتاحة الفرصة للجميع للوصول إلى الذكاء الاصطناعي والحفاظ على التراث اللغوي وتمكين المجتمعات من الازدهار في عصر الرقمنة. ونعمل نحن و«إنسبشن» على إحداث تحول في مشهد النماذج اللغوية الكبيرة وترسيخ سابقة في تطوير الذكاء الاصطناعي المُبتَكَر والشامل والمسؤول».
أصبح «شركالا» متاحًا الآن كنموذج مفتوح المصدر علىHugging Face: https://huggingface.co/inceptionai/Llama-3.1-Sherkala-8B-Chat، مما يتيح للباحثين والمطورين والمؤسسات فرصة استكشاف إمكاناته والبناء عليها.
0 تعليق