أصبح إنشاء الصور باستخدام الذكاء الاصطناعي أسهل من أي وقت مضى، بفضل إدماج أدوات إنشاء الصور في روبوتات الدردشة التي أصبحت منتشرة بنحو كبير في الوقت الحالي، وأصبح العديد من الأشخاص يستخدمونها، وأبرزها: Grok و Gemini.
Grok هو روبوت دردشة جديد نسبيًا مضمن داخل منصة X، وهو الآن متاح مجانًا لجميع مستخدمي المنصة، وهناك شائعات بأنه سيتحول إلى تطبيق مستقل في وقت لاحق من العام المقبل. وهذا سيضعه في منافسة مباشرة مع Gemini من جوجل، وChatGPT من OpenAI، و Meta AI.
كما وفّر فريق xAI لروبوت Grok نموذجًا مخصصًا لإنشاء الصور بالذكاء الاصطناعي. ففي السابق، كان يستخدم نموذج Flux لإنشاء الصور، لكنه انتقل الآن إلى نموذج Aurora.
وأما Gemini فقد تطور كثيرًا مع إطلاق نموذج Gemini 2.0 Flash الذي أصبح متاحًا لمشتركي Gemini Advanced. ومع ذلك، ما يزال يعتمد على نموذج Imagen 3 لإنشاء الصور حاليًا، لكن هذا الوضع سيتغير مع استخدام الإصدار الجديد Gemini 2.0 الذي يتمتع بقدرة كبيرة على إنشاء الصور.
كلا الروبوتين Grok و Gemini يمكنهما إنشاء صور احترافية ومطابقة للوصف النصي، ومع ذلك يتفوق أحدهما على الآخر في بعض الأحيان، لذلك أجرينا مقارنة بينهما لتقييم أدائهما، ومساعدتك في اختيار الروبوت الأفضل في إنشاء الصور.
إنشاء المطالبات للاختبار:
لاختبار كلا الروبوتين سنستخدم الإصدارات المجانية من كليهما، وسنستخدم أيضًا سبعة مطالبات نصية بسيطة تتضمن مفاهيم عامة مع بعض التفاصيل، مع إضافة كلمات مثل: “تخيل” أو “ارسم”، أو “أنشئ صورة” لإعلام النموذج بأن المطلوب ليس نصًا أو قصة. ولضمان تقديم صور حقيقة وليس رسومات، استخدمنا كلمات مثل: التصوير الفوتوغرافي أو التصوير الوثائقي أو التصوير القديم.
Gemini يُنتج الصور بنسبة عرض تبلغ (1:1)، وأما Grok فينتج صورًا بنسبة عرض تبلغ (4:3)، وجميع الصور المرفقة في المقال هي الاستجابات الأولى للروبوتات دون أي تعديلات.
1- صورة لحيوان بري في مدينة حديثة:
لاختبار قدرة هذه الروبوتات على تصوير الحيوانات وتفاصيل الإضاءة والخلفية بدقة، سنستخدم المطالبة التالية: “أنشئ صورة بأسلوب التصوير الفوتوغرافي لثعلب أحمر يتنقل عبر تقاطع مدينة ممطر عند الفجر، بينما ينتظر المارة تحت مظلاتهم عند الإشارة.”
صور Grok:
صور Gemini:
النتيجة: كلا الروبوتين قدمان صور مناسبة للوصف، لكن الصورة التي قدمها Gemini كانت مطابقة تمامًا للوصف، وتضمنت إضاءة مميزة.
الفائز: Gemini
2- صورة لمطبخ مزدحم:
لاختبار قدرة الروبوتات على عرض تفاصيل المطبخ والتفاصيل الدقيقة مثل الأبخرة، سنستخدم المطالبة التالية: “أنشئ صورة لمطبخ طاهٍ محترف مشغول بالطهي، مع بخار يتصاعد من الأواني.”
صور Grok:
صور Gemini:
النتيجة: تفوق Grok على Gemini فقد قدم صورًا مطابقة للوصف تمامًا، وأما Gemini فلم يقدم أي صورة، وكتب ملاحظة تفيد بأن مزية إنشاء الصور ستتوفر قريبًا في Gemini Advanced.
الفائز: Grok
3- صورة لموقع بناء:
لاختبار قدرة الروبوتات على عرض التفاصيل الواقعية وتصوير المباني سنستخدم المطالبة التالية: “أنشئ صورة بأسلوب التصوير الوثائقي لمبنى متوسط الارتفاع قيد الإنشاء، مع عمال يركبون الألواح الزجاجية ورافعات تعمل في السماء الصافية بعد الظهر.”
صور Grok:
صور Gemini:
النتيجة: صورة Gemini كانت أكثر واقعية ومطابقة تمامًا للوصف، واحتوت على التفاصيل المطلوبة مثل: العمال، وشكل السماء الصافية. وأما صور Grok فلم تكن مطابقة تمامًا للتفاصيل المذكورة في المطالبة، فلم يظهر العمال بوضوح في أي صورة، كما أن المباني الظاهرة في جميع الصور عالية الارتفاع وليست متوسطة، وبعض الصور لا تظهر فيها السماء الصافية.
الفائز: Gemini.
4- صورة لسوق خضراوات في الصباح الباكر:
لاختبار قدرة الروبوتات على ضبط الإضاءة والتوقيت والتفاعل البشري، سنستخدم المطالبة التالية: “أنشئ صورة لسوق مزارعين مزدحم في الساعة السابعة صباحًا، مع الباعة يعدّون أكشاكهم والمشترين يفحصون الخضراوات والفاكهة الطازجة.”
صور Grok:
صور Gemini:
النتيجة: تفوق Grok على Gemini، فقد تضمنت الصور التي قدمها جميع التفاصيل المطلوبة، وأما Gemini فقد قدم صورة لا تتضمن سوى القليل من الخضراوات وكانت الصورة قريبة جدًا ولا تتضمن أي تفاصيل أخرى.
الفائز: Grok
5- صورة لسيارة في ورشة تصليح:
لاختبار قدرة الروبوتات على تصوير السيارات وأدوات التصليح والإضاءة المناسبة للوصف، سنستخدم المطالبة التالية: “أنشئ صورة بالأبيض والأسود، بأسلوب تصوير قديم لميكانيكي يستخدم أداة فحص على سيارة حديثة، مع غطاء المحرك مرفوع.”
صور Grok:
صور Gemini:
النتيجة: تفوق Grok على Gemini فقد قدم صورًا مطابقة للوصف تمامًا، وأما Gemini فلم يقدم أي صورة، وكتب ملاحظة تفيد بأن مزية إنشاء الصور ستتوفر قريبًا في Gemini Advanced.
الفائز: Grok
6- صورة لحالة طارئة:
لاختبار قدرة الروبوتات على عرض التفاصيل الواقعية والإجراءات الأمنية، سنستخدم المطالبة التالية: “أنشئ صورة فوتوغرافية لحالة طارئة يُعالج فيها المسعفون مريضاً في شارع سكني بينما يوجه رجال الشرطة حركة المرور حول الموقع.”
صور Grok:
صور Gemini:
النتيجة: تفوق Grok على Gemini فقد قدم صورًا قريبًا جدًا للوصف، وأما Gemini فلم يقدم أي صورة، وكتب ملاحظة طويلة تفيد بأنه غير قادر على إنشاء الصورة، واقترح أدوات ذكاء اصطناعي يمكن استخدامها لإنشاء الصورة المطلوبة.
الفائز: Grok
7- التدريب على عزف الكمان:
لاختبار قدرة الروبوتات على تصوير الإضاءة الطبيعية ووضعية اليد الصحيحة، سنستخدم المطالبة التالية: “أنشئ صورة لعازف كمان يتدرب بمفرده في غرفة عند غروب الشمس، مع إظهار ورقة النوتة الموسيقية على الحامل.”
صور Grok:
صور Gemini:
النتيجة: تفوق Grok على Gemini فقد قدم صورًا مطابقة للوصف تمامًا، وأما Gemini فلم يقدم أي صورة، وكتب ملاحظة تفيد بأنه غير قادر على إنشاء الصورة المطلوبة.
الفائز: Grok
النتيجة النهائية:
يتفوق الإصدار المجاني من Grok على الإصدار المجاني من Gemini في إنشاء الصور الاحترافية والمتنوعة. وهذا يعني أن روبوت Grok هو الخيار المناسب لمستخدمي الإصدارات المجانية من كلا الروبوتين أو الذين يبحثون عن أداة ذكاء اصطناعي لإنشاء صور احترافية مجانًا.
نسخ الرابط تم نسخ الرابط
0 تعليق