دراسة حديثة تكشف عن تراجع أداء “ChatGPT”: هل فعلاً أصبح أقل ذكاءً؟
"تحليل دراسة: تراجع أداء "ChatGPT" عبر الوقت يثير الجدل حول ذكاء الروبوتات اللغوية"
تحليل: دراسة تشير إلى تدهور في أداء “ChatGPT” عبر الوقت
توصلت دراسة حديثة أجريت من قبل باحثين من جامعتي ستانفورد وبيركلي الأمريكيتين إلى نتائج مثيرة للاهتمام حول نموذج اللغة الكبير “جي بي تي” الذي يشكل أساس روبوت الدردشة “شات جي بي تي”. ووفقًا للدراسة، فإن النموذج قد تدهور في أدائه عبر الوقت، وازداد غباءً على نحو ملحوظ.
تُظهر النتائج أن كلاً من نموذجي “جي بي تي-3.5” و “جي بي تي-4” قد شهدا انخفاضًا كبيرًا في دقة ردودهما خلال الأشهر التي تلت إصدارهما. على سبيل المثال، أشارت الدراسة إلى أن نموذج “جي بي تي-4” كان قادرًا على تحديد الأعداد الأولية بدقة تصل إلى 97.6% في شهر آذار/مارس 2023، ولكنه انخفض بشكل كبير في الأداء في نفس الأسئلة في شهر حزيران/يونيو 2023 إلى دقة لم تتجاوز 2.4%.
اقرا المزيد .. خلل تقني في فيسبوك.. وصول طلبات صداقة بشكل تلقائي دون إذن صاحب الحساب
وأظهرت النتائج أيضًا أن النموذجين عانيا من المزيد من أخطاء التنسيق في إنشاء التعليمات البرمجية في شهر حزيران/يونيو مقارنة بشهر آذار/مارس، مما يدعم ادعاءات المستخدمين الذين لاحظوا تدهور أداء روبوت الدردشة مع مرور الوقت.
بالرغم من هذه النتائج، فقد نفى رئيس المنتجات في شركة “أوبن إيه آي OpenAI”، المطورة لروبوت الدردشة “شات جي بي تي”، أن يكون التدهور في أداء “جي بي تي-4” نتيجة متعمدة. وأكد أن الهدف هو جعل كل إصدار جديد أكثر ذكاءً من الإصدار السابق. وربما يكون سبب التغيرات الملحوظة في تجربة المستخدم هو الاستخدام المستمر للنموذج، حيث قد يظهر بعض المشكلات التي لم يتم اكتشافها في البداية.
في النهاية، تُعتبر هذه الدراسة إشارة مهمة لتطويرات وتحسينات مستقبلية لنماذج اللغة الكبيرة مثل “جي بي تي”، وتؤكد على أهمية متابعة وتقييم أداء هذه النماذج بانتظام للتأكد من حفاظها على جودتها وذكائها في مختلف الظروف والتحديثات.