الذكاء الاصطناعي يزداد قوة، لكن هلوساته تزداد سوءًا

لمحة نيوز

في مقابل التقدم السريع لقدرات نماذج الذكاء الاصطناعي على الاستدلال والمعالجة، تظهر “هلاوس” هذه النماذج بمعدلات متزايدة مع زيادة حجمها وتعقيدها. فقد سجل نموذج o3 من OpenAI معدل هلاوس يبلغ 33%، بينما تجاوز o4‑mini نسبة 48% على معيار PersonQA الداخلي للشركة . ولا تقتصر المشكلة على OpenAI؛ إذ أبلغت كلٌ من Google وMeta عن اضطرابات مماثلة في نماذجها الأحدث، ما يشير إلى أن الضخامة والتعقيد لا يضمنان الدقة بالضرورة . رصدت دراسات أكاديمية أنّ نماذج أكبر تولّد هلاوس أكثر عند معالجة وثائق متعددة، إذ بلغت نسبتها 75% في بعض الاختبارات . تعود هذه الظاهرة إلى عوامل منها “قوانين التوسع” غير المكتملة التي تجعل التمييز بين الحقيقة والخيال يتخلف عن سهولة التعلم العام ، وضوضاء بيانات التدريب التي تدفع النماذج لاختلاق معلومات لتوفيق مخرجاتها داخليًا . وللحد من هذه الهلاوس، يقترح الباحثون التوليد المدعوم بالاسترجاع لتثبيت الحقائق في القاعدة المعرفية للنموذج، وتدريبها على الاعتراف بالجهل بقول “لا أعرف” ، بالإضافة إلى إشراف بشري مستمر وتقنيات التصفية ما بعد

المعالجة للمراجعة والكشف المبكر عن المعلومات الملفقة .

تعريف “هلاوس” الذكاء الاصطناعي

مفهوم الهلاوس

الهلاوس في سياق الذكاء الاصطناعي هي الحالات التي يولّد فيها النموذج معلومات زائفة أو غير دقيقة، مدعيًا صحتها بثقة عالية، مما يصعّب على المستخدم اكتشاف الخطأ .

أشكال الهلاوس

تفاصيل مُلفّقة: أمثلة على اقتباسات أو إحصائيات غير موجودة تمامًا.

إجابات متناقضة: وضع بيانات تتصادم داخليًا ضمن نفس الرد.

وهم اليقين: بثقة مفرطة في معلومات خاطئة، مما يغري المستخدم بالاعتماد عليها .

أدلة تفاقم الهلاوس مع التوسع في النماذج

ارتفاع معدلات الهلاوس في النماذج الحديثة

أظهرت تجربة PersonQA أن o3 من OpenAI هلاوس بنسبة 33%، بينما بلغت o4‑mini نسبة 48%، مقارنة بـ16% فقط في o1 و14.8% في o3‑mini .
تؤكد تغطية Futurism أنّ نماذج “الاستدلال” الحديثة تبدي زيادة في إنتاج الهلاوس رغم توقع انحدارها مع النمو في القدرات .

نتائج الأبحاث الأكاديمية

في دراسة بجامعة كاليفورنيا، وجد الباحثون أن نماذج أكبر تولّد هلاوس بنسبة تصل إلى 75% عند التعامل مع ملخصات

متعددة الوثائق، ما يؤكد أن الزيادة في الحجم لا تصحبه دقة متناسبة .

الأسباب الجذرية لارتفاع معدلات الهلاوس

قوانين التوسع غير المكتملة

تكشف قوانين التوسع أن بعض جوانب النموذج، كقدرته على التمييز بين الحقائق والخيال، لا تتحسن بنفس نسبة زيادة الحجم والمعلمات .

جودة بيانات التدريب

تعاني بيانات التدريب من ضوضاء وتناقضات، وبدلًا من رفض المعلومات المشكوك فيها، تعوّض النماذج الكبيرة عن الفجوات عبر اختلاق محتوى يبرر التوافق الداخلي للخروج .

التكاثر الداخلي الافتراضي

يحذّر خبراء من “التكاثر الداخلي الافتراضي”، حيث تُعاد تغذية النماذج بمخرجات مولّدة سابقًا، ما يزيد من حدة الهلاوس مع كل جيل جديد .

تداعيات الهلاوس قصيرة وطويلة الأمد

تآكل ثقة المستخدمين

وجدت دراسة BBC أنّ أكثر من نصف إجابات الذكاء الاصطناعي المتعلقة بالأخبار كانت مضللة أو خاطئة، ما يهدد ثقة الجمهور في هذه التقنيات .

مخاطر أمنية واجتماعية

يمكن أن تُستغل الهلاوس في إنشاء معلومات زائفة لأغراض الاحتيال أو التشهير، مهددةً الأمن السيبراني والنسيج الاجتماعي .

تباطؤ التبني المؤسسي

يتردد

القادة التنفيذيون في إدخال هذه النماذج في مهام حيوية خوفًا من خسائر السمعة والمسؤوليات القانونية الناتجة عن الأخطاء الجسيمة .

استراتيجيات للتخفيف من الهلاوس

التوليد المدعوم بالاسترجاع

ربط النموذج بقواعد بيانات حقيقية لإثراء الأجوبة بالحقائق والتحقق اللحظي يقلل من معدلات الهلاوس .

تدريب على الاعتراف بالجهل

تشجيع النماذج على قول “لا أعرف” عند الشك بدلًا من التأليف يعزز الثقة ويقلل من المخرجات الخاطئة .

إشراف بشري مستمر

إدخال طبقة مراجعة بشرية للأجوبة الحساسة باستخدام أدوات اكتشاف التناقضات يضمن كشف الأخطاء قبل وصولها للمستخدم النهائي .

تصفية ما بعد المعالجة

تطبيق خوارزميات تراقب المحتوى المنتحل وتنبه عند ظهور مؤشرات على هلاوس قبل عرضه على المستخدم .

خاتمة

بينما يواصل الذكاء الاصطناعي تقدمه التقني، تشكل الهلاوس تحديًا مركزيًا يهدد ثقة المستخدمين ويعيق تطبيقاته الآمنة. للتغلب على هذه المفارقة، لا بد من دمج إجراءات التحقق من الحقائق، وتبني استراتيجيات تدريبية جديدة، وتعزيز الإشراف البشري المستمر. بهذه الخطوات المتناسقة، سيمكن تحويل

النماذج من “منتج للردود” إلى أدوات معرفية موثوقة تخدم البشرية بفعالية.

تم نسخ الرابط