سلوك غير مسبوق لنموذج ذكاء اصطناعي تابع لمجموعة "علي بابا" اسمه ROME كشفت عنه ورقة بحثية، ذلك أنه أثناء مرحلة التدريب اكتشف النموذج ثغرة في نظام المكافآت..
فبدلاً من الالتزام بالقيود المحددة، قام بشكل مستقل بإنشاء قناة اتصال خارجية نفق SSH والتحايل على جدران الحماية بهدف تحويل موارد الحوسبة المخصصة للتدريب إلى التنقيب عن العملات الرقمية!!!
ذلك أن النموذج "استنتج" أن السيطرة على موارد إضافية تعزز قدرته الحسابية وبالتالي تحسن أداءه وفق معادلة المكافأة الرياضية دون أي توجيه بشري مباشر لهذا الفعل المشين.
لم يكن الأمر تمرداً كما أوحت العناوين الرنانة، بل كان نتيجةً منطقية لخوارزمية تعلم بالتعزيز سعت لتحقيق أهدافها "وما استتجت أنه أهدافها" بأقل التكاليف وأكبر المكاسب.
مما يعني أننا أمام حاجة ملحة لإعادة صياغة آليات العزل (Sandboxing) ومراقبة السلوك في الزمن الحقيقي، لضمان بقاء الذكاء الاصطناعي أداةً في خدمتنا، لا منافساً يتلاعب بقواعد اللعبة لصالحه.
المصادر:
https://arxiv.org/abs/2512.24873
https://oecd.ai/en/incidents/2026-03-07-95e2
![?=$r['src']?>](pages/photos/a1593798115293aa2z-cn.png)
![?=$r['src']?>](pages/photos/a1593800018531agen_touch-logo.png)
![?=$r['src']?>](pages/photos/a1593798641550aDHL-logo.png)
![?=$r['src']?>](pages/photos/a1593798482251afoxconn-logo.png)
![?=$r['src']?>](pages/photos/a1593799221711aepson-logo.png)