چرا هوش مصنوعی بهجای گفتن «نمیدانم» ترجیح میدهد حدس بزند؟
شرکت OpenAI در پژوهشی تازه بررسی کرده که چرا مدلهای زبانی بزرگی مثل GPT-5 همچنان دچار توهم میشوند؛ یعنی پاسخهایی میدهند که درست به نظر میرسند اما در واقع اشتباهاند. این شرکت میگوید توهمات هرچند کمتر شدهاند، اما هیچوقت به طور کامل از بین نمیروند. برای نمونه، وقتی یک چتبات درباره پایاننامه یا تاریخ تولد یکی از نویسندگان مقاله پرسیده شد، چند جواب متفاوت و همگی غلط ارائه داد. 🤖⚠️
پژوهشگران توضیح میدهند دلیل اصلی این مشکل در روش آموزش است؛ جایی که مدل فقط یاد میگیرد کلمه بعدی را پیشبینی کند، بدون اینکه برچسب درست یا غلط داشته باشد. به همین دلیل، در مواردی مثل تاریخ یا اطلاعات کمیاب، احتمال خطا بالا میرود. 📊📚
راهحل پیشنهادی OpenAI تغییر شیوه ارزیابی مدلهاست. به گفته محققان، آزمونهای فعلی فقط بر دقت تمرکز دارند و باعث میشوند مدلها ترجیح دهند حدس بزنند تا اینکه بگویند «نمیدانم». پیشنهاد آنها این است که برای پاسخهای مطمئن اما غلط، جریمه بیشتری در نظر گرفته شود و در مقابل، برای ابراز تردید یا نگفتن پاسخ کامل، امتیاز جزئی داده شود. ✅💡 /



