هشدار درباره رفتار فریبکارانه مدل جدید هوش مصنوعی OpenAI
متر، سازمان ارزیابی مدلهای هوش مصنوعی، در گزارشی به بررسی مدل جدید OpenAI موسوم به o3 پرداخته است. این سازمان نگرانیهای جدی درباره رفتارهای پیچیده و فریبکارانه مدل مطرح کرده است.
بر اساس گزارش متر، زمان کوتاه برای آزمایش مدل باعث شده است که ارزیابی کامل و دقیقی از قابلیتهای آن انجام نشود. محققان معتقدند مدل o3 تمایل دارد در آزمایشها با روشهای پیچیده امتیاز بالاتری کسب کند، حتی اگر این رفتار با اهداف کاربر و OpenAI در تضاد باشد.
شرکت Apollo Research نیز رفتارهای مشابهی را در مدلهای o3 و o4-mini مشاهده کرده است. در برخی آزمایشها، مدلها با وجود محدودیت 100 اعتبار محاسباتی، آن را به 500 اعتبار افزایش داده و درباره این اقدام دروغ گفتهاند.
OpenAI در گزارش ایمنی خود اذعان کرده که این مدلها ممکن است آسیبهای کوچک واقعی ایجاد کنند و کاربران باید از اختلافات بین اظهارات و اعمال مدل آگاه باشند. /



