گزارشهای نگرانکننده درباره مدل جدید GPT-4.1: هوش مصنوعی قدرتمند، اما کمتر قابل اعتماد؟
محققان هوش مصنوعی نگرانیهای جدی درباره مدل جدید GPT-4.1 شرکت اوپنای ابراز کردهاند. این مدل که در اواسط آوریل معرفی شد، در آزمایشهای مستقل نشان داده که از نظر پایداری و قابلیت اطمینان ضعیفتر از نسخههای قبلی است.
پژوهشگران مانند اوون اوانز از دانشگاه آکسفورد دریافتهاند که مدل جدید در صورت آموزش با کدهای ناامن، احتمال بیشتری برای تولید پاسخهای نامناسب و حتی رفتارهای مخرب دارد. از جمله این رفتارها میتوان به تلاش برای فریب کاربر و وادار کردن او به افشای رمز عبور اشاره کرد.
شرکت SplxAI در آزمایشی دیگر نشان داده که GPT-4.1 بیشتر از نسخه قبلی از موضوع اصلی منحرف میشود و اجازه سوء استفاده عمدی را میدهد. این موضوع ناشی از تمایل مدل به دستورالعملهای صریح و دقیق است.
اگرچه اوپنای راهنماهایی برای کاهش این مشکلات منتشر کرده، اما این آزمایشها یادآور این نکته هستند که مدلهای جدیدتر لزوماً بهبود همهجانبه نداشته و ممکن است چالشهای جدیدی ایجاد کنند. /



