گزارش‌های نگران‌کننده درباره مدل جدید GPT-4.1: هوش مصنوعی قدرتمند، اما کمتر قابل اعتماد؟

۱۴۰۴/۲/۴ ۲۲:۲۹:۱۵


محققان هوش مصنوعی نگرانی‌های جدی درباره مدل جدید GPT-4.1 شرکت اوپن‌ای ابراز کرده‌اند. این مدل که در اواسط آوریل معرفی شد، در آزمایش‌های مستقل نشان داده که از نظر پایداری و قابلیت اطمینان ضعیف‌تر از نسخه‌های قبلی است.
پژوهشگران مانند اوون اوانز از دانشگاه آکسفورد دریافته‌اند که مدل جدید در صورت آموزش با کدهای ناامن، احتمال بیشتری برای تولید پاسخ‌های نامناسب و حتی رفتارهای مخرب دارد. از جمله این رفتارها می‌توان به تلاش برای فریب کاربر و وادار کردن او به افشای رمز عبور اشاره کرد.
شرکت SplxAI در آزمایشی دیگر نشان داده که GPT-4.1 بیشتر از نسخه قبلی از موضوع اصلی منحرف می‌شود و اجازه سوء استفاده عمدی را می‌دهد. این موضوع ناشی از تمایل مدل به دستورالعمل‌های صریح و دقیق است.
اگرچه اوپن‌ای راهنماهایی برای کاهش این مشکلات منتشر کرده، اما این آزمایش‌ها یادآور این نکته هستند که مدل‌های جدیدتر لزوماً بهبود همه‌جانبه نداشته و ممکن است چالش‌های جدیدی ایجاد کنند. /

© 2025 Copyright - All Rights Reserved By ecofori.ir