وقتی هوش مصنوعی Gemini 2.5 گوگل دقیقتر دستور میگیرد اما مرز ایمنی را رد میکند
گوگل در گزارش فنی اخیر خود به بررسی عملکرد مدل هوش مصنوعی Gemini 2.5 Flash پرداخته که نشاندهنده افت عملکرد در آزمونهای امنیتی است.
این مدل در دو معیار اصلی "امنیت متن به متن" و "امنیت تصویر به متن" به ترتیب 4.1 و 9.6 درصد عقبگرد داشته است. آزمونهای مذکور به بررسی میزان تولید محتوای ناقض دستورالعملهای امنیتی گوگل میپردازند.
شرکتهای هوش مصنوعی در حال تلاش برای ایجاد مدلهای انعطافپذیرتر هستند که بتوانند به موضوعات حساس و جنجالی پاسخ دهند. این رویکرد در برخی موارد منجر به نتایج نامطلوب شده است.
گوگل اذعان کرده که Gemini 2.5 Flash دستورات را دقیقتر اجرا میکند، حتی اگر این دستورات از خطوط مشکلساز عبور کنند. شرکت بخشی از این تنزل را ناشی از موارد منفی کاذب میداند.
آزمونهای اضافی نشان میدهد این مدل کمتر از نسخه قبلی از پاسخ دادن به سؤالات جنجالی خودداری میکند و حتی در برخی موارد به تولید محتوای مخاطرهآمیز میپردازد. /



