وقتی هوش مصنوعی Gemini 2.5 گوگل دقیق‌تر دستور می‌گیرد اما مرز ایمنی را رد می‌کند

۱۴۰۴/۲/۱۵ ۱۵:۵۵:۲۷


گوگل در گزارش فنی اخیر خود به بررسی عملکرد مدل هوش مصنوعی Gemini 2.5 Flash پرداخته که نشان‌دهنده افت عملکرد در آزمون‌های امنیتی است.
این مدل در دو معیار اصلی "امنیت متن به متن" و "امنیت تصویر به متن" به ترتیب 4.1 و 9.6 درصد عقب‌گرد داشته است. آزمون‌های مذکور به بررسی میزان تولید محتوای ناقض دستورالعمل‌های امنیتی گوگل می‌پردازند.
شرکت‌های هوش مصنوعی در حال تلاش برای ایجاد مدل‌های انعطاف‌پذیرتر هستند که بتوانند به موضوعات حساس و جنجالی پاسخ دهند. این رویکرد در برخی موارد منجر به نتایج نامطلوب شده است.
گوگل اذعان کرده که Gemini 2.5 Flash دستورات را دقیق‌تر اجرا می‌کند، حتی اگر این دستورات از خطوط مشکل‌ساز عبور کنند. شرکت بخشی از این تنزل را ناشی از موارد منفی کاذب می‌داند.
آزمون‌های اضافی نشان می‌دهد این مدل کمتر از نسخه قبلی از پاسخ دادن به سؤالات جنجالی خودداری می‌کند و حتی در برخی موارد به تولید محتوای مخاطره‌آمیز می‌پردازد. /

© 2025 Copyright - All Rights Reserved By ecofori.ir