وقتی هوش مصنوعی Gemini 2.5 گوگل دقیق‌تر دستور می‌گیرد اما مرز ایمنی را رد می‌کند

۱۴۰۴/۲/۱۵ ۱۵:۵۵:۲۷

گوگل در گزارش فنی اخیر خود به بررسی عملکرد مدل هوش مصنوعی Gemini 2.5 Flash پرداخته که نشان‌دهنده افت عملکرد در آزمون‌های امنیتی است.
این مدل در دو معیار اصلی "امنیت متن به متن" و "امنیت تصویر به متن" به ترتیب 4.1 و 9.6 درصد عقب‌گرد داشته است. آزمون‌های مذکور به بررسی میزان تولید محتوای ناقض دستورالعمل‌های امنیتی گوگل می‌پردازند.
شرکت‌های هوش مصنوعی در حال تلاش برای ایجاد مدل‌های انعطاف‌پذیرتر هستند که بتوانند به موضوعات حساس و جنجالی پاسخ دهند. این رویکرد در برخی موارد منجر به نتایج نامطلوب شده است.
گوگل اذعان کرده که Gemini 2.5 Flash دستورات را دقیق‌تر اجرا می‌کند، حتی اگر این دستورات از خطوط مشکل‌ساز عبور کنند. شرکت بخشی از این تنزل را ناشی از موارد منفی کاذب می‌داند.
آزمون‌های اضافی نشان می‌دهد این مدل کمتر از نسخه قبلی از پاسخ دادن به سؤالات جنجالی خودداری می‌کند و حتی در برخی موارد به تولید محتوای مخاطره‌آمیز می‌پردازد. /

بررسی عملکرد مدل هوش مصنوعی Gemini در آزمون‌های امنیتی

هوش مصنوعیگوگلامنیت فناوریمدل هوش مصنوعیهوش مصنوعی گوگلامنیت مدل‌های هوش مصنوعیGemini Flash مدل جدید

	گوگل گزارش ارزیابی امنیتی مدل هوش مصنوعی Gemini 2.5 Pro را با جزئیات اندک منتشر کرد
	گوگل نسخه جدید Gemini 2.5 Pro را معرفی کرد
	گوگل قابلیت جدید ویرایش تصویر را به ربات هوش مصنوعی Gemini اضافه کرد
	گوگل مدل هوش مصنوعی Gemini 2.5 Flash را معرفی کرد
	گوگل قابلیت جدید Canvas را به هوش مصنوعی Gemini اضافه کرد
	گوگل مدل جدید Gemini Embedding را برای توسعه‌دهندگان معرفی کرد
	گوگل Gemini با قابلیت جدید در صفحه قفل آیفون
	گوگل قابلیت‌های جدید هوش مصنوعی Gemini را معرفی کرد
	نسل جدید محتوای واقعیت مجازی VR با کمک Veo 3؛ ساده، سریع، بدون دوربین!
	تحول هوش مصنوعی در رویداد Google I/O 2025؛ از متن تا ویدیو با یک کلیک

وقتی هوش مصنوعی Gemini 2.5 گوگل دقیق‌تر دستور می‌گیرد اما مرز ایمنی را رد می‌کند

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید