گوگل با Gemini 2.5 به جنگ تصویرسازهای هوش مصنوعی رفت
گوگل با معرفی مدل جدید Gemini 2.5 Flash Image قابلیتهای ویرایش تصویر در چتبات جمینی را ارتقا داد؛ مدلی که به کاربران امکان میدهد تنها با دستورهای متنی، ویرایشهای دقیقتری روی تصاویر انجام دهند و در عین حال جزئیات مهمی مثل چهرهها و حیوانات بدون تغییر باقی بمانند. این ویژگی از امروز در اپلیکیشن جمینی، API جمینی و پلتفرمهای Google AI Studio و Vertex AI در دسترس قرار میگیرد. 🤖🖼️
گوگل میگوید این ابزار نسبت به رقبا مانند ChatGPT و Grok عملکرد بهتری در حفظ کیفیت بصری و اجرای بینقص ویرایشها دارد. مدل جدید پیشتر با نام مستعار nano-banana در پلتفرم ارزیابی LMArena منتشر شده بود و توجه زیادی را جلب کرد. 🐶👩💻
رقابت در حوزه تولید تصویر با هوش مصنوعی بسیار داغ شده است؛ OpenAI با GPT-4o موج بزرگی از استفاده را ایجاد کرد و متا نیز اخیراً اعلام کرده قصد دارد مدلهای Midjourney را لایسنس کند. گوگل امیدوار است با جمینی بتواند فاصله کاربری خود با ChatGPT را کاهش دهد؛ در حالی که ChatGPT بیش از ۷۰۰ میلیون کاربر هفتگی دارد، جمینی تنها ۴۵۰ میلیون کاربر ماهانه را گزارش داده است. 📊🔥
گوگل همچنین برای جلوگیری از سوءاستفاده، محدودیتهای سختگیرانهای بر تولید تصاویر اعمال کرده و تمام خروجیها دارای واترمارک و نشانهگذاری در متادیتا هستند تا تشخیص واقعی یا جعلی بودن تصاویر آسانتر شود. ✅🔒 /



