-
مدل جدید DeepSeek متهم به استفاده از دادههای Gemini و ChatGPT شد
🤖 مدل جدید DeepSeek با نام R1-0528 که عملکرد خوبی در ریاضی و برنامهنویسی دارد، به احتمال زیاد با دادههایی آموزش دیده که از مدلهای رقیب مثل Gemini گوگل گرفته شدهاند. 🔍
📄 توسعهدهندگان میگویند خروجیهای این مدل شباهت زیادی به Gemini دارد و ممکن است از طریق روشی بهنام «تقطیر» آموزش دیده باشد؛ یعنی آموزش با استفاده از خروجیهای مدلهای قدرتمند مثل ChatGPT یا Gemini. ⚠️
📌 پیشتر هم مدل قبلی DeepSeek گاهی خودش را ChatGPT معرفی میکرد که باعث شد به استفاده از دادههای OpenAI متهم شود. 🚨
🔒 شرکتهایی مثل OpenAI و Google حالا برای جلوگیری از سوءاستفاده، دسترسی به مدلهایشان را محدودتر و امنیتیتر کردهاند. 🔐۱۴۰۴/۳/۱۴ ۲۰:۵۱:۱۰ -
مدل جدید هوش مصنوعی متا پایینتر از رقبا
مدل هوش مصنوعی جدید متا به نام Maverick، که بخشی از خانواده Llama 4 است، در آزمون معروف LM Arena عملکرد ضعیفتری نسبت به مدلهای رقیب مثل GPT-4o (OpenAI)، Claude 3.5 (Anthropic) و Gemini 1.5 (گوگل) داشته است.
ماجرا از جایی شروع شد که مشخص شد متا برای گرفتن نمره بالا در این آزمون، از یک نسخه آزمایشی و بهینهشدهی مخصوص چت استفاده کرده بود، نه نسخه عمومی و منتشرشده. این موضوع باعث واکنش کاربران و تغییر قوانین این آزمون شد.
نسخه اصلی مدل متا در مقایسه با دیگر مدلها چندان قوی ظاهر نشده، چون آن بهینهسازیهای خاص نسخه آزمایشی را ندارد.۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۶ -
معرفی استارتاپ Deep Cogito با مدل هوش مصنوعی با قابلیت استدلال
استارتاپ تازهوارد Deep Cogito از پروژه مخفی خود پرده برداشت و خانوادهای از مدلهای هوش مصنوعی به نام Cogito 1 را معرفی کرد که میتوانند بین دو حالت عادی و «تفکر منطقی» جابهجا شوند. این ویژگی به آنها اجازه میدهد برای سوالات ساده سریع پاسخ دهند، و برای مسائل پیچیده، مانند انسان فکر کنند و مرحلهبهمرحله به جواب برسند.
این مدلها ترکیبی از دو سبک مختلف هوش مصنوعی هستند و گفته میشود عملکرد بهتری نسبت به مدلهای مشابه از شرکتهایی مثل Meta و DeepSeek دارند. بزرگترین مدل آنها، Cogito 70B، در برخی تستها حتی از مدلهای قدرتمند بازار هم پیشی گرفته است.
این شرکت تنها در حدود ۷۵ روز این مدلها را توسعه داده و هدف نهایی آن، ساخت هوش مصنوعی است که بتواند بهتر از انسان عمل کند. تمامی مدلها به صورت رایگان از طریق فضای ابری قابل استفاده هستند.۱۴۰۴/۱/۲۱ ۱۱:۳۵:۲۵ -
تنسنت مدل هوش مصنوعی جدید با سرعت پاسخگویی بالا معرفی کرد
شرکت تنسنت غول فناوری چین، مدل هوش مصنوعی جدید Hunyuan Turbo S را رونمایی کرد که قادر است ظرف یک ثانیه به پرسشها پاسخ دهد. این مدل سرعت بالای خود را در مقایسه با مدلهای دیگر مانند DeepSeek-R1 نشان میدهد و نشاندهنده رقابت شدید در عرصه هوش مصنوعی چین است.
۱۴۰۳/۱۲/۹ ۱۵:۰۰:۲۲



