• مدل جدید DeepSeek متهم به استفاده از داده‌های Gemini و ChatGPT شد

    🤖 مدل جدید DeepSeek با نام R1-0528 که عملکرد خوبی در ریاضی و برنامه‌نویسی دارد، به احتمال زیاد با داده‌هایی آموزش دیده که از مدل‌های رقیب مثل Gemini گوگل گرفته شده‌اند. 🔍
    📄 توسعه‌دهندگان می‌گویند خروجی‌های این مدل شباهت زیادی به Gemini دارد و ممکن است از طریق روشی به‌نام «تقطیر» آموزش دیده باشد؛ یعنی آموزش با استفاده از خروجی‌های مدل‌های قدرتمند مثل ChatGPT یا Gemini. ⚠️
    📌 پیش‌تر هم مدل قبلی DeepSeek گاهی خودش را ChatGPT معرفی می‌کرد که باعث شد به استفاده از داده‌های OpenAI متهم شود. 🚨
    🔒 شرکت‌هایی مثل OpenAI و Google حالا برای جلوگیری از سوءاستفاده، دسترسی به مدل‌هایشان را محدودتر و امنیتی‌تر کرده‌اند. 🔐

    ۱۴۰۴/۳/۱۴ ۲۰:۵۱:۱۰
  • مدل جدید هوش مصنوعی متا پایین‌تر از رقبا

    مدل هوش مصنوعی جدید متا به نام Maverick، که بخشی از خانواده Llama 4 است، در آزمون معروف LM Arena عملکرد ضعیف‌تری نسبت به مدل‌های رقیب مثل GPT-4o (OpenAI)، Claude 3.5 (Anthropic) و Gemini 1.5 (گوگل) داشته است.
    ماجرا از جایی شروع شد که مشخص شد متا برای گرفتن نمره بالا در این آزمون، از یک نسخه آزمایشی و بهینه‌شده‌ی مخصوص چت استفاده کرده بود، نه نسخه عمومی و منتشرشده. این موضوع باعث واکنش کاربران و تغییر قوانین این آزمون شد.
    نسخه اصلی مدل متا در مقایسه با دیگر مدل‌ها چندان قوی ظاهر نشده، چون آن بهینه‌سازی‌های خاص نسخه آزمایشی را ندارد.

    ۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۶
  • معرفی استارتاپ Deep Cogito با مدل‌ هوش مصنوعی با قابلیت استدلال

    استارتاپ تازه‌وارد Deep Cogito از پروژه مخفی خود پرده برداشت و خانواده‌ای از مدل‌های هوش مصنوعی به نام Cogito 1 را معرفی کرد که می‌توانند بین دو حالت عادی و «تفکر منطقی» جابه‌جا شوند. این ویژگی به آن‌ها اجازه می‌دهد برای سوالات ساده سریع پاسخ دهند، و برای مسائل پیچیده، مانند انسان فکر کنند و مرحله‌به‌مرحله به جواب برسند.
    این مدل‌ها ترکیبی از دو سبک مختلف هوش مصنوعی هستند و گفته می‌شود عملکرد بهتری نسبت به مدل‌های مشابه از شرکت‌هایی مثل Meta و DeepSeek دارند. بزرگ‌ترین مدل آن‌ها، Cogito 70B، در برخی تست‌ها حتی از مدل‌های قدرتمند بازار هم پیشی گرفته است.
    این شرکت تنها در حدود ۷۵ روز این مدل‌ها را توسعه داده و هدف نهایی آن، ساخت هوش مصنوعی است که بتواند بهتر از انسان عمل کند. تمامی مدل‌ها به صورت رایگان از طریق فضای ابری قابل استفاده هستند.

    ۱۴۰۴/۱/۲۱ ۱۱:۳۵:۲۵
  • تنسنت مدل هوش مصنوعی جدید با سرعت پاسخگویی بالا معرفی کرد

    شرکت تنسنت غول فناوری چین، مدل هوش مصنوعی جدید Hunyuan Turbo S را رونمایی کرد که قادر است ظرف یک ثانیه به پرسش‌ها پاسخ دهد. این مدل سرعت بالای خود را در مقایسه با مدل‌های دیگر مانند DeepSeek-R1 نشان می‌دهد و نشان‌دهنده رقابت شدید در عرصه هوش مصنوعی چین است.

    ۱۴۰۳/۱۲/۹ ۱۵:۰۰:۲۲