-
ابهام در رتبهبندی مدل هوش مصنوعی جدید متا ، Maverick
متا بهتازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسهای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شدهاند نسخهای که در این آزمون استفاده شده، با نسخهای که برای عموم عرضه شده تفاوت دارد و نسخهی شرکت داده شده در تست، بهطور ویژه برای گفتگو بهینهسازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعهدهندگان مبهم باشد و رتبهبندی آن گمراهکننده به نظر برسد. چنین رویکردی، یعنی بهینهسازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، میتواند اعتماد به این رتبهبندیها را زیر سؤال ببرد.
۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹ -
مدل جدید هوش مصنوعی متا پایینتر از رقبا
مدل هوش مصنوعی جدید متا به نام Maverick، که بخشی از خانواده Llama 4 است، در آزمون معروف LM Arena عملکرد ضعیفتری نسبت به مدلهای رقیب مثل GPT-4o (OpenAI)، Claude 3.5 (Anthropic) و Gemini 1.5 (گوگل) داشته است.
ماجرا از جایی شروع شد که مشخص شد متا برای گرفتن نمره بالا در این آزمون، از یک نسخه آزمایشی و بهینهشدهی مخصوص چت استفاده کرده بود، نه نسخه عمومی و منتشرشده. این موضوع باعث واکنش کاربران و تغییر قوانین این آزمون شد.
نسخه اصلی مدل متا در مقایسه با دیگر مدلها چندان قوی ظاهر نشده، چون آن بهینهسازیهای خاص نسخه آزمایشی را ندارد.۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۶



