ابهام در رتبه‌بندی مدل هوش مصنوعی جدید متا ، Maverick

۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹


متا مدل هوش مصنوعی Maverick را به عنوان یکی از مدل‌های پرچمدار خود معرفی کرده که در آزمون LM Arena موفق به کسب رتبه دوم شده است.
محققان تفاوت‌های معناداری میان نسخه آزمایشی این مدل در آزمون و نسخه عمومی آن کشف کرده‌اند. نسخه آزمایشی استفاده شده در آزمون، بسیار پرکاربردتر و با استفاده از شکلک‌های بیشتر طراحی شده است.
این موضوع نگرانی‌هایی را درباره اعتبار آزمون‌های عملکرد مدل‌های هوش مصنوعی ایجاد کرده است. سفارشی‌سازی مدل‌ها برای آزمون‌های خاص می‌تواند باعث گمراهی توسعه‌دهندگان درباره عملکرد واقعی مدل شود. /

© 2025 Copyright - All Rights Reserved By ecofori.ir