رسوایی در رتبه‌بندی هوش مصنوعی! Chatbot Arena

۱۴۰۴/۲/۱۲ ۱۴:۲۹:۰۱

محققان در مطالعه‌ای جدید به بررسی رویه‌های LM Arena در پلتفرم Chatbot Arena پرداختند و ادعا کردند که این سازمان به برخی شرکت‌های بزرگ فناوری امتیاز ویژه‌ای داده است.
آنها دریافتند که شرکت متا در فاصله ژانویه تا مارس، 27 نسخه از مدل‌های خود را به صورت خصوصی آزمایش کرده و تنها مدل برتر را منتشر کرده است. این رویه باعث شده تا این شرکت‌ها بتوانند امتیازات بهتری در رتبه‌بندی کسب کنند.
محققان پیشنهاد کرده‌اند که LM Arena باید شفافیت بیشتری در روند آزمایش مدل‌ها داشته باشد و محدودیت مشخصی برای آزمایش‌های خصوصی تعیین کند. این مطالعه سوالات جدی درباره بی‌طرفی سازمان‌های رتبه‌بندی هوش مصنوعی مطرح کرده است.
LM Arena این ادعاها را رد کرده و مدعی شده که رویه‌های آنها کاملاً منصفانه است. با این حال، این تحقیق توجه زیادی را به شیوه‌های ارزیابی مدل‌های هوش مصنوعی جلب کرده است.
/

بررسی عادلانه رتبه‌بندی مدل‌های هوش مصنوعی

هوش مصنوعیفناوریرقابت فناوریشفافیت AIتحقیقات علمیرتبه‌بندی هوش مصنوعیآزمایش خصوصی مدل‌هاچالش شفافیت در AI

	مدل‌های هوش مصنوعی فقط تقلید می‌کنند، نه تصمیم‌گیری بر اساس ارزش
	انویدیا آزمایشگاه تحقیقاتی محاسبات کوانتومی تأسیس می‌کند
	اخراج کارشناسان ارشد هوش مصنوعی از بنیاد ملی علوم توسط دولت ترامپ
	بازسازی ذهن هوش مصنوعی با ابزار جدید!
	هوش مصنوعی FutureHouse در خدمت دانش؛ اما بدون کشف واقعی!
	عرضه مدل جدید GPT-4.1 بدون گزارش ایمنی ، نگرانی‌ها درباره شفافیت Open‌AI افزایش یافت
	کشف روش جدید جستجوی استنتاجی در هوش مصنوعی توسط محققان گوگل
	هشدار دانشمندان نسبت به ادعاهای گوگل درباره هوش مصنوعی در تحقیقات علمی
	Microsoft Discovery؛ آینده کشفیات علمی
	MIT مقاله جنجالی درباره تأثیر هوش مصنوعی بر بهره‌وری دانشمندان را پس گرفت!

رسوایی در رتبه‌بندی هوش مصنوعی! Chatbot Arena

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید