ارزیابی مردمی هوش مصنوعی زیر سوال رفت
متخصصان هوش مصنوعی نسبت به روشهای کنونی ارزیابی مدلهای هوش مصنوعی توسط کاربران انتقادات جدی دارند. این روش که توسط شرکتهایی مانند OpenAI و Google استفاده میشود، با چالشهای اساسی روبروست.
پژوهشگران معتقدند ارزیابیهای جمعی فاقد اعتبار علمی لازم هستند. آنها تأکید دارند که چنین آزمونهایی باید معیارهای دقیق و مشخصی داشته باشند و صرفاً بر اساس رأی کاربران نباید قضاوت شوند.
از سوی دیگر، متخصصان خواستار جبران زحمات ارزیابان و استفاده از رویکردهای متنوعتر برای سنجش مدلهای هوش مصنوعی هستند. آنها معتقدند باید ارزیابیها در حوزههای تخصصی مختلف و توسط متخصصان آن حوزهها انجام شود.
مدیران پلتفرمهای ارزیابی نیز اذعان دارند که این روشها نباید تنها معیار سنجش مدلها باشند و باید از روشهای مختلف برای ارزیابی دقیق استفاده شود. /



