جدال بر سر نتایج آزمون‌های هوش مصنوعی میان OpenAI و xAI

۱۴۰۳/۱۲/۵ ۰۴:۱۲:۳۳


شرکت xAI متعلق به ایلان ماسک در اقدامی جنجالی، نتایج آزمون ریاضی مدل Grok 3 را منتشر کرد که با واکنش منتقدان و کارکنان OpenAI همراه شد. این شرکت نموداری را ارائه داد که نشان می‌داد مدل Grok 3 از نظر عملکرد ریاضی از مدل‌های OpenAI پیشی گرفته است.
اما کارکنان OpenAI اعلام کردند که نمودار منتشر شده حاوی اطلاعات کامل نیست و با حذف برخی پارامترهای مهم مانند cons@64، تصویری گمراه‌کننده از عملکرد مدل ارائه شده است. این پارامتر به مدل اجازه می‌دهد 64 بار به هر سوال پاسخ دهد و رایج‌ترین پاسخ را انتخاب کند.
در مقایسه‌های دقیق‌تر مشخص شد که امتیازات اولیه Grok 3 در واقع کمتر از مدل‌های OpenAI است. با این حال، xAI همچنان مدعی است که Grok 3 هوشمندترین مدل هوش مصنوعی جهان است.
پژوهشگران معتقدند که مهم‌ترین موضوع در این میان، هزینه محاسباتی و مالی برای دستیابی به این نتایج است که همچنان نامشخص مانده است. این موضوع نشان می‌دهد که آزمون‌های استاندارد هوش مصنوعی محدودیت‌های زیادی در ارزیابی دقیق عملکرد مدل‌ها دارند. /

© 2025 Copyright - All Rights Reserved By ecofori.ir