جدال بر سر نتایج آزمونهای هوش مصنوعی میان OpenAI و xAI
شرکت xAI متعلق به ایلان ماسک در اقدامی جنجالی، نتایج آزمون ریاضی مدل Grok 3 را منتشر کرد که با واکنش منتقدان و کارکنان OpenAI همراه شد. این شرکت نموداری را ارائه داد که نشان میداد مدل Grok 3 از نظر عملکرد ریاضی از مدلهای OpenAI پیشی گرفته است.
اما کارکنان OpenAI اعلام کردند که نمودار منتشر شده حاوی اطلاعات کامل نیست و با حذف برخی پارامترهای مهم مانند cons@64، تصویری گمراهکننده از عملکرد مدل ارائه شده است. این پارامتر به مدل اجازه میدهد 64 بار به هر سوال پاسخ دهد و رایجترین پاسخ را انتخاب کند.
در مقایسههای دقیقتر مشخص شد که امتیازات اولیه Grok 3 در واقع کمتر از مدلهای OpenAI است. با این حال، xAI همچنان مدعی است که Grok 3 هوشمندترین مدل هوش مصنوعی جهان است.
پژوهشگران معتقدند که مهمترین موضوع در این میان، هزینه محاسباتی و مالی برای دستیابی به این نتایج است که همچنان نامشخص مانده است. این موضوع نشان میدهد که آزمونهای استاندارد هوش مصنوعی محدودیتهای زیادی در ارزیابی دقیق عملکرد مدلها دارند. /



