- EcoFori

۱۴۰۴/۲/۲ ۱۰:۳۸:۲۳

اپن‌ای در دسامبر مدل هوش مصنوعی o3 را معرفی کرد و عملکرد بسیار بالایی در حل مسائل ریاضی FrontierMath اعلام نمود.
مارک چن، مدیر تحقیقات اپن‌ای، عملکرد مدل را بیش از 25 درصد در آزمون‌های داخلی اعلام کرد، در حالی که سایر مدل‌ها کمتر از 2 درصد موفق بودند.
موسسه Epoch AI در ارزیابی مستقل، عملکرد o3 را حدود 10 درصد گزارش کرد که پایین‌تر از ادعای اولیه اپن‌ای است.
دلایل این اختلاف می‌تواند شامل تفاوت در محاسبات، زیرساخت‌های متفاوت و نسخه‌های مختلف آزمون باشد.
این رویداد نشان می‌دهد که نتایج آزمون‌های هوش مصنوعی نباید بدون بررسی دقیق پذیرفته شوند. /

نتایج متفاوت آزمون مدل هوش مصنوعی اپن‌ای

هوش مصنوعیاپن‌ایفناورینوآوریآزمون‌های هوش مصنوعیهوش مصنوعی اپن‌ایآزمون مدل o3عملکرد ریاضی هوش مصنوعی

	جدال بر سر نتایج آزمون‌های هوش مصنوعی میان OpenAI و xAI
	تست‌های سنجش هوش مصنوعی بیشتر شبیه تبلیغ‌اند تا واقعیت
	‌اقدام جدید OpenAI برای طراحی آزمون‌های واقعی‌تر جهت سنجش هوش مصنوعی
	معیار GDPval: سنجش عملکرد هوش مصنوعی در صنایع مختلف
	متا در آزمون هوش مصنوعی تقلب کرد
	آزمون جدید هوش مصنوعی ARC-AGI-2 چالش بزرگ برای مدل‌های هوش مصنوعی
	WWDC 2025؛ آزمون بزرگ اپل در رقابت هوش مصنوعی
	Falcon Arabic امارات؛ مدلی کوچک با عملکردی بزرگ از دل ابوظبی
	رقابت شدید در بازار هوش مصنوعی با Mistral Medium 3
	بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید