آزمون جدید هوش مصنوعی ARC-AGI-2 چالش بزرگ برای مدلهای هوش مصنوعی
بنیاد جایزه آرک با همکاری فرانسوا شولت، محقق برجسته هوش مصنوعی، آزمون جدیدی به نام ARC-AGI-2 را برای ارزیابی هوش عمومی مدلهای هوش مصنوعی طراحی کرده است.
این آزمون شامل پازلهای پیچیدهای است که از مدلهای هوش مصنوعی میخواهد الگوهای بصری را از مجموعهای از مربعهای رنگی شناسایی کنند و شبکه پاسخ صحیح را تولید نمایند. هدف اصلی، ارزیابی توانایی سازگاری مدلها با مسائل جدید و پیشبینی نشده است.
نتایج نشان میدهد مدلهای هوش مصنوعی مانند OpenAI و DeepSeek تنها بین 1 تا 1.3 درصد در این آزمون موفق بودهاند، در حالی که گروههای انسانی حدود 60 درصد سوالات را درست پاسخ دادهاند.
شولت تاکید کرده که این آزمون برخلاف نسخه قبلی، از تکیه بر قدرت محاسباتی صرف جلوگیری میکند و کارایی را نیز در کنار توانایی حل مسئله مورد ارزیابی قرار میدهد.
بنیاد جایزه آرک همچنین مسابقهای را برای توسعهدهندگان اعلام کرده که در آن چالش رسیدن به 85 درصد دقت با هزینه تنها 0.42 دلار برای هر تسک مطرح شده است. /



