آزمون جدید هوش مصنوعی ARC-AGI-2 چالش بزرگ برای مدل‌های هوش مصنوعی

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۵


بنیاد جایزه آرک با همکاری فرانسوا شولت، محقق برجسته هوش مصنوعی، آزمون جدیدی به نام ARC-AGI-2 را برای ارزیابی هوش عمومی مدل‌های هوش مصنوعی طراحی کرده است.
این آزمون شامل پازل‌های پیچیده‌ای است که از مدل‌های هوش مصنوعی می‌خواهد الگوهای بصری را از مجموعه‌ای از مربع‌های رنگی شناسایی کنند و شبکه پاسخ صحیح را تولید نمایند. هدف اصلی، ارزیابی توانایی سازگاری مدل‌ها با مسائل جدید و پیش‌بینی نشده است.
نتایج نشان می‌دهد مدل‌های هوش مصنوعی مانند OpenAI و DeepSeek تنها بین 1 تا 1.3 درصد در این آزمون موفق بوده‌اند، در حالی که گروه‌های انسانی حدود 60 درصد سوالات را درست پاسخ داده‌اند.
شولت تاکید کرده که این آزمون برخلاف نسخه قبلی، از تکیه بر قدرت محاسباتی صرف جلوگیری می‌کند و کارایی را نیز در کنار توانایی حل مسئله مورد ارزیابی قرار می‌دهد.
بنیاد جایزه آرک همچنین مسابقه‌ای را برای توسعه‌دهندگان اعلام کرده که در آن چالش رسیدن به 85 درصد دقت با هزینه تنها 0.42 دلار برای هر تسک مطرح شده است. /

© 2025 Copyright - All Rights Reserved By ecofori.ir