ارزیابی هوش مصنوعی با چالشهای خلاقانه در محیط بازی Minecraft
هوش مصنوعی در حال گذار از روشهای سنتی ارزیابی به سمت رویکردهای خلاقانهتر است.
پلتفرم Minecraft Benchmark یک راهکار نوآورانه برای سنجش قابلیتهای مدلهای هوش مصنوعی تولیدی محسوب میشود.
این وبسایت که توسط یک دانشآموز دبیرستانی به نام آدی سینگ راهاندازی شده، از بازی محبوب Minecraft به عنوان محیطی برای مقایسه عملکرد هوش مصنوعی استفاده میکند.
شرکتهای بزرگ فناوری مانند Anthropic، Google، OpenAI و Alibaba محصولات خود را برای این ارزیابی در اختیار گذاشتهاند.
کاربران میتوانند ساختههای هوش مصنوعی را در چالشهای مختلف مانند ساخت آدم برفی یا کلبه ساحلی امتحان و داوری کنند.
هدف اصلی این پروژه، ارائه یک معیار ارزیابی خلاقانه و قابل درک برای عموم مردم است که پیشرفت هوش مصنوعی را به شکلی ملموس نشان میدهد. /



