• چرخش هوش مصنوعی به‌سوی درک احساسات با معرفی EmoNet

    در حالی‌که تمرکز سنتی هوش مصنوعی بر منطق و تحلیل بود، حالا رقابت اصلی بر سر درک احساسات انسانی شکل گرفته است. 🤖
    گروه متن‌باز LAION با معرفی ابزار EmoNet برای تحلیل احساسات از طریق صدا و تصویر، این مسیر را برای توسعه‌دهندگان مستقل هموار کرده است. 🎙️
    مدل‌هایی از OpenAI، گوگل و دیگر شرکت‌ها در تست‌های روان‌سنجی، عملکردی بهتر از انسان‌ها داشته‌اند و درک عاطفی بالایی نشان داده‌اند. در حالی‌که انسان‌ها به‌طور متوسط ۵۶٪ پاسخ درست می‌دهند، این مدل‌ها بیش از ۸۰٪ موفقیت دارند. 📊
    با وجود نگرانی‌ها درباره وابستگی احساسی کاربران، پژوهشگران معتقدند هوش هیجانی می‌تواند به کاهش رفتارهای آسیب‌زا کمک کند. 🛡️
    هدف نهایی، ساخت دستیارانی است که نه‌تنها پاسخ می‌دهند، بلکه احساسات کاربران را درک و حمایت می‌کنند. 🤝

    ۱۴۰۴/۴/۵ ۰۹:۴۰:۲۵
  • تست‌های سنجش هوش مصنوعی بیشتر شبیه تبلیغ‌اند تا واقعیت

    یک پژوهش جدید از مؤسسه اینترنت آکسفورد نشان می‌دهد بسیاری از آزمون‌هایی که برای سنجش عملکرد هوش مصنوعی استفاده می‌شوند، نتایج دقیقی ارائه نمی‌دهند و گمراه‌کننده‌اند. 🤖
    محققان ۴۴۵ تست مختلف را بررسی کردند و دریافتند اغلب آن‌ها تعریف روشنی از مهارت مورد ارزیابی ندارند و روش آماری قابل اعتماد برای مقایسه مدل‌ها ارائه نمی‌کنند. به گفته پژوهشگران، بسیاری از این آزمون‌ها در واقع توانایی واقعی مدل را نمی‌سنجند، بلکه فقط نشان می‌دهند که مدل پاسخ درست را حفظ کرده است. 📊
    برای مثال، آزمون GSM8K که قرار است استدلال ریاضی مدل‌ها را بسنجد، ممکن است صرفاً حافظه آن‌ها را آزمایش کند. در آزمایش‌های جدید، وقتی سؤالات تازه مطرح شد، عملکرد مدل‌ها به‌شدت کاهش یافت. 📉
    این تحقیق هشدار می‌دهد که نتایج تست‌ها معیار مطمئنی برای سنجش «هوش واقعی» مدل‌ها نیست و شرکت‌ها گاهی از آن‌ها برای تبلیغ بیش از اندازه استفاده می‌کنند. 🧠

    ۱۴۰۴/۸/۲۱ ۰۱:۱۲:۳۴
  • نتایج تست‌های ایمنی OpenAI حالا برای همه قابل مشاهده است

    🤖 OpenAI مرکز ارزیابی ایمنی مدل‌های هوش مصنوعی خود را راه‌اندازی کرد. این مرکز نتایج تست‌های مدل‌ها برای محتوای مضر، آسیب پذیری های امنیتی و خطاها را نمایش می‌دهد و با هر به‌روزرسانی جدید مدل‌ها ، آپدیت می‌شود تا شفافیت بیشتری ارائه شود. 💡کاربران می‌توانند در فاز آزمایشی شرکت کرده و بازخورد دهند.

    ۱۴۰۴/۲/۲۹ ۱۱:۳۱:۳۲