-
چرخش هوش مصنوعی بهسوی درک احساسات با معرفی EmoNet
در حالیکه تمرکز سنتی هوش مصنوعی بر منطق و تحلیل بود، حالا رقابت اصلی بر سر درک احساسات انسانی شکل گرفته است. 🤖
گروه متنباز LAION با معرفی ابزار EmoNet برای تحلیل احساسات از طریق صدا و تصویر، این مسیر را برای توسعهدهندگان مستقل هموار کرده است. 🎙️
مدلهایی از OpenAI، گوگل و دیگر شرکتها در تستهای روانسنجی، عملکردی بهتر از انسانها داشتهاند و درک عاطفی بالایی نشان دادهاند. در حالیکه انسانها بهطور متوسط ۵۶٪ پاسخ درست میدهند، این مدلها بیش از ۸۰٪ موفقیت دارند. 📊
با وجود نگرانیها درباره وابستگی احساسی کاربران، پژوهشگران معتقدند هوش هیجانی میتواند به کاهش رفتارهای آسیبزا کمک کند. 🛡️
هدف نهایی، ساخت دستیارانی است که نهتنها پاسخ میدهند، بلکه احساسات کاربران را درک و حمایت میکنند. 🤝۱۴۰۴/۴/۵ ۰۹:۴۰:۲۵ -
تستهای سنجش هوش مصنوعی بیشتر شبیه تبلیغاند تا واقعیت
یک پژوهش جدید از مؤسسه اینترنت آکسفورد نشان میدهد بسیاری از آزمونهایی که برای سنجش عملکرد هوش مصنوعی استفاده میشوند، نتایج دقیقی ارائه نمیدهند و گمراهکنندهاند. 🤖
محققان ۴۴۵ تست مختلف را بررسی کردند و دریافتند اغلب آنها تعریف روشنی از مهارت مورد ارزیابی ندارند و روش آماری قابل اعتماد برای مقایسه مدلها ارائه نمیکنند. به گفته پژوهشگران، بسیاری از این آزمونها در واقع توانایی واقعی مدل را نمیسنجند، بلکه فقط نشان میدهند که مدل پاسخ درست را حفظ کرده است. 📊
برای مثال، آزمون GSM8K که قرار است استدلال ریاضی مدلها را بسنجد، ممکن است صرفاً حافظه آنها را آزمایش کند. در آزمایشهای جدید، وقتی سؤالات تازه مطرح شد، عملکرد مدلها بهشدت کاهش یافت. 📉
این تحقیق هشدار میدهد که نتایج تستها معیار مطمئنی برای سنجش «هوش واقعی» مدلها نیست و شرکتها گاهی از آنها برای تبلیغ بیش از اندازه استفاده میکنند. 🧠۱۴۰۴/۸/۲۱ ۰۱:۱۲:۳۴ -
نتایج تستهای ایمنی OpenAI حالا برای همه قابل مشاهده است
🤖 OpenAI مرکز ارزیابی ایمنی مدلهای هوش مصنوعی خود را راهاندازی کرد. این مرکز نتایج تستهای مدلها برای محتوای مضر، آسیب پذیری های امنیتی و خطاها را نمایش میدهد و با هر بهروزرسانی جدید مدلها ، آپدیت میشود تا شفافیت بیشتری ارائه شود. 💡کاربران میتوانند در فاز آزمایشی شرکت کرده و بازخورد دهند.
۱۴۰۴/۲/۲۹ ۱۱:۳۱:۳۲



