مدل های AI - اخبار فناوری - EcoFori

انتشار یکی از بزرگ‌ترین دیتاست‌های قانونی هوش مصنوعی توسط EleutherAI با Common Pile

سازمان تحقیقاتی EleutherAI یکی از بزرگ‌ترین مجموعه‌های متنی دارای مجوز و منبع‌باز برای آموزش هوش مصنوعی را منتشر کرد. 📚
این دیتاست با نام Common Pile v0.1 در همکاری با استارتاپ‌هایی مانند Hugging Face طی دو سال آماده شده و ۸ ترابایت حجم دارد. 💾
بر اساس آن، دو مدل جدید Comma v0.1-1T و Comma v0.1-2T توسعه یافتند که به‌گفته‌ی EleutherAI با مدل‌های دارای داده‌های بدون مجوز رقابت می‌کنند. 🤖
در حالی‌که بسیاری از شرکت‌های هوش مصنوعی به‌خاطر استفاده از داده‌های دارای حق‌نشر تحت پیگردند، EleutherAI شفافیت را اصل خود می‌داند. ⚖️
این دیتاست با مشاوره حقوقی و با تکیه بر منابعی چون ۳۰۰ هزار کتاب دامنه عمومی تولید شده است. 📘
هدف این پروژه، اثبات امکان ساخت مدل‌های قدرتمند بر پایه داده‌های قانونی و منبع‌باز است. ✅
EleutherAI قول داده در آینده دیتاست‌های شفاف‌تری را با همکاری دانشگاه‌ها و شرکت‌ها منتشر کند. 🔄

۱۴۰۴/۳/۱۸ ۱۷:۴۶:۲۶
Alibaba با معرفی Qwen3 رقابت با غول‌های هوش مصنوعی را داغ‌تر کرد

شرکت Alibaba خانواده جدیدی از مدل‌های هوش مصنوعی به نام Qwen3 معرفی کرده که می‌تواند با مدل‌های برتر گوگل و OpenAI رقابت کند. این مدل‌ها در اندازه‌های مختلف عرضه می‌شوند و برخی از آن‌ها ترکیبی از حالت سریع و حالت دقیق‌تر با توانایی تفکر هستند. Qwen3 می‌تواند مسائل پیچیده را با دقت بیشتری حل کند و از تکنیک‌هایی مثل Mixture of Experts برای کارایی بهتر استفاده می‌کند. این مدل‌ها از ۱۱۹ زبان پشتیبانی می‌کنند و با داده‌های عظیم آموزش دیده‌اند. بعضی مدل‌های Qwen3 در آزمایش‌های برنامه‌نویسی و ریاضی حتی بهتر از مدل‌های OpenAI عمل کرده‌اند. نسخه‌های قابل دانلود این مدل‌ها روی پلتفرم‌هایی مثل Hugging Face و GitHub قرار دارند.

۱۴۰۴/۲/۱۰ ۱۲:۱۷:۰۸
نظارت OpenAI بر مدل‌های هوش مصنوعی برای جلوگیری از تهدیدات زیستی و شیمیایی

شرکت OpenAI برای مدل‌های جدید هوش مصنوعی خود (o3 و o4-mini) سیستم نظارتی تازه‌ای فعال کرده تا از ارائه اطلاعات درباره تهدیدهای زیستی و شیمیایی جلوگیری کند. این سیستم که برای شناسایی درخواست‌های خطرناک آموزش دیده، در آزمایش‌ها موفق شده ۹۸.۷٪ از این درخواست‌ها را مسدود کند.
مدل‌های جدید در مقایسه با نسخه‌های قبلی پاسخ‌های دقیق‌تری می‌دهند و امکان سوءاستفاده از آن‌ها بیشتر است. با این حال، OpenAI آن‌ها را «پرخطر» نمی‌داند، اما برای اطمینان از ایمنی، همچنان نظارت انسانی را نیز ادامه می‌دهد.
با وجود این اقدامات، برخی کارشناسان نسبت به میزان توجه OpenAI به مسائل ایمنی انتقاد کرده‌اند، به‌ویژه که هیچ گزارشی درباره نسخه اخیر GPT-4.1 منتشر نشده است.

۱۴۰۴/۱/۲۹ ۰۱:۳۲:۵۳
متا مدل‌های هوش مصنوعی Llama 4 را با قابلیت‌های پیشرفته معرفی کرد

شرکت متا چهار مدل جدید هوش مصنوعی Llama 4 را منتشر کرد که شامل Scout، Maverick و Behemoth می‌شوند. این مدل‌ها با معماری ترکیبی متخصصان آموزش دیده و قابلیت پردازش تصویر، متن و ویدیو را دارند. Maverick با 400 میلیارد پارامتر در برخی آزمون‌ها از مدل‌های GPT-4o و Gemini 2.0 پیشی گرفته و Scout با پنجره متنی 10 میلیون توکن، توانایی پردازش اسناد بسیار طولانی را دارد.

۱۴۰۴/۱/۱۸ ۰۰:۰۲:۲۳
افشای جزئیات درآمد استارتاپ هوش مصنوعی چینی DeepSeek

استارتاپ چینی DeepSeek که در زمینه هوش مصنوعی فعالیت دارد، برای اولین بار اطلاعاتی درباره حاشیه سود مدل‌های V3 و R1 خود منتشر کرد. این شرکت مدعی نسبت سود به هزینه 545 درصدی روزانه شد، اما تأکید کرد که درآمد واقعی به مراتب کمتر خواهد بود. این افشاگری می‌تواند بازار سهام شرکت‌های هوش مصنوعی را تحت تأثیر قرار دهد.

۱۴۰۳/۱۲/۱۱ ۱۹:۰۰:۱۶