مدل تازه DeepSeek با نام V3.2-exp هزینه اجرای هوش مصنوعی را نصف می‌کند!

۱۴۰۴/۷/۹ ۰۲:۲۰:۵۴

پژوهشگران شرکت DeepSeek (دیپ‌سیک) روز دوشنبه مدل آزمایشی جدیدی با نام V3.2-exp معرفی کردند که هدف آن کاهش چشمگیر هزینه اجرای مدل در پردازش‌های متنی طولانی است. 📉 این مدل از فناوری «توجه پراکنده» (Sparse Attention) استفاده می‌کند و با کمک دو بخش اصلی یعنی «ایندکسر صاعقه‌ای» (Lightning Indexer) و «سیستم انتخاب دقیق توکن» (Fine-Grained Token Selection) می‌تواند بخش‌های مهم متن را شناسایی کرده و با بار پردازشی کمتر پردازش کند. ⚡️
آزمایش‌های اولیه نشان داده‌اند که هزینه هر فراخوانی ساده API در پردازش متن‌های طولانی می‌تواند تا نصف کاهش یابد. 🔎 این مدل به‌صورت متن‌باز روی پلتفرم Hugging Face منتشر شده و به همین دلیل انتظار می‌رود به‌زودی پژوهشگران و شرکت‌های دیگر آزمایش‌های مستقل برای بررسی صحت این ادعا انجام دهند. 🧪
شرکت DeepSeek که در چین فعالیت می‌کند، پیش‌تر با مدل R1 و هزینه پایین آموزش آن خبرساز شده بود. 🇨🇳 هرچند آن مدل برخلاف پیش‌بینی‌ها به انقلاب گسترده در آموزش هوش مصنوعی منجر نشد، اما رویکرد تازه «توجه پراکنده» می‌تواند به کاهش هزینه‌های اجرای مدل‌های هوش مصنوعی برای ارائه‌دهندگان آمریکایی و جهانی کمک کند. 🌍 /

مدل جدید DeepSeek برای کاهش هزینه‌های استنتاج در هوش مصنوعی

DeepSeekمدلV3.2expهوش مصنوعیAPIمدل V3.2-expکاهش هزینه‌های استنتاجتوجه پراکنده DeepSeek

	چالش جدی چین برای آمریکا؛ هزینه آموزش DeepSeek یک‌هزارم OpenAI!
	هوآوی نسخه ایمن‌تر DeepSeek را رونمایی کرد؛ تقریباً ۱۰۰٪ موفق در حذف محتوای حساس!
	تسلا و دو غول چینی: همکاری برای آینده‌ای هوشمند
	چین وارد فاز جدید نوآوری هوش مصنوعی شد؛ DeepSeek V3.1 رکوردها را شکست
	مدل جدید DeepSeek متهم به استفاده از داده‌های Gemini و ChatGPT شد
	DeepSeek و مدل جدید R1-0528 که رکورد می‌شکند اما سیاسی نیست!
	هوش مصنوعی در اندازه جیبی؛ معجزه DeepSeek
	DeepSeek نسخه جدید مدل استدلالی R1 را معرفی کرد
	استفاده از Deepseek در مایکروسافت ممنوع شد
	بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek

مدل تازه DeepSeek با نام V3.2-exp هزینه اجرای هوش مصنوعی را نصف می‌کند!

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید