هوش مصنوعی در اندازه جیبی؛ معجزه DeepSeek

۱۴۰۴/۳/۱۰ ۱۸:۴۰:۳۳

شرکت هوش مصنوعی DeepSeek اخیراً یک نسخه کوچک‌تر و بهینه‌شده از مدل R1 خود را با نام DeepSeek-R1-0528-Qwen3-8B معرفی کرده است. این مدل که بر پایه مدل Qwen3-8B شرکت علی‌بابا توسعه یافته، در آزمون‌های ریاضی پیچیده مانند AIME 2025 عملکردی بهتر از مدل Gemini 2.5 Flash گوگل داشته است.
مدل‌های تقطیر شده مانند DeepSeek-R1-0528-Qwen3-8B معمولاً از نظر توانایی کمتر از نسخه‌های اصلی هستند، اما مزیت آنها نیاز به منابع محاسباتی کمتر است. برای مثال، این مدل تنها به یک کارت گرافیک با 40 تا 80 گیگابایت حافظه نیاز دارد، در حالی که نسخه اصلی R1 به حدود یک دوجین کارت گرافیکی نیاز دارد.
DeepSeek این مدل را با استفاده از متن‌های تولید شده توسط نسخه اصلی R1 و بهینه‌سازی مدل Qwen3-8B آموزش داده است. این مدل با لایسنس MIT منتشر شده و برای استفاده تحقیقاتی و تجاری در دسترس است. /

مدل هوش مصنوعی کوچک و پیشرفته DeepSeek

هوش مصنوعیDeepSeekفناوری پیشرفتهAI پیشرفتهمدل هوش مصنوعینوآوری فناوریهوش مصنوعی DeepSeekمدل R1 هوش مصنوعیفناوری AI پیشرفته

	واکنش مدیرعامل انویدیا به مدل هوش مصنوعی DeepSeek R1
	صعود سریع استارتاپ هوش مصنوعی DeepSeek در عرصه جهانی
	انقلاب هوش مصنوعی چینی در آموزش عالی با استارتاپ DeepSeek
	بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek
	Falcon Arabic امارات؛ مدلی کوچک با عملکردی بزرگ از دل ابوظبی
	پیشتازی آمریکا در هوش مصنوعی در آستانه خطر؛ چین نزدیک‌تر از همیشه!
	OpenAI رونمایی کرد: Operator با O3 هوشمندتر از همیشه
	MIT مقاله جنجالی درباره تأثیر هوش مصنوعی بر بهره‌وری دانشمندان را پس گرفت!
	رقابت شرکت‌های فناوری برای ساخت رایانه‌های کوانتومی
	استارتاپ کره‌ای RLWRLD به‌دنبال ساخت مغز متفکر برای ربات‌ها

هوش مصنوعی در اندازه جیبی؛ معجزه DeepSeek

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید