مدل تازه DeepSeek با نام V3.2-exp هزینه اجرای هوش مصنوعی را نصف میکند!
پژوهشگران شرکت DeepSeek (دیپسیک) روز دوشنبه مدل آزمایشی جدیدی با نام V3.2-exp معرفی کردند که هدف آن کاهش چشمگیر هزینه اجرای مدل در پردازشهای متنی طولانی است. 📉 این مدل از فناوری «توجه پراکنده» (Sparse Attention) استفاده میکند و با کمک دو بخش اصلی یعنی «ایندکسر صاعقهای» (Lightning Indexer) و «سیستم انتخاب دقیق توکن» (Fine-Grained Token Selection) میتواند بخشهای مهم متن را شناسایی کرده و با بار پردازشی کمتر پردازش کند. ⚡️
آزمایشهای اولیه نشان دادهاند که هزینه هر فراخوانی ساده API در پردازش متنهای طولانی میتواند تا نصف کاهش یابد. 🔎 این مدل بهصورت متنباز روی پلتفرم Hugging Face منتشر شده و به همین دلیل انتظار میرود بهزودی پژوهشگران و شرکتهای دیگر آزمایشهای مستقل برای بررسی صحت این ادعا انجام دهند. 🧪
شرکت DeepSeek که در چین فعالیت میکند، پیشتر با مدل R1 و هزینه پایین آموزش آن خبرساز شده بود. 🇨🇳 هرچند آن مدل برخلاف پیشبینیها به انقلاب گسترده در آموزش هوش مصنوعی منجر نشد، اما رویکرد تازه «توجه پراکنده» میتواند به کاهش هزینههای اجرای مدلهای هوش مصنوعی برای ارائهدهندگان آمریکایی و جهانی کمک کند. 🌍 /



