-
مدل تازه DeepSeek با نام V3.2-exp هزینه اجرای هوش مصنوعی را نصف میکند!
پژوهشگران شرکت هوش مصنوعی DeepSeek روز دوشنبه مدل آزمایشی جدیدی با نام V3.2-exp معرفی کردند که هدف آن کاهش چشمگیر هزینه اجرای مدل در پردازشهای متنی طولانی است. 📉 این مدل میتواند بخشهای مهم متن را شناسایی کرده و با بار پردازشی کمتر پردازش کند. ⚡️
آزمایشهای اولیه نشان دادهاند که هزینه هر فراخوانی ساده API در پردازش متنهای طولانی میتواند تا نصف کاهش یابد. 🔎 این مدل بهصورت متنباز روی پلتفرم Hugging Face منتشر شده و به همین دلیل انتظار میرود بهزودی پژوهشگران و شرکتهای دیگر آزمایشهای مستقل برای بررسی صحت این ادعا انجام دهند. 🧪
شرکت DeepSeek که در چین فعالیت میکند، پیشتر با مدل R1 و هزینه پایین آموزش آن خبرساز شده بود. 🇨🇳 هرچند آن مدل برخلاف پیشبینیها به انقلاب گسترده در آموزش هوش مصنوعی منجر نشد، اما رویکرد تازه میتواند به کاهش هزینههای اجرای مدلهای هوش مصنوعی برای ارائهدهندگان کمک کند. 🌍۱۴۰۴/۷/۹ ۰۲:۲۰:۵۴ -
متا از API جدید مدلهای هوش مصنوعی Llama رونمایی کرد
متا در اولین کنفرانس توسعهدهندگان LlamaCon از یک API جدید برای مدلهای هوش مصنوعی Llama رونمایی کرد. این API که فعلاً در نسخه پیشنمایش محدود عرضه شده، به برنامهنویسان اجازه میدهد با مدلهای مختلف Llama کار کرده و محصولات جدیدی بسازند. این ابزار امکاناتی مثل آموزش، بهینهسازی و ارزیابی کیفیت مدلها را فراهم میکند. متا تأکید کرده که دادههای کاربران برای آموزش مدلهای خودش استفاده نمیشود. متا قصد دارد در هفتهها و ماههای آینده دسترسی به این API را گسترش دهد.
۱۴۰۴/۲/۱۰ ۲۱:۲۸:۲۳ -
رونمایی OpenAI از مدل هوش مصنوعی o1-pro
شرکت OpenAI نسخه جدید و قدرتمندتر مدل هوش مصنوعی o1 با نام o1-pro را در API توسعهدهندگان راهاندازی کرد. این مدل با استفاده از محاسبات بیشتر، پاسخهای بهتری ارائه میدهد اما قیمت آن بسیار بالاست. هر میلیون توکن ورودی ۱۵۰ دلار و هر میلیون توکن خروجی ۶۰۰ دلار محاسبه میشود که دو برابر GPT-4.5 است.
۱۴۰۴/۱/۱ ۰۳:۲۶:۲۸



