• مدل تازه DeepSeek با نام V3.2-exp هزینه اجرای هوش مصنوعی را نصف می‌کند!

    پژوهشگران شرکت هوش مصنوعی DeepSeek روز دوشنبه مدل آزمایشی جدیدی با نام V3.2-exp معرفی کردند که هدف آن کاهش چشمگیر هزینه اجرای مدل در پردازش‌های متنی طولانی است. 📉 این مدل می‌تواند بخش‌های مهم متن را شناسایی کرده و با بار پردازشی کمتر پردازش کند. ⚡️
    آزمایش‌های اولیه نشان داده‌اند که هزینه هر فراخوانی ساده API در پردازش متن‌های طولانی می‌تواند تا نصف کاهش یابد. 🔎 این مدل به‌صورت متن‌باز روی پلتفرم Hugging Face منتشر شده و به همین دلیل انتظار می‌رود به‌زودی پژوهشگران و شرکت‌های دیگر آزمایش‌های مستقل برای بررسی صحت این ادعا انجام دهند. 🧪
    شرکت DeepSeek که در چین فعالیت می‌کند، پیش‌تر با مدل R1 و هزینه پایین آموزش آن خبرساز شده بود. 🇨🇳 هرچند آن مدل برخلاف پیش‌بینی‌ها به انقلاب گسترده در آموزش هوش مصنوعی منجر نشد، اما رویکرد تازه می‌تواند به کاهش هزینه‌های اجرای مدل‌های هوش مصنوعی برای ارائه‌دهندگان کمک کند. 🌍

    ۱۴۰۴/۷/۹ ۰۲:۲۰:۵۴
  • متا از API جدید مدل‌های هوش مصنوعی Llama رونمایی کرد

    متا در اولین کنفرانس توسعه‌دهندگان LlamaCon از یک API جدید برای مدل‌های هوش مصنوعی Llama رونمایی کرد. این API که فعلاً در نسخه پیش‌نمایش محدود عرضه شده، به برنامه‌نویسان اجازه می‌دهد با مدل‌های مختلف Llama کار کرده و محصولات جدیدی بسازند. این ابزار امکاناتی مثل آموزش، بهینه‌سازی و ارزیابی کیفیت مدل‌ها را فراهم می‌کند. متا تأکید کرده که داده‌های کاربران برای آموزش مدل‌های خودش استفاده نمی‌شود. متا قصد دارد در هفته‌ها و ماه‌های آینده دسترسی به این API را گسترش دهد.

    ۱۴۰۴/۲/۱۰ ۲۱:۲۸:۲۳
  • رونمایی OpenAI از مدل هوش مصنوعی o1-pro

    شرکت OpenAI نسخه جدید و قدرتمندتر مدل هوش مصنوعی o1 با نام o1-pro را در API توسعه‌دهندگان راه‌اندازی کرد. این مدل با استفاده از محاسبات بیشتر، پاسخ‌های بهتری ارائه می‌دهد اما قیمت آن بسیار بالاست. هر میلیون توکن ورودی ۱۵۰ دلار و هر میلیون توکن خروجی ۶۰۰ دلار محاسبه می‌شود که دو برابر GPT-4.5 است.

    ۱۴۰۴/۱/۱ ۰۳:۲۶:۲۸