• ترکیب مدل‌های هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی

    مدیرعامل DeepMind، اعلام کرد که گوگل قصد دارد مدل هوش مصنوعی را با مدل تولید ویدئو ترکیب کند تا درک بهتری از دنیای فیزیکی برای این دستیار دیجیتال ایجاد کند.
    به گفته او، هدف نهایی ساخت یک دستیار هوشمند همه‌کاره است که بتواند با فهم متن، صدا، تصویر و ویدئو واقعاً در زندگی روزمره کمک‌رسان باشد.
    او گفت مدل ویدئویی Veo با تماشای حجم بالایی از ویدئوهای یوتیوب می‌تواند قوانین دنیای واقعی را یاد بگیرد. این حرکت بخشی از رقابت بزرگ شرکت‌ها برای ساخت مدل‌هایی است که بتوانند همه نوع محتوا را درک و تولید کنند.

    ۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲
  • LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

    لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
    این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
    این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

    ۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
  • متا مدل‌های هوش مصنوعی Llama 4 را با قابلیت‌های پیشرفته معرفی کرد

    شرکت متا چهار مدل جدید هوش مصنوعی Llama 4 را منتشر کرد که شامل Scout، Maverick و Behemoth می‌شوند. این مدل‌ها با معماری ترکیبی متخصصان آموزش دیده و قابلیت پردازش تصویر، متن و ویدیو را دارند. Maverick با 400 میلیارد پارامتر در برخی آزمون‌ها از مدل‌های GPT-4o و Gemini 2.0 پیشی گرفته و Scout با پنجره متنی 10 میلیون توکن، توانایی پردازش اسناد بسیار طولانی را دارد.

    ۱۴۰۴/۱/۱۸ ۰۰:۰۲:۲۳
  • Substack با راه‌اندازی ویدیوهای کوتاه به رقابت با تیک‌تاک می‌آید

    Substack پلتفرم انتشار محتوا، قابلیت جدید ویدیویی مشابه تیک‌تاک را معرفی کرد. نویسندگان می‌توانند ویدیوهای ۱۰ دقیقه‌ای برای مخاطبان خود منتشر کنند. این اقدام در راستای جذب کاربران احتمالی تیک‌تاک در صورت ممنوعیت این پلتفرم صورت می‌گیرد.

    ۱۴۰۴/۱/۱۳ ۰۰:۳۵:۱۳
  • تحولات بزرگ OpenAI در سال 2024: از رشد چشمگیر ChatGPT تا چالش‌های حقوقی

    شرکت OpenAI در سال 2024 با رشد چشمگیر ChatGPT به 300 میلیون کاربر هفتگی و معرفی مدل های جدید مانند GPT-4o همراه با قابلیت‌های چندرسانه‌ای، به یکی از پیشروترین شرکت‌های هوش مصنوعی تبدیل شد. این شرکت همزمان با توسعه فناوری، با چالش‌های حقوقی متعددی از جمله شکایت‌های کپی رایت از سوی رسانه‌ها و نشریات مواجه بود.

    ۱۴۰۳/۱۲/۲۵ ۰۲:۳۶:۴۶
  • بایدو نسل جدید مدل هوش مصنوعی Ernie را در میانه مارس راه‌اندازی می‌کند

    بایدو، غول فناوری چینی، نسل بعدی مدل هوش مصنوعی Ernie را در میانه مارس با قابلیت‌های پیشرفته چندرسانه‌ای و استدلال راه‌اندازی می‌کند. این شرکت پس از موفقیت استارتاپ DeepSeek، تصمیم به منبع باز کردن مدل خود از ۳۰ ژوئن گرفته است و مدیرعامل آن، رابین لی، آن را بهترین مدل تاریخ شرکت می‌داند.

    ۱۴۰۳/۱۲/۹ ۱۳:۴۸:۰۵