-
ترکیب مدلهای هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی
مدیرعامل DeepMind، اعلام کرد که گوگل قصد دارد مدل هوش مصنوعی را با مدل تولید ویدئو ترکیب کند تا درک بهتری از دنیای فیزیکی برای این دستیار دیجیتال ایجاد کند.
به گفته او، هدف نهایی ساخت یک دستیار هوشمند همهکاره است که بتواند با فهم متن، صدا، تصویر و ویدئو واقعاً در زندگی روزمره کمکرسان باشد.
او گفت مدل ویدئویی Veo با تماشای حجم بالایی از ویدئوهای یوتیوب میتواند قوانین دنیای واقعی را یاد بگیرد. این حرکت بخشی از رقابت بزرگ شرکتها برای ساخت مدلهایی است که بتوانند همه نوع محتوا را درک و تولید کنند.۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲ -
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول میکند
لایو کیت (LiveKit) پلتفرمی متنباز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماسهای ۹۱۱ آمریکا استفاده میشود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعهدهنده دارد و شرکتهایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده میکنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷ -
متا مدلهای هوش مصنوعی Llama 4 را با قابلیتهای پیشرفته معرفی کرد
شرکت متا چهار مدل جدید هوش مصنوعی Llama 4 را منتشر کرد که شامل Scout، Maverick و Behemoth میشوند. این مدلها با معماری ترکیبی متخصصان آموزش دیده و قابلیت پردازش تصویر، متن و ویدیو را دارند. Maverick با 400 میلیارد پارامتر در برخی آزمونها از مدلهای GPT-4o و Gemini 2.0 پیشی گرفته و Scout با پنجره متنی 10 میلیون توکن، توانایی پردازش اسناد بسیار طولانی را دارد.
۱۴۰۴/۱/۱۸ ۰۰:۰۲:۲۳ -
Substack با راهاندازی ویدیوهای کوتاه به رقابت با تیکتاک میآید
Substack پلتفرم انتشار محتوا، قابلیت جدید ویدیویی مشابه تیکتاک را معرفی کرد. نویسندگان میتوانند ویدیوهای ۱۰ دقیقهای برای مخاطبان خود منتشر کنند. این اقدام در راستای جذب کاربران احتمالی تیکتاک در صورت ممنوعیت این پلتفرم صورت میگیرد.
۱۴۰۴/۱/۱۳ ۰۰:۳۵:۱۳ -
تحولات بزرگ OpenAI در سال 2024: از رشد چشمگیر ChatGPT تا چالشهای حقوقی
شرکت OpenAI در سال 2024 با رشد چشمگیر ChatGPT به 300 میلیون کاربر هفتگی و معرفی مدل های جدید مانند GPT-4o همراه با قابلیتهای چندرسانهای، به یکی از پیشروترین شرکتهای هوش مصنوعی تبدیل شد. این شرکت همزمان با توسعه فناوری، با چالشهای حقوقی متعددی از جمله شکایتهای کپی رایت از سوی رسانهها و نشریات مواجه بود.
۱۴۰۳/۱۲/۲۵ ۰۲:۳۶:۴۶ -
بایدو نسل جدید مدل هوش مصنوعی Ernie را در میانه مارس راهاندازی میکند
بایدو، غول فناوری چینی، نسل بعدی مدل هوش مصنوعی Ernie را در میانه مارس با قابلیتهای پیشرفته چندرسانهای و استدلال راهاندازی میکند. این شرکت پس از موفقیت استارتاپ DeepSeek، تصمیم به منبع باز کردن مدل خود از ۳۰ ژوئن گرفته است و مدیرعامل آن، رابین لی، آن را بهترین مدل تاریخ شرکت میداند.
۱۴۰۳/۱۲/۹ ۱۳:۴۸:۰۵



