مدل‌های صوتی پیشرفته - اخبار فناوری - EcoFori

استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد

مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدل‌های هوش مصنوعی در چند سال آینده به فناوری‌های عمومی و در دسترس همه تبدیل خواهند شد. 🤖
او گفت تمرکز فعلی شرکت بر بهبود مدل‌های صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 به‌گفته او، در یک تا دو سال آینده مدل‌های چندوجهی که صدا، تصویر و متن را هم‌زمان تولید می‌کنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
شرکت قصد دارد با همکاری‌های جدید و بهره‌گیری از فناوری‌های متن‌باز، میان توسعه مدل‌ها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرم‌افزار و سخت‌افزار در اپل بسازد. 🍏🚀
محصولات این شرکت در پلتفرم‌هایی مانند دوبله ویدیو، پادکست، بازی‌های ویدئویی، کتاب‌های صوتی و محتوای آموزشی استفاده می‌شوند.

۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲
وقتی ویدیوهای بازی، سوخت موتور هوش مصنوعی می‌شوند!

استارتاپ General Intuition از دل پلتفرم اشتراک ویدیوهای بازی Medal متولد شده و هدفش ساخت هوش مصنوعی‌هایی است که بتوانند حرکت اشیا و انسان‌ها را در فضا و زمان درک کنند؛ مفهومی که به آن «استدلال فضا‌-‌زمانی» گفته می‌شود. 🎮🤖
این شرکت از ۲ میلیارد ویدیو بازی در سال و داده‌های ۱۰ میلیون کاربر استفاده می‌کند و معتقد است این منابع برای آموزش مدل‌های هوش مصنوعی از Twitch و YouTube مؤثرترند. 📊 همین موضوع باعث شد OpenAI سال گذشته پیشنهاد خرید ۵۰۰ میلیون دلاری Medal را مطرح کند.💰
General Intuition قصد دارد عامل‌هایی بسازد که در دنیای واقعی مانند ربات‌ها و پهپادهای نجات عمل کنند. 🚀 این مدل‌ها می‌توانند فقط با تصویر محیط را درک کرده و تصمیم بگیرند، مشابه یک بازیکن انسانی. 👁️
هدف نهایی شرکت، ساخت کاراکترهای هوشمند و فناوری‌هایی است که راه را به سوی هوش مصنوعی عمومی واقعی یا AGI هموار کنند. 🧠✨

۱۴۰۴/۷/۲۶ ۲۳:۳۹:۱۰
مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
ورود Runway به دنیای رباتیک و خودروهای خودران

استارتاپ نیویورکی Runway که با ابزارهای تولید تصویر و ویدیو شناخته می‌شود، اکنون فناوری شبیه‌سازی دنیای واقعی خود را وارد حوزه رباتیک و خودروهای خودران کرده است. این مدل‌ها آموزش ربات‌ها را سریع‌تر و کم‌هزینه‌تر می‌کنند و امکان آزمایش سناریوهای مختلف را بدون نیاز به محیط واقعی فراهم می‌سازند. 🤖🚗
Runway قصد دارد مدل‌های فعلی خود را برای این صنایع بهینه‌سازی کند و تیمی ویژه رباتیک تشکیل دهد. این شرکت تاکنون بیش از ۵۰۰ میلیون دلار سرمایه از غول‌هایی مانند گوگل و انویدیا جذب کرده و ارزش آن به ۳ میلیارد دلار رسیده است. ✅💡

۱۴۰۴/۶/۱۲ ۰۰:۲۹:۴۸
متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!

🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینک‌های هوشمند خود را ارتقا دهد. ✅🕶️
هدف متا، بهبود تجربه کار با عینک‌های Ray-Ban با استفاده از مدل‌های زبانی پیشرفته است؛ چون این دستگاه‌ها فاقد نمایشگرند و تعامل با آن‌ها به عملکرد دستیار صوتی وابسته است. ✅🤖
این رویکرد می‌تواند متا را در رقابت عینک‌های هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀

۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶
ChatGPT با لحنی انسانی‌تر از همیشه

قابلیت گفت‌وگوی صوتی در ChatGPT با ارتقاء جدیدی همراه شده که صدای آن را طبیعی‌تر، روان‌تر و احساسی‌تر از قبل می‌کند. 🎙️
به‌گفته OpenAI، نسخه جدید «صدای پیشرفته» با لحن واقعی‌تر، مکث‌های طبیعی، تأکید مناسب و بیان دقیق‌تر احساساتی مانند همدلی یا طعنه طراحی شده است. 🧠
ویژگی ترجمه زنده نیز بهبود یافته و اکنون کاربران می‌توانند بدون وقفه، گفت‌وگوهای چندزبانه را ادامه دهند تا زمانی که بخواهند زبان را تغییر دهند یا متوقف کنند. 🌍
این قابلیت برای همه کاربران سر‌ویس پولی در تمامی پلتفرم‌ها فعال است، هرچند ممکن است گاهی افت کیفیت صوتی یا خطاهای محدود مانند صداهای غیرمنتظره یا موسیقی پس‌زمینه رخ دهد. ⚠️

۱۴۰۴/۳/۲۰ ۱۸:۲۷:۱۹
پیشرفت بزرگ بایدو در تراشه‌های بومی برای آموزش مدل‌های هوش مصنوعی

شرکت بایدو (Baidu) غول موتور جستجوی اینترنتی چین ، خوشه‌ای با ۳۰هزار تراشه Kunlun P800 را فعال کرده که می‌تواند مدل‌هایی مانند DeepSeek را با صدها میلیارد پارامتر آموزش دهد یا هزار کاربر به‌طور هم‌زمان مدل‌های کوچکتر را تنظیم کنند. مدل جدید هوش مصنوعی این شرکت با نام Ernie 4.5 Turbo در تست‌ها عملکردی عالی دارد. همچنین مدل استدلالی Ernie X1 Turbo معرفی شد و قرار است هوش مصنوعی در اپ‌های بایدو مثل فضای ابری و پلتفرم محتوایی به‌کار رود. مدیرعامل بایدو گفت بدون اپلیکیشن، مدل و تراشه بی‌ارزش‌اند. این حرکت در رقابت شدید بازار AI چین برای کاربردی‌کردن مدل‌ها انجام شده است.

۱۴۰۴/۲/۶ ۱۳:۲۴:۱۵
ورود مدل‌های هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی

شرکت Adobe مدل‌های جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید می‌کند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدل‌های تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون می‌توانند با مدل‌هایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایده‌پردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.

۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶
رونمایی OpenAI از مدل‌های هوش مصنوعی o3 و o4-mini با قابلیت‌های پیشرفته استدلال

شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که می‌توانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفته‌ترین مدل این شرکت است و در آزمون‌های تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایین‌تر، عملکرد مناسبی ارائه می‌دهد. این مدل‌ها می‌توانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جست‌وجو کنند. کاربران نسخه پولی ChatGPT و توسعه‌دهندگان از امروز به این مدل‌ها دسترسی دارند. همچنین نسخه قوی‌تر o3 با نام o3-pro نیز به‌زودی عرضه می‌شود.

۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲
الزام شرکت OpenAI به احراز هویت سازمان‌ها برای دسترسی به مدل‌های پیشرفته هوش مصنوعی

شرکت OpenAI برای دسترسی به مدل‌های پیشرفته هوش مصنوعی خود، فرآیند جدید تأیید هویت سازمانی را راه‌اندازی کرده است. این اقدام با هدف افزایش امنیت و جلوگیری از سوء استفاده از API این شرکت صورت می‌گیرد. توسعه‌دهندگان برای دسترسی به قابلیت‌های پیشرفته باید با ارائه مدارک شناسایی رسمی، هویت سازمان خود را تأیید کنند.

۱۴۰۴/۱/۲۶ ۰۱:۱۴:۰۹
‌‏سرمایه‌گذاری گوگل و انویدیا در استارتاپ هوش مصنوعی Safe Superintelligence

‏گوگل (Alphabet) و انویدیا در استارتاپ تازه‌تأسیس SSI به رهبری ایلیا ساتسکِوِر، هم‌بنیان‌گذار OpenAI، سرمایه‌گذاری کرده‌اند. هدف این استارتاپ، ساخت هوش مصنوعی بسیار پیشرفته‌ای است که در عین قدرتمند بودن، از لحاظ امنیت، اخلاق و کنترل انسانی قابل اطمینان باشد.
‏ارزش SSI تنها چند ماه پس از راه‌اندازی به ۳۲ میلیارد دلار رسیده است. گوگل نه‌تنها در آن سرمایه‌گذاری کرده، بلکه تراشه‌های ویژه خود (TPU) را نیز در اختیار این شرکت گذاشته است. SSI فعلاً برای تحقیقاتش بیشتر از TPU استفاده می‌کند تا GPUهای انویدیا.

۱۴۰۴/۱/۲۵ ۱۷:۵۸:۳۳
ناتوانی هوش مصنوعی در رفع اشکالات نرم‌افزاری؛ شکست مدل‌های پیشرفته در آزمون

پژوهشی از شرکت مایکروسافت نشان می‌دهد که مدل‌های هوش مصنوعی پیشرفته مانند Claude 3.7 Sonnet و o3-mini علی‌رغم پیشرفت‌های اخیر، هنوز قادر به رفع کامل اشکالات نرم‌افزاری نیستند. این مدل‌ها در آزمون SWE-bench Lite تنها موفق به حل کمتر از نیمی از وظایف رفع اشکال شدند که نشان‌دهنده محدودیت‌های جدی هوش مصنوعی در حوزه برنامه‌نویسی است.

۱۴۰۴/۱/۲۳ ۰۰:۴۳:۰۵
هزینه‌های سنگین مدل‌های هوش مصنوعی با قابلیت استدلال

مدل‌های جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحله‌به‌مرحله را دارند، عملکرد بهتری نسبت به مدل‌های قبلی نشان می‌دهند، اما آزمایش و ارزیابی آن‌ها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدل‌های OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدل‌های معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدل‌ها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قوی‌تر باشد، آزمایشش هم گران‌تر می‌شود. کارشناسان هشدار می‌دهند که این روند می‌تواند باعث شود فقط شرکت‌های بزرگ توان بررسی این مدل‌ها را داشته باشند و شفافیت علمی کاهش یابد.

۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
متا مدل‌های هوش مصنوعی Llama 4 را با قابلیت‌های پیشرفته معرفی کرد

شرکت متا چهار مدل جدید هوش مصنوعی Llama 4 را منتشر کرد که شامل Scout، Maverick و Behemoth می‌شوند. این مدل‌ها با معماری ترکیبی متخصصان آموزش دیده و قابلیت پردازش تصویر، متن و ویدیو را دارند. Maverick با 400 میلیارد پارامتر در برخی آزمون‌ها از مدل‌های GPT-4o و Gemini 2.0 پیشی گرفته و Scout با پنجره متنی 10 میلیون توکن، توانایی پردازش اسناد بسیار طولانی را دارد.

۱۴۰۴/۱/۱۸ ۰۰:۰۲:۲۳
تغییر برنامه OpenAI برای انتشار مدل‌های هوش مصنوعی جدید

شرکت OpenAI تصمیم گرفته مدل‌های o3 و o4-mini را در هفته‌های آینده منتشر کند. سام آلتمن، مدیرعامل این شرکت که در زمینه هوش مصنوعی فعال است، اعلام کرد GPT-5 با قابلیت‌های بهتری از آنچه پیش‌بینی می‌شد، توسعه خواهد یافت و انتظار می‌رود در چند ماه آینده عرضه شود.

۱۴۰۴/۱/۱۶ ۱۹:۱۹:۴۲
سرمایه‌گذاری گوگل و انویدیا در استارتاپ هوش مصنوعی SandboxAQ

استارتاپ SandboxAQ که از تکنیک‌های رایانش کوانتومی برای توسعه مدل‌های هوش مصنوعی پیشرفته استفاده می‌کند، ۱۵۰ میلیون دلار سرمایه جدید از شرکت‌هایی مانند گوگل و انویدیا جذب کرد. با این سرمایه‌گذاری، ارزش این شرکت به ۵.۷۵ میلیارد دلار رسید.
این استارتاپ که در سال ۲۰۲۲ از شرکت مادر گوگل، آلفابت، جدا شد، مدل‌های پیچیده‌ای برای تجزیه و تحلیل داده‌های عددی و محاسبات پیشرفته توسعه داده است. این مدل‌ها می‌توانند در زمینه‌هایی مانند کشف دارو و مدل‌سازی مالی استفاده شوند.

۱۴۰۴/۱/۱۶ ۱۸:۲۷:۲۷
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند

نوآم براون از محققان ارشد OpenAI معتقد است مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند اگر محققان مسیر درستی را انتخاب می‌کردند. او در کنفرانس GTC انویدیا توضیح داد که انسان‌ها قبل از تصمیم‌گیری زیاد فکر می‌کنند و این رویکرد در مدل o1 با استفاده از استنتاج زمان اجرا (Test-time inference) پیاده‌سازی شده است.

براون تأکید کرد که آموزش اولیه همچنان مهم است اما در کنار استنتاج زمان اجرا استفاده می‌شود. او همچنین گفت که دانشگاه‌ها با تمرکز بر طراحی مدل‌ها و معیارهای ارزیابی، علی‌رغم کمبود منابع محاسباتی، می‌توانند تأثیرگذار باشند.

۱۴۰۴/۱/۱ ۰۱:۱۳:۳۹
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
گوگل دیپ مایند مدل‌های هوش مصنوعی Gemini Robotics را معرفی کرد

گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدل‌های جدید Gemini Robotics را رونمایی کرد که به ربات‌ها امکان تعامل با اشیا و محیط‌های مختلف را می‌دهد. این مدل‌ها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیط‌های آموزش ندیده نیز عملکرد خوبی دارند.

۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴
گوگل دو مدل هوش مصنوعی جدید برای رباتیک معرفی کرد

گوگل دو مدل هوش مصنوعی Gemini Robotics و Gemini Robotics-ER را برای کاربردهای رباتیک معرفی کرد. این مدل‌ها قابلیت درک فضای اطراف و انجام اقدامات فیزیکی را دارند و برای انواع ربات‌ها از جمله انسان‌نما در کارخانه‌ها و انبارها طراحی شده‌اند. این اقدام می‌تواند هزینه‌های توسعه استارتاپ‌های رباتیک را کاهش دهد.

۱۴۰۳/۱۲/۲۲ ۲۰:۰۱:۵۶
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
سرمایه‌گذاری علی‌بابا در هوش مصنوعی با مدل جدید Qwen

علی‌بابا مدل هوش مصنوعی Qwen با ۳۲ میلیارد پارامتر را معرفی کرد که عملکردی مشابه مدل DeepSeek دارد. این مدل قابلیت‌های برجسته‌ای در استدلال ریاضی، کدنویسی و حل مسائل عمومی نشان داده و از طریق سرویس چت‌بات Qwen در دسترس است. این اقدام در راستای حمایت دولت چین از صنعت هوش مصنوعی صورت گرفته است.

۱۴۰۳/۱۲/۱۶ ۱۱:۲۸:۳۵
سرمایه‌گذاری ۳.۵ میلیارد دلاری در استارتاپ هوش مصنوعی Anthropic

استارتاپ هوش مصنوعی Anthropic موفق به جذب سرمایه ۳.۵ میلیارد دلاری با ارزش‌گذاری ۶۱.۵ میلیارد دلاری شد. این شرکت که در زمینه توسعه سیستم‌های هوش مصنوعی فعالیت می‌کند، قصد دارد با این سرمایه ظرفیت محاسباتی خود را افزایش داده و تحقیقات پیشرفته در زمینه هوش مصنوعی انجام دهد. Anthropic همچنین مدل هوش مصنوعی Claude 3.7 Sonnet را راه‌اندازی کرده و درآمد سالانه آن به حدود یک میلیارد دلار رسیده است.

۱۴۰۳/۱۲/۱۴ ۰۰:۲۶:۰۳
الکسای آمازون، دستیار خرید مواد غذایی با هوش مصنوعی پیشرفته

آمازون قابلیت‌های جدیدی را برای دستیار صوتی الکسا معرفی کرد که به کاربران اجازه می‌دهد با استفاده از گفتگوی طبیعی، فهرست خرید مواد غذایی را تهیه کنند. این سرویس جدید امکان سفارش از Amazon Fresh و سایر شرکای توزیع مواد غذایی را فراهم می‌کند و قادر به درک درخواست‌های پیچیده و ارائه پیشنهادات غذایی است.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۹

نمایش بیشتر