هوش مصنوعی صوتی پیشرفته - اخبار فناوری - EcoFori

گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!

🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینک‌های هوشمند خود را ارتقا دهد. ✅🕶️
هدف متا، بهبود تجربه کار با عینک‌های Ray-Ban با استفاده از مدل‌های زبانی پیشرفته است؛ چون این دستگاه‌ها فاقد نمایشگرند و تعامل با آن‌ها به عملکرد دستیار صوتی وابسته است. ✅🤖
این رویکرد می‌تواند متا را در رقابت عینک‌های هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀

۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶
ChatGPT با لحنی انسانی‌تر از همیشه

قابلیت گفت‌وگوی صوتی در ChatGPT با ارتقاء جدیدی همراه شده که صدای آن را طبیعی‌تر، روان‌تر و احساسی‌تر از قبل می‌کند. 🎙️
به‌گفته OpenAI، نسخه جدید «صدای پیشرفته» با لحن واقعی‌تر، مکث‌های طبیعی، تأکید مناسب و بیان دقیق‌تر احساساتی مانند همدلی یا طعنه طراحی شده است. 🧠
ویژگی ترجمه زنده نیز بهبود یافته و اکنون کاربران می‌توانند بدون وقفه، گفت‌وگوهای چندزبانه را ادامه دهند تا زمانی که بخواهند زبان را تغییر دهند یا متوقف کنند. 🌍
این قابلیت برای همه کاربران سر‌ویس پولی در تمامی پلتفرم‌ها فعال است، هرچند ممکن است گاهی افت کیفیت صوتی یا خطاهای محدود مانند صداهای غیرمنتظره یا موسیقی پس‌زمینه رخ دهد. ⚠️

۱۴۰۴/۳/۲۰ ۱۸:۲۷:۱۹
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
الکسای آمازون، دستیار خرید مواد غذایی با هوش مصنوعی پیشرفته

آمازون قابلیت‌های جدیدی را برای دستیار صوتی الکسا معرفی کرد که به کاربران اجازه می‌دهد با استفاده از گفتگوی طبیعی، فهرست خرید مواد غذایی را تهیه کنند. این سرویس جدید امکان سفارش از Amazon Fresh و سایر شرکای توزیع مواد غذایی را فراهم می‌کند و قادر به درک درخواست‌های پیچیده و ارائه پیشنهادات غذایی است.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۹
الکسای جدید آمازون با هوش مصنوعی پیشرفته رونمایی شد

آمازون در رویداد سالانه خود، نسخه پیشرفته الکسا با قابلیت‌های هوش مصنوعی تولیدی را معرفی کرد. این دستیار صوتی اکنون می‌تواند اسناد و ایمیل‌ها را بررسی، اطلاعات مهم را استخراج و خلاصه کند. همچنین قابلیت پاسخگویی به سوالات درباره اسناد آپلود شده، مدیریت تقویم و کنترل دستگاه‌های خانگی را دارد.
این نسخه با استفاده از مدل‌های هوش مصنوعی مختلف از جمله مدل‌های داخلی آمازون و شرکت Anthropic، قادر به انجام وظایف پیچیده است.
الکسای جدید می‌تواند وب‌سایت‌ها را جستجو کرده، خدمات مختلف را اجرا کند و حتی برای کاربر تعمیرکار پیدا کند.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۷
آمازون الکسا را با هوش مصنوعی پیشرفته بازسازی می‌کند

آمازون در حال معرفی نسل جدید الکسا با قابلیت‌های هوش مصنوعی تولیدی است که می‌تواند چندین درخواست را پشت سر هم پاسخ دهد. این سرویس جدید که پروژه داخلی "بانیان" نام دارد، احتمالاً ماهانه 10 دلار هزینه خواهد داشت و قابلیت انجام اقدامات به صورت مستقل را خواهد داشت. آمازون همچنان نسخه کلاسیک الکسا را نیز رایگان ارائه خواهد داد.

۱۴۰۳/۱۲/۸ ۱۶:۱۹:۵۹
آمازون در آستانه معرفی نسخه هوش مصنوعی پیشرفته الکسا

آمازون در رویدادی تخصصی، نسخه جدید دستیار هوشمند الکسا را معرفی می‌کند. این نسخه پیشرفته با قابلیت‌های هوش مصنوعی پیشرفته طراحی شده و می‌تواند چندین درخواست را همزمان پاسخ دهد. الکسای جدید با قیمت ماهانه 5 تا 10 دلار ارائه خواهد شد و قابلیت انجام خودکار درخواست ها را دارد.

۱۴۰۳/۱۲/۷ ۲۱:۴۳:۵۱
تأخیر در هوش مصنوعی تولیدی آمازون و اپل برای دستیاران صوتی

آمازون و اپل با چالش‌های فنی در ادغام فناوری هوش مصنوعی تولیدی در دستیاران صوتی الکسا و سیری مواجه شده‌اند. آمازون انتشار نسخه جدید الکسا را به مارس یا بعد از آن موکول کرده و اپل نیز با مشکلات مهندسی در بازسازی سیری روبرو است. این شرکت‌ها قصد داشتند سریعاً با دستیاران صوتی نسل جدید مانند OpenAI و Google رقابت کنند اما برنامه‌های آنها با وقفه مواجه شده است.

۱۴۰۳/۱۱/۲۷ ۰۳:۲۷:۴۶
رونمایی گوگل از نسخه جدید ابزار تحقیقاتی پیشرفته Gemini Deep Research

گوگل نسخه جدید «Gemini Deep Research» را با تکیه بر مدل «Gemini 3 Pro» معرفی کرد؛ ابزاری که مثل یک دستیار پژوهشی، اطلاعات زیاد را جمع می‌کند و گزارش می‌سازد. نکته تازه این است که برنامه‌نویس‌ها می‌توانند با «Interactions API» همین قابلیت را داخل اپ‌های خودشان هم بیاورند. 🧩
گوگل می‌گوید این ابزار برای کارهایی مثل بررسی‌های تجاری و پژوهش‌های ایمنی دارو استفاده می‌شود و به‌زودی به سرویس‌هایی مثل Google Search، Google Finance، اپ Gemini و NotebookLM اضافه خواهد شد. 🔍
این شرکت تأکید دارد Gemini 3 Pro برای «کمتر اشتباه ساختن اطلاعات» (توهم‌زایی) در کارهای پیچیده آموزش دیده است. گوگل همچنین معیار «DeepSearchQA» را متن‌باز کرده و می‌گوید مدلش در چند آزمون عملکرد بهتری داشته، اما ChatGPT 5 Pro نزدیک بوده و در یک آزمون مرورگرمحور کمی جلو زده؛ همان روز OpenAI هم GPT-5.2 با نام Garlic را معرفی و ادعای برتری در بنچمارک‌ها مطرح کرد. ⚡

۱۴۰۴/۹/۲۴ ۱۱:۱۲:۴۴
آمریکا فروش تراشه فوق‌پیشرفته H200 انویدیا به چین را بررسی می‌کند

دولت آمریکا در حال بررسی صدور مجوز فروش تراشه پیشرفته Nvidia H200 به چین است؛ تراشه‌ای که به‌دلیل محدودیت‌های صادراتی اجازه ورود به این بازار را نداشت. این بازنگری پس از آتش‌بس تجاری اخیر ترامپ و شی جین‌پینگ مطرح شده و نشانه‌ای از نرم‌تر شدن رویکرد واشنگتن نسبت به پکن است، هرچند هنوز تصمیم قطعی گرفته نشده است. 💻🇺🇸🇨🇳
منتقدان در واشنگتن هشدار می‌دهند فروش تراشه‌های قدرتمند می‌تواند توان نظامی چین را تقویت کند. انویدیا نیز می‌گوید قوانین فعلی باعث شده نتواند محصول رقابتی در بازار چین عرضه کند. H200 دو برابر قوی‌تر از H20 است؛ تنها تراشه پیشرفته‌ای که فعلاً مجاز به فروش در چین است. ⚡
در همین هفته، وزارت بازرگانی آمریکا همچنین مجوز ارسال معادل ۷۰ هزار تراشه Blackwell، نسل جدید چیپ‌های انویدیا، به شرکت‌های عربستان و امارات را صادر کرد. 🌍

۱۴۰۴/۹/۵ ۰۰:۵۳:۰۸
مایکروسافت به دنبال ساخت ابرهوش پزشکی است

مایکروسافت تیم جدیدی به نام MAI Superintelligence تشکیل داده تا هوش مصنوعی‌ای بسازد که در برخی زمینه‌ها، ازجمله تشخیص‌های پزشکی، از انسان‌ها توانمندتر باشد. مصطفی سلیمان، مدیر بخش هوش مصنوعی شرکت، در گفت‌وگو با رویترز اعلام کرد که مایکروسافت قصد دارد سرمایه‌گذاری بزرگی روی این پروژه انجام دهد. 💻
به گفته او، برخلاف برخی شرکت‌ها که به‌دنبال «هوش مصنوعی فراگیر و نامحدود» هستند، مایکروسافت بر ایجاد نوعی «فراهوش انسان‌گرا» تمرکز دارد؛ یعنی فناوری‌ای که در خدمت منافع بشر باشد و خطرات وجودی نداشته باشد. سلیمان گفت هدف این است که مدل‌های تخصصی ایجاد شوند که در کارهایی مثل تشخیص بیماری‌ها، طراحی مولکول‌ها یا بهبود ذخیره‌سازی باتری عملکردی فراتر از انسان داشته باشند. 🧠
او تأکید کرد مایکروسافت در دو تا سه سال آینده می‌تواند به «هوش پزشکی فراانسانی» دست یابد؛ سامانه‌ای که با تحلیل عمیق داده‌ها، قادر است بیماری‌های قابل پیشگیری را زودتر تشخیص دهد و در نتیجه عمر و سلامت انسان‌ها را افزایش دهد. 🏥

۱۴۰۴/۸/۱۷ ۰۱:۵۴:۲۶
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!

بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آماده‌شدن سیستم اختصاصی اپل، به‌صورت موقت در سیری به کار گرفته می‌شود. 💬
به‌گفته‌ی منابع آگاه، دو شرکت در حال نهایی‌کردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت می‌کند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستم‌های فعلی اپل دارد و می‌تواند توانایی سیری را در انجام درخواست‌های چندمرحله‌ای بهبود دهد. 🤖
در این همکاری، فناوری جست‌وجوی گوگل وارد سیستم‌عامل‌های اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود می‌شود. اپل پیش‌تر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ می‌شود که گوگل و آمازون پیش‌تر نسخه‌های هوشمندتر از دستیارهای خود را عرضه کرده‌اند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀

۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳
ترامپ در آستانه تصمیمی جنجالی؛ صادرات تراشه‌های پیشرفته به چین

کارشناسان هشدار داده‌اند در صورت موافقت دولت ترامپ با فروش نسخه ضعیف‌تر تراشه پیشرفته Blackwell شرکت Nvidia به چین، برتری هوش مصنوعی آمریکا به خطر می‌افتد. ⚠️🤖
ترامپ گفته ممکن است در دیدار با شی جین‌پینگ درباره این موضوع گفت‌وگو کند. 🇺🇸🇨🇳 طبق تحلیل مؤسسه Institute for Progress، تراشه کاهش‌یافته B30A تفاوت زیادی با نسخه اصلی ندارد و چین می‌تواند با خرید دوبرابر تراشه، به همان توان محاسباتی برسد. 💻
پژوهش‌ها نشان می‌دهد در صورت ادامه صادرات این تراشه‌ها، مزیت فعلی آمریکا که ۳۰ برابر قدرت پردازشی چین است، تا سال ۲۰۲۶ ممکن است کاملاً از بین برود و حتی چین پیشی بگیرد. 📉
کارشناسان امنیت ملی آمریکا تأکید کرده‌اند این تصمیم در عمل پایان کنترل صادرات تراشه‌های پیشرفته آمریکاست و می‌تواند برتری فناورانه واشنگتن را از بین ببرد. 🚨

۱۴۰۴/۸/۹ ۱۱:۲۲:۰۲
نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد

مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدل‌های هوش مصنوعی در چند سال آینده به فناوری‌های عمومی و در دسترس همه تبدیل خواهند شد. 🤖
او گفت تمرکز فعلی شرکت بر بهبود مدل‌های صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 به‌گفته او، در یک تا دو سال آینده مدل‌های چندوجهی که صدا، تصویر و متن را هم‌زمان تولید می‌کنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
شرکت قصد دارد با همکاری‌های جدید و بهره‌گیری از فناوری‌های متن‌باز، میان توسعه مدل‌ها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرم‌افزار و سخت‌افزار در اپل بسازد. 🍏🚀
محصولات این شرکت در پلتفرم‌هایی مانند دوبله ویدیو، پادکست، بازی‌های ویدئویی، کتاب‌های صوتی و محتوای آموزشی استفاده می‌شوند.

۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲
وقتی ویدیوهای بازی، سوخت موتور هوش مصنوعی می‌شوند!

استارتاپ General Intuition از دل پلتفرم اشتراک ویدیوهای بازی Medal متولد شده و هدفش ساخت هوش مصنوعی‌هایی است که بتوانند حرکت اشیا و انسان‌ها را در فضا و زمان درک کنند؛ مفهومی که به آن «استدلال فضا‌-‌زمانی» گفته می‌شود. 🎮🤖
این شرکت از ۲ میلیارد ویدیو بازی در سال و داده‌های ۱۰ میلیون کاربر استفاده می‌کند و معتقد است این منابع برای آموزش مدل‌های هوش مصنوعی از Twitch و YouTube مؤثرترند. 📊 همین موضوع باعث شد OpenAI سال گذشته پیشنهاد خرید ۵۰۰ میلیون دلاری Medal را مطرح کند.💰
General Intuition قصد دارد عامل‌هایی بسازد که در دنیای واقعی مانند ربات‌ها و پهپادهای نجات عمل کنند. 🚀 این مدل‌ها می‌توانند فقط با تصویر محیط را درک کرده و تصمیم بگیرند، مشابه یک بازیکن انسانی. 👁️
هدف نهایی شرکت، ساخت کاراکترهای هوشمند و فناوری‌هایی است که راه را به سوی هوش مصنوعی عمومی واقعی یا AGI هموار کنند. 🧠✨

۱۴۰۴/۷/۲۶ ۲۳:۳۹:۱۰
DGX Spark؛ محاسبات هوش مصنوعی در یک جعبه کوچک!

با وجود تبلیغات زیاد، رایانه‌های موسوم به «AI PC» هنوز توان واقعی اجرای هوش مصنوعی را ندارند. 💻 بیشتر پردازش‌های هوش مصنوعی در مراکز داده بزرگ آمریکا انجام می‌شود. 🇺🇸
شرکت انویدیا که با رشد هوش مصنوعی به غول تریلیون‌دلاری تبدیل شده، رایانه جدیدی به نام DGX Spark با قیمت حدود ۴۰۰۰ دلار معرفی کرده است. 💰 این دستگاه کوچک در نمایشگاه CES 2025 رونمایی شد و برای پردازش‌های سنگین هوش مصنوعی طراحی شده است. ⚙️
Spark با تراشه Blackwell، پردازنده ۲۰ هسته‌ای و سیستم لینوکسی مخصوص انویدیا اجرا می‌شود و دارای ۱۲۸ گیگ رم و ۴ ترابایت حافظه است. 🚀 توان پردازشی آن به ۱ پتافلاپ می‌رسد که چند برابر مدل‌های قدیمی‌تر است. 🔋
Spark از چهارشنبه توسط شرکت‌هایی مانند Acer، Dell و Lenovo عرضه می‌شود. 🏬 انویدیا چند نمونه از آن را به OpenAI، مایکروسافت و ایلان ماسک اهدا کرده است. 🤖 هدف اصلی، جذب توسعه‌دهندگان برای ساخت نسل بعدی ابزارهای هوش مصنوعی است. 🌊✨

۱۴۰۴/۷/۲۶ ۱۳:۱۴:۴۳
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازه‌ای از هوش مصنوعی خانگی

گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخ‌ها سریع‌تر و طبیعی‌تر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک می‌کند. 🍳🏠 اسپیکر می‌تواند از طریق سیستم هوشمند خانه، چراغ‌ها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغ‌ها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و می‌توان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام می‌شود. 🗓️

۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵
مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
چین با تراشه‌های پیشرفته علی‌بابا به جنگ انویدیا می‌رود

China Unicom در شینینگ چین یک مرکز داده ۳۹۰ میلیون دلاری ساخته که با تراشه‌های هوش مصنوعی داخلی، بیشتر از علی‌بابا، کار می‌کند. این پروژه برای کاهش وابستگی به فناوری خارجی طراحی شده است. 🤖🇨🇳
مرکز داده تاکنون با ۲۳ هزار تراشه داخلی به توان ۳۵۷۹ پتافلاپس رسیده و تراشه جدید علی‌بابا (PPU) رقیبی برای H20 انویدیا معرفی شده است. ✅⚡

۱۴۰۴/۶/۲۸ ۰۴:۳۲:۲۱
گوگل، NotebookLM را به 80 زبان گسترش داد

گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی می‌کند. این ویژگی به کاربران امکان می‌دهد یادداشت‌ها، فایل‌های PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیش‌تر فقط برای زبان انگلیسی فعال بود. 🎥🌍
همچنین قابلیت Audio Overviews ارتقا یافته و خلاصه‌های صوتی در زبان‌های غیرانگلیسی اکنون جزئیات بیشتری ارائه می‌دهند. کاربران می‌توانند بسته به نیاز، نسخه کوتاه یا کامل خلاصه‌ها را دریافت کنند. 🎧📑

۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵
چت‌بات Humain Chat: پیشرفته‌ترین مدل زبان عربی

شرکت سعودی Humain چت‌باتی به نام Humain Chat معرفی کرده که بر پایه مدل زبانی «Allam» ساخته شده و با یکی از بزرگ‌ترین مجموعه‌های داده عربی آموزش دیده است. این ابزار علاوه بر تسلط بر زبان عربی، با فرهنگ و ارزش‌های اسلامی نیز هماهنگ است و امکان گفت‌وگوی دو‌زبانه عربی و انگلیسی را دارد و حتی لهجه‌هایی مثل مصری و لبنانی را هم پشتیبانی می‌کند. 🤖💬
این اپلیکیشن ابتدا فقط در عربستان عرضه می‌شود اما قرار است به‌تدریج در کل خاورمیانه و سپس برای حدود ۵۰۰ میلیون کاربر عرب‌زبان در جهان در دسترس قرار گیرد. از آنجا که پروژه زیر نظر دولت عربستان آغاز شده، احتمال سانسور محتوا وجود دارد؛ کشوری که طبق گزارش Freedom House در سال ۲۰۲۴ یکی از پایین‌ترین رتبه‌ها در آزادی اینترنت را داشته است. ✅🌍

۱۴۰۴/۶/۵ ۰۷:۳۹:۰۸
چت‌بات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراج‌شده را بازگرداند!

بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چت‌بات صوتی اخراج کرد، اما به‌دلیل افزایش تماس‌ها و ناکارآمدی سیستم مجبور شد آن‌ها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماس‌ها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شده‌اند. 🤖📞
بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقب‌نشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبه‌رو شدند. ✅👥
این اتفاق نشان می‌دهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژه‌های آزمایشی هوش مصنوعی در شرکت‌ها شکست خورده‌اند. 📊⚡

۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵

نمایش بیشتر