گیمینگ صوتی - صفحه 2 - اخبار فناوری - EcoFori

آمازون با خلاصه‌های صوتی هوشمند، خرید را متحول می‌کند

🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش می‌کند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، می‌توانید توضیحاتی صوتی درباره ویژگی‌ها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمه‌ای تولید شده‌اند تا خرید راحت‌تر و سریع‌تری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد به‌زودی آن را گسترش دهد. 🌍🛍️

۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
AMD با Radeon RX 9060 XT به نبرد کارت‌های گرافیکی اقتصادی رفت

🎮 AMD در نمایشگاه Computex از کارت گرافیک Radeon RX 9060 XT رونمایی کرد؛ مدلی اقتصادی با معماری RDNA 4 و دو نسخه ۸ و ۱۶ گیگابایتی GDDR6. 🧠📦
این کارت با توان اجرای بازی‌ها در رزولوشن 1440p عرضه می‌شود و فرکانس تقویتی آن ۳.۱۳ گیگاهرتز است.⚡🖥️
هنوز قیمت آن اعلام نشده، اما AMD امیدوار است با قیمت‌گذاری مناسب، رقیبی جدی برای RTX 5060 Ti انویدیا باشد. 💰🆚
با توجه به کمبود موجودی مدل‌های ارزان انویدیا، AMD شانس خوبی برای جذب کاربران حساس به قیمت دارد. 📉🛒

۱۴۰۴/۳/۱ ۱۲:۱۳:۳۴
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست

🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار به‌صورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفت‌وگو با افراد به زبان‌های مختلف را در زمان واقعی فراهم می‌کند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوه‌های انگلیسی‌زبان می‌توانند با مادربزرگ اسپانیایی‌زبانشان راحت صحبت کنند یا شرکت‌های بین‌المللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه می‌شود و صدای اصلی شخص نیز به‌صورت کمرنگ در پس‌زمینه شنیده می‌شود 🎙️🔊

۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵
آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون

🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون می‌توانند کتاب‌های صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
اسپاتیفای در سال ۲۰۲۲ امکان خرید کتاب‌های صوتی را به دلیل قوانین سخت‌گیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅

۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲
هوش مصنوعی، گیمینگ و فناوری در کامپیوتکس ۲۰۲۵

🎮 رویداد Computex 2025 در تایوان با تمرکز بر فناوری و هوش مصنوعی در حال برگزاری است.
انویدیا با معرفی GPU جدید RTX 5060 و گسترش ابزارهای هوش مصنوعی‌اش صحنه را داغ کرد، به همراه لپ‌تاپ‌های جدید Razer Blade 14 و Acer Predator Triton 14 AI 🖥️ اما جذاب‌ترین بخش شاید گجت‌های متفاوت نمایشگاه امسال باشد:
✅ Elgato ماژول‌های جدید Stream Deck را معرفی کرده تا کاربران معمولی هم بتوانند دکمه‌های میانبر دلخواه بسازند ⌨️
✅ Asus ROG کیبوردی دو تکه معرفی کرده که هم برای گیم و هم سلامت مچ کاربرد دارد 🎮
✅ Corsair ماوس جدیدی با ۱۶ دکمه قابل برنامه‌ریزی برای گیمرها و تولیدکنندگان محتوا آورده🖱️
✅ Nvidia ابزاری به‌نام G-Assist ساخته که با کمک هوش مصنوعی قابل شخصی‌سازی است و حتی بدون دانش برنامه‌نویسی می‌توان برایش پلاگین ساخت 🤖
✅ Hyte کیس کامپیوترهایی با رنگ‌های خاص مثل شیر توت‌فرنگی و طراحی متفاوت معرفی کرده که شبیه گل‌فروشی‌اند تا سیستم گیمینگ! 🌸🖥️
✅ Dell هم لپ‌تاپ هوش مصنوعی جدیدی معرفی کرده که با تراشه AI اختصاصی خود، قدرت پردازش بالا و مصرف کمی دارد.💻

۱۴۰۴/۲/۳۱ ۱۲:۴۲:۵۸
Razer Blade 14؛ تجسم قدرت در نازکترین حالت ممکن

🎮💻 باریک‌ترین مدل Blade 14 با ضخامت ۰.۶۲ اینچ و وزن ۱.۶۳ کیلوگرم رونمایی شد. قیمت از ۲۳۰۰ دلار با پردازنده گرافیکی Nvidia RTX 5060 شروع می‌شود و برای RTX 5070 به ۲۷۰۰ دلار می‌رسد.
⚡️ پردازنده AMD Ryzen AI 9، حداکثر ۶۴ گیگابایت رم LPDDR5X با سرعت ۸۰۰۰ مگاهرتز و نمایشگر 3K با نرخ تازه‌سازی ۱۲۰ هرتز. 🌐📺
🔊 صدای قدرتمند با سیستم صوتی THX Spatial Audio 🎧 و بدنه آلومینیومی مقاوم.
🚀 باتری تا ۳ ساعت گیمینگ را پشتیبانی می‌کند. اگر به دنبال یک لپ‌تاپ گیمینگ سبک و قدرتمند هستید، Razer Blade 14 گزینه جذابی است، البته به شرطی که بودجه کافی داشته باشید! 🔥

۱۴۰۴/۲/۳۰ ۲۳:۲۳:۰۱
RTX 5060 انویدیا، کارت گرافیک رویایی برای گیمرها

🎮 انویدیا کارت گرافیک GeForce RTX 5060 را با قیمت ۳۰۰ دلار عرضه کرد. این کارت برای بازی‌های 1080p طراحی شده و از فناوری DLSS 4 و هوش مصنوعی برای افزایش فریم استفاده می‌کند. 🤖
اما درایورهای رسمی هنوز منتشر نشده و بررسی کارایی آن نامشخص است. 📉 همزمان، AMD Radeon RX 9060 XT هم در راه است. 🔥

۱۴۰۴/۲/۳۰ ۲۲:۳۰:۵۳
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
Odyssey OLED G660SF؛ غول 500 هرتزی سامسونگ برای گیمرهای حرفه‌ای

🎮📺 سامسونگ از مانیتور جدید Odyssey OLED G660SF با نرخ تازه‌سازی 500 هرتز رونمایی کرد، اما آیا واقعاً این سرعت فوق‌العاده لازم است؟ ⚡🤔
📊 این مانیتور 1440p با زمان پاسخ‌گویی 0.03 میلی‌ثانیه طراحی شده است. با این حال، تنها گیمرهای حرفه‌ای می‌توانند تفاوت بین 240 هرتز و 500 هرتز را تشخیص دهند. 🎮
💰 این مانیتور با قیمت نزدیک به ۱۵۰۰ دلار عرضه خواهد شد. اما آیا این سرعت فوق‌العاده ارزش هزینه را دارد؟

۱۴۰۴/۲/۲۹ ۲۳:۲۰:۵۳
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small

🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشی‌های هوشمند هم کار می‌کند و در کمتر از ۸ ثانیه صدا تولید می‌کند. 📱
✅ برخلاف دیگر مدل‌ها، فقط از آهنگ‌های رایگان برای آموزش استفاده کرده و نگرانی کپی‌رایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی می‌کند و مناسب تولید افکت‌های صوتی و نمونه‌های کوتاه است. 🎧

۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵
Alexa+ در سراشیبی ناکامی

🚨 سرویس هوش مصنوعی جدید Alexa+ آمازون با مشکلاتی در دسترسی کاربران مواجه شده است.
با وجود اعلام آمازون مبنی بر دسترسی صدها هزار کاربر، شواهد عمومی از کاربران واقعی Alexa+ بسیار کم است. ❌
Alexa+ که با قابلیت‌های جدید هوش مصنوعی طراحی شده، قرار بود دستیار صوتی آمازون را احیا کند، اما کاربران از سرعت پایین و گاهی اطلاعات نادرست شکایت دارند. ⚡🤖

۱۴۰۴/۲/۲۸ ۱۹:۲۸:۳۷
پادکسترها به شمارش پخش عمومی اسپاتیفای اعتراض کردند

🎧 اسپاتیفای هفته گذشته قصد داشت تعداد پخش همه پادکست‌ها را عمومی کند، اما با مخالفت شدید سازندگان پادکست مواجه شد.
منتقدان معتقد بودند این اقدام باعث می‌شود پادکست‌های کوچک‌تر شانسی برای جذب مخاطب نداشته باشند.
در نهایت اسپاتیفای عقب‌نشینی کرد و اعلام کرد فقط پادکست‌های بالای ۵۰ هزار پخش، تعداد پخش آنها نمایش داده خواهد شد.
این تصمیم تلاشی برای ایجاد توازن بین پادکست‌های بزرگ و کوچک است.

۱۴۰۴/۲/۲۸ ۰۲:۴۴:۵۷
کنسول جیبی Anbernic که همه کنسول‌های کلاسیک را اجرا می‌کند

شرکت Anbernic یک دستگاه بازی جدید به نام RG34XXSP با طراحی تاشو و قیمت 60 دلاری معرفی کرد که امکان اجرای بازی‌های رترو از Game Boy تا Nintendo 64 را دارد و به همراه دو جوی‌استیک برای تجربه بهتر بازی‌ها ارائه می شود.🎮
دارای ۲ گیگابایت رم و حافظه داخلی ۶۴ گیگ به همراه پردازنده H700 چهار هسته‌ای ARM Cortex-A53.

۱۴۰۴/۲/۲۷ ۲۳:۰۶:۳۶
Acer Predator Triton 14 AI؛ لپ‌تاپی برای گیمرها و هنرمندان

ایسر از لپ‌تاپ جدید Predator Triton 14 AI رونمایی کرد. 💻✏️ این دستگاه با صفحه لمسی هپتیک (بازخورد لمسی) که از قلم پشتیبانی می‌کند، تجربه‌ای شبیه کار با کاغذ را برای هنرمندان دیجیتال فراهم می‌کند. 🎨🖌️
📊 مشخصات: پردازنده Intel Core Ultra 9، کارت گرافیک Nvidia RTX 5070، تا 32 گیگابایت رم LPDDR5X و حداکثر 2 ترابایت حافظه SSD. 💾 صفحه نمایش OLED با رزولوشن 1440p و نرخ تازه‌سازی 120 هرتز. 🌐
🎮 ترکیب قدرت گیمینگ و خلاقیت دیجیتال؛ مناسب برای گیمرها و هنرمندان.

۱۴۰۴/۲/۲۷ ۲۰:۲۹:۵۳
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
ورود هوش مصنوعی به منوی رستوران‌ها

شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخ‌گویی تلفنی رستوران‌ها و کسب‌وکارها رونمایی کرد. این سیستم‌ها بدون نیاز به نصب پیچیده و API، از اطلاعات کسب‌وکار مثل پیام خوش‌آمد، راهنمای تلفظ و قوانین تماس استفاده می‌کنند. مثلاً می‌توانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماس‌های اسپم، تحلیل تماس و انتقال تماس‌های پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسب‌وکار داده می‌شود.

۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد

برند CMF از شرکت Nothing سه مدل ایرپاد بی‌سیم جدید با نام‌های Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی می‌کنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدل‌های بالاتر دارای میکروفون‌های بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدل‌های گران‌تر از صدای فضایی ۳D پشتیبانی می‌کنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزان‌تر بهتر است اما همچنان در برابر ایرپادهای گران‌تر بازار حرفی برای گفتن ندارد.

۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲
نتفلیکس زیرنویس جدید خود را معرفی کرد

نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند

دو دانشجوی کره‌ای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساخته‌اند که می‌تواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر می‌دهد. این مدل رایگان است و در پلتفرم‌های Hugging Face و GitHub قابل دسترسی است. کاربران می‌توانند لحن صدا، مکث‌ها، سرفه و خنده را در گفت‌وگوها تنظیم کنند و حتی صدای واقعی افراد را شبیه‌سازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه داده‌هایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیت‌های اجتماعی و چندزبانه بسازند.

۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸
سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
بازگشت پیش‌فروش کنسول Nintendo Switch 2 با قیمت قبلی

نینتندو پیش‌فروش کنسول Switch 2 را از سر گرفت. این کنسول با قیمت 450 دلار و نسخه باندل با بازی Mario Kart World به قیمت 500 دلار در تاریخ 24 آوریل آغاز می‌شود. تاریخ عرضه همچنان 5 ژوئن است. علاوه بر این، قیمت لوازم جانبی مانند دسته‌ها و دوربین کمی افزایش یافته است.

۱۴۰۴/۱/۳۰ ۲۳:۴۴:۵۱
عرضه گجت جدید نانولیف؛ راه‌حلی برای میزهای شلوغ و نورپردازی حرفه‌ای

شرکت Nanoleaf محصول جدیدی برای گیمرها معرفی کرده که هم چراغ RGB است، هم شارژر، و هم نظم‌دهنده وسایل. با طراحی دوطرفه، امکان نصب وسایل گیمینگ مثل کنترلر و هدست را فراهم می‌کند و در عین حال فضای میز را با نورهای رنگی زیبا می‌سازد. این گجت ۶۰ دلاری دارای پورت‌های USB برای شارژ و قابلیت کنترل نور از طریق اپلیکیشن است و حتی می‌تواند با موسیقی هماهنگ شود. برای میزهای شلوغ گیمرها، ترکیبی از کارایی و زیبایی است.

۱۴۰۴/۱/۲۷ ۲۳:۴۸:۳۴
هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰

نمایش بیشتر