اسپاتیفای صوتی - صفحه 2 - اخبار فناوری - EcoFori

Anthropic قابلیت مکالمه صوتی را به چت‌بات Claude اضافه کرد

🗣️ شرکت Anthropic حالت Voice Mode را برای چت‌بات Claude در نسخه موبایل فعال کرد! کاربران حالا می‌توانند با Claude گفتگوهای صوتی انجام دهند و پاسخ‌ها را با صدا بشنوند. 🎧📱
این قابلیت فعلاً به زبان انگلیسی و در حالت آزمایشی عرضه شده و امکان سوییچ بین متن و صدا، انتخاب از بین ۵ صدای مختلف و دیدن خلاصه گفتگو را فراهم می‌کند. 🔄📝

۱۴۰۴/۳/۸ ۰۲:۵۷:۱۸
آمازون با خلاصه‌های صوتی هوشمند، خرید را متحول می‌کند

🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش می‌کند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، می‌توانید توضیحاتی صوتی درباره ویژگی‌ها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمه‌ای تولید شده‌اند تا خرید راحت‌تر و سریع‌تری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد به‌زودی آن را گسترش دهد. 🌍🛍️

۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
اپل مجبور به عقب‌نشینی شد؛ اسپاتیفای فروشش را چند برابر کرد

🎧 اسپاتیفای اعلام کرد که امکان پرداخت خارج از اپلیکیشن در نسخه iOS باعث افزایش چشمگیر خرید اشتراک پرمیوم توسط کاربران آیفون شده است. 💳📲
پس از حکم دادگاه آمریکا در حمایت از Epic Games، اپل مجبور شد اجازه دهد اپ‌ها در آمریکا، کاربران را به روش‌های پرداخت بیرونی هدایت کنند 🔓⚖️ اسپاتیفای بلافاصله اپ خود را بروزرسانی کرد و لینک خرید مستقیم از سایت و اطلاعات قیمت را به اپ اضافه کرد. 🌐💰
به گفته اسپاتیفای، همین تغییر باعث شده کاربران بیشتری به اشتراک پولی روی بیاورند، چیزی که در اندروید مدت‌ها امکان‌پذیر بود اما در iOS تازه اجرا شده است. 📈📱

۱۴۰۴/۳/۲ ۱۱:۴۳:۱۵
با بخش جدید اسپاتیفای، انتشار آلبوم مورد علاقه‌تان را از دست نمی‌دهید

🎵 اسپاتیفای بخش جدیدی به نام Upcoming Releases معرفی کرده که کاربران می‌توانند از آن برای دیدن آلبوم‌های در راه، پیش‌ذخیره آثار و دریافت نوتیفیکیشن روز انتشار استفاده کنند. 📅🎧📲
همچنین جدول Top 10 Countdowns با بیشترین پیش‌ذخیره هر هفته در شبکه‌های اجتماعی منتشر می‌شود. 📊🔥
اسپاتیفای اخیراً طراحی اپ را هم بهبود داده و امکان خرید مستقیم کتاب صوتی را بدون پرداخت کمیسیون اپل فراهم کرده است. 📚💳

۱۴۰۴/۳/۲ ۱۱:۴۳:۱۳
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست

🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار به‌صورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفت‌وگو با افراد به زبان‌های مختلف را در زمان واقعی فراهم می‌کند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوه‌های انگلیسی‌زبان می‌توانند با مادربزرگ اسپانیایی‌زبانشان راحت صحبت کنند یا شرکت‌های بین‌المللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه می‌شود و صدای اصلی شخص نیز به‌صورت کمرنگ در پس‌زمینه شنیده می‌شود 🎙️🔊

۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small

🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشی‌های هوشمند هم کار می‌کند و در کمتر از ۸ ثانیه صدا تولید می‌کند. 📱
✅ برخلاف دیگر مدل‌ها، فقط از آهنگ‌های رایگان برای آموزش استفاده کرده و نگرانی کپی‌رایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی می‌کند و مناسب تولید افکت‌های صوتی و نمونه‌های کوتاه است. 🎧

۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵
Alexa+ در سراشیبی ناکامی

🚨 سرویس هوش مصنوعی جدید Alexa+ آمازون با مشکلاتی در دسترسی کاربران مواجه شده است.
با وجود اعلام آمازون مبنی بر دسترسی صدها هزار کاربر، شواهد عمومی از کاربران واقعی Alexa+ بسیار کم است. ❌
Alexa+ که با قابلیت‌های جدید هوش مصنوعی طراحی شده، قرار بود دستیار صوتی آمازون را احیا کند، اما کاربران از سرعت پایین و گاهی اطلاعات نادرست شکایت دارند. ⚡🤖

۱۴۰۴/۲/۲۸ ۱۹:۲۸:۳۷
اسپاتیفای، DJ شخصی شما با هوش مصنوعی

🎶 اسپاتیفای با یک به‌روزرسانی هیجان‌انگیز، تجربه دی‌جی هوش مصنوعی خود را تعاملی‌تر کرده است! 🌐 کاربران در بیش از ۶۰ کشور (فقط برای مشترکین پریمیوم) حالا می‌توانند با دستورات صوتی از دی‌جی هوش مصنوعی بخواهند حال و هوای پلی‌لیست را تغییر دهد یا آهنگ‌های خاصی را پخش کند. 🎧✨
📌 کافیست دی‌جی را در نوار جستجو پیدا کنید و با نگه‌داشتن دکمه DJ درخواست خود را با صدا بیان کنید. 🎤 اگر هم دوست دارید بدون درخواست مشخصی، حال و هوای پلی‌لیست تغییر کند، یک‌بار روی دکمه دی‌جی بزنید. 🔀
🔊 این قابلیت جدید، در کنار ویژگی‌های دیگر اسپاتیفای مثل امکان ساخت پلی‌لیست با متن، تجربه گوش دادن به موسیقی را هیجان‌انگیزتر می‌کند! 🚀🔥

۱۴۰۴/۲/۲۵ ۰۲:۱۶:۳۵
هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
خرید آسان‌تر کتاب‌های الکترونیکی با تغییرات جدید Kindle آمازون

📚 به‌دنبال حکم اخیر که اپل را مجبور به توقف دریافت ۲۷٪ کمیسیون از خریدهای اپلیکیشن‌های آیفون کرد، اپلیکیشن Kindle آمازون دکمه "دریافت کتاب" را اضافه کرده است. این تغییر به کاربران امکان خرید کتاب از طریق مرورگر موبایل را می‌دهد. پیش از این، خرید کتاب از طریق اپلیکیشن‌های Kindle یا آمازون ممکن نبود. همچنین، اسپاتیفای نیز از این حکم بهره برده و امکان نمایش قیمت‌ها و لینک‌های پرداخت خارجی را فراهم کرده است. اپل با این حکم مخالف است و درخواست تجدیدنظر داده است.

۱۴۰۴/۲/۱۸ ۱۱:۲۰:۰۹
اسپاتیفای کاربران را به کشف پادکست‌های محبوب ترغیب می‌کند

🎧 اسپاتیفای حالا به کاربران نشان می‌دهد که هر اپیزود پادکست چند بار پخش شده 📊 این متریک تازه به نام “plays” برای اولین‌بار در اپلیکیشن، صفحه اپیزود و حتی برای سازندگان در Spotify for Creators نمایش داده می‌شود. هدف اسپاتیفای این است که کاربران را به کشف پادکست‌های محبوب‌تر تشویق کند و تولیدکنندگان بتوانند عملکردشان را بسنجند و بهبود دهند. 📈🚀
🔥 این قابلیت جدید پس از اعلام رشد چشمگیر اسپاتیفای منتشر شد: ۵ میلیون مشترک جدید پرمیوم و رسیدن به ۲۶۸ میلیون کاربر در سه‌ماهه اول سال!

۱۴۰۴/۲/۱۷ ۲۰:۲۲:۴۴
اسپاتیفای با ابزار Backstage و چت بات AiKA وارد دنیای توسعه‌دهندگان شد

💻🎧🚀 در حالی که اسپاتیفای را به‌عنوان غول موسیقی می‌شناسیم، این شرکت بی سر و صدا در حال ساخت یک امپراتوری جدید در حوزه ابزارهای توسعه‌دهنده است. پلتفرم Backstage که اکنون توسط میلیون‌ها توسعه‌دهنده در شرکت‌های بزرگ استفاده می‌شود، به‌زودی با ابزارهایی چون چت‌بات هوش مصنوعی AiKA، به یک محصول تجاری تمام‌عیار تبدیل می‌شود. 🤖📊
اسپاتیفای هدف دارد این ابزار را به استاندارد جهانی تبدیل کند.

۱۴۰۴/۲/۱۶ ۱۱:۴۹:۰۰
فشار قضایی بر اپل نتیجه داد؛ اسپاتیفای به کاربرانش راه خرید مستقیم می‌دهد

در پی حکم جنجالی دادگاه آمریکا علیه اپل، اسپاتیفای (Spotify) ، غول پخش آنلاین ، در اقدامی مهم نسخه‌ای جدید از اپلیکیشن خود را به اپل ارائه داد که به کاربران آمریکایی امکان خرید مستقیم اشتراک را می‌دهد. این اتفاق می‌تواند قواعد بازی در بازار اپلیکیشن‌ها را تغییر دهد. اسپاتیفای این اقدام را نتیجه چهار سال پیگیری قانونی دانسته و از دادگاه به دلیل پایان دادن به محدودیت‌های ناعادلانه اپل تشکر کرده است. اپل با این حکم مخالف است اما مجبور به اجرای آن شده و در عین حال به دنبال تجدیدنظر است.

۱۴۰۴/۲/۱۳ ۰۵:۲۶:۱۳
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
ورود هوش مصنوعی به منوی رستوران‌ها

شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخ‌گویی تلفنی رستوران‌ها و کسب‌وکارها رونمایی کرد. این سیستم‌ها بدون نیاز به نصب پیچیده و API، از اطلاعات کسب‌وکار مثل پیام خوش‌آمد، راهنمای تلفظ و قوانین تماس استفاده می‌کنند. مثلاً می‌توانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماس‌های اسپم، تحلیل تماس و انتقال تماس‌های پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسب‌وکار داده می‌شود.

۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶
رشد خیره‌کننده کاربران Spotify با وجود افت سود

اسپاتیفای اعلام کرد به دلیل افزایش مالیات‌های حقوق و دستمزد، سود سه‌ماهه دوم آن کمتر از انتظار بازار خواهد بود. این خبر باعث شد سهام این شرکت ۷٪ کاهش پیدا کند. با وجود این، اسپاتیفای همچنان رشد قابل توجهی در تعداد کاربران دارد؛ تعداد مشترکین پولی به ۲۶۸ میلیون نفر رسیده و کاربران فعال ماهانه به ۶۷۸ میلیون نفر افزایش یافته است. اسپاتیفای همچنین با استفاده از محتوای ویدیویی بیشتر و پلی‌لیست‌های ساخته شده با هوش مصنوعی، توانسته توجه کاربران را جلب کند. شرکت انتظار دارد در سه‌ماهه دوم نیز تعداد کاربرانش بیشتر شود.

۱۴۰۴/۲/۱۰ ۱۵:۱۴:۴۷
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد

برند CMF از شرکت Nothing سه مدل ایرپاد بی‌سیم جدید با نام‌های Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی می‌کنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدل‌های بالاتر دارای میکروفون‌های بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدل‌های گران‌تر از صدای فضایی ۳D پشتیبانی می‌کنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزان‌تر بهتر است اما همچنان در برابر ایرپادهای گران‌تر بازار حرفی برای گفتن ندارد.

۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲
نتفلیکس زیرنویس جدید خود را معرفی کرد

نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
۱۴۰۴/۲/۵ ۱۹:۵۱:۱۶
هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند

دو دانشجوی کره‌ای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساخته‌اند که می‌تواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر می‌دهد. این مدل رایگان است و در پلتفرم‌های Hugging Face و GitHub قابل دسترسی است. کاربران می‌توانند لحن صدا، مکث‌ها، سرفه و خنده را در گفت‌وگوها تنظیم کنند و حتی صدای واقعی افراد را شبیه‌سازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه داده‌هایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیت‌های اجتماعی و چندزبانه بسازند.

۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸
اختلال گسترده در سرویس پخش موسیقی Spotify

پلتفرم پخش موسیقی Spotify که در زمینه استریم موسیقی آنلاین فعالیت دارد، با اختلال گسترده‌ای مواجه شد. بیش از ۴۷ هزار کاربر در سراسر جهان از قطعی خدمات این سرویس گزارش دادند. کاربران قادر به جستجو و مشاهده هنرمندان نبودند اما همچنان می‌توانستند موسیقی‌های دانلود شده را پخش کنند.

۱۴۰۴/۱/۲۸ ۱۸:۱۹:۴۷
هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰

نمایش بیشتر