پروتکل صوتی کامپیوتری - صفحه 2 - اخبار فناوری - EcoFori

هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
مایکروسافت و گوگل: همکاری برای آینده‌ای هوشمندتر با پروتکل Agent2Agent (A2A)

مایکروسافت اعلام کرد که از پروتکل جدید گوگل به نام Agent2Agent (A2A) پشتیبانی می‌کند. این پروتکل به هوش مصنوعی‌ها اجازه می‌دهد با هم ارتباط برقرار کنند و در برنامه‌ها و سرویس‌های مختلف همکاری کنند.
با این تصمیم، پلتفرم‌های هوش مصنوعی مایکروسافت، از جمله Azure AI Foundry و Copilot Studio، می‌توانند با دیگر هوش مصنوعی‌ها ارتباط بگیرند. برای مثال، یک هوش مصنوعی مایکروسافت می‌تواند جلسه‌ای را برنامه‌ریزی کند، در حالی که یک هوش مصنوعی گوگل دعوت‌نامه‌ها را ارسال می‌کند. 📅✉️
این اقدام بخشی از تلاش برای ساخت نرم‌افزارهایی است که می‌توانند به‌طور خودکار و هماهنگ با هم کار کنند. 📊 طبق نظرسنجی KPMG، ۶۵٪ شرکت‌ها در حال آزمایش این نوع هوش مصنوعی هستند و این بازار تا سال ۲۰۳۰ به ۵۲ میلیارد دلار می‌رسد. 🚀

۱۴۰۴/۲/۱۹ ۱۹:۳۶:۳۹
Posha: آینده آشپزی در دستان ربات‌ها

در سال ۲۰۱۷، «راگا گوپتا» به‌دنبال راهی ساده برای خوردن غذای خانگی، بدون دردسر آشپزی یا هزینه‌های بالا بود ⏳💸
او با تأسیس استارتاپ Posha، رباتی ساخت که غذا را با بینایی کامپیوتری آماده می‌کند! 🤖🍲
کافی‌ست دستور پخت را انتخاب کنید، مواد را داخل دستگاه بریزید و باقی کار را به Posha بسپارید!
حتی اگر مواد را دقیق اندازه نگیرید، Posha باز هم کارش را انجام می‌دهد! ⚙️👌
در ژانویه ۲۰۲۵، اولین سری دستگاه‌ها به فروش رسید و حالا پیش‌سفارش سری دوم آغاز شده است! ✅📦
اخیراً Posha با جذب ۸ میلیون دلار سرمایه قصد دارد تنوع غذاها را بیشتر کند و امکان پیشنهاد دستور پخت با کمک هوش مصنوعی را فراهم کند! 🧠🍽️
گوپتا می‌گوید: همان‌طور که یخچال و مایکروویو بخشی از خانه‌ها شدند، Posha هم به‌زودی جزو ضروریات خواهد بود! 🏠✨

۱۴۰۴/۲/۱۷ ۱۹:۳۷:۳۵
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
ورود هوش مصنوعی به منوی رستوران‌ها

شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخ‌گویی تلفنی رستوران‌ها و کسب‌وکارها رونمایی کرد. این سیستم‌ها بدون نیاز به نصب پیچیده و API، از اطلاعات کسب‌وکار مثل پیام خوش‌آمد، راهنمای تلفظ و قوانین تماس استفاده می‌کنند. مثلاً می‌توانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماس‌های اسپم، تحلیل تماس و انتقال تماس‌های پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسب‌وکار داده می‌شود.

۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد

برند CMF از شرکت Nothing سه مدل ایرپاد بی‌سیم جدید با نام‌های Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی می‌کنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدل‌های بالاتر دارای میکروفون‌های بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدل‌های گران‌تر از صدای فضایی ۳D پشتیبانی می‌کنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزان‌تر بهتر است اما همچنان در برابر ایرپادهای گران‌تر بازار حرفی برای گفتن ندارد.

۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲
نورالینک ایلان ماسک در پی جذب سرمایه ۵۰۰ میلیون دلاری

شرکت ایمپلنت مغزی Neuralink، متعلق به ایلان ماسک، در حال برنامه‌ریزی برای جذب ۵۰۰ میلیون دلار سرمایه با ارزشی حدود ۸.۵ میلیارد دلار است. این شرکت که پیش‌تر ۲۸۰ میلیون دلار سرمایه جذب کرده بود، هم‌اکنون در حال آزمایش ایمپلنتی است که به افراد آسیب‌دیده نخاعی اجازه می‌دهد فقط با ذهن خود بازی کنند، در اینترنت بگردند و کارهای دیگری انجام دهند. هدف ماسک استفاده گسترده از این فناوری برای درمان بیماری‌هایی مانند چاقی و افسردگی است.

۱۴۰۴/۲/۸ ۱۸:۵۲:۰۷
قطع شدن شبکه اجتماعی غیرمتمرکز Bluesky؛ چطور ممکن شد؟

شبکه اجتماعی غیرمتمرکز Bluesky رقیب X ، حدود یک ساعت از دسترس خارج شد. علت مشکل، اختلال در سرورهای داده شخصی بود. با اینکه این پلتفرم غیرمتمرکز است، بیشتر کاربران از زیرساخت رسمی استفاده می‌کنند و همین باعث شد قطعی گسترده‌ای ایجاد شود. برخی کاربران Mastodon رقیب Bluesky ، این اتفاق را به تمسخر گرفتند که چطور یک شیکه غیر متمرکز قطع می شود. با این حال، مشکل به‌سرعت رفع شد و سرویس اکنون فعال است.

۱۴۰۴/۲/۶ ۱۵:۱۵:۲۵
نتفلیکس زیرنویس جدید خود را معرفی کرد

نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند

دو دانشجوی کره‌ای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساخته‌اند که می‌تواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر می‌دهد. این مدل رایگان است و در پلتفرم‌های Hugging Face و GitHub قابل دسترسی است. کاربران می‌توانند لحن صدا، مکث‌ها، سرفه و خنده را در گفت‌وگوها تنظیم کنند و حتی صدای واقعی افراد را شبیه‌سازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه داده‌هایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیت‌های اجتماعی و چندزبانه بسازند.

۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸
سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
گوگل از پروتکل ارتباطی مدل هوش مصنوعی Anthropic پشتیبانی می‌کند

گوگل اعلام کرد که مانند OpenAI، از استاندارد جدید شرکت Anthropic با نام “پروتکل MCP” برای اتصال مدل‌های هوش مصنوعی به منابع داده پشتیبانی خواهد کرد. این پروتکل که حالا به یک استاندارد در حال گسترش تبدیل شده، امکان ارتباط دوطرفه بین داده‌ها و برنامه‌های مبتنی بر هوش مصنوعی مانند چت‌بات‌ها را فراهم می‌کند.
این پروتکل به مدل‌ها اجازه می‌دهد تا از ابزارها، نرم‌افزارها و منابع محتوایی مختلف اطلاعات دریافت کرده و وظایف خود را انجام دهند. گوگل قرار است این پروتکل را به مدل‌های Gemini و ابزار توسعه خود اضافه کند، اما زمان دقیق آن را اعلام نکرده است.

۱۴۰۴/۱/۲۴ ۲۱:۰۳:۵۵
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد

اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغ‌دهندگان امکان می‌دهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را به‌صورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغ‌کنندگان اجازه می‌دهد در لحظه و به‌صورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.

۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹
رشد اکوسیستم باز شبکه‌های اجتماعی با پروتکل AT

BlueSky شبکه اجتماعی که یک سال پیش راه‌اندازی شد، اکنون به بیش از ۳۳ میلیون کاربر رسیده و پروتکل AT (ATProto) آن منجر به توسعه ده‌ها اپلیکیشن جدید شده است. این اپلیکیشن‌ها در راستای ایجاد یک شبکه اجتماعی باز و غیرمتمرکز طراحی شده‌اند که به کاربران کنترل بیشتری بر داده‌های شخصی خود می‌دهند.

۱۴۰۴/۱/۱۱ ۲۱:۵۲:۱۸
پایان نمایشگرهای لمسی در خودروها؟

صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالش‌های جدی مواجه شده‌اند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمه‌های فیزیکی بازمی‌گردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواس‌پرتی راننده و نقص‌های نرم‌افزاری که عملکردهای حیاتی خودرو را مختل می‌کنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستم‌های خودرو را شکل می‌دهند.

۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳
هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
OpenAI از پروتکل ارتباطی Anthropic پشتیبانی می‌کند

شرکت OpenAI با همکاری شرکت رقیبش Anthropic، پروتکل زمینه مدل (MCP) را در محصولات خود از جمله اپلیکیشن دسکتاپ ChatGPT اجرا می‌کند. این پروتکل متن‌باز به مدل‌های هوش مصنوعی کمک می‌کند تا از منابع داده مختلف مانند ابزارهای کسب و کار و نرم‌افزارها اطلاعات دریافت کرده و پاسخ‌های دقیق‌تری ارائه دهند.

۱۴۰۴/۱/۷ ۲۳:۱۷:۵۸
توقف پشتیبانی Google Assistant از Waze در iOS

شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفته‌ای را جایگزین خواهد کرد و همزمان روی ویژگی گزارش‌دهی مکالمه‌ای مبتنی بر هوش مصنوعی کار می‌کند.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶
تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
کنفرانس اتمسفر: جنبشی برای اینترنت غیرمتمرکز و کنترل کاربران بر داده‌ها

کنفرانس ATmosphere در سیاتل، اولین گردهمایی توسعه‌دهندگان AT Protocol، بر بازگرداندن کنترل داده‌ها به کاربران و ایجاد اینترنتی آزادتر تمرکز داشت.

حاضران، از جمله مدیرعامل Bluesky، Jay Graber، درباره کاهش نفوذ پلتفرم‌های متمرکز و اشتباهات گذشته بحث کردند. پروژه‌هایی مانند BlackSky و Northsky Social بر ساخت جوامع امن‌تر تأکید داشتند.

این رویداد، فراتر از یک کنفرانس فنی، جنبشی اجتماعی برای ساخت اینترنتی غیرمتمرکز و عادلانه‌تر بود.

۱۴۰۴/۱/۷ ۰۲:۳۶:۳۱
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹

نمایش بیشتر