-
هدست Clio ریزر: نجاتدهنده گیمرهای طاس!
🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول بهویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفونهای معمولی با ناراحتی مواجه میشوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلیمتری و پشتیبانی از THX Spatial Audio، صدای فراگیر سهبعدی را مستقیماً به گوش کاربر منتقل میکند. این دستگاه از طریق بیسیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل میشود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظهدار ساخته شده و میتواند به اکثر صندلیهای گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱ -
مایکروسافت و گوگل: همکاری برای آیندهای هوشمندتر با پروتکل Agent2Agent (A2A)
مایکروسافت اعلام کرد که از پروتکل جدید گوگل به نام Agent2Agent (A2A) پشتیبانی میکند. این پروتکل به هوش مصنوعیها اجازه میدهد با هم ارتباط برقرار کنند و در برنامهها و سرویسهای مختلف همکاری کنند.
با این تصمیم، پلتفرمهای هوش مصنوعی مایکروسافت، از جمله Azure AI Foundry و Copilot Studio، میتوانند با دیگر هوش مصنوعیها ارتباط بگیرند. برای مثال، یک هوش مصنوعی مایکروسافت میتواند جلسهای را برنامهریزی کند، در حالی که یک هوش مصنوعی گوگل دعوتنامهها را ارسال میکند. 📅✉️
این اقدام بخشی از تلاش برای ساخت نرمافزارهایی است که میتوانند بهطور خودکار و هماهنگ با هم کار کنند. 📊 طبق نظرسنجی KPMG، ۶۵٪ شرکتها در حال آزمایش این نوع هوش مصنوعی هستند و این بازار تا سال ۲۰۳۰ به ۵۲ میلیارد دلار میرسد. 🚀۱۴۰۴/۲/۱۹ ۱۹:۳۶:۳۹ -
Posha: آینده آشپزی در دستان رباتها
در سال ۲۰۱۷، «راگا گوپتا» بهدنبال راهی ساده برای خوردن غذای خانگی، بدون دردسر آشپزی یا هزینههای بالا بود ⏳💸
او با تأسیس استارتاپ Posha، رباتی ساخت که غذا را با بینایی کامپیوتری آماده میکند! 🤖🍲
کافیست دستور پخت را انتخاب کنید، مواد را داخل دستگاه بریزید و باقی کار را به Posha بسپارید!
حتی اگر مواد را دقیق اندازه نگیرید، Posha باز هم کارش را انجام میدهد! ⚙️👌
در ژانویه ۲۰۲۵، اولین سری دستگاهها به فروش رسید و حالا پیشسفارش سری دوم آغاز شده است! ✅📦
اخیراً Posha با جذب ۸ میلیون دلار سرمایه قصد دارد تنوع غذاها را بیشتر کند و امکان پیشنهاد دستور پخت با کمک هوش مصنوعی را فراهم کند! 🧠🍽️
گوپتا میگوید: همانطور که یخچال و مایکروویو بخشی از خانهها شدند، Posha هم بهزودی جزو ضروریات خواهد بود! 🏠✨۱۴۰۴/۲/۱۷ ۱۹:۳۷:۳۵ -
گوگل قابلیت صوتیسازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد
گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکستهایی هوش مصنوعیمحور از اسناد کاربران تولید میکند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون میتوانند زبان تولید پادکستها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصیسازیشده را فراهم میکند. این ابزار برای مثال به دانشآموزان کمک میکند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبانهای جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر میشود.
۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴ -
ورود هوش مصنوعی به منوی رستورانها
شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخگویی تلفنی رستورانها و کسبوکارها رونمایی کرد. این سیستمها بدون نیاز به نصب پیچیده و API، از اطلاعات کسبوکار مثل پیام خوشآمد، راهنمای تلفظ و قوانین تماس استفاده میکنند. مثلاً میتوانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماسهای اسپم، تحلیل تماس و انتقال تماسهای پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسبوکار داده میشود.۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶ -
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد
برند CMF از شرکت Nothing سه مدل ایرپاد بیسیم جدید با نامهای Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی میکنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدلهای بالاتر دارای میکروفونهای بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدلهای گرانتر از صدای فضایی ۳D پشتیبانی میکنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزانتر بهتر است اما همچنان در برابر ایرپادهای گرانتر بازار حرفی برای گفتن ندارد.۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲ -
نورالینک ایلان ماسک در پی جذب سرمایه ۵۰۰ میلیون دلاری
شرکت ایمپلنت مغزی Neuralink، متعلق به ایلان ماسک، در حال برنامهریزی برای جذب ۵۰۰ میلیون دلار سرمایه با ارزشی حدود ۸.۵ میلیارد دلار است. این شرکت که پیشتر ۲۸۰ میلیون دلار سرمایه جذب کرده بود، هماکنون در حال آزمایش ایمپلنتی است که به افراد آسیبدیده نخاعی اجازه میدهد فقط با ذهن خود بازی کنند، در اینترنت بگردند و کارهای دیگری انجام دهند. هدف ماسک استفاده گسترده از این فناوری برای درمان بیماریهایی مانند چاقی و افسردگی است.
۱۴۰۴/۲/۸ ۱۸:۵۲:۰۷ -
قطع شدن شبکه اجتماعی غیرمتمرکز Bluesky؛ چطور ممکن شد؟
شبکه اجتماعی غیرمتمرکز Bluesky رقیب X ، حدود یک ساعت از دسترس خارج شد. علت مشکل، اختلال در سرورهای داده شخصی بود. با اینکه این پلتفرم غیرمتمرکز است، بیشتر کاربران از زیرساخت رسمی استفاده میکنند و همین باعث شد قطعی گستردهای ایجاد شود. برخی کاربران Mastodon رقیب Bluesky ، این اتفاق را به تمسخر گرفتند که چطور یک شیکه غیر متمرکز قطع می شود. با این حال، مشکل بهسرعت رفع شد و سرویس اکنون فعال است.
۱۴۰۴/۲/۶ ۱۵:۱۵:۲۵ -
نتفلیکس زیرنویس جدید خود را معرفی کرد
نتفلیکس قابلیت جدیدی به زیرنویسهای خود اضافه کرده که فقط دیالوگها را نشان میدهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شدهاند. این ویژگی که با انتخاب گزینه “English” بهجای “English (CC)” فعال میشود، برای کسانی طراحی شده که فقط میخواهند گفتوگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویسهای کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و بهزودی در دیگر آثار اصلی نتفلیکس و به تمام زبانها ارائه خواهد شد.
۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵ -
هوش مصنوعی عینکهای هوشمند متا به اروپا گسترش یافت
متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینکهای هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون میتوانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما بهدلیل قوانین سختگیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیتهای جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک میبیند. این ویژگیها از هفته آینده در کشورهای اروپایی پشتیبانیشده فعال میشوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوریهای پوشیدنی و هوش مصنوعی است.۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴ -
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند
دو دانشجوی کرهای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساختهاند که میتواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر میدهد. این مدل رایگان است و در پلتفرمهای Hugging Face و GitHub قابل دسترسی است. کاربران میتوانند لحن صدا، مکثها، سرفه و خنده را در گفتوگوها تنظیم کنند و حتی صدای واقعی افراد را شبیهسازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه دادههایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیتهای اجتماعی و چندزبانه بسازند.
۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱ -
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی
استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستمها به کسبوکارها کمک میکنند تا تماسهای مشتریان را خودکار مدیریت کنند و وظایف سادهای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماسهای پیچیده به اپراتور انسانی واگذار میشود. این دستیارها با صدای بازیگران واقعی ساخته میشوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم ششنفره پردازش کردهاند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.
۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸ -
سرمایهگذاری Spotify برای گسترش کتابهای صوتی غیر انگلیسی
اسپاتیفای برای افزایش تولید کتابهای صوتی به زبانهای غیر انگلیسی، بهویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایهگذاری میکند. این اقدام بهدلیل کمبود کتابهای صوتی در این زبانها و رقابت با پلتفرمهایی مثل Audible انجام میشود.
در فرانسه تنها ۳٪ از کتابها بهصورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای میخواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنشهایی در صنعت نشر مواجه شده است.۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴ -
هوش مصنوعی گوگل به رمزگشایی زبان دلفینها کمک میکند
گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفینها کمک میکند. این مدل با دادههای پروژهای علمی روی دلفینهای آتلانتیک آموزش دیده و حتی میتواند صداهایی شبیه دلفینها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفینها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام میشد، اما حالا با قدرت بیشتر و عملکرد دقیقتر ادامه مییابد.۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵ -
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول میکند
لایو کیت (LiveKit) پلتفرمی متنباز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماسهای ۹۱۱ آمریکا استفاده میشود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعهدهنده دارد و شرکتهایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده میکنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷ -
گوگل از پروتکل ارتباطی مدل هوش مصنوعی Anthropic پشتیبانی میکند
گوگل اعلام کرد که مانند OpenAI، از استاندارد جدید شرکت Anthropic با نام “پروتکل MCP” برای اتصال مدلهای هوش مصنوعی به منابع داده پشتیبانی خواهد کرد. این پروتکل که حالا به یک استاندارد در حال گسترش تبدیل شده، امکان ارتباط دوطرفه بین دادهها و برنامههای مبتنی بر هوش مصنوعی مانند چتباتها را فراهم میکند.
این پروتکل به مدلها اجازه میدهد تا از ابزارها، نرمافزارها و منابع محتوایی مختلف اطلاعات دریافت کرده و وظایف خود را انجام دهند. گوگل قرار است این پروتکل را به مدلهای Gemini و ابزار توسعه خود اضافه کند، اما زمان دقیق آن را اعلام نکرده است.۱۴۰۴/۱/۲۴ ۲۱:۰۳:۵۵ -
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیتتر تا اسکن اسناد و خلاصه پیامهای صوتی
واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخشهای چت، تماس و کانالها اضافه کرده است. از این پس، در گروهها میتوان دید چه کسانی آنلاین هستند، نوتیفیکیشنها را فقط برای پیامهای مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگنمایی (زوم) انجام داد.
کاربران آیفون همچنین میتوانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماسهای تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چتهای دو نفره، پاسخ به دعوتها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.
در بخش کانالها نیز، ادمینها میتوانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیامهای صوتی را برای دنبالکنندگان ارسال کنند.۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶ -
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic
آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که میتواند صدا را بسیار طبیعی تولید و گفتوگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفتهتر عمل میکند و حتی با مدلهای پیشرفتهی شرکتهایی مثل OpenAI و گوگل رقابت میکند.
این مدل بهگونهای طراحی شده که مکالمات را روانتر و با درک بهتری از صدا، حتی در محیطهای پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون میگوید این مدل تا ۸۰٪ ارزانتر از برخی رقباست و سرعت پاسخدهی بالاتری هم دارد.۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد
اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغدهندگان امکان میدهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را بهصورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغکنندگان اجازه میدهد در لحظه و بهصورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹ -
رشد اکوسیستم باز شبکههای اجتماعی با پروتکل AT
BlueSky شبکه اجتماعی که یک سال پیش راهاندازی شد، اکنون به بیش از ۳۳ میلیون کاربر رسیده و پروتکل AT (ATProto) آن منجر به توسعه دهها اپلیکیشن جدید شده است. این اپلیکیشنها در راستای ایجاد یک شبکه اجتماعی باز و غیرمتمرکز طراحی شدهاند که به کاربران کنترل بیشتری بر دادههای شخصی خود میدهند.
۱۴۰۴/۱/۱۱ ۲۱:۵۲:۱۸ -
پایان نمایشگرهای لمسی در خودروها؟
صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالشهای جدی مواجه شدهاند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمههای فیزیکی بازمیگردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواسپرتی راننده و نقصهای نرمافزاری که عملکردهای حیاتی خودرو را مختل میکنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستمهای خودرو را شکل میدهند.
۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳ -
هدفونهای Star Wars با افکت صوتی شخصیتهای محبوب منتشر شد
شرکت Audio-Technica هدفونهای بیسیم ATH-CKS50TW2 را با طرحهای اختصاصی شخصیتهای محبوب جنگ ستارگان منتشر کرد. این هدفونها با رنگبندی و افکت صوتی شخصیتهایی مانند گروگو، دارث ویدر و R2-D2 طراحی شدهاند و قیمت آنها 180 دلار است. هدفونها قابلیت حذف نویز، شارژ بیسیم و عمر باتری 40 ساعته دارند.
۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰ -
OpenAI از پروتکل ارتباطی Anthropic پشتیبانی میکند
شرکت OpenAI با همکاری شرکت رقیبش Anthropic، پروتکل زمینه مدل (MCP) را در محصولات خود از جمله اپلیکیشن دسکتاپ ChatGPT اجرا میکند. این پروتکل متنباز به مدلهای هوش مصنوعی کمک میکند تا از منابع داده مختلف مانند ابزارهای کسب و کار و نرمافزارها اطلاعات دریافت کرده و پاسخهای دقیقتری ارائه دهند.
۱۴۰۴/۱/۷ ۲۳:۱۷:۵۸ -
توقف پشتیبانی Google Assistant از Waze در iOS
شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفتهای را جایگزین خواهد کرد و همزمان روی ویژگی گزارشدهی مکالمهای مبتنی بر هوش مصنوعی کار میکند.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶ -
تغییر لهجه با هوش مصنوعی در تماسهای صوتی توسط Krisp
استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماسهای صوتی راهاندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واجها را تغییر میدهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳ -
کنفرانس اتمسفر: جنبشی برای اینترنت غیرمتمرکز و کنترل کاربران بر دادهها
کنفرانس ATmosphere در سیاتل، اولین گردهمایی توسعهدهندگان AT Protocol، بر بازگرداندن کنترل دادهها به کاربران و ایجاد اینترنتی آزادتر تمرکز داشت.
حاضران، از جمله مدیرعامل Bluesky، Jay Graber، درباره کاهش نفوذ پلتفرمهای متمرکز و اشتباهات گذشته بحث کردند. پروژههایی مانند BlackSky و Northsky Social بر ساخت جوامع امنتر تأکید داشتند.
این رویداد، فراتر از یک کنفرانس فنی، جنبشی اجتماعی برای ساخت اینترنتی غیرمتمرکز و عادلانهتر بود.۱۴۰۴/۱/۷ ۰۲:۳۶:۳۱ -
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفههای مکالمه
شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه میدهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراکدهنده میتوانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعیتر و روانتری را فراهم میکند.
۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹



