• پایان نمایشگرهای لمسی در خودروها؟

    صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالش‌های جدی مواجه شده‌اند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمه‌های فیزیکی بازمی‌گردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواس‌پرتی راننده و نقص‌های نرم‌افزاری که عملکردهای حیاتی خودرو را مختل می‌کنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستم‌های خودرو را شکل می‌دهند.

    ۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳
  • هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

    شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

    ۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
  • توقف پشتیبانی Google Assistant از Waze در iOS

    شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفته‌ای را جایگزین خواهد کرد و همزمان روی ویژگی گزارش‌دهی مکالمه‌ای مبتنی بر هوش مصنوعی کار می‌کند.

    ۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶
  • تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

    استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

    ۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
  • بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

    شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

    ۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
  • افزایش محتوای مستهجن در Spotify

    اسپاتیفای از حذف حساب‌های محتوای مستهجن در پلتفرم ویدیویی خود خبر داد. این شرکت که خدمات پخش موسیقی و پادکست ارائه می‌دهد، تأکید کرد هیچ درآمدی به این حساب‌ها نداده و آنها را از پلتفرم حذف کرده است. برخی کاربران در جستجوهای خود با محتوای نامناسب مواجه شده بودند که اسپاتیفای آن را خلاف قوانین خود دانسته است.

    ۱۴۰۴/۱/۳ ۰۵:۰۹:۰۵
  • OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

    شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

    ۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
  • اسپاتیفای با پلی‌لیست جدید، کنسرت‌های محلی را به گوش موسیقی‌دوستان می‌رساند

    اسپاتیفای پلی‌لیست جدید "کنسرت‌های نزدیک شما" را راه‌اندازی کرد که هر هفته ۳۰ آهنگ از هنرمندان محلی را معرفی می‌کند. این پلی‌لیست با استفاده از علاقه‌مندی‌های کاربران طراحی شده و اطلاعات کامل رویدادها و لینک بلیت را نیز ارائه می‌دهد. کاربران باید موقعیت مکانی خود را در اپلیکیشن فعال کنند تا از این امکان استفاده کنند.

    ۱۴۰۴/۱/۱ ۱۹:۳۸:۳۰
  • فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

    محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
    این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
    این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

    ۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
  • رشد مشترکان خدمات پخش موسیقی در آمریکا به بیش از ۱۰۰ میلیون نفر

    انجمن صنعت ضبط آمریکا گزارش داد که تعداد مشترکان خدمات پخش موسیقی در این کشور برای اولین بار از مرز ۱۰۰ میلیون نفر گذشت. اسپاتیفای با ۳۶ درصد سهم بازار پیشتاز است و درآمد پخش موسیقی ۸۴ درصد از کل درآمد موسیقی را تشکیل می‌دهد. افزایش قیمت اشتراک‌ها نیز در رشد درآمد این خدمات موثر بوده است.

    ۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۴۶
  • تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude

    استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیت‌های صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعی‌تر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کرده‌اند.

    ۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷
  • آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

    آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

    ۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
  • گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

    گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

    ۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
  • حذف گزینه پردازش محلی صدا در دستگاه‌های هوشمند آمازون

    آمازون قابلیت پردازش محلی درخواست‌های صوتی در دستگاه‌های Echo را حذف می‌کند و تمامی ضبط‌های صوتی کاربران به فضای ابری این شرکت ارسال خواهد شد. این تصمیم در راستای گسترش قابلیت‌های هوش مصنوعی Alexa با استفاده از پردازش ابری اتخاذ شده است.

    ۱۴۰۳/۱۲/۲۶ ۲۳:۰۹:۳۹
  • تأخیر در هوش مصنوعی سیری اپل؛ سقوط روحیه تیم

    اپل با به تعویق انداختن برنامه‌های هوش مصنوعی سیری، نه تنها باعث افت ارزش سهام شرکت شد بلکه روحیه تیم سیری را نیز تضعیف کرد. روبی واکر، مدیر ارشد بخش سیری، در جلسه‌ای تیمی به کارکنان اذعان کرد که شرایط مطلوب نیست و تبلیغات قبلی اپل درباره ویژگی‌های جدید، انتظارات را برآورده نکرده است.

    ۱۴۰۳/۱۲/۲۵ ۲۱:۲۱:۲۱
  • رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

    شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

    ۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
  • گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

    گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

    ۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
  • قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

    اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

    ۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
  • گوگل دیپ مایند مدل‌های هوش مصنوعی Gemini Robotics را معرفی کرد

    گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدل‌های جدید Gemini Robotics را رونمایی کرد که به ربات‌ها امکان تعامل با اشیا و محیط‌های مختلف را می‌دهد. این مدل‌ها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیط‌های آموزش ندیده نیز عملکرد خوبی دارند.

    ۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴
  • اسپاتیفای: افزایش درآمد هنرمندان در سال ۲۰۲۴

    اسپاتیفای در گزارش سالانه خود اعلام کرد که درآمد هنرمندان از پخش موسیقی در این پلتفرم افزایش یافته است. بر اساس این گزارش، یک هنرمند با یک میلیون استریم می‌تواند بیش از ۱۰ هزار دلار درآمد کسب کند که ۱۰ برابر ده سال گذشته است. اسپاتیفای در سال ۲۰۲۴ مبلغ ۱۰ میلیارد دلار حق امتیاز به هنرمندان پرداخت کرد. حدود ۱,۵۰۰ هنرمند بیش از یک میلیون دلار درآمد کسب کردند و این رقم ۱۰ برابر بیشتر از سال ۲۰۱۴ است.
    این شرکت همچنین از یک شکایت حقوقی در آمریکا مبنی بر پرداخت ناکافی حق امتیاز تبرئه شد.

    ۱۴۰۳/۱۲/۲۲ ۱۰:۳۶:۴۲
  • پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم

    Pocket Casts با راه‌اندازی پخش رایگان پادکست در وب‌سایت خود، رویکردی باز و دموکراتیک در برابر پلتفرم‌های بسته پادکست اتخاذ کرده است. کاربران می‌توانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکست‌ها بپردازند و برای امکانات بیشتر می‌توانند حساب رایگان ایجاد کنند.

    https://pocketcasts.com/

    ۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶
  • نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه

    نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه می‌دهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.

    ۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴
  • هشدار درباره ابزارهای جعل صدا؛ نبود محدودیت‌های امنیتی در اکثر نرم‌افزارهای شبیه‌سازی صدا

    گزارش جدید Consumer Reports نشان می‌دهد اکثر ابزارهای شبیه‌سازی صدا فاقد محافظت‌های معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام داده‌اند و سایر شرکت‌ها صرفاً تأیید حقوقی کاربر را کافی می‌دانند. کارشناسان هشدار می‌دهند این ابزارها می‌توانند خطر کلاهبرداری‌های صوتی را افزایش دهند.

    ۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲
  • تأخیر در بهبود هوش مصنوعی دستیار صوتی سیری اپل تا سال ۲۰۲۶

    اپل اعلام کرد که بهبودهای هوش مصنوعی برای دستیار صوتی سیری که شامل قابلیت‌های شخصی‌سازی و انجام اقدامات در اپلیکیشن‌ها می‌شود، تا سال ۲۰۲۶ به تعویق افتاده است. این شرکت پیش‌تر قصد داشت این ویژگی‌ها را در سال ۲۰۲۵ ارائه دهد و در حال ساخت زیرساخت رایانش ابری با تراشه‌های اختصاصی برای حفظ حریم خصوصی کاربران است.

    ۱۴۰۳/۱۲/۱۷ ۲۱:۵۴:۰۲
  • متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

    شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

    ۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
  • اختلال در سرویس پخش موسیقی Spotify برای کاربران پرمیوم

    اسپاتیفای مشکلی را تایید کرده که باعث پخش تبلیغات برای مشترکان پرمیوم می‌شود. این اختلال در پلتفرم‌های مختلف موبایل، دسکتاپ و وب رخ داده و مشترکان از پخش تبلیغات علیرغم پرداخت هزینه اشتراک پرمیوم ناراضی هستند. تیم فنی اسپاتیفای اعلام کرده در حال رفع مشکل است.

    ۱۴۰۳/۱۲/۱۶ ۲۲:۵۱:۱۱
  • تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

    شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

    ۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
  • پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

    پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

    ۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
  • پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد


    ‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

    ۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
  • تأخیر در هوش مصنوعی Siri اپل

    اپل در راه اندازی هوش مصنوعی Siri با تأخیر جدی مواجه شده است. بر اساس گزارش‌ها، Siri هوشمند احتمالاً تا بهار ۲۰۲۶ و با نسخه iOS 19.4 عرضه خواهد شد. این تأخیر می‌تواند فرصتی برای بهبود قابلیت‌های هوش مصنوعی و ارائه تجربه کاربری بهتر باشد. اپل در حال تلاش برای ادغام معماری قدیمی سیری با نرم‌افزارهای مدرن هوش مصنوعی است.

    ۱۴۰۳/۱۲/۱۴ ۰۰:۲۵:۵۰
نمایش بیشتر