فناوری صوتی - صفحه 2 - اخبار فناوری - EcoFori

هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
پایان نمایشگرهای لمسی در خودروها؟

صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالش‌های جدی مواجه شده‌اند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمه‌های فیزیکی بازمی‌گردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواس‌پرتی راننده و نقص‌های نرم‌افزاری که عملکردهای حیاتی خودرو را مختل می‌کنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستم‌های خودرو را شکل می‌دهند.

۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳
هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
تأخیر در هوش مصنوعی سیری اپل؛ سقوط روحیه تیم

اپل با به تعویق انداختن برنامه‌های هوش مصنوعی سیری، نه تنها باعث افت ارزش سهام شرکت شد بلکه روحیه تیم سیری را نیز تضعیف کرد. روبی واکر، مدیر ارشد بخش سیری، در جلسه‌ای تیمی به کارکنان اذعان کرد که شرایط مطلوب نیست و تبلیغات قبلی اپل درباره ویژگی‌های جدید، انتظارات را برآورده نکرده است.

۱۴۰۳/۱۲/۲۵ ۲۱:۲۱:۲۱
گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
اسپاتیفای برنامه انتشار داستان‌های کوتاه صوتی را راه‌اندازی کرد

اسپاتیفای برنامه جدیدی برای انتشار کتاب‌های صوتی کوتاه راه‌اندازی کرده که به نویسندگان اجازه می‌دهد داستان‌های کوتاه خود را برای تبدیل به کتاب صوتی ارائه دهند. این شرکت که در زمینه پخش موسیقی و پادکست فعالیت دارد، داستان‌های ژانرهای رمانس، معما، تریلر و علمی-تخیلی را می‌پذیرد و به نویسندگان پیش‌پرداخت و حق امتیاز می‌دهد.

۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۲۳
گوگل دیپ مایند مدل‌های هوش مصنوعی Gemini Robotics را معرفی کرد

گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدل‌های جدید Gemini Robotics را رونمایی کرد که به ربات‌ها امکان تعامل با اشیا و محیط‌های مختلف را می‌دهد. این مدل‌ها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیط‌های آموزش ندیده نیز عملکرد خوبی دارند.

۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه

نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه می‌دهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.

۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴
هشدار درباره ابزارهای جعل صدا؛ نبود محدودیت‌های امنیتی در اکثر نرم‌افزارهای شبیه‌سازی صدا

گزارش جدید Consumer Reports نشان می‌دهد اکثر ابزارهای شبیه‌سازی صدا فاقد محافظت‌های معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام داده‌اند و سایر شرکت‌ها صرفاً تأیید حقوقی کاربر را کافی می‌دانند. کارشناسان هشدار می‌دهند این ابزارها می‌توانند خطر کلاهبرداری‌های صوتی را افزایش دهند.

۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲
تأخیر در بهبود هوش مصنوعی دستیار صوتی سیری اپل تا سال ۲۰۲۶

اپل اعلام کرد که بهبودهای هوش مصنوعی برای دستیار صوتی سیری که شامل قابلیت‌های شخصی‌سازی و انجام اقدامات در اپلیکیشن‌ها می‌شود، تا سال ۲۰۲۶ به تعویق افتاده است. این شرکت پیش‌تر قصد داشت این ویژگی‌ها را در سال ۲۰۲۵ ارائه دهد و در حال ساخت زیرساخت رایانش ابری با تراشه‌های اختصاصی برای حفظ حریم خصوصی کاربران است.

۱۴۰۳/۱۲/۱۷ ۲۱:۵۴:۰۲
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
تأخیر در هوش مصنوعی Siri اپل

اپل در راه اندازی هوش مصنوعی Siri با تأخیر جدی مواجه شده است. بر اساس گزارش‌ها، Siri هوشمند احتمالاً تا بهار ۲۰۲۶ و با نسخه iOS 19.4 عرضه خواهد شد. این تأخیر می‌تواند فرصتی برای بهبود قابلیت‌های هوش مصنوعی و ارائه تجربه کاربری بهتر باشد. اپل در حال تلاش برای ادغام معماری قدیمی سیری با نرم‌افزارهای مدرن هوش مصنوعی است.

۱۴۰۳/۱۲/۱۴ ۰۰:۲۵:۵۰
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاه‌های موبایل

استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاه‌های موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.

۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶
الکسای آمازون، دستیار خرید مواد غذایی با هوش مصنوعی پیشرفته

آمازون قابلیت‌های جدیدی را برای دستیار صوتی الکسا معرفی کرد که به کاربران اجازه می‌دهد با استفاده از گفتگوی طبیعی، فهرست خرید مواد غذایی را تهیه کنند. این سرویس جدید امکان سفارش از Amazon Fresh و سایر شرکای توزیع مواد غذایی را فراهم می‌کند و قادر به درک درخواست‌های پیچیده و ارائه پیشنهادات غذایی است.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۹
الکسای جدید آمازون با هوش مصنوعی پیشرفته رونمایی شد

آمازون در رویداد سالانه خود، نسخه پیشرفته الکسا با قابلیت‌های هوش مصنوعی تولیدی را معرفی کرد. این دستیار صوتی اکنون می‌تواند اسناد و ایمیل‌ها را بررسی، اطلاعات مهم را استخراج و خلاصه کند. همچنین قابلیت پاسخگویی به سوالات درباره اسناد آپلود شده، مدیریت تقویم و کنترل دستگاه‌های خانگی را دارد.
این نسخه با استفاده از مدل‌های هوش مصنوعی مختلف از جمله مدل‌های داخلی آمازون و شرکت Anthropic، قادر به انجام وظایف پیچیده است.
الکسای جدید می‌تواند وب‌سایت‌ها را جستجو کرده، خدمات مختلف را اجرا کند و حتی برای کاربر تعمیرکار پیدا کند.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۷
آمازون الکسا را با هوش مصنوعی پیشرفته بازسازی می‌کند

آمازون در حال معرفی نسل جدید الکسا با قابلیت‌های هوش مصنوعی تولیدی است که می‌تواند چندین درخواست را پشت سر هم پاسخ دهد. این سرویس جدید که پروژه داخلی "بانیان" نام دارد، احتمالاً ماهانه 10 دلار هزینه خواهد داشت و قابلیت انجام اقدامات به صورت مستقل را خواهد داشت. آمازون همچنان نسخه کلاسیک الکسا را نیز رایگان ارائه خواهد داد.

۱۴۰۳/۱۲/۸ ۱۶:۱۹:۵۹
راه‌اندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs

شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتاب‌های صوتی با فناوری هوش مصنوعی راه‌اندازی کرد. این پلتفرم به نویسندگان اجازه می‌دهد کتاب‌های صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.

۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰
آمازون در آستانه معرفی نسخه هوش مصنوعی پیشرفته الکسا

آمازون در رویدادی تخصصی، نسخه جدید دستیار هوشمند الکسا را معرفی می‌کند. این نسخه پیشرفته با قابلیت‌های هوش مصنوعی پیشرفته طراحی شده و می‌تواند چندین درخواست را همزمان پاسخ دهد. الکسای جدید با قیمت ماهانه 5 تا 10 دلار ارائه خواهد شد و قابلیت انجام خودکار درخواست ها را دارد.

۱۴۰۳/۱۲/۷ ۲۱:۴۳:۵۱
اسپاتیفای مجوز انتشار کتاب‌های صوتی با صدای هوش مصنوعی را صادر کرد

اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتاب‌های صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان می‌توانند کتاب‌های صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنش‌های متفاوت در جامعه نشر همراه شده و نگرانی‌هایی درباره کیفیت محتوای تولید شده وجود دارد.

۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴
تأخیر در هوش مصنوعی تولیدی آمازون و اپل برای دستیاران صوتی

آمازون و اپل با چالش‌های فنی در ادغام فناوری هوش مصنوعی تولیدی در دستیاران صوتی الکسا و سیری مواجه شده‌اند. آمازون انتشار نسخه جدید الکسا را به مارس یا بعد از آن موکول کرده و اپل نیز با مشکلات مهندسی در بازسازی سیری روبرو است. این شرکت‌ها قصد داشتند سریعاً با دستیاران صوتی نسل جدید مانند OpenAI و Google رقابت کنند اما برنامه‌های آنها با وقفه مواجه شده است.

۱۴۰۳/۱۱/۲۷ ۰۳:۲۷:۴۶
اپل قیمت آیفون را بالا می‌برد یا سودش را قربانی می‌کند؟

کمبود جهانی تراشه‌های حافظه (DRAM) بازار موبایل را تحت فشار گذاشته و حالا همه منتظر تصمیم اپل هستند: آیا قیمت آیفون را بالا می‌برد یا برای حفظ سهم بازار، سودش را کاهش می‌دهد. تیم کوک اعلام کرده قیمت حافظه به‌زودی به‌طور قابل‌توجهی افزایش می‌یابد، اما درباره افزایش قیمت آیفون پاسخ قطعی نداده است. 📱
تحلیلگران می‌گویند اپل به‌دلیل روابط قوی با تأمین‌کنندگان بزرگی مانند سامسونگ و Micron احتمالاً راحت‌تر از برندهای کوچک‌تر به حافظه دسترسی دارد. در عین حال، رشد سریع زیرساخت‌های هوش مصنوعی باعث شده بخش زیادی از تراشه‌ها به دیتاسنترها اختصاص یابد و قیمت‌ها بالا برود. 🧠
طبق داده‌های IDC، این بحران ممکن است نخستین افت سالانه بازار جهانی موبایل از ۲۰۲۳ را رقم بزند. همچنین برخی تولیدکنندگان، به‌ویژه در چین، به‌دلیل کمبود حافظه تولید را کاهش داده‌اند؛ تصمیم اپل و سامسونگ می‌تواند جهت قیمت کل بازار را مشخص کند. 📉

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۳۲
اتحادیه اروپا تیک‌تاک را به طراحی اعتیادآور متهم کرد!

اتحادیه اروپا تیک‌تاک را متهم کرده که با طراحی اعتیادآور اپلیکیشن خود، قوانین محتوای آنلاین را نقض کرده است. کمیسیون اروپا اعلام کرده در صورت اثبات تخلف، این شرکت ممکن است تا ۶٪ از درآمد جهانی بایت‌دنس (مالک تیک تاک) جریمه شود. این پرونده پس از یک سال تحقیق تحت قانون خدمات دیجیتال اتحادیه اروپا مطرح شده است. ⚖️
مقام‌های اروپایی می‌گویند قابلیت‌هایی مانند اسکرول بی‌پایان، پخش خودکار ، نوتیفیکیشن ها و الگوریتم پیشنهاددهی شخصی، کاربران را به استفاده مداوم سوق می‌دهد. به‌گفته آن‌ها، تیک‌تاک بررسی کافی درباره اثر این ویژگی‌ها بر سلامت روان، به‌ویژه کودکان و نوجوانان، انجام نداده و شاخص‌هایی مثل استفاده شبانه طولانی را نادیده گرفته است. 📱
اتحادیه اروپا خواستار تغییر طراحی تیک‌تاک در اروپا برای محافظت بهتر از کاربران شده است. تیک‌تاک این اتهامات را کاملاً رد کرده و اعلام کرده برای دفاع از خود اقدام قانونی انجام خواهد داد. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۲۷
تنش‌های ژئوپلیتیکی مانع توافق جهانی بر سر هوش مصنوعی نظامی شد

در نشست بین‌المللی «هوش مصنوعی مسئولانه در حوزه نظامی» (REAIM) در شهر آکورونیا اسپانیا، فقط ۳۵ کشور از مجموع ۸۵ کشور حاضر، بیانیه‌ای درباره نحوه استفاده از هوش مصنوعی در جنگ را امضا کردند؛ اما آمریکا و چین از پیوستن به آن خودداری کردند. 🌍
این بیانیه ۲۰ اصل کلی را مطرح می‌کند؛ از جمله تأکید بر اینکه تصمیم نهایی در استفاده از سلاح‌های مبتنی بر هوش مصنوعی باید با انسان باشد، زنجیره فرماندهی شفاف حفظ شود و ارزیابی ریسک و آزمایش‌های دقیق انجام گیرد. با اینکه سند الزام‌آور نیست، برخی کشورها به‌دلیل رقابت نظامی با چین و روسیه تمایلی به محدودسازی خود نداشتند. ⚖️
وزیر دفاع هلند گفت دولت‌ها در یک «دوراهی» قرار گرفته‌اند: از یک سو باید استفاده مسئولانه از AI را تضمین کنند و از سوی دیگر نمی‌خواهند در رقابت تسلیحاتی عقب بمانند. کانادا، آلمان، فرانسه، بریتانیا، هلند، کره‌جنوبی و اوکراین از امضاکنندگان این توافق بودند. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۱۹

نمایش بیشتر