• جنجال استفاده از هوش مصنوعی برای بازسازی صدای قربانی جنایت در مستند نتفلیکس

    نتفلیکس در مستندی درباره گبی پتیتو، یک بلاگر توریستی که به قتل رسید، با استفاده از هوش مصنوعی صدای او را بازسازی کرد. این اقدام واکنش‌های منفی گسترده‌ای در شبکه‌های اجتماعی ایجاد کرد. سازندگان مستند مدعی هستند که با اجازه خانواده پتیتو این کار را انجام داده‌اند، اما کاربران آن را غیراخلاقی و ناراحت‌کننده می‌دانند.

    ۱۴۰۳/۱۲/۲ ۱۷:۵۸:۲۱
  • صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

    استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
    فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

    ۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
  • همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲

    اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قوی‌تر از ایرپادز پرو ۲ عمل می‌کند و سری‌های فومی جدید هم باعث می‌شوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
    کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قوی‌تر و صدای فراگیرتری ارائه می‌شود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یک‌سوم بیشتر از نسل قبل. 🔋🎶
    ایرپادز پرو ۳ امکانات تازه‌ای مثل اندازه‌گیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سری‌ها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
    با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیت‌های بیشتر با همان هزینه. ✅💵

    ۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸
  • ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!

    گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که می‌تواند صحبت‌ها را به‌صورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپ‌فیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
    این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا می‌شود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمی‌شود. گوگل امیدوار است این فناوری راه را برای ارتباط آسان‌تر میان زبان‌های مختلف باز کند، هرچند نگرانی‌هایی درباره سوءاستفاده از دیپ‌فیک همچنان وجود دارد. ✅🌍

    ۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸
  • عینک‌های Beast Viture: تجربه‌ای جدید در دنیای واقعیت افزوده!

    🎯 شرکت Viture از عینک واقعیت افزوده جدید خود به نام «Beast» رونمایی کرد؛ مدلی قدرتمند با نمایشگر micro-OLED، میدان دید ۵۸ درجه و وضوح «شبیه 4K» (درواقع 1080p) که به‌گفته شرکت، شارپ‌ترین تصویر بازار را دارد. ✅🕶️
    🎧 این عینک دارای صدای Harman، سنسور عمق، روشنایی ۱۲۸۰ نیت و شیشه‌های الکتروکرومیک است و با وزن ۸۸ گرم، امکاناتی مشابه هدست‌های پیشرفته را در قالبی کوچک ارائه می‌دهد. ✅📱
    💵 عرضه Beast از اکتبر آغاز می‌شود و قیمت آن ۵۴۹ دلار است. ✅💰

    ۱۴۰۴/۴/۲۴ ۰۸:۴۲:۴۴
  • ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!

    اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز می‌شوند: ضبط صدای حرفه‌ای و کنترل دوربین با لمس ایرپاد. 🎧
    با استفاده از چیپ H2، میکروفون‌های پیشرفته و پردازش هوشمند صدا، کاربران می‌توانند حتی در محیط‌های شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماس‌های باکیفیت‌تری داشته باشند. 🎙️
    همچنین با نگه‌داشتن ساقه ایرپاد، می‌توان دوربین آیفون یا اپ‌های دوربین دیگر را فعال کرد و به‌راحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکه‌های اجتماعی بسیار کاربردی است. 📸
    این قابلیت‌ها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅

    ۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷
  • کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

    📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
    این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
    هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
    ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
    با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

    ۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
  • هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

    🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
    Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
    این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

    ۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
  • آیا گربه‌تان می‌تواند با شما صحبت کند؟ بایدو می‌گوید بله!

    🐾 شرکت فناوری چینی بایدو (Baidu) پتنتی برای سیستم هوش مصنوعی ثبت کرده که می‌تواند صدای حیوانات را به زبان انسان ترجمه کند! 🤖 این سیستم با تحلیل صداها، رفتارها و سیگنال‌های فیزیولوژیکی، احساسات حیوانات را شناسایی و به جملات انسانی تبدیل می‌کند. 💬
    این فناوری می‌تواند ارتباط عمیق‌تری بین انسان و حیوانات ایجاد کند. ❤️ اگرچه این پروژه هنوز در مرحله تحقیقاتی است، برخی کاربران شبکه‌های اجتماعی چین مشتاقانه منتظر این فناوری‌اند، در حالی که برخی دیگر با تردید به عملکرد آن نگاه می‌کنند. 🐕
    📌 بایدو، یکی از پیشگامان هوش مصنوعی در چین، با مدل جدید Ernie 4.5 Turbo به دنبال تثبیت جایگاه خود است. 🚀🔥

    ۱۴۰۴/۲/۲۲ ۰۰:۴۴:۲۷
  • هوش مصنوعی صدای مقتول را در دادگاه زنده کرد!

    ⚖️ در رویدادی بی‌سابقه، خانواده کریستوفر پلکی که در سال ۲۰۲۱ در یک حادثه خشونت جاده‌ای در آریزونا کشته شده بود، با استفاده از هوش مصنوعی صدای او را به دادگاه بازگرداندند. این ویدیو، چهره و صدای پلکی را بازسازی کرده بود که با قاتلش صحبت می‌کرد: «افسوس که آن روز همدیگر را در آن شرایط ملاقات کردیم. شاید در زندگی دیگر، دوستان می‌شدیم.» 💔🚗
    🚔 گابریل پل هورکاسیتاس به جرم قتل غیرعمد به ۱۰سال زندان محکوم شد.
    👩‍💻 استیسی ویلز، خواهر پلکی، این ویدیو را به همراه همسر و دوست خانوادگی خود که در حوزه فناوری کار می‌کنند، طراحی کرد. هدف او «انسانی‌کردن کریستوفر و نشان‌دادن تأثیر او در این دنیا» بود. 💡🌐
    ❗ اما این استفاده خلاقانه از هوش مصنوعی در دادگاه‌ها نگرانی‌های اخلاقی ایجاد کرده است. هری سوردن، استاد حقوق، هشدار داده که چنین فناوری‌هایی می‌توانند احساسات قضات و هیئت منصفه را دستکاری کنند. ❓

    ۱۴۰۴/۲/۲۱ ۱۲:۴۱:۵۷
  • بازسازی ذهن هوش مصنوعی با ابزار جدید!

    🤖آیا تا به حال فکر کرده‌اید چرا یک خودرو خودران منحرف می‌شود یا چرا یک دستیار دیجیتال ناگهان رفتار عجیبی نشان می‌دهد؟ محققان دانشگاه جورجیا ابزار نوینی به نام «AI Psychiatry» توسعه داده‌اند که می‌تواند مدل‌های هوش مصنوعی را پس از خرابی، بازسازی کند تا دلیل اصلی خطا مشخص شود. این ابزار مانند یک کالبدشکافی دیجیتال، با بازسازی حافظه مدل در زمان وقوع خطا، امکان تحلیل دقیق رفتار AI را فراهم می‌کند. از حملات سایبری گرفته تا نقص داده‌های آموزشی، این سیستم همه سناریوها را بررسی می‌کند و در مدل‌های واقعی مانند خودروهای خودران، عملکرد موفقی داشته است. ابزار مذکور متن‌باز است و می‌تواند در بازرسی و نظارت بر سیستم‌های هوش مصنوعی در بخش‌های مختلف به کار رود.
    🚗📊🔐

    ۱۴۰۴/۲/۱۴ ۰۹:۵۶:۴۳
  • بازسازی استراتژی خودروسازی چینی BYD برای ورود به بازار اروپا

    شرکت خودروسازی BYD چین پس از ورود ناموفق به اروپا، با استخدام مدیران محلی، توسعه نمایندگی‌ها و عرضه خودروهای هیبریدی، فعالیت‌هایش را بازسازی کرده است. اشتباهات اولیه شامل ناآشنایی با بازارها و تمرکز فقط بر خودروهای برقی بود. با این اصلاحات، فروش سه‌ماهه اول ۲۰۲۵ در بازار اروپا سه برابر شده، اما کارشناسان تأکید دارند موفقیت در اروپا نیازمند زمان و شناخت دقیق‌تر از هر کشور است.

    ۱۴۰۴/۲/۴ ۱۰:۵۳:۳۲
  • هک جالب در سیلیکون‌ولی: دکمه‌های عابرپیاده با صدای ایلان ماسک و زاکربرگ صحبت می‌کنند!

    در آخر هفته گذشته، دکمه‌های صوتی مخصوص عابران پیاده در سیلیکون‌ولی هک شدند. صدای این دکمه‌ها به‌جای پیام‌های معمولی، جملاتی تقلیدی از صدای مارک زاکربرگ و ایلان ماسک پخش می‌کردند که توسط هوش مصنوعی تولید شده بودند.

    در یکی از پیام‌ها با صدای زاکربرگ گفته می‌شود: «نگران نباشید، چون کاری از دست‌تان برنمی‌آید!» و در پیام دیگری با صدای ماسک گفته می‌شود: «پول خوشبختی نمی‌آره، ولی یه سایبرتراک می‌تونه بیاره!»

    برخی کاربران در شبکه‌های اجتماعی با طنز به این اتفاق واکنش نشان دادند. مقام‌های محلی در حال بررسی این موضوع هستند و احتمال می‌دهند که این اقدام نوعی «هکتیویسم» (ترکیب هک و اعتراض سیاسی/اجتماعی) باشد.
    کارشناسان امنیتی پیش‌تر هشدار داده بودند که برخی از این دکمه‌ها با رمزهای پیش‌فرض محافظت می‌شوند و می‌توان آن‌ها را به‌راحتی تغییر داد.

    ۱۴۰۴/۱/۲۶ ۱۸:۲۲:۰۹
  • صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد

    صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگ‌ساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
    کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانه‌های شخصی را منتقل می‌کند.

    ۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷
  • استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

    شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
    مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

    ۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
  • بازسازی ویژگی Overlay دیسکورد با قابلیت‌های جدید

    دیسکورد سیستم Overlay خود را بازطراحی کرد که به کاربران اجازه می‌دهد بدون باز کردن کامل برنامه، ویجت‌های مختلف مانند پیام‌ها و تنظیمات صدا را در حین بازی مشاهده کنند. این قابلیت جدید امکان سفارشی‌سازی محل، اندازه و شفافیت ویجت‌ها را فراهم می‌کند و تجربه کاربری استریمرها را بهبود می‌بخشد.

    ۱۴۰۴/۱/۶ ۲۰:۴۳:۱۶
  • OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

    شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

    ۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
  • فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

    محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
    این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
    این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

    ۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
  • آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

    آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

    ۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
  • تحول در اینتل با مدیریت جدید؛ استراتژی بازسازی صنعت تراشه

    لیپ-بو تان، مدیرعامل جدید اینتل، برنامه گسترده‌ای برای احیای این شرکت فناوری در دست دارد. وی قصد دارد با کاهش نیروی میانی، بازسازی فرآیندهای تولید و تمرکز بر هوش مصنوعی، عملکرد شرکت را بهبود بخشد. تان که پیش از این در هیئت مدیره اینتل بوده، استراتژی تولید تراشه برای مشتریان خارجی و توسعه محصولات هوش مصنوعی را در دستور کار قرار داده است.

    ۱۴۰۳/۱۲/۲۷ ۱۵:۳۴:۲۳
  • رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

    شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

    ۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
  • فاجعه هوش مصنوعی در بازسازی سریال‌های کلاسیک

    شرکت Carsey-Werner با استفاده از هوش مصنوعی اقدام به بازسازی سریال‌های کلاسیک مانند Roseanne و A Different World کرده که نتیجه آن تخریب کیفیت تصویری و ایجاد تصاویری نامطلوب است. این بازسازی باعث تغییرات عجیب در چهره بازیگران، متون و جزئیات تصاویر شده و کیفیت اصلی سریال‌ها را از بین برده است.

    ۱۴۰۳/۱۲/۱۶ ۲۲:۱۹:۳۸
  • تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

    شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

    ۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
  • همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاه‌های موبایل

    استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاه‌های موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.

    ۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶
  • سیری اپل در تلاش برای بازسازی با رویکرد هوش مصنوعی

    اپل در حال بازسازی دستیار هوشمند سیری با رویکرد هوش مصنوعی تولیدی است. طبق گزارش‌ها، نسخه جدید سیری در می ۲۰۲۵ با قابلیت‌های هوش مصنوعی اپل معرفی خواهد شد. این دستیار دارای دو مغز هوشمند برای پاسخگویی به دستورات ساده و پیچیده خواهد بود و احتمالاً نسخه کامل و مدرن آن تا سال ۲۰۲۷ منتشر نخواهد شد.

    ۱۴۰۳/۱۲/۱۳ ۰۲:۰۳:۳۸
  • آمازون الکسا را با هوش مصنوعی پیشرفته بازسازی می‌کند

    آمازون در حال معرفی نسل جدید الکسا با قابلیت‌های هوش مصنوعی تولیدی است که می‌تواند چندین درخواست را پشت سر هم پاسخ دهد. این سرویس جدید که پروژه داخلی "بانیان" نام دارد، احتمالاً ماهانه 10 دلار هزینه خواهد داشت و قابلیت انجام اقدامات به صورت مستقل را خواهد داشت. آمازون همچنان نسخه کلاسیک الکسا را نیز رایگان ارائه خواهد داد.

    ۱۴۰۳/۱۲/۸ ۱۶:۱۹:۵۹
  • اسپاتیفای مجوز انتشار کتاب‌های صوتی با صدای هوش مصنوعی را صادر کرد

    اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتاب‌های صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان می‌توانند کتاب‌های صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنش‌های متفاوت در جامعه نشر همراه شده و نگرانی‌هایی درباره کیفیت محتوای تولید شده وجود دارد.

    ۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴