صدای مصنوعی کتاب - اخبار فناوری - EcoFori

اسپاتیفای مجوز انتشار کتاب‌های صوتی با صدای هوش مصنوعی را صادر کرد

اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتاب‌های صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان می‌توانند کتاب‌های صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنش‌های متفاوت در جامعه نشر همراه شده و نگرانی‌هایی درباره کیفیت محتوای تولید شده وجود دارد.

۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد

صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگ‌ساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانه‌های شخصی را منتقل می‌کند.

۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷
آمازون نخستین Kindle Scribe رنگی را معرفی کرد؛ تجربه‌ای متفاوت برای کتاب‌خوان‌ها

آمازون در رویداد سخت‌افزاری پاییزه خود از نسخه جدید کتابخوان Kindle Scribe و نخستین مدل رنگی آن با امکانات هوش مصنوعی رونمایی کرد. 📚 این دستگاه با نمایشگر ۱۱ اینچی بدون بازتاب، ضخامت ۵.۴ میلی‌متر و وزن ۴۰۰ گرم عرضه می‌شود و سرعت نوشتن و ورق‌زدن آن ۴۰ درصد افزایش یافته است. آمازون اعلام کرد شیشه جدید این محصول حس نوشتن روی کاغذ را شبیه‌سازی می‌کند. ✍️
همچنین مدل Kindle Scribe Colorsoft با فناوری نمایش رنگ نرم و بدون آسیب به چشم معرفی شد که از باتری چند هفته‌ای بهره می‌برد .
هر دو مدل به امکانات هوش مصنوعی مجهز شده‌اند که شامل خلاصه‌سازی یادداشت‌ها، جست‌وجوی هوشمند در میان دفترچه‌ها و امکان ارسال به الکسا برای تعامل بیشتر است. 🤖

۱۴۰۴/۷/۱۰ ۰۲:۰۸:۰۷
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
اپل متهم به استفاده غیرقانونی از کتاب‌های نویسندگان برای آموزش هوش مصنوعی

اپل در آمریکا با شکایت گروهی از نویسندگان روبه‌رو شده است. این نویسندگان می‌گویند اپل بدون اجازه و بدون پرداخت حق‌التألیف، از کتاب‌هایشان برای آموزش سیستم‌های هوش مصنوعی خود استفاده کرده است. دادخواست در دادگاه فدرال کالیفرنیا ثبت شده و نویسندگان ادعا کرده‌اند آثارشان در دیتاست‌های غیرقانونی به کار رفته است. 📚⚖️
این پرونده بخشی از موج بزرگ شکایت‌ها علیه شرکت‌های فناوری است که متهم به استفاده غیرمجاز از محتوای نویسندگان و رسانه‌ها برای آموزش هوش مصنوعی شده‌اند. پیش‌تر، استارتاپ Anthropic برای پایان دادن به دعوای مشابهی پذیرفت ۱.۵ میلیارد دلار غرامت بپردازد؛ مایکروسافت، متا و OpenAI نیز با پرونده‌های مشابهی روبه‌رو هستند. ✅🤖

۱۴۰۴/۶/۱۶ ۱۲:۳۵:۰۳
غرامت ۳ هزار دلاری برای هر کتاب؛ نویسندگان بر سر هوش مصنوعی به پیروزی رسیدند

شرکت Anthropic موافقت کرده است ۱.۵ میلیارد دلار بپردازد تا شکایت نویسندگان و ناشران بابت استفاده غیرقانونی از ۷ میلیون کتاب برای آموزش چت‌بات «Claude» پایان یابد. طبق این توافق، که هنوز باید به تأیید دادگاه برسد، به هر نویسنده حدود ۳ هزار دلار بابت هر کتاب پرداخت خواهد شد. این مبلغ بزرگ‌ترین تسویه تاریخ پرونده‌های کپی‌رایت در آمریکا به شمار می‌رود. 🤝📚
دادگاه قبلاً اعلام کرده بود استفاده از کتاب‌ها برای آموزش مدل‌های هوش مصنوعی «منصفانه» است، اما نگهداری آن‌ها در یک کتابخانه دیجیتال نقض قانون محسوب می‌شود. Anthropic با ارزشی حدود ۱۸۳ میلیارد دلار همچنان با پرونده‌های دیگری از سوی Reddit و گروهی از نویسندگان روبه‌رو است. ✅⚖️

۱۴۰۴/۶/۱۶ ۱۲:۲۴:۴۱
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!

گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که می‌تواند صحبت‌ها را به‌صورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپ‌فیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا می‌شود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمی‌شود. گوگل امیدوار است این فناوری راه را برای ارتباط آسان‌تر میان زبان‌های مختلف باز کند، هرچند نگرانی‌هایی درباره سوءاستفاده از دیپ‌فیک همچنان وجود دارد. ✅🌍

۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸
امضای بیش از ۱۱۰۰ نویسنده در حمایت از محدودیت هوش مصنوعی

گروهی از نویسندگان سرشناس با انتشار نامه‌ای سرگشاده از ناشران کتاب خواسته‌اند استفاده از ابزارهای هوش مصنوعی را محدود کرده و به حفظ نیروی انسانی در صنعت نشر متعهد بمانند. ✍️
در این نامه آمده که شرکت‌های فناوری بدون پرداخت هزینه، از کتاب‌های آن‌ها برای آموزش مدل‌های هوش مصنوعی استفاده کرده‌اند؛ در نتیجه، به جای پرداخت سهمی به نویسندگان، سود آن نصیب شرکت‌هایی شده که از تلاش آن‌ها بهره برده‌اند. 💰
از جمله خواسته‌های اصلی این نویسندگان، تعهد ناشران به عدم انتشار کتاب‌های تولیدشده با هوش مصنوعی، استفاده از راویان انسانی برای کتاب‌های صوتی، و جلوگیری از جایگزینی کارکنان با ابزارهای خودکار است. 📚
این نامه ابتدا با امضای ده‌ها نویسنده منتشر شد، اما تنها در ۲۴ ساعت بیش از ۱۱۰۰ امضای دیگر نیز به آن اضافه شد. 📈
هم‌زمان، برخی نویسندگان نیز از شرکت‌های فناوری به‌دلیل استفاده بدون اجازه از آثارشان شکایت کرده‌اند، اما اخیراً دادگاه‌های فدرال در آمریکا بخش زیادی از این شکایات را رد کرده‌اند. ⚖️

۱۴۰۴/۴/۹ ۲۲:۲۸:۰۸
کتاب The Optimist: روایتی بی‌پرده از فراز و فرود سم آلتمن در دنیای هوش مصنوعی

📚 کتاب جدید «خوش‌بین: سم آلتمن، OpenAI و رقابت برای ساخت آینده» (The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future) ، نوشته کیچ هیگی (Keach Hagey)، خبرنگار وال‌استریت ژورنال، نگاهی عمیق به زندگی و حرفه سم آلتمن دارد. 🧠
📌 از کودکی در غرب میانه آمریکا تا استارتاپ‌ها، شتاب‌دهنده Y Combinator و نهایتاً OpenAI، مسیر او بررسی شده است. 📈
🔥 بخش مهمی به بحران برکناری و بازگشت آلتمن در OpenAI و ساختار پیچیده این شرکت می‌پردازد که ممکن است جذب سرمایه را دشوار کند. 🏛️💸
🎙️ هیگی تأکید دارد آلتمن باوجود دیدگاه‌های پیشرو، همکاری‌های مهمی با دولت ترامپ در زمینه زیرساخت‌ها داشته است. 🏗️
👨‍👩‍👦 خانواده ایده‌گرا و تجربه‌های شخصی آلتمن، نگاه مثبتش به جهان را شکل داده‌اند.
🌐 این کتاب، تصویری از یک چهره بانفوذ سیلیکون‌ولی و نگاهی واقع‌گرایانه به آینده هوش مصنوعی است. 🤖
🎧 نسخه صوتی کتاب در اسپاتیفای در دسترس است. مطالعه آن به علاقه‌مندان فناوری، سیاست و آینده پیشنهاد می‌شود. 📖

۱۴۰۴/۳/۱۲ ۲۰:۳۰:۳۳
هوش مصنوعی، ناشر کتاب‌های خیالی در روزنامه معتبر!

📚 روزنامه آمریکایی Chicago Sun-Times که یکی از رسانه‌های قدیمی و معتبر شهر شیکاگو است، اخیراً با انتشار یک «فهرست کتاب‌های تابستانی» جنجال به‌پا کرد، چون بسیاری از کتاب‌های معرفی‌شده اصلاً واقعی نبودند! 🤯📖
این فهرست توسط هوش مصنوعی تهیه شده بود و شامل عناوینی جعلی بود که به نویسندگان معروف نسبت داده شده‌اند، اما وجود خارجی ندارند. 🤖❌
روزنامه اعلام کرد این لیست توسط تحریریه رسمی تهیه نشده و در حال بررسی ماجراست. این اتفاق نشان می‌دهد که حتی رسانه‌های باسابقه نیز ممکن است قربانی اشتباهات محتوای تولیدشده با AI شوند. ⚠️📰

۱۴۰۴/۳/۶ ۰۲:۵۳:۱۸
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
آیا گربه‌تان می‌تواند با شما صحبت کند؟ بایدو می‌گوید بله!

🐾 شرکت فناوری چینی بایدو (Baidu) پتنتی برای سیستم هوش مصنوعی ثبت کرده که می‌تواند صدای حیوانات را به زبان انسان ترجمه کند! 🤖 این سیستم با تحلیل صداها، رفتارها و سیگنال‌های فیزیولوژیکی، احساسات حیوانات را شناسایی و به جملات انسانی تبدیل می‌کند. 💬
این فناوری می‌تواند ارتباط عمیق‌تری بین انسان و حیوانات ایجاد کند. ❤️ اگرچه این پروژه هنوز در مرحله تحقیقاتی است، برخی کاربران شبکه‌های اجتماعی چین مشتاقانه منتظر این فناوری‌اند، در حالی که برخی دیگر با تردید به عملکرد آن نگاه می‌کنند. 🐕
📌 بایدو، یکی از پیشگامان هوش مصنوعی در چین، با مدل جدید Ernie 4.5 Turbo به دنبال تثبیت جایگاه خود است. 🚀🔥

۱۴۰۴/۲/۲۲ ۰۰:۴۴:۲۷
هوش مصنوعی صدای مقتول را در دادگاه زنده کرد!

⚖️ در رویدادی بی‌سابقه، خانواده کریستوفر پلکی که در سال ۲۰۲۱ در یک حادثه خشونت جاده‌ای در آریزونا کشته شده بود، با استفاده از هوش مصنوعی صدای او را به دادگاه بازگرداندند. این ویدیو، چهره و صدای پلکی را بازسازی کرده بود که با قاتلش صحبت می‌کرد: «افسوس که آن روز همدیگر را در آن شرایط ملاقات کردیم. شاید در زندگی دیگر، دوستان می‌شدیم.» 💔🚗
🚔 گابریل پل هورکاسیتاس به جرم قتل غیرعمد به ۱۰سال زندان محکوم شد.
👩‍💻 استیسی ویلز، خواهر پلکی، این ویدیو را به همراه همسر و دوست خانوادگی خود که در حوزه فناوری کار می‌کنند، طراحی کرد. هدف او «انسانی‌کردن کریستوفر و نشان‌دادن تأثیر او در این دنیا» بود. 💡🌐
❗ اما این استفاده خلاقانه از هوش مصنوعی در دادگاه‌ها نگرانی‌های اخلاقی ایجاد کرده است. هری سوردن، استاد حقوق، هشدار داده که چنین فناوری‌هایی می‌توانند احساسات قضات و هیئت منصفه را دستکاری کنند. ❓

۱۴۰۴/۲/۲۱ ۱۲:۴۱:۵۷
هوش مصنوعی متا زیر تیغ عدالت؛ آیا بازار کتاب نابود می‌شود؟

⚖️ در دادگاهی در آمریکا، استفاده متا از کتاب‌های نویسندگان معروف برای آموزش مدل LLaMA بدون اجازه قانونی زیر ذره‌بین رفت. قاضی گفت این مدل می‌تواند میلیاردها محتوای رقیب تولید کند و بازار آثار اصلی را نابود سازد. متا ادعا می‌کند استفاده‌اش منصفانه بوده، اما دادگاه در حال بررسی آثار واقعی این اقدام بر حقوق نویسندگان است. این پرونده بخشی از موج شکایت‌های بزرگ علیه غول‌های هوش مصنوعی است. ⚠️

۱۴۰۴/۲/۱۳ ۰۲:۱۲:۴۲
سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
هک جالب در سیلیکون‌ولی: دکمه‌های عابرپیاده با صدای ایلان ماسک و زاکربرگ صحبت می‌کنند!

در آخر هفته گذشته، دکمه‌های صوتی مخصوص عابران پیاده در سیلیکون‌ولی هک شدند. صدای این دکمه‌ها به‌جای پیام‌های معمولی، جملاتی تقلیدی از صدای مارک زاکربرگ و ایلان ماسک پخش می‌کردند که توسط هوش مصنوعی تولید شده بودند.

در یکی از پیام‌ها با صدای زاکربرگ گفته می‌شود: «نگران نباشید، چون کاری از دست‌تان برنمی‌آید!» و در پیام دیگری با صدای ماسک گفته می‌شود: «پول خوشبختی نمی‌آره، ولی یه سایبرتراک می‌تونه بیاره!»

برخی کاربران در شبکه‌های اجتماعی با طنز به این اتفاق واکنش نشان دادند. مقام‌های محلی در حال بررسی این موضوع هستند و احتمال می‌دهند که این اقدام نوعی «هکتیویسم» (ترکیب هک و اعتراض سیاسی/اجتماعی) باشد.
کارشناسان امنیتی پیش‌تر هشدار داده بودند که برخی از این دکمه‌ها با رمزهای پیش‌فرض محافظت می‌شوند و می‌توان آن‌ها را به‌راحتی تغییر داد.

۱۴۰۴/۱/۲۶ ۱۸:۲۲:۰۹
حمایت اساتید حقوق از نویسندگان در دعوای حقوقی علیه متا

گروهی از اساتید حقوق مالکیت فکری با ارسال نامه‌ای رسمی از نویسندگانی حمایت کردند که از شرکت متا به‌دلیل استفاده بدون اجازه از کتاب‌هایشان برای آموزش مدل هوش مصنوعی Llama شکایت کرده‌اند. آن‌ها می‌گویند این استفاده، عادلانه نیست چون جنبه تجاری دارد و به بازار نویسندگان آسیب می‌زند.
در این پرونده، برخی نویسندگان مدعی‌اند متا حتی اطلاعات کپی‌رایت را از کتاب‌ها حذف کرده است. متا در دفاعیه‌اش این استفاده را «عادلانه» خوانده و خواستار رد شکایت شده، اما دادگاه اجازه داده بخش‌هایی از آن ادامه پیدا کند. این پرونده یکی از دعواهای مهم کپی‌رایت در حوزه هوش مصنوعی در آمریکاست.

۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۴
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
معرفی ویژگی جدید «خلاصه» در کتابخوان Kindle آمازون با استفاده از هوش مصنوعی

آمازون قابلیت جدید «خلاصه» را برای کتابخوان Kindle معرفی کرد که با استفاده از هوش مصنوعی، خوانندگان می‌توانند نکات کلیدی داستان و شخصیت‌های یک سری کتاب را پیش از شروع کتاب جدید مرور کنند. این ویژگی برای کتاب‌های پرفروش انگلیسی زبان در ایالات متحده راه‌اندازی شده و به زودی در اپلیکیشن iOS نیز در دسترس خواهد بود.

۱۴۰۴/۱/۱۶ ۰۰:۴۷:۴۰
سرقت ادبی؛ هجوم شرکت‌های فناوری به کتابخانه‌های عمومی

شرکت‌های فناوری مانند Meta با استفاده از سایت‌های غیرقانونی مانند LibGen، میلیون‌ها کتاب را بدون اجازه نویسندگان برای آموزش هوش مصنوعی دانلود کرده‌اند. همزمان، دولت ترامپ با قطع بودجه کتابخانه‌های عمومی، دسترسی مردم به منابع ادبی را محدود می‌کند. این اقدامات باعث نگرانی نویسندگان و تهدید حقوق مالکیت معنوی آنها شده است.

۱۴۰۴/۱/۳ ۰۵:۰۹:۰۷
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
پیشروی دعوای حق تألیف علیه متا در پرونده استفاده از کتب برای آموزش هوش مصنوعی

دادگاه فدرال پرونده شکایت نویسندگان علیه شرکت متا را مبنی بر استفاده غیرقانونی از کتب آنها برای آموزش مدل های هوش مصنوعی Llama تأیید کرد. قاضی پرونده، اقدامات متا در حذف اطلاعات حق تألیف را محرز دانسته و بخشی از شکایت را پذیرفته است.

۱۴۰۳/۱۲/۱۹ ۰۰:۰۱:۱۷
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاه‌های موبایل

استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاه‌های موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.

۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶
شانگر هوش مصنوعی برای کتاب‌های کاغذی

ن
‏
‏مارک یک نشانگر هوشمند برای کتاب‌های کاغذی است که با استفاده از هوش مصنوعی، خلاصه مطالب خوانده شده را به گوشی هوشمند ارسال می‌کند. این محصول با قیمت ۱۳۰ دلار برای علاقه‌مندان به کتاب‌های چاپی طراحی شده و قابلیت ثبت پیشرفت مطالعاتی و اشتراک‌گذاری آن در شبکه‌های اجتماعی را دارد.

۱۴۰۳/۱۲/۱۰ ۲۱:۵۹:۳۸
راه‌اندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs

شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتاب‌های صوتی با فناوری هوش مصنوعی راه‌اندازی کرد. این پلتفرم به نویسندگان اجازه می‌دهد کتاب‌های صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.

۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰

نمایش بیشتر