-
اسپاتیفای مجوز انتشار کتابهای صوتی با صدای هوش مصنوعی را صادر کرد
اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتابهای صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان میتوانند کتابهای صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنشهای متفاوت در جامعه نشر همراه شده و نگرانیهایی درباره کیفیت محتوای تولید شده وجود دارد.
۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴ -
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد
📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیهسازیشده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروشها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصیاش میگوید و موضعی موافق با حق سقط جنین اتخاذ میکند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطهعطفی در کتابهای صوتی میداند. 🚀🔊۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱ -
صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد
صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانههای شخصی را منتقل میکند.۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷ -
آمازون نخستین Kindle Scribe رنگی را معرفی کرد؛ تجربهای متفاوت برای کتابخوانها
آمازون در رویداد سختافزاری پاییزه خود از نسخه جدید کتابخوان Kindle Scribe و نخستین مدل رنگی آن با امکانات هوش مصنوعی رونمایی کرد. 📚 این دستگاه با نمایشگر ۱۱ اینچی بدون بازتاب، ضخامت ۵.۴ میلیمتر و وزن ۴۰۰ گرم عرضه میشود و سرعت نوشتن و ورقزدن آن ۴۰ درصد افزایش یافته است. آمازون اعلام کرد شیشه جدید این محصول حس نوشتن روی کاغذ را شبیهسازی میکند. ✍️
همچنین مدل Kindle Scribe Colorsoft با فناوری نمایش رنگ نرم و بدون آسیب به چشم معرفی شد که از باتری چند هفتهای بهره میبرد .
هر دو مدل به امکانات هوش مصنوعی مجهز شدهاند که شامل خلاصهسازی یادداشتها، جستوجوی هوشمند در میان دفترچهها و امکان ارسال به الکسا برای تعامل بیشتر است. 🤖۱۴۰۴/۷/۱۰ ۰۲:۰۸:۰۷ -
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance
استارتاپ نروژی Hance نرمافزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکتهایی مثل Intel و Riedel Communications (تأمینکننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدلهای پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام میشود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance میتواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلیثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخشهای امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشههای جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴ -
اپل متهم به استفاده غیرقانونی از کتابهای نویسندگان برای آموزش هوش مصنوعی
اپل در آمریکا با شکایت گروهی از نویسندگان روبهرو شده است. این نویسندگان میگویند اپل بدون اجازه و بدون پرداخت حقالتألیف، از کتابهایشان برای آموزش سیستمهای هوش مصنوعی خود استفاده کرده است. دادخواست در دادگاه فدرال کالیفرنیا ثبت شده و نویسندگان ادعا کردهاند آثارشان در دیتاستهای غیرقانونی به کار رفته است. 📚⚖️
این پرونده بخشی از موج بزرگ شکایتها علیه شرکتهای فناوری است که متهم به استفاده غیرمجاز از محتوای نویسندگان و رسانهها برای آموزش هوش مصنوعی شدهاند. پیشتر، استارتاپ Anthropic برای پایان دادن به دعوای مشابهی پذیرفت ۱.۵ میلیارد دلار غرامت بپردازد؛ مایکروسافت، متا و OpenAI نیز با پروندههای مشابهی روبهرو هستند. ✅🤖۱۴۰۴/۶/۱۶ ۱۲:۳۵:۰۳ -
غرامت ۳ هزار دلاری برای هر کتاب؛ نویسندگان بر سر هوش مصنوعی به پیروزی رسیدند
شرکت Anthropic موافقت کرده است ۱.۵ میلیارد دلار بپردازد تا شکایت نویسندگان و ناشران بابت استفاده غیرقانونی از ۷ میلیون کتاب برای آموزش چتبات «Claude» پایان یابد. طبق این توافق، که هنوز باید به تأیید دادگاه برسد، به هر نویسنده حدود ۳ هزار دلار بابت هر کتاب پرداخت خواهد شد. این مبلغ بزرگترین تسویه تاریخ پروندههای کپیرایت در آمریکا به شمار میرود. 🤝📚
دادگاه قبلاً اعلام کرده بود استفاده از کتابها برای آموزش مدلهای هوش مصنوعی «منصفانه» است، اما نگهداری آنها در یک کتابخانه دیجیتال نقض قانون محسوب میشود. Anthropic با ارزشی حدود ۱۸۳ میلیارد دلار همچنان با پروندههای دیگری از سوی Reddit و گروهی از نویسندگان روبهرو است. ✅⚖️۱۴۰۴/۶/۱۶ ۱۲:۲۴:۴۱ -
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!
گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که میتواند صحبتها را بهصورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپفیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا میشود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمیشود. گوگل امیدوار است این فناوری راه را برای ارتباط آسانتر میان زبانهای مختلف باز کند، هرچند نگرانیهایی درباره سوءاستفاده از دیپفیک همچنان وجود دارد. ✅🌍۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸ -
امضای بیش از ۱۱۰۰ نویسنده در حمایت از محدودیت هوش مصنوعی
گروهی از نویسندگان سرشناس با انتشار نامهای سرگشاده از ناشران کتاب خواستهاند استفاده از ابزارهای هوش مصنوعی را محدود کرده و به حفظ نیروی انسانی در صنعت نشر متعهد بمانند. ✍️
در این نامه آمده که شرکتهای فناوری بدون پرداخت هزینه، از کتابهای آنها برای آموزش مدلهای هوش مصنوعی استفاده کردهاند؛ در نتیجه، به جای پرداخت سهمی به نویسندگان، سود آن نصیب شرکتهایی شده که از تلاش آنها بهره بردهاند. 💰
از جمله خواستههای اصلی این نویسندگان، تعهد ناشران به عدم انتشار کتابهای تولیدشده با هوش مصنوعی، استفاده از راویان انسانی برای کتابهای صوتی، و جلوگیری از جایگزینی کارکنان با ابزارهای خودکار است. 📚
این نامه ابتدا با امضای دهها نویسنده منتشر شد، اما تنها در ۲۴ ساعت بیش از ۱۱۰۰ امضای دیگر نیز به آن اضافه شد. 📈
همزمان، برخی نویسندگان نیز از شرکتهای فناوری بهدلیل استفاده بدون اجازه از آثارشان شکایت کردهاند، اما اخیراً دادگاههای فدرال در آمریکا بخش زیادی از این شکایات را رد کردهاند. ⚖️۱۴۰۴/۴/۹ ۲۲:۲۸:۰۸ -
کتاب The Optimist: روایتی بیپرده از فراز و فرود سم آلتمن در دنیای هوش مصنوعی
📚 کتاب جدید «خوشبین: سم آلتمن، OpenAI و رقابت برای ساخت آینده» (The Optimist: Sam Altman, OpenAI, and the Race to Invent the Future) ، نوشته کیچ هیگی (Keach Hagey)، خبرنگار والاستریت ژورنال، نگاهی عمیق به زندگی و حرفه سم آلتمن دارد. 🧠
📌 از کودکی در غرب میانه آمریکا تا استارتاپها، شتابدهنده Y Combinator و نهایتاً OpenAI، مسیر او بررسی شده است. 📈
🔥 بخش مهمی به بحران برکناری و بازگشت آلتمن در OpenAI و ساختار پیچیده این شرکت میپردازد که ممکن است جذب سرمایه را دشوار کند. 🏛️💸
🎙️ هیگی تأکید دارد آلتمن باوجود دیدگاههای پیشرو، همکاریهای مهمی با دولت ترامپ در زمینه زیرساختها داشته است. 🏗️
👨👩👦 خانواده ایدهگرا و تجربههای شخصی آلتمن، نگاه مثبتش به جهان را شکل دادهاند.
🌐 این کتاب، تصویری از یک چهره بانفوذ سیلیکونولی و نگاهی واقعگرایانه به آینده هوش مصنوعی است. 🤖
🎧 نسخه صوتی کتاب در اسپاتیفای در دسترس است. مطالعه آن به علاقهمندان فناوری، سیاست و آینده پیشنهاد میشود. 📖۱۴۰۴/۳/۱۲ ۲۰:۳۰:۳۳ -
هوش مصنوعی، ناشر کتابهای خیالی در روزنامه معتبر!
📚 روزنامه آمریکایی Chicago Sun-Times که یکی از رسانههای قدیمی و معتبر شهر شیکاگو است، اخیراً با انتشار یک «فهرست کتابهای تابستانی» جنجال بهپا کرد، چون بسیاری از کتابهای معرفیشده اصلاً واقعی نبودند! 🤯📖
این فهرست توسط هوش مصنوعی تهیه شده بود و شامل عناوینی جعلی بود که به نویسندگان معروف نسبت داده شدهاند، اما وجود خارجی ندارند. 🤖❌
روزنامه اعلام کرد این لیست توسط تحریریه رسمی تهیه نشده و در حال بررسی ماجراست. این اتفاق نشان میدهد که حتی رسانههای باسابقه نیز ممکن است قربانی اشتباهات محتوای تولیدشده با AI شوند. ⚠️📰۱۴۰۴/۳/۶ ۰۲:۵۳:۱۸ -
هوش مصنوعی، راهکار جدید Audible برای گسترش کتابهای صوتی
🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتابهای چاپی و الکترونیکی را به کتابهای صوتی با صدای هوش مصنوعی تبدیل میکند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبانهای مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه میشود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را بهزودی فعال میکند. اما برخی ناشران نگران کاهش کیفیت کتابهای صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتابهای صوتی و رقابت با اپل و اسپاتیفای انجام میشود.۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶ -
آیا گربهتان میتواند با شما صحبت کند؟ بایدو میگوید بله!
🐾 شرکت فناوری چینی بایدو (Baidu) پتنتی برای سیستم هوش مصنوعی ثبت کرده که میتواند صدای حیوانات را به زبان انسان ترجمه کند! 🤖 این سیستم با تحلیل صداها، رفتارها و سیگنالهای فیزیولوژیکی، احساسات حیوانات را شناسایی و به جملات انسانی تبدیل میکند. 💬
این فناوری میتواند ارتباط عمیقتری بین انسان و حیوانات ایجاد کند. ❤️ اگرچه این پروژه هنوز در مرحله تحقیقاتی است، برخی کاربران شبکههای اجتماعی چین مشتاقانه منتظر این فناوریاند، در حالی که برخی دیگر با تردید به عملکرد آن نگاه میکنند. 🐕
📌 بایدو، یکی از پیشگامان هوش مصنوعی در چین، با مدل جدید Ernie 4.5 Turbo به دنبال تثبیت جایگاه خود است. 🚀🔥۱۴۰۴/۲/۲۲ ۰۰:۴۴:۲۷ -
هوش مصنوعی صدای مقتول را در دادگاه زنده کرد!
⚖️ در رویدادی بیسابقه، خانواده کریستوفر پلکی که در سال ۲۰۲۱ در یک حادثه خشونت جادهای در آریزونا کشته شده بود، با استفاده از هوش مصنوعی صدای او را به دادگاه بازگرداندند. این ویدیو، چهره و صدای پلکی را بازسازی کرده بود که با قاتلش صحبت میکرد: «افسوس که آن روز همدیگر را در آن شرایط ملاقات کردیم. شاید در زندگی دیگر، دوستان میشدیم.» 💔🚗
🚔 گابریل پل هورکاسیتاس به جرم قتل غیرعمد به ۱۰سال زندان محکوم شد.
👩💻 استیسی ویلز، خواهر پلکی، این ویدیو را به همراه همسر و دوست خانوادگی خود که در حوزه فناوری کار میکنند، طراحی کرد. هدف او «انسانیکردن کریستوفر و نشاندادن تأثیر او در این دنیا» بود. 💡🌐
❗ اما این استفاده خلاقانه از هوش مصنوعی در دادگاهها نگرانیهای اخلاقی ایجاد کرده است. هری سوردن، استاد حقوق، هشدار داده که چنین فناوریهایی میتوانند احساسات قضات و هیئت منصفه را دستکاری کنند. ❓۱۴۰۴/۲/۲۱ ۱۲:۴۱:۵۷ -
هوش مصنوعی متا زیر تیغ عدالت؛ آیا بازار کتاب نابود میشود؟
⚖️ در دادگاهی در آمریکا، استفاده متا از کتابهای نویسندگان معروف برای آموزش مدل LLaMA بدون اجازه قانونی زیر ذرهبین رفت. قاضی گفت این مدل میتواند میلیاردها محتوای رقیب تولید کند و بازار آثار اصلی را نابود سازد. متا ادعا میکند استفادهاش منصفانه بوده، اما دادگاه در حال بررسی آثار واقعی این اقدام بر حقوق نویسندگان است. این پرونده بخشی از موج شکایتهای بزرگ علیه غولهای هوش مصنوعی است. ⚠️
۱۴۰۴/۲/۱۳ ۰۲:۱۲:۴۲ -
سرمایهگذاری Spotify برای گسترش کتابهای صوتی غیر انگلیسی
اسپاتیفای برای افزایش تولید کتابهای صوتی به زبانهای غیر انگلیسی، بهویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایهگذاری میکند. این اقدام بهدلیل کمبود کتابهای صوتی در این زبانها و رقابت با پلتفرمهایی مثل Audible انجام میشود.
در فرانسه تنها ۳٪ از کتابها بهصورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای میخواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنشهایی در صنعت نشر مواجه شده است.۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴ -
هک جالب در سیلیکونولی: دکمههای عابرپیاده با صدای ایلان ماسک و زاکربرگ صحبت میکنند!
در آخر هفته گذشته، دکمههای صوتی مخصوص عابران پیاده در سیلیکونولی هک شدند. صدای این دکمهها بهجای پیامهای معمولی، جملاتی تقلیدی از صدای مارک زاکربرگ و ایلان ماسک پخش میکردند که توسط هوش مصنوعی تولید شده بودند.
در یکی از پیامها با صدای زاکربرگ گفته میشود: «نگران نباشید، چون کاری از دستتان برنمیآید!» و در پیام دیگری با صدای ماسک گفته میشود: «پول خوشبختی نمیآره، ولی یه سایبرتراک میتونه بیاره!»
برخی کاربران در شبکههای اجتماعی با طنز به این اتفاق واکنش نشان دادند. مقامهای محلی در حال بررسی این موضوع هستند و احتمال میدهند که این اقدام نوعی «هکتیویسم» (ترکیب هک و اعتراض سیاسی/اجتماعی) باشد.
کارشناسان امنیتی پیشتر هشدار داده بودند که برخی از این دکمهها با رمزهای پیشفرض محافظت میشوند و میتوان آنها را بهراحتی تغییر داد.۱۴۰۴/۱/۲۶ ۱۸:۲۲:۰۹ -
حمایت اساتید حقوق از نویسندگان در دعوای حقوقی علیه متا
گروهی از اساتید حقوق مالکیت فکری با ارسال نامهای رسمی از نویسندگانی حمایت کردند که از شرکت متا بهدلیل استفاده بدون اجازه از کتابهایشان برای آموزش مدل هوش مصنوعی Llama شکایت کردهاند. آنها میگویند این استفاده، عادلانه نیست چون جنبه تجاری دارد و به بازار نویسندگان آسیب میزند.
در این پرونده، برخی نویسندگان مدعیاند متا حتی اطلاعات کپیرایت را از کتابها حذف کرده است. متا در دفاعیهاش این استفاده را «عادلانه» خوانده و خواستار رد شکایت شده، اما دادگاه اجازه داده بخشهایی از آن ادامه پیدا کند. این پرونده یکی از دعواهای مهم کپیرایت در حوزه هوش مصنوعی در آمریکاست.۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۴ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
معرفی ویژگی جدید «خلاصه» در کتابخوان Kindle آمازون با استفاده از هوش مصنوعی
آمازون قابلیت جدید «خلاصه» را برای کتابخوان Kindle معرفی کرد که با استفاده از هوش مصنوعی، خوانندگان میتوانند نکات کلیدی داستان و شخصیتهای یک سری کتاب را پیش از شروع کتاب جدید مرور کنند. این ویژگی برای کتابهای پرفروش انگلیسی زبان در ایالات متحده راهاندازی شده و به زودی در اپلیکیشن iOS نیز در دسترس خواهد بود.
۱۴۰۴/۱/۱۶ ۰۰:۴۷:۴۰ -
سرقت ادبی؛ هجوم شرکتهای فناوری به کتابخانههای عمومی
شرکتهای فناوری مانند Meta با استفاده از سایتهای غیرقانونی مانند LibGen، میلیونها کتاب را بدون اجازه نویسندگان برای آموزش هوش مصنوعی دانلود کردهاند. همزمان، دولت ترامپ با قطع بودجه کتابخانههای عمومی، دسترسی مردم به منابع ادبی را محدود میکند. این اقدامات باعث نگرانی نویسندگان و تهدید حقوق مالکیت معنوی آنها شده است.
۱۴۰۴/۱/۳ ۰۵:۰۹:۰۷ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد میکند
آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیتهای هوش مصنوعی الکسا انجام میشود و کاربران دیگر نمیتوانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیتهای جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.
۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶ -
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان
شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیتهایی در زبانهای غیرانگلیسی دارد.
۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸ -
پیشروی دعوای حق تألیف علیه متا در پرونده استفاده از کتب برای آموزش هوش مصنوعی
دادگاه فدرال پرونده شکایت نویسندگان علیه شرکت متا را مبنی بر استفاده غیرقانونی از کتب آنها برای آموزش مدل های هوش مصنوعی Llama تأیید کرد. قاضی پرونده، اقدامات متا در حذف اطلاعات حق تألیف را محرز دانسته و بخشی از شکایت را پذیرفته است.
۱۴۰۳/۱۲/۱۹ ۰۰:۰۱:۱۷ -
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانیهای امنیتی
شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیهسازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفادههای احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.
۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶ -
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاههای موبایل
استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاههای موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.
۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶ -
شانگر هوش مصنوعی برای کتابهای کاغذی
ن
مارک یک نشانگر هوشمند برای کتابهای کاغذی است که با استفاده از هوش مصنوعی، خلاصه مطالب خوانده شده را به گوشی هوشمند ارسال میکند. این محصول با قیمت ۱۳۰ دلار برای علاقهمندان به کتابهای چاپی طراحی شده و قابلیت ثبت پیشرفت مطالعاتی و اشتراکگذاری آن در شبکههای اجتماعی را دارد.۱۴۰۳/۱۲/۱۰ ۲۱:۵۹:۳۸ -
راهاندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs
شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتابهای صوتی با فناوری هوش مصنوعی راهاندازی کرد. این پلتفرم به نویسندگان اجازه میدهد کتابهای صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.
۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰



