-
هوش مصنوعی عینکهای هوشمند متا به اروپا گسترش یافت
متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینکهای هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون میتوانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما بهدلیل قوانین سختگیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیتهای جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک میبیند. این ویژگیها از هفته آینده در کشورهای اروپایی پشتیبانیشده فعال میشوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوریهای پوشیدنی و هوش مصنوعی است.۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴ -
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند
دو دانشجوی کرهای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساختهاند که میتواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر میدهد. این مدل رایگان است و در پلتفرمهای Hugging Face و GitHub قابل دسترسی است. کاربران میتوانند لحن صدا، مکثها، سرفه و خنده را در گفتوگوها تنظیم کنند و حتی صدای واقعی افراد را شبیهسازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه دادههایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیتهای اجتماعی و چندزبانه بسازند.
۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱ -
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی
استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستمها به کسبوکارها کمک میکنند تا تماسهای مشتریان را خودکار مدیریت کنند و وظایف سادهای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماسهای پیچیده به اپراتور انسانی واگذار میشود. این دستیارها با صدای بازیگران واقعی ساخته میشوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم ششنفره پردازش کردهاند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.
۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸ -
اولین کتابخوان دیجیتال تاشو با صفحه رنگی Readmoo
شرکت Readmoo از اولین کتابخوان دیجیتال تاشو با نمایشگر رنگی به نام mooInk V رونمایی کرد؛ دستگاهی ۸ اینچی که مانند کتاب واقعی باز و بسته میشود و طراحی جمعوجور آن، حمل آسان را ممکن میکند. این محصول از فناوری E Ink Gallery 3 برای نمایش رنگهای زنده بهره میبرد، اما سرعت پایین تغییر تصویر ممکن است خواندن را کند کند. بدنه آلیاژی و وزن سبک ۲۵۵ گرمی، از دیگر ویژگیهای آن است. با وجود دوام ۲۰۰ هزار بار تا شدن در آزمایش، نگرانیهایی درباره خط تای صفحه و آسیبپذیری آن وجود دارد. هنوز قیمت یا زمان عرضه مشخص نشده، اما احتمال میرود قیمت بالایی داشته باشد.
۱۴۰۴/۱/۳۰ ۲۰:۲۱:۰۱ -
اختلال گسترده در سرویس پخش موسیقی Spotify
پلتفرم پخش موسیقی Spotify که در زمینه استریم موسیقی آنلاین فعالیت دارد، با اختلال گستردهای مواجه شد. بیش از ۴۷ هزار کاربر در سراسر جهان از قطعی خدمات این سرویس گزارش دادند. کاربران قادر به جستجو و مشاهده هنرمندان نبودند اما همچنان میتوانستند موسیقیهای دانلود شده را پخش کنند.
۱۴۰۴/۱/۲۸ ۱۸:۱۹:۴۷ -
هوش مصنوعی گوگل به رمزگشایی زبان دلفینها کمک میکند
گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفینها کمک میکند. این مدل با دادههای پروژهای علمی روی دلفینهای آتلانتیک آموزش دیده و حتی میتواند صداهایی شبیه دلفینها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفینها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام میشد، اما حالا با قدرت بیشتر و عملکرد دقیقتر ادامه مییابد.۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵ -
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول میکند
لایو کیت (LiveKit) پلتفرمی متنباز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماسهای ۹۱۱ آمریکا استفاده میشود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعهدهنده دارد و شرکتهایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده میکنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷ -
حمایت اساتید حقوق از نویسندگان در دعوای حقوقی علیه متا
گروهی از اساتید حقوق مالکیت فکری با ارسال نامهای رسمی از نویسندگانی حمایت کردند که از شرکت متا بهدلیل استفاده بدون اجازه از کتابهایشان برای آموزش مدل هوش مصنوعی Llama شکایت کردهاند. آنها میگویند این استفاده، عادلانه نیست چون جنبه تجاری دارد و به بازار نویسندگان آسیب میزند.
در این پرونده، برخی نویسندگان مدعیاند متا حتی اطلاعات کپیرایت را از کتابها حذف کرده است. متا در دفاعیهاش این استفاده را «عادلانه» خوانده و خواستار رد شکایت شده، اما دادگاه اجازه داده بخشهایی از آن ادامه پیدا کند. این پرونده یکی از دعواهای مهم کپیرایت در حوزه هوش مصنوعی در آمریکاست.۱۴۰۴/۱/۲۴ ۰۴:۳۱:۵۴ -
صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد
صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانههای شخصی را منتقل میکند.۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷ -
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیتتر تا اسکن اسناد و خلاصه پیامهای صوتی
واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخشهای چت، تماس و کانالها اضافه کرده است. از این پس، در گروهها میتوان دید چه کسانی آنلاین هستند، نوتیفیکیشنها را فقط برای پیامهای مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگنمایی (زوم) انجام داد.
کاربران آیفون همچنین میتوانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماسهای تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چتهای دو نفره، پاسخ به دعوتها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.
در بخش کانالها نیز، ادمینها میتوانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیامهای صوتی را برای دنبالکنندگان ارسال کنند.۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶ -
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic
آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که میتواند صدا را بسیار طبیعی تولید و گفتوگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفتهتر عمل میکند و حتی با مدلهای پیشرفتهی شرکتهایی مثل OpenAI و گوگل رقابت میکند.
این مدل بهگونهای طراحی شده که مکالمات را روانتر و با درک بهتری از صدا، حتی در محیطهای پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون میگوید این مدل تا ۸۰٪ ارزانتر از برخی رقباست و سرعت پاسخدهی بالاتری هم دارد.۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
معرفی ویژگی جدید «خلاصه» در کتابخوان Kindle آمازون با استفاده از هوش مصنوعی
آمازون قابلیت جدید «خلاصه» را برای کتابخوان Kindle معرفی کرد که با استفاده از هوش مصنوعی، خوانندگان میتوانند نکات کلیدی داستان و شخصیتهای یک سری کتاب را پیش از شروع کتاب جدید مرور کنند. این ویژگی برای کتابهای پرفروش انگلیسی زبان در ایالات متحده راهاندازی شده و به زودی در اپلیکیشن iOS نیز در دسترس خواهد بود.
۱۴۰۴/۱/۱۶ ۰۰:۴۷:۴۰ -
چالش آمازون با فرانسه بر سر هزینه تحویل کتاب
آمازون در دادگاه عالی اروپا علیه هزینه سه یورویی تحویل کتاب در فرانسه اعتراض کرد. این هزینه که از سوی پاریس برای حمایت از کتابفروشیهای مستقل محلی وضع شده، از نظر آمازون تبعیضآمیز و مغایر با قوانین اتحادیه اروپا است. آمازون این مصوبه را اقدامی حمایتگرایانه میداند که تنها به نفع فروشندگان فیزیکی فرانسوی است.
۱۴۰۴/۱/۱۵ ۱۴:۰۵:۱۱ -
پایان نمایشگرهای لمسی در خودروها؟
صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالشهای جدی مواجه شدهاند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمههای فیزیکی بازمیگردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواسپرتی راننده و نقصهای نرمافزاری که عملکردهای حیاتی خودرو را مختل میکنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستمهای خودرو را شکل میدهند.
۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳ -
هدفونهای Star Wars با افکت صوتی شخصیتهای محبوب منتشر شد
شرکت Audio-Technica هدفونهای بیسیم ATH-CKS50TW2 را با طرحهای اختصاصی شخصیتهای محبوب جنگ ستارگان منتشر کرد. این هدفونها با رنگبندی و افکت صوتی شخصیتهایی مانند گروگو، دارث ویدر و R2-D2 طراحی شدهاند و قیمت آنها 180 دلار است. هدفونها قابلیت حذف نویز، شارژ بیسیم و عمر باتری 40 ساعته دارند.
۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰ -
توقف پشتیبانی Google Assistant از Waze در iOS
شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفتهای را جایگزین خواهد کرد و همزمان روی ویژگی گزارشدهی مکالمهای مبتنی بر هوش مصنوعی کار میکند.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶ -
تغییر لهجه با هوش مصنوعی در تماسهای صوتی توسط Krisp
استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماسهای صوتی راهاندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واجها را تغییر میدهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳ -
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفههای مکالمه
شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه میدهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراکدهنده میتوانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعیتر و روانتری را فراهم میکند.
۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸ -
سرقت ادبی؛ هجوم شرکتهای فناوری به کتابخانههای عمومی
شرکتهای فناوری مانند Meta با استفاده از سایتهای غیرقانونی مانند LibGen، میلیونها کتاب را بدون اجازه نویسندگان برای آموزش هوش مصنوعی دانلود کردهاند. همزمان، دولت ترامپ با قطع بودجه کتابخانههای عمومی، دسترسی مردم به منابع ادبی را محدود میکند. این اقدامات باعث نگرانی نویسندگان و تهدید حقوق مالکیت معنوی آنها شده است.
۱۴۰۴/۱/۳ ۰۵:۰۹:۰۷ -
افزایش محتوای مستهجن در Spotify
اسپاتیفای از حذف حسابهای محتوای مستهجن در پلتفرم ویدیویی خود خبر داد. این شرکت که خدمات پخش موسیقی و پادکست ارائه میدهد، تأکید کرد هیچ درآمدی به این حسابها نداده و آنها را از پلتفرم حذف کرده است. برخی کاربران در جستجوهای خود با محتوای نامناسب مواجه شده بودند که اسپاتیفای آن را خلاف قوانین خود دانسته است.
۱۴۰۴/۱/۳ ۰۵:۰۹:۰۵ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
اسپاتیفای با پلیلیست جدید، کنسرتهای محلی را به گوش موسیقیدوستان میرساند
اسپاتیفای پلیلیست جدید "کنسرتهای نزدیک شما" را راهاندازی کرد که هر هفته ۳۰ آهنگ از هنرمندان محلی را معرفی میکند. این پلیلیست با استفاده از علاقهمندیهای کاربران طراحی شده و اطلاعات کامل رویدادها و لینک بلیت را نیز ارائه میدهد. کاربران باید موقعیت مکانی خود را در اپلیکیشن فعال کنند تا از این امکان استفاده کنند.
۱۴۰۴/۱/۱ ۱۹:۳۸:۳۰ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
رشد مشترکان خدمات پخش موسیقی در آمریکا به بیش از ۱۰۰ میلیون نفر
انجمن صنعت ضبط آمریکا گزارش داد که تعداد مشترکان خدمات پخش موسیقی در این کشور برای اولین بار از مرز ۱۰۰ میلیون نفر گذشت. اسپاتیفای با ۳۶ درصد سهم بازار پیشتاز است و درآمد پخش موسیقی ۸۴ درصد از کل درآمد موسیقی را تشکیل میدهد. افزایش قیمت اشتراکها نیز در رشد درآمد این خدمات موثر بوده است.
۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۴۶ -
تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude
استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیتهای صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعیتر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کردهاند.
۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷ -
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد میکند
آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیتهای هوش مصنوعی الکسا انجام میشود و کاربران دیگر نمیتوانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیتهای جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.
۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶ -
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش میدهد
گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه میکند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتابهای گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.
۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹ -
متا انتشار کتاب افشاگرانه کارمند سابقش را موقتاً متوقف کرد
یک داور حقوقی حکم داد که سارا وین-ویلیامز، کارمند سابق متا، احتمالاً توافق عدم تخریب شرکت را نقض کرده و تا پایان داوری، اجازه تبلیغ یا توزیع کتابش با نام “مردم بی دقت” (Careless People) را ندارد.
این کتاب نگاهی انتقادی به روابط فیس بوک با دولت چین دارد. ناشر آن، مکمیلان، متا را به سرکوب یک نویسنده متهم کرده، اما متا این ادعاها را رد کرده و وین-ویلیامز را کارمندی اخراج شده به دلیل عملکردی ضعیف خوانده است.
این کتاب هماکنون در فهرست پرفروشهای آمازون قرار گرفته است.۱۴۰۳/۱۲/۲۷ ۰۱:۳۱:۴۹ -
حذف گزینه پردازش محلی صدا در دستگاههای هوشمند آمازون
آمازون قابلیت پردازش محلی درخواستهای صوتی در دستگاههای Echo را حذف میکند و تمامی ضبطهای صوتی کاربران به فضای ابری این شرکت ارسال خواهد شد. این تصمیم در راستای گسترش قابلیتهای هوش مصنوعی Alexa با استفاده از پردازش ابری اتخاذ شده است.
۱۴۰۳/۱۲/۲۶ ۲۳:۰۹:۳۹



