-
آمازون با خلاصههای صوتی هوشمند، خرید را متحول میکند
🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش میکند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، میتوانید توضیحاتی صوتی درباره ویژگیها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمهای تولید شدهاند تا خرید راحتتر و سریعتری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد بهزودی آن را گسترش دهد. 🌍🛍️۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶ -
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد
📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیهسازیشده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروشها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصیاش میگوید و موضعی موافق با حق سقط جنین اتخاذ میکند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطهعطفی در کتابهای صوتی میداند. 🚀🔊۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱ -
AMD با Radeon RX 9060 XT به نبرد کارتهای گرافیکی اقتصادی رفت
🎮 AMD در نمایشگاه Computex از کارت گرافیک Radeon RX 9060 XT رونمایی کرد؛ مدلی اقتصادی با معماری RDNA 4 و دو نسخه ۸ و ۱۶ گیگابایتی GDDR6. 🧠📦
این کارت با توان اجرای بازیها در رزولوشن 1440p عرضه میشود و فرکانس تقویتی آن ۳.۱۳ گیگاهرتز است.⚡🖥️
هنوز قیمت آن اعلام نشده، اما AMD امیدوار است با قیمتگذاری مناسب، رقیبی جدی برای RTX 5060 Ti انویدیا باشد. 💰🆚
با توجه به کمبود موجودی مدلهای ارزان انویدیا، AMD شانس خوبی برای جذب کاربران حساس به قیمت دارد. 📉🛒۱۴۰۴/۳/۱ ۱۲:۱۳:۳۴ -
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست
🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار بهصورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفتوگو با افراد به زبانهای مختلف را در زمان واقعی فراهم میکند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوههای انگلیسیزبان میتوانند با مادربزرگ اسپانیاییزبانشان راحت صحبت کنند یا شرکتهای بینالمللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه میشود و صدای اصلی شخص نیز بهصورت کمرنگ در پسزمینه شنیده میشود 🎙️🔊۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵ -
آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون
🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون میتوانند کتابهای صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
اسپاتیفای در سال ۲۰۲۲ امکان خرید کتابهای صوتی را به دلیل قوانین سختگیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲ -
هوش مصنوعی، گیمینگ و فناوری در کامپیوتکس ۲۰۲۵
🎮 رویداد Computex 2025 در تایوان با تمرکز بر فناوری و هوش مصنوعی در حال برگزاری است.
انویدیا با معرفی GPU جدید RTX 5060 و گسترش ابزارهای هوش مصنوعیاش صحنه را داغ کرد، به همراه لپتاپهای جدید Razer Blade 14 و Acer Predator Triton 14 AI 🖥️ اما جذابترین بخش شاید گجتهای متفاوت نمایشگاه امسال باشد:
✅ Elgato ماژولهای جدید Stream Deck را معرفی کرده تا کاربران معمولی هم بتوانند دکمههای میانبر دلخواه بسازند ⌨️
✅ Asus ROG کیبوردی دو تکه معرفی کرده که هم برای گیم و هم سلامت مچ کاربرد دارد 🎮
✅ Corsair ماوس جدیدی با ۱۶ دکمه قابل برنامهریزی برای گیمرها و تولیدکنندگان محتوا آورده🖱️
✅ Nvidia ابزاری بهنام G-Assist ساخته که با کمک هوش مصنوعی قابل شخصیسازی است و حتی بدون دانش برنامهنویسی میتوان برایش پلاگین ساخت 🤖
✅ Hyte کیس کامپیوترهایی با رنگهای خاص مثل شیر توتفرنگی و طراحی متفاوت معرفی کرده که شبیه گلفروشیاند تا سیستم گیمینگ! 🌸🖥️
✅ Dell هم لپتاپ هوش مصنوعی جدیدی معرفی کرده که با تراشه AI اختصاصی خود، قدرت پردازش بالا و مصرف کمی دارد.💻۱۴۰۴/۲/۳۱ ۱۲:۴۲:۵۸ -
Razer Blade 14؛ تجسم قدرت در نازکترین حالت ممکن
🎮💻 باریکترین مدل Blade 14 با ضخامت ۰.۶۲ اینچ و وزن ۱.۶۳ کیلوگرم رونمایی شد. قیمت از ۲۳۰۰ دلار با پردازنده گرافیکی Nvidia RTX 5060 شروع میشود و برای RTX 5070 به ۲۷۰۰ دلار میرسد.
⚡️ پردازنده AMD Ryzen AI 9، حداکثر ۶۴ گیگابایت رم LPDDR5X با سرعت ۸۰۰۰ مگاهرتز و نمایشگر 3K با نرخ تازهسازی ۱۲۰ هرتز. 🌐📺
🔊 صدای قدرتمند با سیستم صوتی THX Spatial Audio 🎧 و بدنه آلومینیومی مقاوم.
🚀 باتری تا ۳ ساعت گیمینگ را پشتیبانی میکند. اگر به دنبال یک لپتاپ گیمینگ سبک و قدرتمند هستید، Razer Blade 14 گزینه جذابی است، البته به شرطی که بودجه کافی داشته باشید! 🔥۱۴۰۴/۲/۳۰ ۲۳:۲۳:۰۱ -
RTX 5060 انویدیا، کارت گرافیک رویایی برای گیمرها
🎮 انویدیا کارت گرافیک GeForce RTX 5060 را با قیمت ۳۰۰ دلار عرضه کرد. این کارت برای بازیهای 1080p طراحی شده و از فناوری DLSS 4 و هوش مصنوعی برای افزایش فریم استفاده میکند. 🤖
اما درایورهای رسمی هنوز منتشر نشده و بررسی کارایی آن نامشخص است. 📉 همزمان، AMD Radeon RX 9060 XT هم در راه است. 🔥۱۴۰۴/۲/۳۰ ۲۲:۳۰:۵۳ -
هوش مصنوعی، راهکار جدید Audible برای گسترش کتابهای صوتی
🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتابهای چاپی و الکترونیکی را به کتابهای صوتی با صدای هوش مصنوعی تبدیل میکند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبانهای مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه میشود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را بهزودی فعال میکند. اما برخی ناشران نگران کاهش کیفیت کتابهای صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتابهای صوتی و رقابت با اپل و اسپاتیفای انجام میشود.۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶ -
Odyssey OLED G660SF؛ غول 500 هرتزی سامسونگ برای گیمرهای حرفهای
🎮📺 سامسونگ از مانیتور جدید Odyssey OLED G660SF با نرخ تازهسازی 500 هرتز رونمایی کرد، اما آیا واقعاً این سرعت فوقالعاده لازم است؟ ⚡🤔
📊 این مانیتور 1440p با زمان پاسخگویی 0.03 میلیثانیه طراحی شده است. با این حال، تنها گیمرهای حرفهای میتوانند تفاوت بین 240 هرتز و 500 هرتز را تشخیص دهند. 🎮
💰 این مانیتور با قیمت نزدیک به ۱۵۰۰ دلار عرضه خواهد شد. اما آیا این سرعت فوقالعاده ارزش هزینه را دارد؟۱۴۰۴/۲/۲۹ ۲۳:۲۰:۵۳ -
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small
🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشیهای هوشمند هم کار میکند و در کمتر از ۸ ثانیه صدا تولید میکند. 📱
✅ برخلاف دیگر مدلها، فقط از آهنگهای رایگان برای آموزش استفاده کرده و نگرانی کپیرایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی میکند و مناسب تولید افکتهای صوتی و نمونههای کوتاه است. 🎧۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵ -
Alexa+ در سراشیبی ناکامی
🚨 سرویس هوش مصنوعی جدید Alexa+ آمازون با مشکلاتی در دسترسی کاربران مواجه شده است.
با وجود اعلام آمازون مبنی بر دسترسی صدها هزار کاربر، شواهد عمومی از کاربران واقعی Alexa+ بسیار کم است. ❌
Alexa+ که با قابلیتهای جدید هوش مصنوعی طراحی شده، قرار بود دستیار صوتی آمازون را احیا کند، اما کاربران از سرعت پایین و گاهی اطلاعات نادرست شکایت دارند. ⚡🤖۱۴۰۴/۲/۲۸ ۱۹:۲۸:۳۷ -
پادکسترها به شمارش پخش عمومی اسپاتیفای اعتراض کردند
🎧 اسپاتیفای هفته گذشته قصد داشت تعداد پخش همه پادکستها را عمومی کند، اما با مخالفت شدید سازندگان پادکست مواجه شد.
منتقدان معتقد بودند این اقدام باعث میشود پادکستهای کوچکتر شانسی برای جذب مخاطب نداشته باشند.
در نهایت اسپاتیفای عقبنشینی کرد و اعلام کرد فقط پادکستهای بالای ۵۰ هزار پخش، تعداد پخش آنها نمایش داده خواهد شد.
این تصمیم تلاشی برای ایجاد توازن بین پادکستهای بزرگ و کوچک است.۱۴۰۴/۲/۲۸ ۰۲:۴۴:۵۷ -
کنسول جیبی Anbernic که همه کنسولهای کلاسیک را اجرا میکند
شرکت Anbernic یک دستگاه بازی جدید به نام RG34XXSP با طراحی تاشو و قیمت 60 دلاری معرفی کرد که امکان اجرای بازیهای رترو از Game Boy تا Nintendo 64 را دارد و به همراه دو جویاستیک برای تجربه بهتر بازیها ارائه می شود.🎮
دارای ۲ گیگابایت رم و حافظه داخلی ۶۴ گیگ به همراه پردازنده H700 چهار هستهای ARM Cortex-A53.۱۴۰۴/۲/۲۷ ۲۳:۰۶:۳۶ -
Acer Predator Triton 14 AI؛ لپتاپی برای گیمرها و هنرمندان
ایسر از لپتاپ جدید Predator Triton 14 AI رونمایی کرد. 💻✏️ این دستگاه با صفحه لمسی هپتیک (بازخورد لمسی) که از قلم پشتیبانی میکند، تجربهای شبیه کار با کاغذ را برای هنرمندان دیجیتال فراهم میکند. 🎨🖌️
📊 مشخصات: پردازنده Intel Core Ultra 9، کارت گرافیک Nvidia RTX 5070، تا 32 گیگابایت رم LPDDR5X و حداکثر 2 ترابایت حافظه SSD. 💾 صفحه نمایش OLED با رزولوشن 1440p و نرخ تازهسازی 120 هرتز. 🌐
🎮 ترکیب قدرت گیمینگ و خلاقیت دیجیتال؛ مناسب برای گیمرها و هنرمندان.۱۴۰۴/۲/۲۷ ۲۰:۲۹:۵۳ -
گوگل قابلیت صوتیسازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد
گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکستهایی هوش مصنوعیمحور از اسناد کاربران تولید میکند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون میتوانند زبان تولید پادکستها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصیسازیشده را فراهم میکند. این ابزار برای مثال به دانشآموزان کمک میکند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبانهای جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر میشود.
۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴ -
ورود هوش مصنوعی به منوی رستورانها
شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخگویی تلفنی رستورانها و کسبوکارها رونمایی کرد. این سیستمها بدون نیاز به نصب پیچیده و API، از اطلاعات کسبوکار مثل پیام خوشآمد، راهنمای تلفظ و قوانین تماس استفاده میکنند. مثلاً میتوانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماسهای اسپم، تحلیل تماس و انتقال تماسهای پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسبوکار داده میشود.۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶ -
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد
برند CMF از شرکت Nothing سه مدل ایرپاد بیسیم جدید با نامهای Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی میکنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدلهای بالاتر دارای میکروفونهای بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدلهای گرانتر از صدای فضایی ۳D پشتیبانی میکنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزانتر بهتر است اما همچنان در برابر ایرپادهای گرانتر بازار حرفی برای گفتن ندارد.۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲ -
نتفلیکس زیرنویس جدید خود را معرفی کرد
نتفلیکس قابلیت جدیدی به زیرنویسهای خود اضافه کرده که فقط دیالوگها را نشان میدهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شدهاند. این ویژگی که با انتخاب گزینه “English” بهجای “English (CC)” فعال میشود، برای کسانی طراحی شده که فقط میخواهند گفتوگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویسهای کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و بهزودی در دیگر آثار اصلی نتفلیکس و به تمام زبانها ارائه خواهد شد.
۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵ -
هوش مصنوعی عینکهای هوشمند متا به اروپا گسترش یافت
متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینکهای هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون میتوانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما بهدلیل قوانین سختگیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیتهای جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک میبیند. این ویژگیها از هفته آینده در کشورهای اروپایی پشتیبانیشده فعال میشوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوریهای پوشیدنی و هوش مصنوعی است.۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴ -
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند
دو دانشجوی کرهای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساختهاند که میتواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر میدهد. این مدل رایگان است و در پلتفرمهای Hugging Face و GitHub قابل دسترسی است. کاربران میتوانند لحن صدا، مکثها، سرفه و خنده را در گفتوگوها تنظیم کنند و حتی صدای واقعی افراد را شبیهسازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه دادههایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیتهای اجتماعی و چندزبانه بسازند.
۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱ -
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی
استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستمها به کسبوکارها کمک میکنند تا تماسهای مشتریان را خودکار مدیریت کنند و وظایف سادهای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماسهای پیچیده به اپراتور انسانی واگذار میشود. این دستیارها با صدای بازیگران واقعی ساخته میشوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم ششنفره پردازش کردهاند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.
۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸ -
سرمایهگذاری Spotify برای گسترش کتابهای صوتی غیر انگلیسی
اسپاتیفای برای افزایش تولید کتابهای صوتی به زبانهای غیر انگلیسی، بهویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایهگذاری میکند. این اقدام بهدلیل کمبود کتابهای صوتی در این زبانها و رقابت با پلتفرمهایی مثل Audible انجام میشود.
در فرانسه تنها ۳٪ از کتابها بهصورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای میخواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنشهایی در صنعت نشر مواجه شده است.۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴ -
بازگشت پیشفروش کنسول Nintendo Switch 2 با قیمت قبلی
نینتندو پیشفروش کنسول Switch 2 را از سر گرفت. این کنسول با قیمت 450 دلار و نسخه باندل با بازی Mario Kart World به قیمت 500 دلار در تاریخ 24 آوریل آغاز میشود. تاریخ عرضه همچنان 5 ژوئن است. علاوه بر این، قیمت لوازم جانبی مانند دستهها و دوربین کمی افزایش یافته است.
۱۴۰۴/۱/۳۰ ۲۳:۴۴:۵۱ -
عرضه گجت جدید نانولیف؛ راهحلی برای میزهای شلوغ و نورپردازی حرفهای
شرکت Nanoleaf محصول جدیدی برای گیمرها معرفی کرده که هم چراغ RGB است، هم شارژر، و هم نظمدهنده وسایل. با طراحی دوطرفه، امکان نصب وسایل گیمینگ مثل کنترلر و هدست را فراهم میکند و در عین حال فضای میز را با نورهای رنگی زیبا میسازد. این گجت ۶۰ دلاری دارای پورتهای USB برای شارژ و قابلیت کنترل نور از طریق اپلیکیشن است و حتی میتواند با موسیقی هماهنگ شود. برای میزهای شلوغ گیمرها، ترکیبی از کارایی و زیبایی است.
۱۴۰۴/۱/۲۷ ۲۳:۴۸:۳۴ -
هوش مصنوعی گوگل به رمزگشایی زبان دلفینها کمک میکند
گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفینها کمک میکند. این مدل با دادههای پروژهای علمی روی دلفینهای آتلانتیک آموزش دیده و حتی میتواند صداهایی شبیه دلفینها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفینها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام میشد، اما حالا با قدرت بیشتر و عملکرد دقیقتر ادامه مییابد.۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵ -
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول میکند
لایو کیت (LiveKit) پلتفرمی متنباز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماسهای ۹۱۱ آمریکا استفاده میشود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعهدهنده دارد و شرکتهایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده میکنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷ -
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیتتر تا اسکن اسناد و خلاصه پیامهای صوتی
واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخشهای چت، تماس و کانالها اضافه کرده است. از این پس، در گروهها میتوان دید چه کسانی آنلاین هستند، نوتیفیکیشنها را فقط برای پیامهای مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگنمایی (زوم) انجام داد.
کاربران آیفون همچنین میتوانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماسهای تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چتهای دو نفره، پاسخ به دعوتها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.
در بخش کانالها نیز، ادمینها میتوانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیامهای صوتی را برای دنبالکنندگان ارسال کنند.۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶ -
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic
آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که میتواند صدا را بسیار طبیعی تولید و گفتوگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفتهتر عمل میکند و حتی با مدلهای پیشرفتهی شرکتهایی مثل OpenAI و گوگل رقابت میکند.
این مدل بهگونهای طراحی شده که مکالمات را روانتر و با درک بهتری از صدا، حتی در محیطهای پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون میگوید این مدل تا ۸۰٪ ارزانتر از برخی رقباست و سرعت پاسخدهی بالاتری هم دارد.۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰



