-
تحقیق جدید کنگره آمریکا درباره سانسور هوش مصنوعی
جیم جردن رئیس کمیته قضایی مجلس نمایندگان از گوگل، OpenAI و ۱۴ شرکت دیگر خواسته ارتباطاتشان با دولت بایدن را درباره کنترل گفتار در AI افشا کنند. ایلان ماسک و xAI مستثنی شدهاند. برخی شرکتها سیاستهای خود را تغییر دادهاند، اما گوگل همچنان پاسخهای سیاسی را محدود میکند.۱۴۰۳/۱۲/۲۵ ۰۲:۰۵:۴۲ -
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان
شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیتهایی در زبانهای غیرانگلیسی دارد.
۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸ -
گوگل از قابلیت Auracast در گوشیهای اندروید رونمایی کرد
گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک میکند تا در محیطهای پرسر و صدا مانند ایستگاه راهآهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشیهای سامسونگ Galaxy و Google Pixel با تنظیمات شخصیسازی صدا در دسترس خواهد بود.
۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸ -
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل
اپل در حال برنامهریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با بهروزرسانی نرمافزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیشتر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.
۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶ -
اسپاتیفای برنامه انتشار داستانهای کوتاه صوتی را راهاندازی کرد
اسپاتیفای برنامه جدیدی برای انتشار کتابهای صوتی کوتاه راهاندازی کرده که به نویسندگان اجازه میدهد داستانهای کوتاه خود را برای تبدیل به کتاب صوتی ارائه دهند. این شرکت که در زمینه پخش موسیقی و پادکست فعالیت دارد، داستانهای ژانرهای رمانس، معما، تریلر و علمی-تخیلی را میپذیرد و به نویسندگان پیشپرداخت و حق امتیاز میدهد.
۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۲۳ -
گوگل دیپ مایند مدلهای هوش مصنوعی Gemini Robotics را معرفی کرد
گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدلهای جدید Gemini Robotics را رونمایی کرد که به رباتها امکان تعامل با اشیا و محیطهای مختلف را میدهد. این مدلها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیطهای آموزش ندیده نیز عملکرد خوبی دارند.
۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴ -
پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم
Pocket Casts با راهاندازی پخش رایگان پادکست در وبسایت خود، رویکردی باز و دموکراتیک در برابر پلتفرمهای بسته پادکست اتخاذ کرده است. کاربران میتوانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکستها بپردازند و برای امکانات بیشتر میتوانند حساب رایگان ایجاد کنند.
https://pocketcasts.com/۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶ -
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه
نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه میدهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.
۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴ -
هشدار درباره ابزارهای جعل صدا؛ نبود محدودیتهای امنیتی در اکثر نرمافزارهای شبیهسازی صدا
گزارش جدید Consumer Reports نشان میدهد اکثر ابزارهای شبیهسازی صدا فاقد محافظتهای معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام دادهاند و سایر شرکتها صرفاً تأیید حقوقی کاربر را کافی میدانند. کارشناسان هشدار میدهند این ابزارها میتوانند خطر کلاهبرداریهای صوتی را افزایش دهند.
۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲ -
تأخیر در بهبود هوش مصنوعی دستیار صوتی سیری اپل تا سال ۲۰۲۶
اپل اعلام کرد که بهبودهای هوش مصنوعی برای دستیار صوتی سیری که شامل قابلیتهای شخصیسازی و انجام اقدامات در اپلیکیشنها میشود، تا سال ۲۰۲۶ به تعویق افتاده است. این شرکت پیشتر قصد داشت این ویژگیها را در سال ۲۰۲۵ ارائه دهد و در حال ساخت زیرساخت رایانش ابری با تراشههای اختصاصی برای حفظ حریم خصوصی کاربران است.
۱۴۰۳/۱۲/۱۷ ۲۱:۵۴:۰۲ -
نفوذ تبلیغات روسیه در پاسخهای هوش مصنوعی
گزارش جدید نشان میدهد شبکه روسی «پراودا» با انتشار میلیونها مقاله گمراهکننده، در حال تأثیرگذاری بر پاسخهای هوش مصنوعی است. تحلیل NewsGuard نشان داد که هوش مصنوعی حدود ۳۳ درصد اوقات روایتهای نادرست روسی را تکرار میکند که شامل ادعاهایی مانند وجود آزمایشگاههای تسلیحاتی مخفی آمریکا در اوکراین است.
۱۴۰۳/۱۲/۱۷ ۱۹:۴۸:۳۰ -
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیتهای صوتی پیشرفته
شرکت متا در حال آمادهسازی مدل Llama 4 است که با تمرکز بر قابلیتهای صوتی پیشرفته طراحی شده و کاربران میتوانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همهکاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع دادهها خواهد بود. رقابت با مدلهای هوش مصنوعی چینی DeepSeek، متا را به توسعه سریعتر Llama واداشته است.
۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰ -
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانیهای امنیتی
شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیهسازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفادههای احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.
۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶ -
گوگل قابلیت جدید هوش مصنوعی در جستجو را راهاندازی میکند
گوگل قابلیت جدید "AI Mode" را در سرویس جستجوی خود معرفی کرد که به کاربران اجازه میدهد سؤالات پیچیده و چندبخشی را مستقیماً در جستجو مطرح کنند. این ویژگی با استفاده از نسخه اختصاصی Gemini 2.0 طراحی شده و برای مشترکان Google One AI Premium در دسترس است. کاربران میتوانند سؤالات پیچیده را بپرسند و با دریافت پاسخهای تفصیلی همراه با لینک منابع، جستجوی خود را ادامه دهند.
۱۴۰۳/۱۲/۱۵ ۲۱:۲۸:۳۱ -
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی
پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم میکند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریعتر و کارآمدتر میسازد و در شبکههای اجتماعی با استقبال گستردهای مواجه شده است.
۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵ -
پادکستسازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد
podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعهدهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینههای تولید و افزایش کیفیت تبدیل متن به صدا است.۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱ -
تأخیر در هوش مصنوعی Siri اپل
اپل در راه اندازی هوش مصنوعی Siri با تأخیر جدی مواجه شده است. بر اساس گزارشها، Siri هوشمند احتمالاً تا بهار ۲۰۲۶ و با نسخه iOS 19.4 عرضه خواهد شد. این تأخیر میتواند فرصتی برای بهبود قابلیتهای هوش مصنوعی و ارائه تجربه کاربری بهتر باشد. اپل در حال تلاش برای ادغام معماری قدیمی سیری با نرمافزارهای مدرن هوش مصنوعی است.
۱۴۰۳/۱۲/۱۴ ۰۰:۲۵:۵۰ -
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاههای موبایل
استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاههای موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.
۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶ -
رباتهای هوشمند با قابلیت تغییر شکل و حالت فیزیکی
محققان دانشگاه کالیفرنیا رباتهای کوچکی را توسعه دادهاند که میتوانند به صورت جمعی عمل کنند و شکل خود را تغییر دهند. این رباتها با الهام از بافتهای جنینی طراحی شدهاند و قابلیت حرکت، اتصال و دریافت دستورات را دارند. اگرچه فناوری هنوز در مراحل اولیه است، اما نوید پیشرفتهای آینده در رباتیک را میدهد.
۱۴۰۳/۱۲/۱۲ ۰۰:۴۶:۴۸ -
متا در تدارک راهاندازی اپلیکیشن مستقل هوش مصنوعی
شرکت متا قصد دارد اپلیکیشن مستقل هوش مصنوعی خود با نام متا AI را در سهماهه دوم سال مالی جاری منتشر کند. این اپلیکیشن که هماکنون تنها در وبسایت و اپلیکیشنهای خانواده متا در دسترس است، با هدف رقابت با چتباتهای هوش مصنوعی مانند ChatGPT توسعه مییابد. متا همچنین برنامه راهاندازی سرویس اشتراک پولی برای این دستیار هوش مصنوعی را دارد.
۱۴۰۳/۱۲/۱۰ ۰۳:۱۹:۱۸ -
رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن
استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی میکند و در برخی زبانها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیتهایی مانند تشخیص گوینده و زمانبندی کلمات را دارد.
۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹ -
گوگل در حال جایگزینی دستیار صوتی با Gemini در اندروید
گوگل در حال تغییر دستیار صوتی اندروید از "Hey Google" به "Hey Gemini" است. این تغییر نشان میدهد که شرکت قصد دارد هوش مصنوعی Gemini را به طور گسترده در سیستم عامل اندروید ادغام کند. هدف اصلی افزایش استفاده کاربران از این دستیار هوش مصنوعی و رقابت با ChatGPT است.
۱۴۰۳/۱۲/۸ ۲۱:۱۴:۱۱ -
یوتیوب با یک میلیارد بیننده ماهانه، پادکست را تسخیر کرد
یوتیوب با عبور از مرز یک میلیارد بیننده ماهانه پادکست، سلطه خود را در عرصه محتوای صوتی-تصویری تثبیت کرد. این پلتفرم با تمرکز بر فرمت ویدیویی و تغییر در نحوه نمایش تبلیغات میانبرنامهای، رقبای اصلی خود مانند اسپاتیفای را تحت فشار قرار داده است.
۱۴۰۳/۱۲/۸ ۲۱:۰۳:۴۵ -
الکسای آمازون، دستیار خرید مواد غذایی با هوش مصنوعی پیشرفته
آمازون قابلیتهای جدیدی را برای دستیار صوتی الکسا معرفی کرد که به کاربران اجازه میدهد با استفاده از گفتگوی طبیعی، فهرست خرید مواد غذایی را تهیه کنند. این سرویس جدید امکان سفارش از Amazon Fresh و سایر شرکای توزیع مواد غذایی را فراهم میکند و قادر به درک درخواستهای پیچیده و ارائه پیشنهادات غذایی است.
۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۹ -
الکسای جدید آمازون با هوش مصنوعی پیشرفته رونمایی شد
آمازون در رویداد سالانه خود، نسخه پیشرفته الکسا با قابلیتهای هوش مصنوعی تولیدی را معرفی کرد. این دستیار صوتی اکنون میتواند اسناد و ایمیلها را بررسی، اطلاعات مهم را استخراج و خلاصه کند. همچنین قابلیت پاسخگویی به سوالات درباره اسناد آپلود شده، مدیریت تقویم و کنترل دستگاههای خانگی را دارد.
این نسخه با استفاده از مدلهای هوش مصنوعی مختلف از جمله مدلهای داخلی آمازون و شرکت Anthropic، قادر به انجام وظایف پیچیده است.
الکسای جدید میتواند وبسایتها را جستجو کرده، خدمات مختلف را اجرا کند و حتی برای کاربر تعمیرکار پیدا کند.۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۷ -
آمازون الکسا را با هوش مصنوعی پیشرفته بازسازی میکند
آمازون در حال معرفی نسل جدید الکسا با قابلیتهای هوش مصنوعی تولیدی است که میتواند چندین درخواست را پشت سر هم پاسخ دهد. این سرویس جدید که پروژه داخلی "بانیان" نام دارد، احتمالاً ماهانه 10 دلار هزینه خواهد داشت و قابلیت انجام اقدامات به صورت مستقل را خواهد داشت. آمازون همچنان نسخه کلاسیک الکسا را نیز رایگان ارائه خواهد داد.
۱۴۰۳/۱۲/۸ ۱۶:۱۹:۵۹ -
راهاندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs
شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتابهای صوتی با فناوری هوش مصنوعی راهاندازی کرد. این پلتفرم به نویسندگان اجازه میدهد کتابهای صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.
۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰ -
آمازون در آستانه معرفی نسخه هوش مصنوعی پیشرفته الکسا
آمازون در رویدادی تخصصی، نسخه جدید دستیار هوشمند الکسا را معرفی میکند. این نسخه پیشرفته با قابلیتهای هوش مصنوعی پیشرفته طراحی شده و میتواند چندین درخواست را همزمان پاسخ دهد. الکسای جدید با قیمت ماهانه 5 تا 10 دلار ارائه خواهد شد و قابلیت انجام خودکار درخواست ها را دارد.
۱۴۰۳/۱۲/۷ ۲۱:۴۳:۵۱ -
اسپاتیفای مجوز انتشار کتابهای صوتی با صدای هوش مصنوعی را صادر کرد
اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتابهای صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان میتوانند کتابهای صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنشهای متفاوت در جامعه نشر همراه شده و نگرانیهایی درباره کیفیت محتوای تولید شده وجود دارد.
۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴ -
استارتاپ سانس با فناوری هوش مصنوعی، تبعیض لهجه در مراکز تماس را کاهش میدهد
استارتاپ سانس با استفاده از هوش مصنوعی، نرمافزاری توسعه داده که قادر به تعدیل لهجه گویندگان در زمان واقعی است. این شرکت که در سال ۲۰۲۰ تأسیس شده، با هدف کاهش تبعیض لهجهای در مراکز تماس فعالیت میکند. سانس با فناوری هوش مصنوعی خود توانسته درآمد سالانه ۲۱ میلیون دلاری کسب کند و اخیراً ۶۵ میلیون دلار سرمایه جذب کرده است.
۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۳



