حالت صوتی چت‌بات - صفحه 4 - اخبار فناوری - EcoFori

تحقیق جدید کنگره آمریکا درباره سانسور هوش مصنوعی

جیم جردن رئیس کمیته قضایی مجلس نمایندگان از گوگل، OpenAI و ۱۴ شرکت دیگر خواسته ارتباطاتشان با دولت بایدن را درباره کنترل گفتار در AI افشا کنند. ایلان ماسک و xAI مستثنی شده‌اند. برخی شرکت‌ها سیاست‌های خود را تغییر داده‌اند، اما گوگل همچنان پاسخ‌های سیاسی را محدود می‌کند.

۱۴۰۳/۱۲/۲۵ ۰۲:۰۵:۴۲
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
اسپاتیفای برنامه انتشار داستان‌های کوتاه صوتی را راه‌اندازی کرد

اسپاتیفای برنامه جدیدی برای انتشار کتاب‌های صوتی کوتاه راه‌اندازی کرده که به نویسندگان اجازه می‌دهد داستان‌های کوتاه خود را برای تبدیل به کتاب صوتی ارائه دهند. این شرکت که در زمینه پخش موسیقی و پادکست فعالیت دارد، داستان‌های ژانرهای رمانس، معما، تریلر و علمی-تخیلی را می‌پذیرد و به نویسندگان پیش‌پرداخت و حق امتیاز می‌دهد.

۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۲۳
گوگل دیپ مایند مدل‌های هوش مصنوعی Gemini Robotics را معرفی کرد

گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدل‌های جدید Gemini Robotics را رونمایی کرد که به ربات‌ها امکان تعامل با اشیا و محیط‌های مختلف را می‌دهد. این مدل‌ها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیط‌های آموزش ندیده نیز عملکرد خوبی دارند.

۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴
پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم

Pocket Casts با راه‌اندازی پخش رایگان پادکست در وب‌سایت خود، رویکردی باز و دموکراتیک در برابر پلتفرم‌های بسته پادکست اتخاذ کرده است. کاربران می‌توانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکست‌ها بپردازند و برای امکانات بیشتر می‌توانند حساب رایگان ایجاد کنند.

https://pocketcasts.com/

۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه

نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه می‌دهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.

۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴
هشدار درباره ابزارهای جعل صدا؛ نبود محدودیت‌های امنیتی در اکثر نرم‌افزارهای شبیه‌سازی صدا

گزارش جدید Consumer Reports نشان می‌دهد اکثر ابزارهای شبیه‌سازی صدا فاقد محافظت‌های معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام داده‌اند و سایر شرکت‌ها صرفاً تأیید حقوقی کاربر را کافی می‌دانند. کارشناسان هشدار می‌دهند این ابزارها می‌توانند خطر کلاهبرداری‌های صوتی را افزایش دهند.

۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲
تأخیر در بهبود هوش مصنوعی دستیار صوتی سیری اپل تا سال ۲۰۲۶

اپل اعلام کرد که بهبودهای هوش مصنوعی برای دستیار صوتی سیری که شامل قابلیت‌های شخصی‌سازی و انجام اقدامات در اپلیکیشن‌ها می‌شود، تا سال ۲۰۲۶ به تعویق افتاده است. این شرکت پیش‌تر قصد داشت این ویژگی‌ها را در سال ۲۰۲۵ ارائه دهد و در حال ساخت زیرساخت رایانش ابری با تراشه‌های اختصاصی برای حفظ حریم خصوصی کاربران است.

۱۴۰۳/۱۲/۱۷ ۲۱:۵۴:۰۲
نفوذ تبلیغات روسیه در پاسخ‌های هوش مصنوعی

گزارش جدید نشان می‌دهد شبکه روسی «پراودا» با انتشار میلیون‌ها مقاله گمراه‌کننده، در حال تأثیرگذاری بر پاسخ‌های هوش مصنوعی است. تحلیل NewsGuard نشان داد که هوش مصنوعی حدود ۳۳ درصد اوقات روایت‌های نادرست روسی را تکرار می‌کند که شامل ادعاهایی مانند وجود آزمایشگاه‌های تسلیحاتی مخفی آمریکا در اوکراین است.

۱۴۰۳/۱۲/۱۷ ۱۹:۴۸:۳۰
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
گوگل قابلیت جدید هوش مصنوعی در جستجو را راه‌اندازی می‌کند

گوگل قابلیت جدید "AI Mode" را در سرویس جستجوی خود معرفی کرد که به کاربران اجازه می‌دهد سؤالات پیچیده و چندبخشی را مستقیماً در جستجو مطرح کنند. این ویژگی با استفاده از نسخه اختصاصی Gemini 2.0 طراحی شده و برای مشترکان Google One AI Premium در دسترس است. کاربران می‌توانند سؤالات پیچیده را بپرسند و با دریافت پاسخ‌های تفصیلی همراه با لینک منابع، جستجوی خود را ادامه دهند.

۱۴۰۳/۱۲/۱۵ ۲۱:۲۸:۳۱
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد

‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
تأخیر در هوش مصنوعی Siri اپل

اپل در راه اندازی هوش مصنوعی Siri با تأخیر جدی مواجه شده است. بر اساس گزارش‌ها، Siri هوشمند احتمالاً تا بهار ۲۰۲۶ و با نسخه iOS 19.4 عرضه خواهد شد. این تأخیر می‌تواند فرصتی برای بهبود قابلیت‌های هوش مصنوعی و ارائه تجربه کاربری بهتر باشد. اپل در حال تلاش برای ادغام معماری قدیمی سیری با نرم‌افزارهای مدرن هوش مصنوعی است.

۱۴۰۳/۱۲/۱۴ ۰۰:۲۵:۵۰
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاه‌های موبایل

استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاه‌های موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.

۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶
رباتهای هوشمند با قابلیت تغییر شکل و حالت فیزیکی

محققان دانشگاه کالیفرنیا رباتهای کوچکی را توسعه داده‌اند که می‌توانند به صورت جمعی عمل کنند و شکل خود را تغییر دهند. این ربات‌ها با الهام از بافت‌های جنینی طراحی شده‌اند و قابلیت حرکت، اتصال و دریافت دستورات را دارند. اگرچه فناوری هنوز در مراحل اولیه است، اما نوید پیشرفت‌های آینده در رباتیک را می‌دهد.

۱۴۰۳/۱۲/۱۲ ۰۰:۴۶:۴۸
متا در تدارک راه‌اندازی اپلیکیشن مستقل هوش مصنوعی

شرکت متا قصد دارد اپلیکیشن مستقل هوش مصنوعی خود با نام متا AI را در سه‌ماهه دوم سال مالی جاری منتشر کند. این اپلیکیشن که هم‌اکنون تنها در وب‌سایت و اپلیکیشن‌های خانواده متا در دسترس است، با هدف رقابت با چت‌بات‌های هوش مصنوعی مانند ChatGPT توسعه می‌یابد. متا همچنین برنامه راه‌اندازی سرویس اشتراک پولی برای این دستیار هوش مصنوعی را دارد.

۱۴۰۳/۱۲/۱۰ ۰۳:۱۹:۱۸
رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن

استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی می‌کند و در برخی زبان‌ها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیت‌هایی مانند تشخیص گوینده و زمان‌بندی کلمات را دارد.

۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹
گوگل در حال جایگزینی دستیار صوتی با Gemini در اندروید

گوگل در حال تغییر دستیار صوتی اندروید از "Hey Google" به "Hey Gemini" است. این تغییر نشان می‌دهد که شرکت قصد دارد هوش مصنوعی Gemini را به طور گسترده در سیستم عامل اندروید ادغام کند. هدف اصلی افزایش استفاده کاربران از این دستیار هوش مصنوعی و رقابت با ChatGPT است.

۱۴۰۳/۱۲/۸ ۲۱:۱۴:۱۱
یوتیوب با یک میلیارد بیننده ماهانه، پادکست را تسخیر کرد

یوتیوب با عبور از مرز یک میلیارد بیننده ماهانه پادکست، سلطه خود را در عرصه محتوای صوتی-تصویری تثبیت کرد. این پلتفرم با تمرکز بر فرمت ویدیویی و تغییر در نحوه نمایش تبلیغات میان‌برنامه‌ای، رقبای اصلی خود مانند اسپاتیفای را تحت فشار قرار داده است.

۱۴۰۳/۱۲/۸ ۲۱:۰۳:۴۵
الکسای آمازون، دستیار خرید مواد غذایی با هوش مصنوعی پیشرفته

آمازون قابلیت‌های جدیدی را برای دستیار صوتی الکسا معرفی کرد که به کاربران اجازه می‌دهد با استفاده از گفتگوی طبیعی، فهرست خرید مواد غذایی را تهیه کنند. این سرویس جدید امکان سفارش از Amazon Fresh و سایر شرکای توزیع مواد غذایی را فراهم می‌کند و قادر به درک درخواست‌های پیچیده و ارائه پیشنهادات غذایی است.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۹
الکسای جدید آمازون با هوش مصنوعی پیشرفته رونمایی شد

آمازون در رویداد سالانه خود، نسخه پیشرفته الکسا با قابلیت‌های هوش مصنوعی تولیدی را معرفی کرد. این دستیار صوتی اکنون می‌تواند اسناد و ایمیل‌ها را بررسی، اطلاعات مهم را استخراج و خلاصه کند. همچنین قابلیت پاسخگویی به سوالات درباره اسناد آپلود شده، مدیریت تقویم و کنترل دستگاه‌های خانگی را دارد.
این نسخه با استفاده از مدل‌های هوش مصنوعی مختلف از جمله مدل‌های داخلی آمازون و شرکت Anthropic، قادر به انجام وظایف پیچیده است.
الکسای جدید می‌تواند وب‌سایت‌ها را جستجو کرده، خدمات مختلف را اجرا کند و حتی برای کاربر تعمیرکار پیدا کند.

۱۴۰۳/۱۲/۸ ۲۰:۵۳:۰۷
آمازون الکسا را با هوش مصنوعی پیشرفته بازسازی می‌کند

آمازون در حال معرفی نسل جدید الکسا با قابلیت‌های هوش مصنوعی تولیدی است که می‌تواند چندین درخواست را پشت سر هم پاسخ دهد. این سرویس جدید که پروژه داخلی "بانیان" نام دارد، احتمالاً ماهانه 10 دلار هزینه خواهد داشت و قابلیت انجام اقدامات به صورت مستقل را خواهد داشت. آمازون همچنان نسخه کلاسیک الکسا را نیز رایگان ارائه خواهد داد.

۱۴۰۳/۱۲/۸ ۱۶:۱۹:۵۹
راه‌اندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs

شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتاب‌های صوتی با فناوری هوش مصنوعی راه‌اندازی کرد. این پلتفرم به نویسندگان اجازه می‌دهد کتاب‌های صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.

۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰
آمازون در آستانه معرفی نسخه هوش مصنوعی پیشرفته الکسا

آمازون در رویدادی تخصصی، نسخه جدید دستیار هوشمند الکسا را معرفی می‌کند. این نسخه پیشرفته با قابلیت‌های هوش مصنوعی پیشرفته طراحی شده و می‌تواند چندین درخواست را همزمان پاسخ دهد. الکسای جدید با قیمت ماهانه 5 تا 10 دلار ارائه خواهد شد و قابلیت انجام خودکار درخواست ها را دارد.

۱۴۰۳/۱۲/۷ ۲۱:۴۳:۵۱
اسپاتیفای مجوز انتشار کتاب‌های صوتی با صدای هوش مصنوعی را صادر کرد

اسپاتیفای همکاری با ElevenLabs را آغاز کرده و اجازه انتشار کتاب‌های صوتی با صدای مصنوعی را در پلتفرم خود داده است. نویسندگان می‌توانند کتاب‌های صوتی خود را در ۲۹ زبان با استفاده از فناوری هوش مصنوعی تولید کنند. این اقدام با واکنش‌های متفاوت در جامعه نشر همراه شده و نگرانی‌هایی درباره کیفیت محتوای تولید شده وجود دارد.

۱۴۰۳/۱۲/۲ ۲۱:۳۶:۲۴
استارتاپ سانس با فناوری هوش مصنوعی، تبعیض لهجه در مراکز تماس را کاهش می‌دهد

استارتاپ سانس با استفاده از هوش مصنوعی، نرم‌افزاری توسعه داده که قادر به تعدیل لهجه گویندگان در زمان واقعی است. این شرکت که در سال ۲۰۲۰ تأسیس شده، با هدف کاهش تبعیض لهجه‌ای در مراکز تماس فعالیت می‌کند. سانس با فناوری هوش مصنوعی خود توانسته درآمد سالانه ۲۱ میلیون دلاری کسب کند و اخیراً ۶۵ میلیون دلار سرمایه جذب کرده است.

۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۳

نمایش بیشتر