دستیار صوتی - صفحه 4 - اخبار فناوری - EcoFori

هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
استارتاپ هوش مصنوعی Manus در چین رسماً معرفی شد

استارتاپ هوش مصنوعی Manus با معرفی دستیار هوش مصنوعی خود در رسانه های دولتی چین، توجه سرمایه گذاران را به خود جلب کرد. این شرکت با ادعای ارائه اولین عامل هوش مصنوعی عمومی که قادر به تصمیم گیری و اجرای خودکار وظایف است، موفق به دریافت مجوز رسمی از دولت چین شد. Manus با همکاری استراتژیک با تیم هوش مصنوعی Alibaba، برای گسترش فعالیت های خود در بازار داخلی چین آماده می شود و در حال حاضر بیش از 2 میلیون متقاضی در لیست انتظار دارد.

۱۴۰۴/۱/۲ ۱۱:۵۲:۲۸
تغییرات مدیریتی اپل در تیم هوش مصنوعی سیری

اپل در پاسخ به ضعف سیری در پاسخگویی به پرسش‌های ساده، تغییرات مدیریتی گسترده‌ای انجام داده است. مایک راکول، معاون سابق گروه محصولات Vision، جایگزین جان جیانندرا در رهبری تیم سیری شده و این تغییر نشان‌دهنده ناکامی اپل در توسعه هوش مصنوعی و عقب ماندن از رقبا است.

۱۴۰۴/۱/۲ ۰۱:۰۲:۰۵
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
همکاری NatWest با OpenAI برای ارتقای خدمات بانکی با هوش مصنوعی

بانک NatWest در انگلستان با OpenAI همکاری کرده تا با استفاده از هوش مصنوعی، تجربه مشتریان را بهبود بخشد. این همکاری شامل ارتقای دستیاران دیجیتال Cora و AskArchie برای افزایش کارایی خدمات بانکی و مقابله با کلاهبرداری مالی است. با این اقدام، بانک درصدد کاهش هزینه‌ها و افزایش رضایت مشتریان است.

۱۴۰۴/۱/۱ ۱۷:۲۲:۰۹
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
هوش مصنوعی کدنویسی Cursor: آموزش به جای تولید کد

دستیار کدنویسی Cursor در اقدامی جالب، به کاربری که درخواست تولید کد کرده بود توصیه کرد خودش کد را بنویسد تا سیستم را بهتر درک کند. این رویداد واکنش‌های متفاوتی در شبکه‌های اجتماعی برانگیخت و سوالاتی درباره رویکرد هوش مصنوعی در آموزش و تولید کد مطرح شد.

۱۴۰۳/۱۲/۲۵ ۰۱:۴۴:۳۷
گوگل دستیار هوش مصنوعی خود را با Gemini جایگزین می‌کند

گوگل رسماً اعلام کرد که دستیار گوگل را در اکثر دستگاه‌های اندرویدی با Gemini جایگزین خواهد کرد. این تغییر شامل تلفن‌ها، تبلت‌ها، هدفون‌ها و حتی دستیار خودرو می‌شود. Gemini که قابلیت‌های محاوره‌ای پیشرفته‌تری دارد، به عنوان نسل جدید دستیارهای هوش مصنوعی معرفی می‌شود و تنها دستگاه‌های با حافظه محدود از این تغییر مستثنی هستند.

۱۴۰۳/۱۲/۲۴ ۲۳:۴۰:۲۴
گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
کوپایلوت بازی مایکروسافت؛ دستیار هوش مصنوعی برای گیمرها

مایکروسافت دستیار هوش مصنوعی «کوپایلوت برای بازی» را معرفی کرد که قابلیت راهنمایی بازیکنان در بازی‌های مختلف را دارد. این دستیار صوتی می‌تواند اطلاعات تخصصی بازی، توصیه‌های فنی و حتی مشاوره برای انتخاب شخصیت مناسب در بازی‌های آنلاین ارائه دهد. کوپایلوت همچنین قادر به نصب بازی، معرفی بازی‌های جدید و برقراری ارتباط با دوستان بازیکن است.

۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۳۰
اسپاتیفای برنامه انتشار داستان‌های کوتاه صوتی را راه‌اندازی کرد

اسپاتیفای برنامه جدیدی برای انتشار کتاب‌های صوتی کوتاه راه‌اندازی کرده که به نویسندگان اجازه می‌دهد داستان‌های کوتاه خود را برای تبدیل به کتاب صوتی ارائه دهند. این شرکت که در زمینه پخش موسیقی و پادکست فعالیت دارد، داستان‌های ژانرهای رمانس، معما، تریلر و علمی-تخیلی را می‌پذیرد و به نویسندگان پیش‌پرداخت و حق امتیاز می‌دهد.

۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۲۳
گوگل دیپ مایند مدل‌های هوش مصنوعی Gemini Robotics را معرفی کرد

گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدل‌های جدید Gemini Robotics را رونمایی کرد که به ربات‌ها امکان تعامل با اشیا و محیط‌های مختلف را می‌دهد. این مدل‌ها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیط‌های آموزش ندیده نیز عملکرد خوبی دارند.

۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴
پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم

Pocket Casts با راه‌اندازی پخش رایگان پادکست در وب‌سایت خود، رویکردی باز و دموکراتیک در برابر پلتفرم‌های بسته پادکست اتخاذ کرده است. کاربران می‌توانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکست‌ها بپردازند و برای امکانات بیشتر می‌توانند حساب رایگان ایجاد کنند.

https://pocketcasts.com/

۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶
OpenAI راه‌حل‌های جدید توسعه دستیاران هوش مصنوعی را معرفی کرد

شرکت OpenAI ابزارهای جدیدی برای توسعه‌دهندگان منتشر کرد که به آنها امکان ساخت دستیار هوش مصنوعی مستقل (AI Agent) را می‌دهد.
این ابزارها شامل Responses API با قابلیت‌های جستجوی وب، بررسی پرونده‌ها و اجرای وظایف رایانه‌ای است. این ابزار رایگان بوده و جایگزین Assistants API خواهد شد.
این اقدام در پاسخ به رقابت فزاینده استارتاپ‌های هوش مصنوعی چینی مانند Monica صورت گرفته است که ادعای عملکرد برتر در توسعه دستیار هوش مصنوعی دارند.
علی‌رغم محدودیت‌های فعلی، OpenAI امیدوار است با این ابزارها بتواند شکاف بین نمایش‌های تبلیغاتی و محصولات عملی دستیاران هوش مصنوعی را پر کند.

۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۵۰
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه

نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه می‌دهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.

۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴
هشدار درباره ابزارهای جعل صدا؛ نبود محدودیت‌های امنیتی در اکثر نرم‌افزارهای شبیه‌سازی صدا

گزارش جدید Consumer Reports نشان می‌دهد اکثر ابزارهای شبیه‌سازی صدا فاقد محافظت‌های معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام داده‌اند و سایر شرکت‌ها صرفاً تأیید حقوقی کاربر را کافی می‌دانند. کارشناسان هشدار می‌دهند این ابزارها می‌توانند خطر کلاهبرداری‌های صوتی را افزایش دهند.

۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
رقابت استارتاپ هوش مصنوعی Mistral AI با غول های فناوری جهان

Mistral AI یک استارتاپ فرانسوی در حوزه هوش مصنوعی است که با هدف دسترسی همگانی به فناوری پیشرفته تأسیس شده است. این شرکت با راه‌اندازی دستیار هوش مصنوعی Le Chat و جذب سرمایه بیش از یک میلیارد یورو، توانسته توجه جهانی را به خود جلب کند. مدیران Mistral AI که سابقه کار در شرکت‌های بزرگ فناوری مانند گوگل و متا را دارند، با ارائه مدل‌های مختلف هوش مصنوعی و همکاری با شرکت‌های بین‌المللی، قصد رقابت با OpenAI را دارند.

۱۴۰۳/۱۲/۱۶ ۲۲:۳۰:۰۱
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
طرح OpenAI برای عرضه دستیار هوش مصنوعی با قیمت های میلیونی

OpenAI قصد دارد محصولات هوش مصنوعی تخصصی با قیمت های متفاوت از 2000 تا 20000 دلار ماهانه راه اندازی کند. این عامل های هوش مصنوعی (AI Agents) برای کاربردهای مختلف مانند مدیریت فروش و مهندسی نرم‌افزار طراحی شده‌اند. شرکت سرمایه‌گذار SoftBank متعهد به هزینه 3 میلیارد دلاری برای این محصولات شده است.

۱۴۰۳/۱۲/۱۵ ۲۳:۳۴:۱۲
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
گوگل Gemini با قابلیت جدید در صفحه قفل آیفون

کاربران Gemini اکنون می‌توانند با اضافه کردن ویجت Gemini، به قابلیت هوش مصنوعی این دستیار در صفحه قفل آیفون دسترسی داشته باشند. این امکان شامل گفتگوی صوتی زنده، ثبت یادآور، رویداد تقویمی و آپلود تصاویر است که رقابت میان شرکت‌های فناوری برای ارائه دستیارهای هوش مصنوعی را نشان می‌دهد.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۳
پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد

‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاه‌های موبایل

استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاه‌های موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.

۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶
دویچه تلکوم و perplexity ، همکاری برای ساخت تلفن هوشمند هوش مصنوعی

perplexity
‏
‏دویچه تلکوم در همکاری با perplexity، یک تلفن هوشمند مبتنی بر هوش مصنوعی با قیمت کمتر از ۱۰۰۰ دلار طراحی می‌کند. این تلفن هوشمند که در نیمه دوم سال جاری رونمایی خواهد شد، با استفاده از خدمات هوش مصنوعی پرپلکسیتی، گوگل کلود و سایر شرکت‌ها قابلیت‌های پیشرفته‌ای خواهد داشت و در بازار اروپا عرضه خواهد شد.

۱۴۰۳/۱۲/۱۳ ۲۰:۲۶:۳۱
گوگل قابلیت‌های جدید هوش مصنوعی Gemini را معرفی کرد

گوگل در کنگره جهانی موبایل، قابلیت‌های جدیدی برای دستیار هوش مصنوعی Gemini رونمایی کرد. این قابلیت‌ها شامل امکان اشتراک‌گذاری صفحه نمایش تلفن همراه و جستجوی ویدیویی می‌شود. این امکانات برای کاربران Gemini Advanced در اندروید در ماه جاری عرضه خواهد شد.

۱۴۰۳/۱۲/۱۳ ۱۴:۴۲:۳۷
سیری اپل در تلاش برای بازسازی با رویکرد هوش مصنوعی

اپل در حال بازسازی دستیار هوشمند سیری با رویکرد هوش مصنوعی تولیدی است. طبق گزارش‌ها، نسخه جدید سیری در می ۲۰۲۵ با قابلیت‌های هوش مصنوعی اپل معرفی خواهد شد. این دستیار دارای دو مغز هوشمند برای پاسخگویی به دستورات ساده و پیچیده خواهد بود و احتمالاً نسخه کامل و مدرن آن تا سال ۲۰۲۷ منتشر نخواهد شد.

۱۴۰۳/۱۲/۱۳ ۰۲:۰۳:۳۸

نمایش بیشتر