فناوری صوتی - اخبار فناوری - EcoFori

ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!

اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز می‌شوند: ضبط صدای حرفه‌ای و کنترل دوربین با لمس ایرپاد. 🎧
با استفاده از چیپ H2، میکروفون‌های پیشرفته و پردازش هوشمند صدا، کاربران می‌توانند حتی در محیط‌های شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماس‌های باکیفیت‌تری داشته باشند. 🎙️
همچنین با نگه‌داشتن ساقه ایرپاد، می‌توان دوربین آیفون یا اپ‌های دوربین دیگر را فعال کرد و به‌راحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکه‌های اجتماعی بسیار کاربردی است. 📸
این قابلیت‌ها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅

۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷
ChatGPT با لحنی انسانی‌تر از همیشه

قابلیت گفت‌وگوی صوتی در ChatGPT با ارتقاء جدیدی همراه شده که صدای آن را طبیعی‌تر، روان‌تر و احساسی‌تر از قبل می‌کند. 🎙️
به‌گفته OpenAI، نسخه جدید «صدای پیشرفته» با لحن واقعی‌تر، مکث‌های طبیعی، تأکید مناسب و بیان دقیق‌تر احساساتی مانند همدلی یا طعنه طراحی شده است. 🧠
ویژگی ترجمه زنده نیز بهبود یافته و اکنون کاربران می‌توانند بدون وقفه، گفت‌وگوهای چندزبانه را ادامه دهند تا زمانی که بخواهند زبان را تغییر دهند یا متوقف کنند. 🌍
این قابلیت برای همه کاربران سر‌ویس پولی در تمامی پلتفرم‌ها فعال است، هرچند ممکن است گاهی افت کیفیت صوتی یا خطاهای محدود مانند صداهای غیرمنتظره یا موسیقی پس‌زمینه رخ دهد. ⚠️

۱۴۰۴/۳/۲۰ ۱۸:۲۷:۱۹
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small

🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشی‌های هوشمند هم کار می‌کند و در کمتر از ۸ ثانیه صدا تولید می‌کند. 📱
✅ برخلاف دیگر مدل‌ها، فقط از آهنگ‌های رایگان برای آموزش استفاده کرده و نگرانی کپی‌رایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی می‌کند و مناسب تولید افکت‌های صوتی و نمونه‌های کوتاه است. 🎧

۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude

استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیت‌های صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعی‌تر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کرده‌اند.

۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم

Pocket Casts با راه‌اندازی پخش رایگان پادکست در وب‌سایت خود، رویکردی باز و دموکراتیک در برابر پلتفرم‌های بسته پادکست اتخاذ کرده است. کاربران می‌توانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکست‌ها بپردازند و برای امکانات بیشتر می‌توانند حساب رایگان ایجاد کنند.

https://pocketcasts.com/

۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیت‌های صوتی پیشرفته

شرکت متا در حال آماده‌سازی مدل Llama 4 است که با تمرکز بر قابلیت‌های صوتی پیشرفته طراحی شده و کاربران می‌توانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همه‌کاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع داده‌ها خواهد بود. رقابت با مدل‌های هوش مصنوعی چینی DeepSeek، متا را به توسعه سریع‌تر Llama واداشته است.

۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰
پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد

‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن

استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی می‌کند و در برخی زبان‌ها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیت‌هایی مانند تشخیص گوینده و زمان‌بندی کلمات را دارد.

۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹
استارتاپ سانس با فناوری هوش مصنوعی، تبعیض لهجه در مراکز تماس را کاهش می‌دهد

استارتاپ سانس با استفاده از هوش مصنوعی، نرم‌افزاری توسعه داده که قادر به تعدیل لهجه گویندگان در زمان واقعی است. این شرکت که در سال ۲۰۲۰ تأسیس شده، با هدف کاهش تبعیض لهجه‌ای در مراکز تماس فعالیت می‌کند. سانس با فناوری هوش مصنوعی خود توانسته درآمد سالانه ۲۱ میلیون دلاری کسب کند و اخیراً ۶۵ میلیون دلار سرمایه جذب کرده است.

۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۳
هشدار جدید درباره هدفون‌های دارای حذف نویز

گزارش جدید بی‌بی‌سی نشان می‌دهد استفاده مداوم از هدفون‌های حذف کننده صدا می‌تواند منجر به اختلال پردازش شنیداری شود. پنج بخش شنوایی سازمان بهداشت ملی انگلستان افزایش مراجعه جوانان با مشکلات پردازش صوتی را گزارش کرده‌اند. نظریه اصلی این است که فناوری حذف نویز ممکن است توانایی مغز در فیلتر کردن صداها را کاهش دهد.

۱۴۰۳/۱۱/۳۰ ۰۱:۳۷:۲۶
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازه‌ای از هوش مصنوعی خانگی

گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخ‌ها سریع‌تر و طبیعی‌تر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک می‌کند. 🍳🏠 اسپیکر می‌تواند از طریق سیستم هوشمند خانه، چراغ‌ها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغ‌ها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و می‌توان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام می‌شود. 🗓️

۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵
تحول بزرگ در سیری: اپل به دنبال همکاری با OpenAI و Anthropic

اپل در حال بررسی استفاده از مدل‌های هوش مصنوعی OpenAI یا Anthropic برای ارتقای دستیار صوتی سیری است؛ اقدامی که نشان‌دهنده تغییر راهبرد از مدل‌های داخلی به راهکارهای بیرونی است. 🤖
گزارش بلومبرگ می‌گوید مذاکرات با این شرکت‌ها برای اجرای مدل‌ها روی زیرساخت ابری اپل آغاز شده، اما هنوز تصمیم نهایی گرفته نشده است. ☁️
این در حالی‌ست که اپل به‌روزرسانی‌های سیری را تا سال ۲۰۲۶ به تعویق انداخته و هم‌زمان ابزارهای هوش مصنوعی خود و OpenAI را در اختیار توسعه‌دهندگان قرار داده است. 🛠️

۱۴۰۴/۴/۱۲ ۰۱:۰۴:۴۱
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست

🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار به‌صورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفت‌وگو با افراد به زبان‌های مختلف را در زمان واقعی فراهم می‌کند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوه‌های انگلیسی‌زبان می‌توانند با مادربزرگ اسپانیایی‌زبانشان راحت صحبت کنند یا شرکت‌های بین‌المللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه می‌شود و صدای اصلی شخص نیز به‌صورت کمرنگ در پس‌زمینه شنیده می‌شود 🎙️🔊

۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵
آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون

🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون می‌توانند کتاب‌های صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
اسپاتیفای در سال ۲۰۲۲ امکان خرید کتاب‌های صوتی را به دلیل قوانین سخت‌گیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅

۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
Alexa+ در سراشیبی ناکامی

🚨 سرویس هوش مصنوعی جدید Alexa+ آمازون با مشکلاتی در دسترسی کاربران مواجه شده است.
با وجود اعلام آمازون مبنی بر دسترسی صدها هزار کاربر، شواهد عمومی از کاربران واقعی Alexa+ بسیار کم است. ❌
Alexa+ که با قابلیت‌های جدید هوش مصنوعی طراحی شده، قرار بود دستیار صوتی آمازون را احیا کند، اما کاربران از سرعت پایین و گاهی اطلاعات نادرست شکایت دارند. ⚡🤖

۱۴۰۴/۲/۲۸ ۱۹:۲۸:۳۷
پادکسترها به شمارش پخش عمومی اسپاتیفای اعتراض کردند

🎧 اسپاتیفای هفته گذشته قصد داشت تعداد پخش همه پادکست‌ها را عمومی کند، اما با مخالفت شدید سازندگان پادکست مواجه شد.
منتقدان معتقد بودند این اقدام باعث می‌شود پادکست‌های کوچک‌تر شانسی برای جذب مخاطب نداشته باشند.
در نهایت اسپاتیفای عقب‌نشینی کرد و اعلام کرد فقط پادکست‌های بالای ۵۰ هزار پخش، تعداد پخش آنها نمایش داده خواهد شد.
این تصمیم تلاشی برای ایجاد توازن بین پادکست‌های بزرگ و کوچک است.

۱۴۰۴/۲/۲۸ ۰۲:۴۴:۵۷
هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
ورود هوش مصنوعی به منوی رستوران‌ها

شرکت Yelp از دستیارهای صوتی هوش مصنوعی برای پاسخ‌گویی تلفنی رستوران‌ها و کسب‌وکارها رونمایی کرد. این سیستم‌ها بدون نیاز به نصب پیچیده و API، از اطلاعات کسب‌وکار مثل پیام خوش‌آمد، راهنمای تلفظ و قوانین تماس استفاده می‌کنند. مثلاً می‌توانند مشتری را به لیست انتظار اضافه کرده یا اطلاعات رزرو را بعد از تماس ارسال کنند.
امکان فیلتر تماس‌های اسپم، تحلیل تماس و انتقال تماس‌های پیچیده به انسان نیز وجود دارد. پس از هر تماس، گزارش، متن و فایل صوتی به کسب‌وکار داده می‌شود.

۱۴۰۴/۲/۱۰ ۲۳:۲۱:۳۶
برند CMF از Nothing ایرپادهایی با سه مدل مختلف در رده قیمتی پایین معرفی کرد

برند CMF از شرکت Nothing سه مدل ایرپاد بی‌سیم جدید با نام‌های Buds 2a، Buds 2 و Buds 2 Plus با قیمت های ۴۹ تا ۶۸ دلار معرفی کرده. هر سه مدل از حذف نویز فعال (ANC) پشتیبانی می‌کنند و طراحی ساده و اقتصادی دارند.
تفاوت اصلی این سه مدل در چند بخش است: عمر باتری (مدل Plus با ۱۴ ساعت بیشترین دوام را دارد)، کیفیت تماس صوتی (مدل‌های بالاتر دارای میکروفون‌های بیشتر و پردازش صوتی بهتر هستند)، و کیفیت صدا (مدل‌های گران‌تر از صدای فضایی ۳D پشتیبانی می‌کنند).
در زمینه حذف نویز، عملکرد مدل Plus نسبت به دو مدل ارزان‌تر بهتر است اما همچنان در برابر ایرپادهای گران‌تر بازار حرفی برای گفتن ندارد.

۱۴۰۴/۲/۱۰ ۱۱:۴۶:۳۲
هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند

دو دانشجوی کره‌ای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساخته‌اند که می‌تواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر می‌دهد. این مدل رایگان است و در پلتفرم‌های Hugging Face و GitHub قابل دسترسی است. کاربران می‌توانند لحن صدا، مکث‌ها، سرفه و خنده را در گفت‌وگوها تنظیم کنند و حتی صدای واقعی افراد را شبیه‌سازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه داده‌هایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیت‌های اجتماعی و چندزبانه بسازند.

۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸

نمایش بیشتر