محتوای صوتی - صفحه 4 - اخبار فناوری - EcoFori

استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد

اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغ‌دهندگان امکان می‌دهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را به‌صورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغ‌کنندگان اجازه می‌دهد در لحظه و به‌صورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.

۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹
سرمایه‌گذاری ۳۰۸ میلیون دلاری در استارتاپ Runway برای توسعه تولید محتوای هوش مصنوعی

استارتاپ Runway که در زمینه تولید محتوای رسانه‌ای با هوش مصنوعی فعالیت می‌کند، ۳۰۸ میلیون دلار سرمایه جدید جذب کرد. این سرمایه برای تحقیقات، جذب نیرو و گسترش استودیوهای فیلم و انیمیشن آن استفاده خواهد شد.
این استارتاپ اخیراً مدل جدید Gen-4 را معرفی کرده که ویدیوهای باکیفیت و یکپارچه تولید می‌کند. این شرکت با OpenAI و Google رقابت دارد و در تلاش است با همکاری هالیوود، جایگاه خود را تثبیت کند.

۱۴۰۴/۱/۱۵ ۲۳:۴۳:۵۹
نتفلیکس با گسترش گزینه‌های زبانی، تماشای جهانی فیلم و سریال را آسان‌تر کرد

نتفلیکس سرویس پخش اینترنتی فیلم و سریال، امکان انتخاب زبان زیرنویس و دوبله را برای کاربران تلویزیون گسترش داد. این تغییر در حالی اتفاق می‌افتد که حدود یک سوم مخاطبان این پلتفرم، مخاطب فیلم‌های غیرانگلیسی هستند. نتفلیکس هم‌اکنون زیرنویس در 33 زبان و دوبله در 36 زبان را ارائه می‌دهد.

۱۴۰۴/۱/۱۴ ۱۹:۰۹:۱۳
Substack با راه‌اندازی ویدیوهای کوتاه به رقابت با تیک‌تاک می‌آید

Substack پلتفرم انتشار محتوا، قابلیت جدید ویدیویی مشابه تیک‌تاک را معرفی کرد. نویسندگان می‌توانند ویدیوهای ۱۰ دقیقه‌ای برای مخاطبان خود منتشر کنند. این اقدام در راستای جذب کاربران احتمالی تیک‌تاک در صورت ممنوعیت این پلتفرم صورت می‌گیرد.

۱۴۰۴/۱/۱۳ ۰۰:۳۵:۱۳
پایان نمایشگرهای لمسی در خودروها؟

صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالش‌های جدی مواجه شده‌اند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمه‌های فیزیکی بازمی‌گردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواس‌پرتی راننده و نقص‌های نرم‌افزاری که عملکردهای حیاتی خودرو را مختل می‌کنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستم‌های خودرو را شکل می‌دهند.

۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳
تغییرات جدید OpenAI در سیاست‌های محتوایی چت‌جی‌پی‌تی

شرکت OpenAI سیاست‌های محدودکننده تولید تصاویر در چت‌جی‌پی‌تی را تغییر داد. این شرکت اکنون تولید تصاویر از چهره‌های عمومی، نمادهای نفرت‌انگیز و ویژگی‌های نژادی را مجاز دانسته است. این تغییر با هدف ارائه کنترل بیشتر به کاربران و کاهش محدودیت‌های قبلی صورت گرفته است.

۱۴۰۴/۱/۱۰ ۰۰:۵۴:۵۱
هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
اینستاگرام قابلیت پخش سریع ویدیو را از تیک‌تاک کپی کرد

اینستاگرام متعلق به متا، قابلیت جدید پخش ویدیو با سرعت 2 برابر را از تیک‌تاک اقتباس کرد. کاربران می‌توانند با نگه داشتن انگشت در سمت راست یا چپ صفحه، ویدیوهای Reels را سریع‌تر مشاهده کنند. این ویژگی با هدف افزایش سرعت مصرف محتوا و حفظ توجه مخاطب طراحی شده است.

۱۴۰۴/۱/۹ ۰۱:۵۵:۱۱
افشای سیستم سانسور هوش مصنوعی پیشرفته چین برای کنترل محتوای آنلاین

یک پایگاه داده‌ از 133 هزار نمونه محتوای حساس نشان می‌دهد که چین یک سیستم هوش مصنوعی پیشرفته برای سانسور محتوای آنلاین توسعه داده است. این سیستم قادر است مطالب مرتبط با موضوعات سیاسی، اجتماعی و نظامی را به سرعت شناسایی و مسدود کند. هدف اصلی، کنترل گفتمان عمومی و جلوگیری از انتشار محتوای مخالف با سیاست‌های دولت چین است.

۱۴۰۴/۱/۷ ۲۲:۲۶:۱۹
شبکه اجتماعی بدون محتوای تحریک‌کننده خشم

اپلیکیشن Sez Us، ساخته‌ی استراتژیست دموکرات جو تریپی، قصد دارد شبکه‌ای اجتماعی بدون محتوای تحریک‌آمیز (Rage-bait) بسازد. برخلاف پلتفرم‌های بزرگی مثل اینستاگرام و تیک‌تاک که از محتوای جنجالی برای افزایش تعامل استفاده می‌کنند، Sez Us به کاربران امکان می‌دهد پست‌ها را از نظر تأثیرگذاری، مفید بودن و ادب ارزیابی کنند.

اگرچه تغییر الگوی شبکه‌های اجتماعی کار ساده‌ای نیست، اما این آزمایش می‌تواند الهام‌بخش روش‌های جدیدی برای مدیریت محتوا در پلتفرم‌های دیگر باشد.

۱۴۰۴/۱/۷ ۲۰:۴۰:۳۸
توقف پشتیبانی Google Assistant از Waze در iOS

شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفته‌ای را جایگزین خواهد کرد و همزمان روی ویژگی گزارش‌دهی مکالمه‌ای مبتنی بر هوش مصنوعی کار می‌کند.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶
تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
افزایش محتوای مستهجن در Spotify

اسپاتیفای از حذف حساب‌های محتوای مستهجن در پلتفرم ویدیویی خود خبر داد. این شرکت که خدمات پخش موسیقی و پادکست ارائه می‌دهد، تأکید کرد هیچ درآمدی به این حساب‌ها نداده و آنها را از پلتفرم حذف کرده است. برخی کاربران در جستجوهای خود با محتوای نامناسب مواجه شده بودند که اسپاتیفای آن را خلاف قوانین خود دانسته است.

۱۴۰۴/۱/۳ ۰۵:۰۹:۰۵
متا در پی استفاده از هوش مصنوعی برای نوشتن نظرات در اینستاگرام

شرکت متا در حال آزمایش قابلیت جدیدی در اینستاگرام است که به کاربران اجازه می‌دهد با استفاده از هوش مصنوعی، نظرات پیشنهادی برای پست‌ها تولید کنند. این ویژگی با تحلیل تصویر، سه پیشنهاد نظر را ارائه می‌دهد که کاربران می‌توانند آنها را انتخاب یا تغییر دهند. این اقدام با واکنش‌های منفی کاربرانی که خواهان نظرات واقعی و صمیمانه هستند، مواجه شده است.

۱۴۰۴/۱/۲ ۲۳:۱۱:۵۲
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
شکایت ایکس از دولت هند به دلیل سانسور محتوا

پلتفرم رسانه اجتماعی X متعلق به ایلان ماسک از دولت هند به دلیل گسترش غیرقانونی اختیارات برای حذف محتوای آنلاین شکایت کرد. این شرکت مدعی است مکانیسم دولت هند برای حذف محتوا فاقد نظارت کافی است و منجر به سانسور گسترده می‌شود. X در پی مقابله با دستورات سانسوری دولت هند از طریق مسیر حقوقی است.

۱۴۰۴/۱/۱ ۲۰:۳۰:۵۰
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
زیان میلیاردی اپل در سرویس پخش اینترنتی Apple TV+

گزارش رویترز حاکی است که اپل سالانه بیش از یک میلیارد دلار در سرویس پخش اینترنتی Apple TV+ متحمل زیان می‌شود. این اطلاعات از سوی دو منبع آگاه به نشریه information اعلام شده است.

۱۴۰۴/۱/۱ ۱۷:۲۲:۱۶
تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude

استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیت‌های صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعی‌تر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کرده‌اند.

۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
آغاز نظارت بر خدمات اشتراک‌گذاری فایل در انگلستان برای مقابله با محتوای غیرقانونی

نهاد نظارتی Ofcom انگلستان با اجرای قانون ایمنی آنلاین، برنامه جدید نظارتی بر خدمات اشتراک‌گذاری و ذخیره‌سازی فایل آغاز کرده است. این نهاد معتقد است این خدمات مستعد انتشار محتوای جنسی کودکان هستند و از آنها خواسته شده اقدامات امنیتی خود را ارائه دهند. عدم همکاری می‌تواند منجر به جریمه‌های سنگین تا ۱۰ درصد درآمد سالانه شود.

۱۴۰۳/۱۲/۲۷ ۱۵:۳۴:۲۵
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش می‌دهد

گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه می‌کند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتاب‌های گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.

۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹
حذف گزینه پردازش محلی صدا در دستگاه‌های هوشمند آمازون

آمازون قابلیت پردازش محلی درخواست‌های صوتی در دستگاه‌های Echo را حذف می‌کند و تمامی ضبط‌های صوتی کاربران به فضای ابری این شرکت ارسال خواهد شد. این تصمیم در راستای گسترش قابلیت‌های هوش مصنوعی Alexa با استفاده از پردازش ابری اتخاذ شده است.

۱۴۰۳/۱۲/۲۶ ۲۳:۰۹:۳۹
تأخیر در هوش مصنوعی سیری اپل؛ سقوط روحیه تیم

اپل با به تعویق انداختن برنامه‌های هوش مصنوعی سیری، نه تنها باعث افت ارزش سهام شرکت شد بلکه روحیه تیم سیری را نیز تضعیف کرد. روبی واکر، مدیر ارشد بخش سیری، در جلسه‌ای تیمی به کارکنان اذعان کرد که شرایط مطلوب نیست و تبلیغات قبلی اپل درباره ویژگی‌های جدید، انتظارات را برآورده نکرده است.

۱۴۰۳/۱۲/۲۵ ۲۱:۲۱:۲۱
چین الزامات برچسب‌گذاری محتوای هوش مصنوعی را تصویب کرد

دولت چین الزامات جدیدی برای برچسب‌گذاری محتوای هوش مصنوعی تدوین کرده که از اول سپتامبر ۲۰۲۵ اجرایی خواهد شد. این اقدام با هدف توسعه سالم هوش مصنوعی صورت گرفته و نشان از نگاه نظارتی چین به فناوری‌های نوظهور دارد.

۱۴۰۳/۱۲/۲۴ ۱۳:۲۹:۰۳
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان

شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیت‌هایی در زبان‌های غیرانگلیسی دارد.

۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸
گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶

نمایش بیشتر