-
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد
اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغدهندگان امکان میدهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را بهصورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغکنندگان اجازه میدهد در لحظه و بهصورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹ -
سرمایهگذاری ۳۰۸ میلیون دلاری در استارتاپ Runway برای توسعه تولید محتوای هوش مصنوعی
استارتاپ Runway که در زمینه تولید محتوای رسانهای با هوش مصنوعی فعالیت میکند، ۳۰۸ میلیون دلار سرمایه جدید جذب کرد. این سرمایه برای تحقیقات، جذب نیرو و گسترش استودیوهای فیلم و انیمیشن آن استفاده خواهد شد.
این استارتاپ اخیراً مدل جدید Gen-4 را معرفی کرده که ویدیوهای باکیفیت و یکپارچه تولید میکند. این شرکت با OpenAI و Google رقابت دارد و در تلاش است با همکاری هالیوود، جایگاه خود را تثبیت کند.۱۴۰۴/۱/۱۵ ۲۳:۴۳:۵۹ -
نتفلیکس با گسترش گزینههای زبانی، تماشای جهانی فیلم و سریال را آسانتر کرد
نتفلیکس سرویس پخش اینترنتی فیلم و سریال، امکان انتخاب زبان زیرنویس و دوبله را برای کاربران تلویزیون گسترش داد. این تغییر در حالی اتفاق میافتد که حدود یک سوم مخاطبان این پلتفرم، مخاطب فیلمهای غیرانگلیسی هستند. نتفلیکس هماکنون زیرنویس در 33 زبان و دوبله در 36 زبان را ارائه میدهد.
۱۴۰۴/۱/۱۴ ۱۹:۰۹:۱۳ -
Substack با راهاندازی ویدیوهای کوتاه به رقابت با تیکتاک میآید
Substack پلتفرم انتشار محتوا، قابلیت جدید ویدیویی مشابه تیکتاک را معرفی کرد. نویسندگان میتوانند ویدیوهای ۱۰ دقیقهای برای مخاطبان خود منتشر کنند. این اقدام در راستای جذب کاربران احتمالی تیکتاک در صورت ممنوعیت این پلتفرم صورت میگیرد.
۱۴۰۴/۱/۱۳ ۰۰:۳۵:۱۳ -
پایان نمایشگرهای لمسی در خودروها؟
صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالشهای جدی مواجه شدهاند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمههای فیزیکی بازمیگردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواسپرتی راننده و نقصهای نرمافزاری که عملکردهای حیاتی خودرو را مختل میکنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستمهای خودرو را شکل میدهند.
۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳ -
تغییرات جدید OpenAI در سیاستهای محتوایی چتجیپیتی
شرکت OpenAI سیاستهای محدودکننده تولید تصاویر در چتجیپیتی را تغییر داد. این شرکت اکنون تولید تصاویر از چهرههای عمومی، نمادهای نفرتانگیز و ویژگیهای نژادی را مجاز دانسته است. این تغییر با هدف ارائه کنترل بیشتر به کاربران و کاهش محدودیتهای قبلی صورت گرفته است.
۱۴۰۴/۱/۱۰ ۰۰:۵۴:۵۱ -
هدفونهای Star Wars با افکت صوتی شخصیتهای محبوب منتشر شد
شرکت Audio-Technica هدفونهای بیسیم ATH-CKS50TW2 را با طرحهای اختصاصی شخصیتهای محبوب جنگ ستارگان منتشر کرد. این هدفونها با رنگبندی و افکت صوتی شخصیتهایی مانند گروگو، دارث ویدر و R2-D2 طراحی شدهاند و قیمت آنها 180 دلار است. هدفونها قابلیت حذف نویز، شارژ بیسیم و عمر باتری 40 ساعته دارند.
۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰ -
اینستاگرام قابلیت پخش سریع ویدیو را از تیکتاک کپی کرد
اینستاگرام متعلق به متا، قابلیت جدید پخش ویدیو با سرعت 2 برابر را از تیکتاک اقتباس کرد. کاربران میتوانند با نگه داشتن انگشت در سمت راست یا چپ صفحه، ویدیوهای Reels را سریعتر مشاهده کنند. این ویژگی با هدف افزایش سرعت مصرف محتوا و حفظ توجه مخاطب طراحی شده است.
۱۴۰۴/۱/۹ ۰۱:۵۵:۱۱ -
افشای سیستم سانسور هوش مصنوعی پیشرفته چین برای کنترل محتوای آنلاین
یک پایگاه داده از 133 هزار نمونه محتوای حساس نشان میدهد که چین یک سیستم هوش مصنوعی پیشرفته برای سانسور محتوای آنلاین توسعه داده است. این سیستم قادر است مطالب مرتبط با موضوعات سیاسی، اجتماعی و نظامی را به سرعت شناسایی و مسدود کند. هدف اصلی، کنترل گفتمان عمومی و جلوگیری از انتشار محتوای مخالف با سیاستهای دولت چین است.
۱۴۰۴/۱/۷ ۲۲:۲۶:۱۹ -
شبکه اجتماعی بدون محتوای تحریککننده خشم
اپلیکیشن Sez Us، ساختهی استراتژیست دموکرات جو تریپی، قصد دارد شبکهای اجتماعی بدون محتوای تحریکآمیز (Rage-bait) بسازد. برخلاف پلتفرمهای بزرگی مثل اینستاگرام و تیکتاک که از محتوای جنجالی برای افزایش تعامل استفاده میکنند، Sez Us به کاربران امکان میدهد پستها را از نظر تأثیرگذاری، مفید بودن و ادب ارزیابی کنند.
اگرچه تغییر الگوی شبکههای اجتماعی کار سادهای نیست، اما این آزمایش میتواند الهامبخش روشهای جدیدی برای مدیریت محتوا در پلتفرمهای دیگر باشد.۱۴۰۴/۱/۷ ۲۰:۴۰:۳۸ -
توقف پشتیبانی Google Assistant از Waze در iOS
شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفتهای را جایگزین خواهد کرد و همزمان روی ویژگی گزارشدهی مکالمهای مبتنی بر هوش مصنوعی کار میکند.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶ -
تغییر لهجه با هوش مصنوعی در تماسهای صوتی توسط Krisp
استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماسهای صوتی راهاندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واجها را تغییر میدهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳ -
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفههای مکالمه
شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه میدهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراکدهنده میتوانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعیتر و روانتری را فراهم میکند.
۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸ -
افزایش محتوای مستهجن در Spotify
اسپاتیفای از حذف حسابهای محتوای مستهجن در پلتفرم ویدیویی خود خبر داد. این شرکت که خدمات پخش موسیقی و پادکست ارائه میدهد، تأکید کرد هیچ درآمدی به این حسابها نداده و آنها را از پلتفرم حذف کرده است. برخی کاربران در جستجوهای خود با محتوای نامناسب مواجه شده بودند که اسپاتیفای آن را خلاف قوانین خود دانسته است.
۱۴۰۴/۱/۳ ۰۵:۰۹:۰۵ -
متا در پی استفاده از هوش مصنوعی برای نوشتن نظرات در اینستاگرام
شرکت متا در حال آزمایش قابلیت جدیدی در اینستاگرام است که به کاربران اجازه میدهد با استفاده از هوش مصنوعی، نظرات پیشنهادی برای پستها تولید کنند. این ویژگی با تحلیل تصویر، سه پیشنهاد نظر را ارائه میدهد که کاربران میتوانند آنها را انتخاب یا تغییر دهند. این اقدام با واکنشهای منفی کاربرانی که خواهان نظرات واقعی و صمیمانه هستند، مواجه شده است.
۱۴۰۴/۱/۲ ۲۳:۱۱:۵۲ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
شکایت ایکس از دولت هند به دلیل سانسور محتوا
پلتفرم رسانه اجتماعی X متعلق به ایلان ماسک از دولت هند به دلیل گسترش غیرقانونی اختیارات برای حذف محتوای آنلاین شکایت کرد. این شرکت مدعی است مکانیسم دولت هند برای حذف محتوا فاقد نظارت کافی است و منجر به سانسور گسترده میشود. X در پی مقابله با دستورات سانسوری دولت هند از طریق مسیر حقوقی است.
۱۴۰۴/۱/۱ ۲۰:۳۰:۵۰ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
زیان میلیاردی اپل در سرویس پخش اینترنتی Apple TV+
گزارش رویترز حاکی است که اپل سالانه بیش از یک میلیارد دلار در سرویس پخش اینترنتی Apple TV+ متحمل زیان میشود. این اطلاعات از سوی دو منبع آگاه به نشریه information اعلام شده است.
۱۴۰۴/۱/۱ ۱۷:۲۲:۱۶ -
تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude
استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیتهای صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعیتر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کردهاند.
۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷ -
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد میکند
آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیتهای هوش مصنوعی الکسا انجام میشود و کاربران دیگر نمیتوانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیتهای جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.
۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶ -
آغاز نظارت بر خدمات اشتراکگذاری فایل در انگلستان برای مقابله با محتوای غیرقانونی
نهاد نظارتی Ofcom انگلستان با اجرای قانون ایمنی آنلاین، برنامه جدید نظارتی بر خدمات اشتراکگذاری و ذخیرهسازی فایل آغاز کرده است. این نهاد معتقد است این خدمات مستعد انتشار محتوای جنسی کودکان هستند و از آنها خواسته شده اقدامات امنیتی خود را ارائه دهند. عدم همکاری میتواند منجر به جریمههای سنگین تا ۱۰ درصد درآمد سالانه شود.
۱۴۰۳/۱۲/۲۷ ۱۵:۳۴:۲۵ -
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش میدهد
گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه میکند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتابهای گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.
۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹ -
حذف گزینه پردازش محلی صدا در دستگاههای هوشمند آمازون
آمازون قابلیت پردازش محلی درخواستهای صوتی در دستگاههای Echo را حذف میکند و تمامی ضبطهای صوتی کاربران به فضای ابری این شرکت ارسال خواهد شد. این تصمیم در راستای گسترش قابلیتهای هوش مصنوعی Alexa با استفاده از پردازش ابری اتخاذ شده است.
۱۴۰۳/۱۲/۲۶ ۲۳:۰۹:۳۹ -
تأخیر در هوش مصنوعی سیری اپل؛ سقوط روحیه تیم
اپل با به تعویق انداختن برنامههای هوش مصنوعی سیری، نه تنها باعث افت ارزش سهام شرکت شد بلکه روحیه تیم سیری را نیز تضعیف کرد. روبی واکر، مدیر ارشد بخش سیری، در جلسهای تیمی به کارکنان اذعان کرد که شرایط مطلوب نیست و تبلیغات قبلی اپل درباره ویژگیهای جدید، انتظارات را برآورده نکرده است.
۱۴۰۳/۱۲/۲۵ ۲۱:۲۱:۲۱ -
چین الزامات برچسبگذاری محتوای هوش مصنوعی را تصویب کرد
دولت چین الزامات جدیدی برای برچسبگذاری محتوای هوش مصنوعی تدوین کرده که از اول سپتامبر ۲۰۲۵ اجرایی خواهد شد. این اقدام با هدف توسعه سالم هوش مصنوعی صورت گرفته و نشان از نگاه نظارتی چین به فناوریهای نوظهور دارد.
۱۴۰۳/۱۲/۲۴ ۱۳:۲۹:۰۳ -
رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان
شرکت Sesame مدل پایه صوتی CSM-1B با یک میلیارد پارامتر را منتشر کرد که زیرساخت دستیار صوتی Maya است. این مدل با مجوز Apache 2.0 قابل استفاده تجاری بوده و توانایی تولید کدهای صوتی از متن و ورودی صدا را دارد. مدل قادر به تولید صداهای مختلف است اما محدودیتهایی در زبانهای غیرانگلیسی دارد.
۱۴۰۳/۱۲/۲۴ ۰۲:۵۹:۳۸ -
گوگل از قابلیت Auracast در گوشیهای اندروید رونمایی کرد
گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک میکند تا در محیطهای پرسر و صدا مانند ایستگاه راهآهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشیهای سامسونگ Galaxy و Google Pixel با تنظیمات شخصیسازی صدا در دسترس خواهد بود.
۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸ -
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل
اپل در حال برنامهریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با بهروزرسانی نرمافزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیشتر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.
۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶



