-
هدفونهای Star Wars با افکت صوتی شخصیتهای محبوب منتشر شد
شرکت Audio-Technica هدفونهای بیسیم ATH-CKS50TW2 را با طرحهای اختصاصی شخصیتهای محبوب جنگ ستارگان منتشر کرد. این هدفونها با رنگبندی و افکت صوتی شخصیتهایی مانند گروگو، دارث ویدر و R2-D2 طراحی شدهاند و قیمت آنها 180 دلار است. هدفونها قابلیت حذف نویز، شارژ بیسیم و عمر باتری 40 ساعته دارند.
۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰ -
تغییر لهجه با هوش مصنوعی در تماسهای صوتی توسط Krisp
استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماسهای صوتی راهاندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واجها را تغییر میدهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.
۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
استارتاپ هوش مصنوعی Manus در چین رسماً معرفی شد
استارتاپ هوش مصنوعی Manus با معرفی دستیار هوش مصنوعی خود در رسانه های دولتی چین، توجه سرمایه گذاران را به خود جلب کرد. این شرکت با ادعای ارائه اولین عامل هوش مصنوعی عمومی که قادر به تصمیم گیری و اجرای خودکار وظایف است، موفق به دریافت مجوز رسمی از دولت چین شد. Manus با همکاری استراتژیک با تیم هوش مصنوعی Alibaba، برای گسترش فعالیت های خود در بازار داخلی چین آماده می شود و در حال حاضر بیش از 2 میلیون متقاضی در لیست انتظار دارد.
۱۴۰۴/۱/۲ ۱۱:۵۲:۲۸ -
تغییرات مدیریتی اپل در تیم هوش مصنوعی سیری
اپل در پاسخ به ضعف سیری در پاسخگویی به پرسشهای ساده، تغییرات مدیریتی گستردهای انجام داده است. مایک راکول، معاون سابق گروه محصولات Vision، جایگزین جان جیانندرا در رهبری تیم سیری شده و این تغییر نشاندهنده ناکامی اپل در توسعه هوش مصنوعی و عقب ماندن از رقبا است.
۱۴۰۴/۱/۲ ۰۱:۰۲:۰۵ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
همکاری NatWest با OpenAI برای ارتقای خدمات بانکی با هوش مصنوعی
بانک NatWest در انگلستان با OpenAI همکاری کرده تا با استفاده از هوش مصنوعی، تجربه مشتریان را بهبود بخشد. این همکاری شامل ارتقای دستیاران دیجیتال Cora و AskArchie برای افزایش کارایی خدمات بانکی و مقابله با کلاهبرداری مالی است. با این اقدام، بانک درصدد کاهش هزینهها و افزایش رضایت مشتریان است.
۱۴۰۴/۱/۱ ۱۷:۲۲:۰۹ -
گوگل با معرفی Chirp 3، پلتفرم توسعه هوش مصنوعی صوتی خود را گسترش میدهد
گوگل Chirp 3، رابط صوتی با کیفیت بالا را به پلتفرم Vertex AI اضافه میکند. این فناوری ، هشت صدای جدید را برای 31 زبان ارائه داده و کاربردهایی مانند دستیار صوتی، کتابهای گویا و تولید صدا برای ویدیو دارد. گوگل سعی در کنترل سوء استفاده از این فناوری با اعمال محدودیت هایی دارد و معتقد است هوش مصنوعی در دهه آینده تحولات مهمی ایجاد خواهد کرد.
۱۴۰۳/۱۲/۲۷ ۱۳:۵۱:۲۹ -
هوش مصنوعی کدنویسی Cursor: آموزش به جای تولید کد
دستیار کدنویسی Cursor در اقدامی جالب، به کاربری که درخواست تولید کد کرده بود توصیه کرد خودش کد را بنویسد تا سیستم را بهتر درک کند. این رویداد واکنشهای متفاوتی در شبکههای اجتماعی برانگیخت و سوالاتی درباره رویکرد هوش مصنوعی در آموزش و تولید کد مطرح شد.
۱۴۰۳/۱۲/۲۵ ۰۱:۴۴:۳۷ -
گوگل دستیار هوش مصنوعی خود را با Gemini جایگزین میکند
گوگل رسماً اعلام کرد که دستیار گوگل را در اکثر دستگاههای اندرویدی با Gemini جایگزین خواهد کرد. این تغییر شامل تلفنها، تبلتها، هدفونها و حتی دستیار خودرو میشود. Gemini که قابلیتهای محاورهای پیشرفتهتری دارد، به عنوان نسل جدید دستیارهای هوش مصنوعی معرفی میشود و تنها دستگاههای با حافظه محدود از این تغییر مستثنی هستند.
۱۴۰۳/۱۲/۲۴ ۲۳:۴۰:۲۴ -
گوگل از قابلیت Auracast در گوشیهای اندروید رونمایی کرد
گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک میکند تا در محیطهای پرسر و صدا مانند ایستگاه راهآهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشیهای سامسونگ Galaxy و Google Pixel با تنظیمات شخصیسازی صدا در دسترس خواهد بود.
۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸ -
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل
اپل در حال برنامهریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با بهروزرسانی نرمافزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیشتر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.
۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶ -
کوپایلوت بازی مایکروسافت؛ دستیار هوش مصنوعی برای گیمرها
مایکروسافت دستیار هوش مصنوعی «کوپایلوت برای بازی» را معرفی کرد که قابلیت راهنمایی بازیکنان در بازیهای مختلف را دارد. این دستیار صوتی میتواند اطلاعات تخصصی بازی، توصیههای فنی و حتی مشاوره برای انتخاب شخصیت مناسب در بازیهای آنلاین ارائه دهد. کوپایلوت همچنین قادر به نصب بازی، معرفی بازیهای جدید و برقراری ارتباط با دوستان بازیکن است.
۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۳۰ -
اسپاتیفای برنامه انتشار داستانهای کوتاه صوتی را راهاندازی کرد
اسپاتیفای برنامه جدیدی برای انتشار کتابهای صوتی کوتاه راهاندازی کرده که به نویسندگان اجازه میدهد داستانهای کوتاه خود را برای تبدیل به کتاب صوتی ارائه دهند. این شرکت که در زمینه پخش موسیقی و پادکست فعالیت دارد، داستانهای ژانرهای رمانس، معما، تریلر و علمی-تخیلی را میپذیرد و به نویسندگان پیشپرداخت و حق امتیاز میدهد.
۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۲۳ -
گوگل دیپ مایند مدلهای هوش مصنوعی Gemini Robotics را معرفی کرد
گوگل دیپ مایند، آزمایشگاه تحقیقاتی هوش مصنوعی، مدلهای جدید Gemini Robotics را رونمایی کرد که به رباتها امکان تعامل با اشیا و محیطهای مختلف را میدهد. این مدلها قادرند با دستورات صوتی، وظایفی مانند تا کردن کاغذ و گذاشتن عینک در جعبه را انجام دهند و در محیطهای آموزش ندیده نیز عملکرد خوبی دارند.
۱۴۰۳/۱۲/۲۳ ۰۰:۲۳:۲۴ -
پخش رایگان پادکست در وب پلیر Pocket Casts برای عموم
Pocket Casts با راهاندازی پخش رایگان پادکست در وبسایت خود، رویکردی باز و دموکراتیک در برابر پلتفرمهای بسته پادکست اتخاذ کرده است. کاربران میتوانند بدون نیاز به اشتراک یا ایجاد حساب کاربری، به پخش آزادانه پادکستها بپردازند و برای امکانات بیشتر میتوانند حساب رایگان ایجاد کنند.
https://pocketcasts.com/۱۴۰۳/۱۲/۲۱ ۲۲:۵۰:۲۶ -
OpenAI راهحلهای جدید توسعه دستیاران هوش مصنوعی را معرفی کرد
شرکت OpenAI ابزارهای جدیدی برای توسعهدهندگان منتشر کرد که به آنها امکان ساخت دستیار هوش مصنوعی مستقل (AI Agent) را میدهد.
این ابزارها شامل Responses API با قابلیتهای جستجوی وب، بررسی پروندهها و اجرای وظایف رایانهای است. این ابزار رایگان بوده و جایگزین Assistants API خواهد شد.
این اقدام در پاسخ به رقابت فزاینده استارتاپهای هوش مصنوعی چینی مانند Monica صورت گرفته است که ادعای عملکرد برتر در توسعه دستیار هوش مصنوعی دارند.
علیرغم محدودیتهای فعلی، OpenAI امیدوار است با این ابزارها بتواند شکاف بین نمایشهای تبلیغاتی و محصولات عملی دستیاران هوش مصنوعی را پر کند.۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۵۰ -
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه
نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه میدهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.
۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴ -
هشدار درباره ابزارهای جعل صدا؛ نبود محدودیتهای امنیتی در اکثر نرمافزارهای شبیهسازی صدا
گزارش جدید Consumer Reports نشان میدهد اکثر ابزارهای شبیهسازی صدا فاقد محافظتهای معنادار برای جلوگیری از سوء استفاده هستند. از شش شرکت بررسی شده، تنها Descript و Resemble AI اقداماتی برای مقابله با سوء استفاده انجام دادهاند و سایر شرکتها صرفاً تأیید حقوقی کاربر را کافی میدانند. کارشناسان هشدار میدهند این ابزارها میتوانند خطر کلاهبرداریهای صوتی را افزایش دهند.
۱۴۰۳/۱۲/۲۰ ۱۸:۴۹:۰۲ -
متا در آستانه معرفی مدل هوش مصنوعی Llama 4 با قابلیتهای صوتی پیشرفته
شرکت متا در حال آمادهسازی مدل Llama 4 است که با تمرکز بر قابلیتهای صوتی پیشرفته طراحی شده و کاربران میتوانند در حین گفتگو با مدل، گفتار مدل را قطع کنند. (یعنی وقتی مدل در حال صحبت است با حرف زدن صحبتش قطع می شود٫ مشابه نسخه صوتی chatgpt و live جمینی گوگل) . این مدل به عنوان یک مدل "همهکاره" قادر به تفسیر و تولید متن، گفتار و سایر انواع دادهها خواهد بود. رقابت با مدلهای هوش مصنوعی چینی DeepSeek، متا را به توسعه سریعتر Llama واداشته است.
۱۴۰۳/۱۲/۱۷ ۱۸:۵۶:۲۰ -
رقابت استارتاپ هوش مصنوعی Mistral AI با غول های فناوری جهان
Mistral AI یک استارتاپ فرانسوی در حوزه هوش مصنوعی است که با هدف دسترسی همگانی به فناوری پیشرفته تأسیس شده است. این شرکت با راهاندازی دستیار هوش مصنوعی Le Chat و جذب سرمایه بیش از یک میلیارد یورو، توانسته توجه جهانی را به خود جلب کند. مدیران Mistral AI که سابقه کار در شرکتهای بزرگ فناوری مانند گوگل و متا را دارند، با ارائه مدلهای مختلف هوش مصنوعی و همکاری با شرکتهای بینالمللی، قصد رقابت با OpenAI را دارند.
۱۴۰۳/۱۲/۱۶ ۲۲:۳۰:۰۱ -
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانیهای امنیتی
شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیهسازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفادههای احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.
۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶ -
طرح OpenAI برای عرضه دستیار هوش مصنوعی با قیمت های میلیونی
OpenAI قصد دارد محصولات هوش مصنوعی تخصصی با قیمت های متفاوت از 2000 تا 20000 دلار ماهانه راه اندازی کند. این عامل های هوش مصنوعی (AI Agents) برای کاربردهای مختلف مانند مدیریت فروش و مهندسی نرمافزار طراحی شدهاند. شرکت سرمایهگذار SoftBank متعهد به هزینه 3 میلیارد دلاری برای این محصولات شده است.
۱۴۰۳/۱۲/۱۵ ۲۳:۳۴:۱۲ -
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی
پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم میکند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریعتر و کارآمدتر میسازد و در شبکههای اجتماعی با استقبال گستردهای مواجه شده است.
۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵ -
گوگل Gemini با قابلیت جدید در صفحه قفل آیفون
کاربران Gemini اکنون میتوانند با اضافه کردن ویجت Gemini، به قابلیت هوش مصنوعی این دستیار در صفحه قفل آیفون دسترسی داشته باشند. این امکان شامل گفتگوی صوتی زنده، ثبت یادآور، رویداد تقویمی و آپلود تصاویر است که رقابت میان شرکتهای فناوری برای ارائه دستیارهای هوش مصنوعی را نشان میدهد.
۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۳ -
پادکستسازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد
podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعهدهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینههای تولید و افزایش کیفیت تبدیل متن به صدا است.۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱ -
همکاری Stability AI و Arm برای تولید صدای هوش مصنوعی در دستگاههای موبایل
استارتاپ Stability AI با همکاری شرکت Arm، مدل هوش مصنوعی Stable Audio Open را برای تولید صدا و افکت صوتی در دستگاههای موبایل بهینه کرده است. این مدل قادر است صداهایی مانند امواج دریا را با توصیف متنی تولید کند و با استفاده از محتوای رایگان حق تألیف آموزش دیده است.
۱۴۰۳/۱۲/۱۳ ۲۳:۵۵:۰۶ -
دویچه تلکوم و perplexity ، همکاری برای ساخت تلفن هوشمند هوش مصنوعی
perplexity
دویچه تلکوم در همکاری با perplexity، یک تلفن هوشمند مبتنی بر هوش مصنوعی با قیمت کمتر از ۱۰۰۰ دلار طراحی میکند. این تلفن هوشمند که در نیمه دوم سال جاری رونمایی خواهد شد، با استفاده از خدمات هوش مصنوعی پرپلکسیتی، گوگل کلود و سایر شرکتها قابلیتهای پیشرفتهای خواهد داشت و در بازار اروپا عرضه خواهد شد.۱۴۰۳/۱۲/۱۳ ۲۰:۲۶:۳۱ -
گوگل قابلیتهای جدید هوش مصنوعی Gemini را معرفی کرد
گوگل در کنگره جهانی موبایل، قابلیتهای جدیدی برای دستیار هوش مصنوعی Gemini رونمایی کرد. این قابلیتها شامل امکان اشتراکگذاری صفحه نمایش تلفن همراه و جستجوی ویدیویی میشود. این امکانات برای کاربران Gemini Advanced در اندروید در ماه جاری عرضه خواهد شد.
۱۴۰۳/۱۲/۱۳ ۱۴:۴۲:۳۷ -
سیری اپل در تلاش برای بازسازی با رویکرد هوش مصنوعی
اپل در حال بازسازی دستیار هوشمند سیری با رویکرد هوش مصنوعی تولیدی است. طبق گزارشها، نسخه جدید سیری در می ۲۰۲۵ با قابلیتهای هوش مصنوعی اپل معرفی خواهد شد. این دستیار دارای دو مغز هوشمند برای پاسخگویی به دستورات ساده و پیچیده خواهد بود و احتمالاً نسخه کامل و مدرن آن تا سال ۲۰۲۷ منتشر نخواهد شد.
۱۴۰۳/۱۲/۱۳ ۰۲:۰۳:۳۸



