دستیار صوتی Gemini جدید - صفحه 2 - اخبار فناوری - EcoFori

دستیار هوش مصنوعی Perplexity، همراه جدید گوشی‌های سامسونگ

📱 سامسونگ در آستانه سرمایه‌گذاری بزرگ در استارتاپ هوش مصنوعی Perplexity قرار دارد و قصد دارد فناوری این شرکت را در دستگاه‌های خود به‌کار بگیرد.
🔍 طبق گزارش بلومبرگ، قرار است اپلیکیشن و دستیار Perplexity به‌صورت پیش‌فرض روی گوشی‌های سامسونگ نصب شود و قابلیت جست‌وجوی آن در مرورگر اصلی گوشی ادغام گردد. 🌐
🗣️ همچنین بخشی از قابلیت‌های دستیار بیکسبی سامسونگ نیز ممکن است با فناوری Perplexity تقویت شود.
احتمال دارد این همکاری در سال جاری رسماً اعلام شود، هرچند هنوز دو شرکت واکنشی نشان نداده‌اند. 🕒
پیش از این اپل هم به استفاده از Perplexity در مرورگر سافاری فکر کرده بود و موتورولا نیز همکاری خود را آغاز کرده است. 🤝

۱۴۰۴/۳/۱۴ ۰۲:۲۳:۰۹
آمازون با خلاصه‌های صوتی هوشمند، خرید را متحول می‌کند

🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش می‌کند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، می‌توانید توضیحاتی صوتی درباره ویژگی‌ها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمه‌ای تولید شده‌اند تا خرید راحت‌تر و سریع‌تری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد به‌زودی آن را گسترش دهد. 🌍🛍️

۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶
NotebookLM گوگل حالا تصویری شد؛ تبدیل یادداشت‌ها به ویدیو با هوش مصنوعی!

گوگل در I/O 2025 از قابلیت‌های جدیدی برای ابزار هوش مصنوعی NotebookLM رونمایی کرد. 🧠📒 این ابزار که برای یادداشت‌برداری و تحقیق طراحی شده، حالا می‌تواند محتواهای پیچیده مثل یادداشت‌ها، PDFها و تصاویر را به ویدیوهای قابل‌فهم تبدیل کند. 🎥📝
قابلیت «Video Overviews» کمک می‌کند موضوعات سخت را به‌صورت تصویری بهتر درک کنید، در ادامه نسخه صوتی هم ارتقا یافته و حالا می‌توان طول فایل‌های صوتی را به دلخواه تنظیم کرد. 🎧🗣️
همچنین اپلیکیشن NotebookLM برای اندروید و iOS منتشر شده و قابلیت‌هایی مثل پخش در پس‌زمینه و حالت آفلاین را دارد.📱

۱۴۰۴/۳/۱ ۰۳:۱۲:۳۱
شمارش معکوس برای گوگل I/O 2025: چه چیزهایی در انتظار ماست؟

🔍 گوگل در رویداد سالانه I/O خود، از جدیدترین فناوری‌ها و محصولاتش رونمایی می‌کند. این رویداد در روزهای ۲۰ و ۲۱ می برگزار می‌شود و شامل معرفی قابلیت‌های جدید Gemini AI، اندروید ۱۶ و Android XR (پلتفرم واقعیت افزوده و ترکیبی) خواهد بود. 🌐🤖
📱 گزارش‌ها حاکی از این است که گوگل ممکن است دوباره به دنیای عینک‌های هوشمند بازگردد. شاید این بار رقیبی جدی برای عینک‌های Ray-Ban متا باشد. 👓

۱۴۰۴/۲/۳۰ ۲۲:۳۰:۵۰
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
Alexa+ در سراشیبی ناکامی

🚨 سرویس هوش مصنوعی جدید Alexa+ آمازون با مشکلاتی در دسترسی کاربران مواجه شده است.
با وجود اعلام آمازون مبنی بر دسترسی صدها هزار کاربر، شواهد عمومی از کاربران واقعی Alexa+ بسیار کم است. ❌
Alexa+ که با قابلیت‌های جدید هوش مصنوعی طراحی شده، قرار بود دستیار صوتی آمازون را احیا کند، اما کاربران از سرعت پایین و گاهی اطلاعات نادرست شکایت دارند. ⚡🤖

۱۴۰۴/۲/۲۸ ۱۹:۲۸:۳۷
Peak Points؛ استراتژی جدید تبلیغات یوتیوب

🚀 یوتیوب با معرفی فرمت جدید تبلیغاتی خود به نام “Peak Points” تلاش می‌کند تبلیغات را دقیقاً در لحظات احساسی و اوج توجه بینندگان نمایش دهد! 📺💥 این قابلیت با استفاده از هوش مصنوعی Gemini گوگل، ویدیوها را تحلیل می‌کند و بهترین زمان برای نمایش تبلیغات را شناسایی می‌کند. 🎯 تبلیغاتی که دقیقاً پس از لحظات مهم و احساسی ظاهر می‌شوند، تأثیر بیشتری بر کاربران دارند. اما این روش ممکن است برای برخی کاربران خسته‌کننده باشد، به‌ویژه زمانی که در اوج احساسات هستند. همزمان، یوتیوب قابلیت جدیدی را معرفی کرده که به کاربران امکان می‌دهد حین تبلیغات محصولات را خریداری کنند! 🛒✨

۱۴۰۴/۲/۲۶ ۰۲:۲۴:۵۷
از ساعت مچی تا تلویزیون؛ سلطه Gemini بر دستگاه‌های هوشمند

گوگل با رونمایی از Gemini به دنیای ساعت‌های هوشمند Wear OS و تلویزیون Google TV وارد شد! این دستیار هوش مصنوعی که به زودی جایگزین Google Assistant می‌شود، قرار است زندگی کاربران را هوشمندتر کند. 📱⌚️
👋 از حالا، با Gemini روی مچ دستتان، می‌توانید هنگام دوچرخه‌سواری یا آشپزی با دست‌های آردی، پیام بفرستید یا یادآوری تنظیم کنید. 🍕🚴‍♂️ حتی اگر گوشی‌تان درون کمد باشه، فقط بگید: “یادآوری: امروز از کمد ۴۳ استفاده می‌کنم!” 🔖
📺 در تلویزیون Google TV، Gemini به شما فیلم‌ها و سریال‌های مناسب سن کودکان را پیشنهاد می‌دهد. 🎥🎬
🎮 اما این پایان ماجرا نیست! گوگل این دستیار هوشمند را به پلتفرم جدید Android XR (واقعیت افزوده) و Android Auto نیز می‌آورد. عینک هوشمند بزنید و دنیای دیجیتال را به چشمانتان بیاورید یا در خودرو با Gemini مسیرها و اخبار را بررسی کنید. 🚗🗺️

۱۴۰۴/۲/۲۵ ۰۳:۲۱:۲۲
هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
وقتی هوش مصنوعی Gemini 2.5 گوگل دقیق‌تر دستور می‌گیرد اما مرز ایمنی را رد می‌کند

🤖⚠️📉
‌📄 گزارش فنی گوگل نشان می‌دهد مدل Gemini 2.5 Flash در تست‌های ایمنی عملکرد ضعیف‌تری نسبت به نسخه قبلی دارد.
‌🔍 این مدل دستورها را بهتر اجرا می‌کند، اما در برخی موارد، محتوای ناسازگار با سیاست‌های ایمنی تولید
کرده است.
⚠️ برای مثال، در یکی از آزمایش‌ها، مدل بدون هیچ مخالفتی مقاله‌هایی تولید کرد که از جایگزینی قضات انسانی با هوش مصنوعی و تضعیف حقوق قانونی متهمان دفاع می‌کرد.
‌🧠 گوگل علت را بخشی ناشی از تشخیص اشتباه دانسته، اما تأیید کرده که در مواردی نقض واقعی رخ داده است.
‌🔓 هم‌زمان با تلاش شرکت‌ها برای کاهش محدودیت در پاسخ به موضوعات بحث‌برانگیز، کارشناسان خواهان شفافیت بیشتر گوگل در گزارش‌های ایمنی شده‌اند.

۱۴۰۴/۲/۱۵ ۱۵:۵۵:۲۷
جنگ الکسا و سیری؛ آمازون فعلاً جلوتر است

🤖🔥 دستیار صوتی هوشمند Alexa+ آمازون حالا روی بیش از ۱۰۰,۰۰۰ دستگاه فعال است! اما هنوز خبری از قابلیت‌هایی مثل داستان‌گویی برای کودک، پیشنهاد هدیه یا اجرای اپ‌های دیگر نیست. مدیرعامل آمازون تأیید کرده که این نسخه هنوز دقیق نیست و هدف نهایی رسیدن به ۹۰٪ دقت است و قرار است الکسا در آیند بصورت طبیعی با کاربر گفتگو کند.🎯
در همین زمان، سیری اپل همچنان در حال آماده‌سازی نسخه جدیدش است و عقب‌تر از آمازون حرکت می‌کند. رقابت غول‌های فناوری برای تسخیر آینده‌ی دستیارهای هوشمند ادامه دارد! ⚡️📱

۱۴۰۴/۲/۱۳ ۰۷:۳۷:۳۷
گوگل قابلیت جدید ویرایش تصویر را به ربات هوش مصنوعی Gemini اضافه کرد

🚀 ربات Gemini گوگل، با یک قابلیت جدید و جذاب، دنیای ویرایش تصاویر را متحول کرد! 📸✨ حالا می‌توانید پس‌زمینه تصاویر را عوض کنید، چهره خود را با رنگ موهای جدید ببینید و حتی داستان‌های تصویری خلاقانه بسازید! 🖼️👩‍🎨 این فناوری فوق‌العاده، در بیش از ۴۵ زبان جهان در دسترس قرار می‌گیرد و برای جلوگیری از تصاویر جعلی (دیپ‌فیک)، همه عکس‌ها را با واترمارک نامرئی امن کرده است.🔐🌐

۱۴۰۴/۲/۱۲ ۰۸:۵۴:۰۰
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
نتفلیکس زیرنویس جدید خود را معرفی کرد

نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
اپل مجبور شد وعده «دستیار هوش مصنوعی در دسترس» را از سایت خود حذف کند

سازمان ملی تبلیغات آمریکا از اپل خواست تا عبارت «اکنون در دسترس» را از صفحه هوش مصنوعی خود حذف کند.
اپل وعده داده بود قابلیت‌های هوش مصنوعی آیفون ۱۶ با عنوان Apple Intelligence هم‌اکنون فعال‌اند، اما بررسی این نهاد نظارتی نشان داد که همه این ویژگی‌ها در دسترس نیستند. به‌دنبال این موضوع، اپل مجبور شد عبارت «در دسترس اکنون» را از وب‌سایتش حذف کند. برخی قابلیت‌ها مثل Siri جدید هنوز آماده نیستند و حتی ویژگی‌های فعال‌شده نیز عملکرد ضعیفی داشته‌اند. اپل ضمن مخالفت با این نتیجه، اعلام کرد که توصیه‌ها را می‌پذیرد.

۱۴۰۴/۲/۴ ۰۰:۴۸:۰۴
تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸
عینک واقعیت افزوده جدید گوگل معرفی شد

گوگل در کنفرانس TED2025 از نمونه‌ای جدید از عینک‌های واقعیت افزوده (XR) خود رونمایی کرد؛ عینکی که به‌ظاهر شبیه عینک‌های معمولی است، اما می‌تواند متن‌ها را نمایش دهد، با هوش مصنوعی گفت‌وگو کند، زبان‌ها را ترجمه کند و حتی آهنگ درخواستی را از یوتیوب پخش کند.

این عینک‌ها با سیستم عامل اختصاصی گوگل برای XR کار می‌کنند و می‌توانند از طریق دوربین و میکروفون اطلاعات محیط را پردازش کرده و به کاربر کمک کنند. با اینکه این فناوری پیشرفته و جذاب است، هنوز مشخص نیست که آیا گوگل قصد دارد این محصول را به بازار عرضه کند یا نه.

۱۴۰۴/۱/۲۲ ۲۲:۱۴:۳۰
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
گوگل قابلیت‌های هوش مصنوعی دستیار کدنویسی Gemini Code Assist را گسترش داد

گوگل در کنفرانس Cloud Next، قابلیت‌های جدید هوش مصنوعی برای Gemini Code Assist معرفی کرد. این دستیار کدنویسی اکنون می‌تواند وظایف پیچیده برنامه‌نویسی مانند ایجاد اپلیکیشن از مستندات گوگل، تبدیل کد بین زبان‌های مختلف ، ایجاد مستندات و بازبینی کد را انجام دهد. با این حال، محدودیت‌های فعلی هوش مصنوعی در تولید کد، نیاز به بررسی دقیق کدهای تولید شده را توسط انسان ضروری می‌سازد.

۱۴۰۴/۱/۲۱ ۱۶:۳۴:۰۵
مایکروسافت 50 ساله شد و قابلیت‌های جدید هوش مصنوعی Copilot را معرفی کرد

مایکروسافت به مناسبت پنجاهمین سالگرد تأسیس، قابلیت‌های جدیدی را به دستیار هوش مصنوعی Copilot افزوده است. این هوش مصنوعی اکنون می‌تواند در اکثر وب‌سایت‌ها اقدام به رزرو بلیت و رستوران کند، تصاویر را تحلیل کند، جزئیات شخصی کاربر را به خاطر بسپارد و حتی پادکست مجازی تولید کند. Copilot همچنین قابلیت جستجو و سازماندهی فایل‌ها در سیستم عامل ویندوز را نیز دارد.

۱۴۰۴/۱/۱۶ ۲۰:۳۳:۱۵
دستیار خرید جدید آمازون، از سایت‌های دیگر هم برای شما خرید می‌کند

آمازون در حال آزمایش یک ویژگی جدید به نام “Buy for Me” است. اگر محصولی در آمازون موجود نباشد، این هوش مصنوعی محصولات مشابه را در سایت‌های دیگر جستجو کرده و امکان خرید آن‌ها را مستقیماً از داخل اپلیکیشن آمازون فراهم می‌کند.
این فناوری از مدل‌های هوش مصنوعی آمازون و شرکت Anthropic استفاده می‌کند و اطلاعات پرداخت کاربران را به‌صورت رمزگذاری‌شده در سایت‌های دیگر وارد می‌کند.

۱۴۰۴/۱/۱۶ ۱۸:۰۶:۵۱
سرعت گوگل در انتشار مدل‌های هوش مصنوعی از گزارش‌های ایمنی آن پیشی گرفته است

گوگل به شدت سرعت توسعه و عرضه مدل‌های هوش مصنوعی خود را افزایش داده است تا از رقبا عقب نماند. در چند ماه اخیر، این شرکت مدل‌های جدیدی مانند را منتشر کرده که در زمینه‌هایی مانند کدنویسی و ریاضیات عملکرد فوق‌العاده‌ای دارند. اما نکته نگران‌کننده این است که گوگل هنوز گزارش‌های ایمنی این مدل‌ها را منتشر نکرده است، در حالی که دیگر شرکت‌های بزرگ مانند OpenAI و Meta چنین گزارش‌هایی را برای مدل‌های خود ارائه می‌دهند.

گوگل می‌گوید که این مدل‌ها هنوز در مرحله آزمایشی هستند و بعداً اطلاعات مربوط به ایمنی آن‌ها منتشر خواهد شد. با این حال، برخی کارشناسان معتقدند که این روند می‌تواند به کاهش شفافیت و افزایش خطرات احتمالی هوش مصنوعی منجر شود، به‌ویژه در شرایطی که قوانین نظارتی مشخصی برای کنترل ایمنی این مدل‌ها وجود ندارد.

۱۴۰۴/۱/۱۶ ۰۲:۰۹:۲۶
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد

اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغ‌دهندگان امکان می‌دهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را به‌صورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغ‌کنندگان اجازه می‌دهد در لحظه و به‌صورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.

۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹
توقف پشتیبانی Google Assistant از Waze در iOS

شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفته‌ای را جایگزین خواهد کرد و همزمان روی ویژگی گزارش‌دهی مکالمه‌ای مبتنی بر هوش مصنوعی کار می‌کند.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶
گوگل با قابلیت‌های جدید هوش مصنوعی Gemini از اپل پیشی گرفت

گوگل قابلیت‌های جدید هوش مصنوعی Gemini را برای کاربران Android راه‌اندازی کرد. این امکانات شامل استفاده از دوربین برای شناسایی اشیا و اشتراک‌گذاری صفحه نمایش است که برای کاربران Gemini Advanced و Google One AI Premium در دسترس است. این ویژگی‌ها به کاربران اجازه می‌دهد تا Gemini را برای راهنمایی در دنیای واقعی مانند خرید کاشی یا شناسایی اشیا استفاده کنند.

۱۴۰۴/۱/۶ ۲۰:۴۳:۱۸
بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
تغییرات مدیریتی اپل در تیم هوش مصنوعی سیری

اپل در پاسخ به ضعف سیری در پاسخگویی به پرسش‌های ساده، تغییرات مدیریتی گسترده‌ای انجام داده است. مایک راکول، معاون سابق گروه محصولات Vision، جایگزین جان جیانندرا در رهبری تیم سیری شده و این تغییر نشان‌دهنده ناکامی اپل در توسعه هوش مصنوعی و عقب ماندن از رقبا است.

۱۴۰۴/۱/۲ ۰۱:۰۲:۰۵

نمایش بیشتر