موتور صدای هوش مصنوعی - اخبار فناوری - EcoFori

تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانی‌های امنیتی

شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیه‌سازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفاده‌های احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.

۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶
دستیار هوش مصنوعی مبتنی بر Google Gemini به خودروهای جنرال موتورز می‌آید

شرکت جنرال‌موتورز (GM) در یک رویداد در نیویورک اعلام کرد از سال آینده خودروهای بیوک، شورولت، کادیلاک و جی‌ام‌سی به دستیار گفت‌وگومحور Google Gemini مجهز می‌شوند تا رانندگان بتوانند با هوش مصنوعی صحبت کنند، پیام ارسال کنند، مسیر خود را با توقف‌های دلخواه (مثل شارژ یا قهوه) تنظیم کنند و حتی پیش از حرکت، خودرو را برای جلسه آماده سازند؛ مثلاً تنظیم دما، نمایش خلاصه ایمیل‌ها یا مسیر جلسه. 🚗🤖
این دستیار از طریق سیستم OnStar به داده‌های خودرو متصل می‌شود تا هشدارهای فنی، پیشنهاد مسیر و توضیح ویژگی‌هایی مانند رانندگی با یک پدال را ارائه دهد؛ یعنی راننده تنها با فشردن یا رها کردن پدال گاز، خودرو را حرکت دهد یا متوقف کند. ⚙️🦶

۱۴۰۴/۸/۳ ۰۸:۵۰:۵۱
Cadillac Escalade IQ؛ جنرال موتورز از معماری هوشمند با تراشه انویدیا رونمایی کرد

شرکت جنرال موتورز اعلام کرده است که از سال ۲۰۲۷ با معرفی مدل Cadillac Escalade IQ نسل جدیدی از خودروهای خود را با معماری کاملاً هوشمند عرضه می‌کند. ⚙️ این سیستم با همکاری انویدیا و استفاده از ابررایانه‌ی Nvidia Drive Thor ساخته شده و توان پردازش و سرعت نرم‌افزار را چندین برابر افزایش می‌دهد. 💻 در این ساختار جدید، تمام بخش‌های خودرو مانند پیشرانه، فرمان، ترمز و سیستم ایمنی به‌صورت یکپارچه و بلادرنگ کنترل می‌شوند. 🔄 جنرال موتورز می‌گوید این فناوری عملکرد هوش مصنوعی را تا ۳۵ برابر و ظرفیت به‌روزرسانی از راه دور را تا ۱۰ برابر افزایش می‌دهد و هدف آن رساندن زمان توسعه خودروها از پنج سال به دو سال است. 🚀

۱۴۰۴/۸/۳ ۰۸:۵۰:۴۸
وقتی ویدیوهای بازی، سوخت موتور هوش مصنوعی می‌شوند!

استارتاپ General Intuition از دل پلتفرم اشتراک ویدیوهای بازی Medal متولد شده و هدفش ساخت هوش مصنوعی‌هایی است که بتوانند حرکت اشیا و انسان‌ها را در فضا و زمان درک کنند؛ مفهومی که به آن «استدلال فضا‌-‌زمانی» گفته می‌شود. 🎮🤖
این شرکت از ۲ میلیارد ویدیو بازی در سال و داده‌های ۱۰ میلیون کاربر استفاده می‌کند و معتقد است این منابع برای آموزش مدل‌های هوش مصنوعی از Twitch و YouTube مؤثرترند. 📊 همین موضوع باعث شد OpenAI سال گذشته پیشنهاد خرید ۵۰۰ میلیون دلاری Medal را مطرح کند.💰
General Intuition قصد دارد عامل‌هایی بسازد که در دنیای واقعی مانند ربات‌ها و پهپادهای نجات عمل کنند. 🚀 این مدل‌ها می‌توانند فقط با تصویر محیط را درک کرده و تصمیم بگیرند، مشابه یک بازیکن انسانی. 👁️
هدف نهایی شرکت، ساخت کاراکترهای هوشمند و فناوری‌هایی است که راه را به سوی هوش مصنوعی عمومی واقعی یا AGI هموار کنند. 🧠✨

۱۴۰۴/۷/۲۶ ۲۳:۳۹:۱۰
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
آیا هوش مصنوعی جایگزین موتورهای جستجو می‌شود؟

مدیرعامل Cloudflare، متیو پرینس در پادکستی هشدار داده که دوران موتورهای جستجو تمام شده و جای آن‌ها را «موتورهای پاسخ» هوش مصنوعی گرفته‌اند. او می‌گوید این تغییر برای روزنامه‌نگاران، پژوهشگران و تولیدکنندگان محتوا خطرناک است، چون وقتی کاربران پاسخ آماده از هوش مصنوعی می‌گیرند، دیگر کمتر به سراغ وب‌سایت‌ها می‌روند. 🤖⚠️
پرینس سه آینده احتمالی ترسیم می‌کند: یکی، «اینترنت مرده» (Dead Internet) که محتوای انسانی کاملاً از بین می‌رود؛ دیگری، سناریوی «بلک میرر» (Black Mirror) که در آن چند شرکت بزرگ هوش مصنوعی مثل OpenAI یا Anthropic همه اطلاعات را کنترل می‌کنند؛ و سوم، آینده‌ای بهتر که در آن شرکت‌های AI مثل نتفلیکس، برای استفاده از محتوای ناشران پول پرداخت می‌کنند. 📜🌍
او می‌گوید تنها راه حفظ اینترنت زنده، این است که ناشران دسترسی ربات‌های هوش مصنوعی به محتوای خود را محدود کنند مگر اینکه هزینه بپردازند. Cloudflare هم امسال این امکان را به مشتریانش داده و شرکت‌های بزرگی مثل Associated Press و Conde Nast از آن استفاده کرده‌اند. ✅💡

۱۴۰۴/۶/۲۸ ۰۴:۳۲:۱۷
گوگل AI Mode را به پنج زبان جدید گسترش داد

گوگل قابلیت جستجوی هوش مصنوعی خود با نام AI Mode را که تاکنون فقط به انگلیسی فعال بود، به پنج زبان جدید شامل هندی، اندونزیایی، ژاپنی، کره‌ای و پرتغالی برزیلی گسترش داد. این ویژگی حالا در بیش از ۱۸۰ کشور فعال است و به کاربران اجازه می‌دهد پرسش‌های پیچیده را در زبان دلخواه خود مطرح کنند. 🌍🤖
AI Mode بر پایه Gemini 2.5 ساخته شده و رقیبی برای پلتفرم‌هایی مثل Perplexity و ChatGPT Search محسوب می‌شود. گوگل همچنین امکاناتی مثل رزرو رستوران را آزمایش کرده که فعلاً فقط برای مشترکان ویژه در آمریکا و با هزینه ماهانه ۲۴۹.۹۹ دلار در دسترس است. 📲💡
گوگل می‌گوید این قابلیت به‌زودی می‌تواند به حالت پیش‌فرض جستجو تبدیل شود و برخلاف برخی انتقادها، باعث کاهش بازدید سایت‌ها نشده است. ✅🔎

۱۴۰۴/۶/۲۰ ۱۲:۱۳:۴۷
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!

گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که می‌تواند صحبت‌ها را به‌صورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپ‌فیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا می‌شود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمی‌شود. گوگل امیدوار است این فناوری راه را برای ارتباط آسان‌تر میان زبان‌های مختلف باز کند، هرچند نگرانی‌هایی درباره سوءاستفاده از دیپ‌فیک همچنان وجود دارد. ✅🌍

۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸
اپل در حال ساخت اپلیکیشن مشابه ChatGPT

بلومبرگ گزارش داد اپل تیم جدیدی با نام «Answers, Knowledge, and Information» تشکیل داده تا یک اپلیکیشن مشابه ChatGPT توسعه دهد. این تیم در حال ساخت یک «موتور پاسخ‌گویی» است که بتواند با استفاده از اطلاعات سراسر وب به پرسش‌ها پاسخ دهد. 🤖📱
این فناوری می‌تواند به‌صورت یک اپلیکیشن مستقل عرضه شود یا قابلیت‌های جست‌وجو را در سرویس‌هایی مانند سیری، سافاری و سایر محصولات اپل تقویت کند. اپل همچنین برای جذب نیرو در این پروژه، به‌دنبال متخصصان الگوریتم‌های جست‌وجو و توسعه موتورهای جست‌وجو است. 🔍💼
هرچند ChatGPT پیش‌تر در سیری ادغام شده، اما نسخه شخصی‌سازی‌شده و پیشرفته‌تر این دستیار صوتی بارها با تأخیر مواجه شده است. شکست حقوقی اخیر گوگل در پرونده ضدانحصار نیز ممکن است اپل را وادار به تغییر قرارداد جست‌وجو با این شرکت کند. ✅⚖️

۱۴۰۴/۵/۱۴ ۰۱:۵۶:۲۰
Perplexity Labs؛ هوش مصنوعی در خدمت پروژه‌های شخصی و کاری شما

🔍 شرکت Perplexity، که با موتور جستجوی هوش مصنوعی خود در حال رقابت با گوگل است، ابزار جدیدی به نام Perplexity Labs معرفی کرده است. این ابزار برای انجام پروژه‌های کاری یا شخصی طراحی شده است. 💼🧠
🧪 Perplexity Labs می‌تواند گزارش، جدول، داشبورد و حتی اپ‌های ساده بسازد. برای این کار از ابزارهایی مثل جستجوی وب، تولید کد، ساخت نمودار و تصویر استفاده می‌شود. همه فایل‌ها در یک تب مخصوص ذخیره می‌شوند و قابل مشاهده و دانلود هستند. 📊📂
✨ هدف Perplexity از این ابزار، گسترش خدمات فراتر از جستجو و ورود به فضای تولید محتوای کاربردی است. این شرکت اخیراً مرورگر وب Comet را معرفی کرده و شبکه اجتماعی Read.vc را نیز خریداری کرده است. 🌐🚀

۱۴۰۴/۳/۱۰ ۰۱:۱۱:۰۴
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
آیا گربه‌تان می‌تواند با شما صحبت کند؟ بایدو می‌گوید بله!

🐾 شرکت فناوری چینی بایدو (Baidu) پتنتی برای سیستم هوش مصنوعی ثبت کرده که می‌تواند صدای حیوانات را به زبان انسان ترجمه کند! 🤖 این سیستم با تحلیل صداها، رفتارها و سیگنال‌های فیزیولوژیکی، احساسات حیوانات را شناسایی و به جملات انسانی تبدیل می‌کند. 💬
این فناوری می‌تواند ارتباط عمیق‌تری بین انسان و حیوانات ایجاد کند. ❤️ اگرچه این پروژه هنوز در مرحله تحقیقاتی است، برخی کاربران شبکه‌های اجتماعی چین مشتاقانه منتظر این فناوری‌اند، در حالی که برخی دیگر با تردید به عملکرد آن نگاه می‌کنند. 🐕
📌 بایدو، یکی از پیشگامان هوش مصنوعی در چین، با مدل جدید Ernie 4.5 Turbo به دنبال تثبیت جایگاه خود است. 🚀🔥

۱۴۰۴/۲/۲۲ ۰۰:۴۴:۲۷
هوش مصنوعی صدای مقتول را در دادگاه زنده کرد!

⚖️ در رویدادی بی‌سابقه، خانواده کریستوفر پلکی که در سال ۲۰۲۱ در یک حادثه خشونت جاده‌ای در آریزونا کشته شده بود، با استفاده از هوش مصنوعی صدای او را به دادگاه بازگرداندند. این ویدیو، چهره و صدای پلکی را بازسازی کرده بود که با قاتلش صحبت می‌کرد: «افسوس که آن روز همدیگر را در آن شرایط ملاقات کردیم. شاید در زندگی دیگر، دوستان می‌شدیم.» 💔🚗
🚔 گابریل پل هورکاسیتاس به جرم قتل غیرعمد به ۱۰سال زندان محکوم شد.
👩‍💻 استیسی ویلز، خواهر پلکی، این ویدیو را به همراه همسر و دوست خانوادگی خود که در حوزه فناوری کار می‌کنند، طراحی کرد. هدف او «انسانی‌کردن کریستوفر و نشان‌دادن تأثیر او در این دنیا» بود. 💡🌐
❗ اما این استفاده خلاقانه از هوش مصنوعی در دادگاه‌ها نگرانی‌های اخلاقی ایجاد کرده است. هری سوردن، استاد حقوق، هشدار داده که چنین فناوری‌هایی می‌توانند احساسات قضات و هیئت منصفه را دستکاری کنند. ❓

۱۴۰۴/۲/۲۱ ۱۲:۴۱:۵۷
۱۴۰۴/۲/۱۱ ۱۹:۳۰:۰۹
هدف‌گیری مد و فناوری؛ ایرپادهای جدید موتورولا با کریستال‌های سواروسکی

موتورولا از ایرپادهای جدید خود به نام Moto Buds Loop رونمایی کرده که در نسخه‌ای خاص با کریستال‌های سواروسکی (Swarovski) تزئین شده‌اند. این ایرپادها به جای قرارگیری داخل گوش، روی گوش قرار می‌گیرند و صدا را به‌صورت غیرمستقیم منتقل می‌کنند، بنابراین صدای محیط را نیز حفظ میکنند. طراحی آن‌ها بیشتر روی سلیقه‌ مدگرایان تمرکز دارد. نسخه خاص این محصول با ظاهر درخشانش، مناسب کسانی‌ست که به سبک شخصی خود اهمیت می‌دهند. از نظر فنی، این ایرپادها دارای صدای فضایی، عمر باتری تا ۸ ساعت (و ۳۷ ساعت با کیس)، و پشتیبانی از خلاصه‌سازی نوتیفیکیشن‌ها با هوش مصنوعی Moto AI گوشی های موتورولا هستند. هنوز قیمت و زمان عرضه این محصول مشخص نیست، اما انتظار می‌رود نسخه لوکس آن بسیار گران‌قیمت باشد.

۱۴۰۴/۲/۵ ۲۰:۰۱:۲۶
موتورولا سه گوشی هوشمند تاشو Razr با تمرکز بر هوش مصنوعی معرفی کرد

موتورولا سه مدل گوشی تاشو Razr شامل Razr، Razr+ و Razr Ultra را با تمرکز بر قابلیت‌های هوش مصنوعی معرفی کرد. این گوشی‌ها با همکاری شرکت‌های بزرگ فناوری مانند Perplexity، گوگل، متا و مایکروسافت، قابلیت‌های هوشمندانه‌ای مانند پیشنهاد وظایف، خلاصه‌نویسی و یادآوری اطلاعات را ارائه می‌دهند. مدل Ultra به عنوان پرچمدار با صفحه نمایش 7 اینچی، دوربین 50 مگاپیکسلی و باتری 4700 میلی‌آمپری معرفی شده است.

۱۴۰۴/۲/۵ ۱۹:۵۱:۱۸
افشای رد پیشنهاد همکاری OpenAI توسط گوگل در دادگاه

در جریان دادگاه ضدانحصار گوگل، مشخص شد که OpenAI قصد داشته برای بهبود جست‌وجوی چت‌بات ChatGPT از فناوری جست‌وجوی گوگل استفاده کند، اما گوگل این درخواست را رد کرده است. OpenAI گفته بود استفاده از جست‌وجوی گوگل باعث بهبود عملکرد چت‌بات می‌شود. این درخواست در حالی مطرح شده که OpenAI هم‌اکنون از موتور جست‌وجوی بینگ (وابسته به مایکروسافت) بهره می‌برد.
وزارت دادگستری آمریکا تلاش دارد گوگل را مجبور کند مرورگر کروم را بفروشد و قراردادهای انحصاری‌اش را لغو کند تا رقابت در حوزه جست‌وجو و تبلیغات بازگردد. دادستان‌ها همچنین نگران آن هستند که گوگل با استفاده از برتری در جست‌وجو، بر هوش مصنوعی نیز مسلط شود. گوگل اما ادعا می‌کند با رقبای بزرگی مثل مایکروسافت و متا روبه‌رو است.

۱۴۰۴/۲/۳ ۲۱:۴۹:۴۸
رشد چشمگیر جستجوی ChatGPT در اروپا

قابلیت جست‌وجوی ChatGPT در اروپا رشد چشمگیری داشته و تعداد کاربران فعال آن در شش ماه گذشته از ۱۱ میلیون به بیش از ۴۱ میلیون نفر رسیده است. اگر این روند ادامه یابد، ممکن است مشمول مقررات سخت اتحادیه اروپا شود. این مقررات شامل محدودسازی الگوریتم‌ها، اشتراک داده با نهادها و جریمه‌های سنگین در صورت عدم رعایت است. در حالی‌که محبوبیت این قابلیت در حال افزایش است، تحقیقات نشان می‌دهد دقت آن در مقایسه با موتورهایی مثل گوگل کمتر است و گاهی اطلاعات اشتباه ارائه می‌دهد.

۱۴۰۴/۲/۳ ۰۳:۱۵:۴۰
سرمایه‌گذاری ۲۰ میلیون دلاری روی موتور الکتریکی جدید و کم‌هزینه

استارتاپ Conifer، متشکل از مهندسان سابق اپل و Lucid، موفق به جذب ۲۰ میلیون دلار سرمایه برای تولید موتورهای الکتریکی جدیدی شده که بدون عناصر کمیاب و با آهنرباهای رایج ساخته می‌شوند. این موتورها کوچک‌تر، ارزان‌تر و کارآمدتر از مدل‌های قبلی هستند و به‌راحتی جایگزین موتورهای چرخ فعلی می‌شوند.
هدف اصلی Conifer وسایل نقلیه سبک است، اما تولیدکنندگان تراکتور، چمن‌زن و تهویه نیز علاقه‌مند شده‌اند. این شرکت با تکیه بر تولید محلی و خطوط تولید خودکار، قصد دارد محصول خود را امسال وارد بازار کند.

۱۴۰۴/۱/۳۱ ۱۵:۴۷:۳۹
هک جالب در سیلیکون‌ولی: دکمه‌های عابرپیاده با صدای ایلان ماسک و زاکربرگ صحبت می‌کنند!

در آخر هفته گذشته، دکمه‌های صوتی مخصوص عابران پیاده در سیلیکون‌ولی هک شدند. صدای این دکمه‌ها به‌جای پیام‌های معمولی، جملاتی تقلیدی از صدای مارک زاکربرگ و ایلان ماسک پخش می‌کردند که توسط هوش مصنوعی تولید شده بودند.

در یکی از پیام‌ها با صدای زاکربرگ گفته می‌شود: «نگران نباشید، چون کاری از دست‌تان برنمی‌آید!» و در پیام دیگری با صدای ماسک گفته می‌شود: «پول خوشبختی نمی‌آره، ولی یه سایبرتراک می‌تونه بیاره!»

برخی کاربران در شبکه‌های اجتماعی با طنز به این اتفاق واکنش نشان دادند. مقام‌های محلی در حال بررسی این موضوع هستند و احتمال می‌دهند که این اقدام نوعی «هکتیویسم» (ترکیب هک و اعتراض سیاسی/اجتماعی) باشد.
کارشناسان امنیتی پیش‌تر هشدار داده بودند که برخی از این دکمه‌ها با رمزهای پیش‌فرض محافظت می‌شوند و می‌توان آن‌ها را به‌راحتی تغییر داد.

۱۴۰۴/۱/۲۶ ۱۸:۲۲:۰۹
موتورولا آماده معرفی نسل جدید گوشی‌های تاشو Razr با قابلیت‌ هوش مصنوعی

موتورولا در رویدادی پیش رو، نسل هفتم گوشی‌های تاشوی Razr را معرفی خواهد کرد. این گوشی‌ها با بهبود عملکرد سخت‌افزاری، نمایشگرهای روشن‌تر و دوربین بهتر همراه خواهند بود. شرکت همچنین قابلیت‌های هوش مصنوعی Moto AI را معرفی می‌کند که شامل خلاصه‌سازی اعلان‌ها، رونویسی خودکار و ویرایش تصاویر خواهد بود.

۱۴۰۴/۱/۲۳ ۰۱:۱۴:۱۱
صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد

صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگ‌ساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانه‌های شخصی را منتقل می‌کند.

۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷
گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد

گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران می‌توانند از طریق عکس‌هایی که می‌گیرند یا آپلود می‌کنند، سوالات پیچیده بپرسند.
این ویژگی که با کمک فناوری Google Lens کار می‌کند، می‌تواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفته‌اند.

به‌عنوان نمونه، اگر از کتابخانه‌تان عکس بگیرید و بپرسید: «اگه از این کتاب‌ها خوشم اومده، چه کتاب‌های مشابهی پیشنهاد می‌کنی؟» این سیستم کتاب‌ها را شناسایی می‌کند و پیشنهادهایی برایتان می‌آورد. همچنین می‌توانید سوال‌های بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»

این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویس‌هایی مثل ChatGPT Search و Perplexity محسوب می‌شود.

۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
پاسخ مدیرعامل Perplexity به شایعات مالی و استراتژی جدید جستجوی هوش مصنوعی

مدیرعامل Perplexity، آراویند سریناواس، در پاسخ به شایعات مالی اعلام کرد که شرکت از نظر مالی در وضعیت مطلوبی قرار دارد. وی توضیح داد که حالت خودکار جستجو با هدف ساده‌سازی تجربه کاربری و کاهش پیچیدگی‌های محصولات هوش مصنوعی طراحی شده است. سریناواس تأکید کرد که شرکت از نظر مالی پایدار است و برنامه‌ای برای عرضه عمومی سهام قبل از سال ۲۰۲۸ ندارد.

۱۴۰۴/۱/۱۲ ۰۰:۰۳:۵۴
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
همکاری انویدیا، دیزنی و گوگل برای توسعه موتور فیزیک رباتیک نیوتون

انویدیا در همکاری با دیزنی و Google Deepmind، موتور فیزیک نیوتون را برای شبیه‌سازی حرکات رباتیک توسعه می‌دهد. این موتور به روبات‌ها کمک می‌کند تا با دقت بیشتری با محیط طبیعی تعامل داشته باشند. دیزنی از نخستین استفاده‌کنندگان این فناوری برای روبات‌های سری جنگ ستارگان در پارک‌های خود خواهد بود.

۱۴۰۳/۱۲/۲۹ ۰۵:۰۱:۵۷
همکاری جنرال موتورز و انویدیا برای توسعه فناوری هوش مصنوعی در خودروسازی

جنرال موتورز با همکاری انویدیا، تراشه‌ها و نرم‌افزارهای هوش مصنوعی را برای توسعه فناوری خودروهای خودران و بهبود فرآیندهای تولید به کار می‌گیرد. این شرکت قصد دارد با استفاده از پلتفرم‌های انویدیا، سیستم‌های هوش مصنوعی برای برنامه‌ریزی کارخانه و سیستم‌های کمک راننده پیشرفته ایجاد کند.

۱۴۰۳/۱۲/۲۸ ۲۱:۴۷:۳۷
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶

نمایش بیشتر