-
تأخیر در عرضه موتور صدای OpenAI به دلیل نگرانیهای امنیتی
شرکت OpenAI، سرویس موتور صدای خود که قادر به شبیهسازی صدای افراد با تنها ۱۵ ثانیه گفتار است، را همچنان در مرحله محدود نگه داشته است. این شرکت با هدف بررسی کاربردهای مسئولانه و جلوگیری از سوء استفادههای احتمالی، دسترسی به این فناوری را تنها برای شرکای محدود فراهم کرده و در حال آزمایش و ارزیابی جوانب مختلف آن است.
۱۴۰۳/۱۲/۱۶ ۱۸:۰۰:۰۶ -
دستیار هوش مصنوعی مبتنی بر Google Gemini به خودروهای جنرال موتورز میآید
شرکت جنرالموتورز (GM) در یک رویداد در نیویورک اعلام کرد از سال آینده خودروهای بیوک، شورولت، کادیلاک و جیامسی به دستیار گفتوگومحور Google Gemini مجهز میشوند تا رانندگان بتوانند با هوش مصنوعی صحبت کنند، پیام ارسال کنند، مسیر خود را با توقفهای دلخواه (مثل شارژ یا قهوه) تنظیم کنند و حتی پیش از حرکت، خودرو را برای جلسه آماده سازند؛ مثلاً تنظیم دما، نمایش خلاصه ایمیلها یا مسیر جلسه. 🚗🤖
این دستیار از طریق سیستم OnStar به دادههای خودرو متصل میشود تا هشدارهای فنی، پیشنهاد مسیر و توضیح ویژگیهایی مانند رانندگی با یک پدال را ارائه دهد؛ یعنی راننده تنها با فشردن یا رها کردن پدال گاز، خودرو را حرکت دهد یا متوقف کند. ⚙️🦶۱۴۰۴/۸/۳ ۰۸:۵۰:۵۱ -
Cadillac Escalade IQ؛ جنرال موتورز از معماری هوشمند با تراشه انویدیا رونمایی کرد
شرکت جنرال موتورز اعلام کرده است که از سال ۲۰۲۷ با معرفی مدل Cadillac Escalade IQ نسل جدیدی از خودروهای خود را با معماری کاملاً هوشمند عرضه میکند. ⚙️ این سیستم با همکاری انویدیا و استفاده از ابررایانهی Nvidia Drive Thor ساخته شده و توان پردازش و سرعت نرمافزار را چندین برابر افزایش میدهد. 💻 در این ساختار جدید، تمام بخشهای خودرو مانند پیشرانه، فرمان، ترمز و سیستم ایمنی بهصورت یکپارچه و بلادرنگ کنترل میشوند. 🔄 جنرال موتورز میگوید این فناوری عملکرد هوش مصنوعی را تا ۳۵ برابر و ظرفیت بهروزرسانی از راه دور را تا ۱۰ برابر افزایش میدهد و هدف آن رساندن زمان توسعه خودروها از پنج سال به دو سال است. 🚀
۱۴۰۴/۸/۳ ۰۸:۵۰:۴۸ -
وقتی ویدیوهای بازی، سوخت موتور هوش مصنوعی میشوند!
استارتاپ General Intuition از دل پلتفرم اشتراک ویدیوهای بازی Medal متولد شده و هدفش ساخت هوش مصنوعیهایی است که بتوانند حرکت اشیا و انسانها را در فضا و زمان درک کنند؛ مفهومی که به آن «استدلال فضا-زمانی» گفته میشود. 🎮🤖
این شرکت از ۲ میلیارد ویدیو بازی در سال و دادههای ۱۰ میلیون کاربر استفاده میکند و معتقد است این منابع برای آموزش مدلهای هوش مصنوعی از Twitch و YouTube مؤثرترند. 📊 همین موضوع باعث شد OpenAI سال گذشته پیشنهاد خرید ۵۰۰ میلیون دلاری Medal را مطرح کند.💰
General Intuition قصد دارد عاملهایی بسازد که در دنیای واقعی مانند رباتها و پهپادهای نجات عمل کنند. 🚀 این مدلها میتوانند فقط با تصویر محیط را درک کرده و تصمیم بگیرند، مشابه یک بازیکن انسانی. 👁️
هدف نهایی شرکت، ساخت کاراکترهای هوشمند و فناوریهایی است که راه را به سوی هوش مصنوعی عمومی واقعی یا AGI هموار کنند. 🧠✨۱۴۰۴/۷/۲۶ ۲۳:۳۹:۱۰ -
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance
استارتاپ نروژی Hance نرمافزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکتهایی مثل Intel و Riedel Communications (تأمینکننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدلهای پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام میشود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance میتواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلیثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخشهای امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشههای جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴ -
آیا هوش مصنوعی جایگزین موتورهای جستجو میشود؟
مدیرعامل Cloudflare، متیو پرینس در پادکستی هشدار داده که دوران موتورهای جستجو تمام شده و جای آنها را «موتورهای پاسخ» هوش مصنوعی گرفتهاند. او میگوید این تغییر برای روزنامهنگاران، پژوهشگران و تولیدکنندگان محتوا خطرناک است، چون وقتی کاربران پاسخ آماده از هوش مصنوعی میگیرند، دیگر کمتر به سراغ وبسایتها میروند. 🤖⚠️
پرینس سه آینده احتمالی ترسیم میکند: یکی، «اینترنت مرده» (Dead Internet) که محتوای انسانی کاملاً از بین میرود؛ دیگری، سناریوی «بلک میرر» (Black Mirror) که در آن چند شرکت بزرگ هوش مصنوعی مثل OpenAI یا Anthropic همه اطلاعات را کنترل میکنند؛ و سوم، آیندهای بهتر که در آن شرکتهای AI مثل نتفلیکس، برای استفاده از محتوای ناشران پول پرداخت میکنند. 📜🌍
او میگوید تنها راه حفظ اینترنت زنده، این است که ناشران دسترسی رباتهای هوش مصنوعی به محتوای خود را محدود کنند مگر اینکه هزینه بپردازند. Cloudflare هم امسال این امکان را به مشتریانش داده و شرکتهای بزرگی مثل Associated Press و Conde Nast از آن استفاده کردهاند. ✅💡۱۴۰۴/۶/۲۸ ۰۴:۳۲:۱۷ -
گوگل AI Mode را به پنج زبان جدید گسترش داد
گوگل قابلیت جستجوی هوش مصنوعی خود با نام AI Mode را که تاکنون فقط به انگلیسی فعال بود، به پنج زبان جدید شامل هندی، اندونزیایی، ژاپنی، کرهای و پرتغالی برزیلی گسترش داد. این ویژگی حالا در بیش از ۱۸۰ کشور فعال است و به کاربران اجازه میدهد پرسشهای پیچیده را در زبان دلخواه خود مطرح کنند. 🌍🤖
AI Mode بر پایه Gemini 2.5 ساخته شده و رقیبی برای پلتفرمهایی مثل Perplexity و ChatGPT Search محسوب میشود. گوگل همچنین امکاناتی مثل رزرو رستوران را آزمایش کرده که فعلاً فقط برای مشترکان ویژه در آمریکا و با هزینه ماهانه ۲۴۹.۹۹ دلار در دسترس است. 📲💡
گوگل میگوید این قابلیت بهزودی میتواند به حالت پیشفرض جستجو تبدیل شود و برخلاف برخی انتقادها، باعث کاهش بازدید سایتها نشده است. ✅🔎۱۴۰۴/۶/۲۰ ۱۲:۱۳:۴۷ -
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!
گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که میتواند صحبتها را بهصورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپفیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا میشود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمیشود. گوگل امیدوار است این فناوری راه را برای ارتباط آسانتر میان زبانهای مختلف باز کند، هرچند نگرانیهایی درباره سوءاستفاده از دیپفیک همچنان وجود دارد. ✅🌍۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸ -
اپل در حال ساخت اپلیکیشن مشابه ChatGPT
بلومبرگ گزارش داد اپل تیم جدیدی با نام «Answers, Knowledge, and Information» تشکیل داده تا یک اپلیکیشن مشابه ChatGPT توسعه دهد. این تیم در حال ساخت یک «موتور پاسخگویی» است که بتواند با استفاده از اطلاعات سراسر وب به پرسشها پاسخ دهد. 🤖📱
این فناوری میتواند بهصورت یک اپلیکیشن مستقل عرضه شود یا قابلیتهای جستوجو را در سرویسهایی مانند سیری، سافاری و سایر محصولات اپل تقویت کند. اپل همچنین برای جذب نیرو در این پروژه، بهدنبال متخصصان الگوریتمهای جستوجو و توسعه موتورهای جستوجو است. 🔍💼
هرچند ChatGPT پیشتر در سیری ادغام شده، اما نسخه شخصیسازیشده و پیشرفتهتر این دستیار صوتی بارها با تأخیر مواجه شده است. شکست حقوقی اخیر گوگل در پرونده ضدانحصار نیز ممکن است اپل را وادار به تغییر قرارداد جستوجو با این شرکت کند. ✅⚖️۱۴۰۴/۵/۱۴ ۰۱:۵۶:۲۰ -
Perplexity Labs؛ هوش مصنوعی در خدمت پروژههای شخصی و کاری شما
🔍 شرکت Perplexity، که با موتور جستجوی هوش مصنوعی خود در حال رقابت با گوگل است، ابزار جدیدی به نام Perplexity Labs معرفی کرده است. این ابزار برای انجام پروژههای کاری یا شخصی طراحی شده است. 💼🧠
🧪 Perplexity Labs میتواند گزارش، جدول، داشبورد و حتی اپهای ساده بسازد. برای این کار از ابزارهایی مثل جستجوی وب، تولید کد، ساخت نمودار و تصویر استفاده میشود. همه فایلها در یک تب مخصوص ذخیره میشوند و قابل مشاهده و دانلود هستند. 📊📂
✨ هدف Perplexity از این ابزار، گسترش خدمات فراتر از جستجو و ورود به فضای تولید محتوای کاربردی است. این شرکت اخیراً مرورگر وب Comet را معرفی کرده و شبکه اجتماعی Read.vc را نیز خریداری کرده است. 🌐🚀۱۴۰۴/۳/۱۰ ۰۱:۱۱:۰۴ -
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد
📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیهسازیشده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروشها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصیاش میگوید و موضعی موافق با حق سقط جنین اتخاذ میکند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطهعطفی در کتابهای صوتی میداند. 🚀🔊۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱ -
آیا گربهتان میتواند با شما صحبت کند؟ بایدو میگوید بله!
🐾 شرکت فناوری چینی بایدو (Baidu) پتنتی برای سیستم هوش مصنوعی ثبت کرده که میتواند صدای حیوانات را به زبان انسان ترجمه کند! 🤖 این سیستم با تحلیل صداها، رفتارها و سیگنالهای فیزیولوژیکی، احساسات حیوانات را شناسایی و به جملات انسانی تبدیل میکند. 💬
این فناوری میتواند ارتباط عمیقتری بین انسان و حیوانات ایجاد کند. ❤️ اگرچه این پروژه هنوز در مرحله تحقیقاتی است، برخی کاربران شبکههای اجتماعی چین مشتاقانه منتظر این فناوریاند، در حالی که برخی دیگر با تردید به عملکرد آن نگاه میکنند. 🐕
📌 بایدو، یکی از پیشگامان هوش مصنوعی در چین، با مدل جدید Ernie 4.5 Turbo به دنبال تثبیت جایگاه خود است. 🚀🔥۱۴۰۴/۲/۲۲ ۰۰:۴۴:۲۷ -
هوش مصنوعی صدای مقتول را در دادگاه زنده کرد!
⚖️ در رویدادی بیسابقه، خانواده کریستوفر پلکی که در سال ۲۰۲۱ در یک حادثه خشونت جادهای در آریزونا کشته شده بود، با استفاده از هوش مصنوعی صدای او را به دادگاه بازگرداندند. این ویدیو، چهره و صدای پلکی را بازسازی کرده بود که با قاتلش صحبت میکرد: «افسوس که آن روز همدیگر را در آن شرایط ملاقات کردیم. شاید در زندگی دیگر، دوستان میشدیم.» 💔🚗
🚔 گابریل پل هورکاسیتاس به جرم قتل غیرعمد به ۱۰سال زندان محکوم شد.
👩💻 استیسی ویلز، خواهر پلکی، این ویدیو را به همراه همسر و دوست خانوادگی خود که در حوزه فناوری کار میکنند، طراحی کرد. هدف او «انسانیکردن کریستوفر و نشاندادن تأثیر او در این دنیا» بود. 💡🌐
❗ اما این استفاده خلاقانه از هوش مصنوعی در دادگاهها نگرانیهای اخلاقی ایجاد کرده است. هری سوردن، استاد حقوق، هشدار داده که چنین فناوریهایی میتوانند احساسات قضات و هیئت منصفه را دستکاری کنند. ❓۱۴۰۴/۲/۲۱ ۱۲:۴۱:۵۷ -
-
هدفگیری مد و فناوری؛ ایرپادهای جدید موتورولا با کریستالهای سواروسکی
موتورولا از ایرپادهای جدید خود به نام Moto Buds Loop رونمایی کرده که در نسخهای خاص با کریستالهای سواروسکی (Swarovski) تزئین شدهاند. این ایرپادها به جای قرارگیری داخل گوش، روی گوش قرار میگیرند و صدا را بهصورت غیرمستقیم منتقل میکنند، بنابراین صدای محیط را نیز حفظ میکنند. طراحی آنها بیشتر روی سلیقه مدگرایان تمرکز دارد. نسخه خاص این محصول با ظاهر درخشانش، مناسب کسانیست که به سبک شخصی خود اهمیت میدهند. از نظر فنی، این ایرپادها دارای صدای فضایی، عمر باتری تا ۸ ساعت (و ۳۷ ساعت با کیس)، و پشتیبانی از خلاصهسازی نوتیفیکیشنها با هوش مصنوعی Moto AI گوشی های موتورولا هستند. هنوز قیمت و زمان عرضه این محصول مشخص نیست، اما انتظار میرود نسخه لوکس آن بسیار گرانقیمت باشد.
۱۴۰۴/۲/۵ ۲۰:۰۱:۲۶ -
موتورولا سه گوشی هوشمند تاشو Razr با تمرکز بر هوش مصنوعی معرفی کرد
موتورولا سه مدل گوشی تاشو Razr شامل Razr، Razr+ و Razr Ultra را با تمرکز بر قابلیتهای هوش مصنوعی معرفی کرد. این گوشیها با همکاری شرکتهای بزرگ فناوری مانند Perplexity، گوگل، متا و مایکروسافت، قابلیتهای هوشمندانهای مانند پیشنهاد وظایف، خلاصهنویسی و یادآوری اطلاعات را ارائه میدهند. مدل Ultra به عنوان پرچمدار با صفحه نمایش 7 اینچی، دوربین 50 مگاپیکسلی و باتری 4700 میلیآمپری معرفی شده است.
۱۴۰۴/۲/۵ ۱۹:۵۱:۱۸ -
افشای رد پیشنهاد همکاری OpenAI توسط گوگل در دادگاه
در جریان دادگاه ضدانحصار گوگل، مشخص شد که OpenAI قصد داشته برای بهبود جستوجوی چتبات ChatGPT از فناوری جستوجوی گوگل استفاده کند، اما گوگل این درخواست را رد کرده است. OpenAI گفته بود استفاده از جستوجوی گوگل باعث بهبود عملکرد چتبات میشود. این درخواست در حالی مطرح شده که OpenAI هماکنون از موتور جستوجوی بینگ (وابسته به مایکروسافت) بهره میبرد.
وزارت دادگستری آمریکا تلاش دارد گوگل را مجبور کند مرورگر کروم را بفروشد و قراردادهای انحصاریاش را لغو کند تا رقابت در حوزه جستوجو و تبلیغات بازگردد. دادستانها همچنین نگران آن هستند که گوگل با استفاده از برتری در جستوجو، بر هوش مصنوعی نیز مسلط شود. گوگل اما ادعا میکند با رقبای بزرگی مثل مایکروسافت و متا روبهرو است.۱۴۰۴/۲/۳ ۲۱:۴۹:۴۸ -
رشد چشمگیر جستجوی ChatGPT در اروپا
قابلیت جستوجوی ChatGPT در اروپا رشد چشمگیری داشته و تعداد کاربران فعال آن در شش ماه گذشته از ۱۱ میلیون به بیش از ۴۱ میلیون نفر رسیده است. اگر این روند ادامه یابد، ممکن است مشمول مقررات سخت اتحادیه اروپا شود. این مقررات شامل محدودسازی الگوریتمها، اشتراک داده با نهادها و جریمههای سنگین در صورت عدم رعایت است. در حالیکه محبوبیت این قابلیت در حال افزایش است، تحقیقات نشان میدهد دقت آن در مقایسه با موتورهایی مثل گوگل کمتر است و گاهی اطلاعات اشتباه ارائه میدهد.
۱۴۰۴/۲/۳ ۰۳:۱۵:۴۰ -
سرمایهگذاری ۲۰ میلیون دلاری روی موتور الکتریکی جدید و کمهزینه
استارتاپ Conifer، متشکل از مهندسان سابق اپل و Lucid، موفق به جذب ۲۰ میلیون دلار سرمایه برای تولید موتورهای الکتریکی جدیدی شده که بدون عناصر کمیاب و با آهنرباهای رایج ساخته میشوند. این موتورها کوچکتر، ارزانتر و کارآمدتر از مدلهای قبلی هستند و بهراحتی جایگزین موتورهای چرخ فعلی میشوند.
هدف اصلی Conifer وسایل نقلیه سبک است، اما تولیدکنندگان تراکتور، چمنزن و تهویه نیز علاقهمند شدهاند. این شرکت با تکیه بر تولید محلی و خطوط تولید خودکار، قصد دارد محصول خود را امسال وارد بازار کند.۱۴۰۴/۱/۳۱ ۱۵:۴۷:۳۹ -
هک جالب در سیلیکونولی: دکمههای عابرپیاده با صدای ایلان ماسک و زاکربرگ صحبت میکنند!
در آخر هفته گذشته، دکمههای صوتی مخصوص عابران پیاده در سیلیکونولی هک شدند. صدای این دکمهها بهجای پیامهای معمولی، جملاتی تقلیدی از صدای مارک زاکربرگ و ایلان ماسک پخش میکردند که توسط هوش مصنوعی تولید شده بودند.
در یکی از پیامها با صدای زاکربرگ گفته میشود: «نگران نباشید، چون کاری از دستتان برنمیآید!» و در پیام دیگری با صدای ماسک گفته میشود: «پول خوشبختی نمیآره، ولی یه سایبرتراک میتونه بیاره!»
برخی کاربران در شبکههای اجتماعی با طنز به این اتفاق واکنش نشان دادند. مقامهای محلی در حال بررسی این موضوع هستند و احتمال میدهند که این اقدام نوعی «هکتیویسم» (ترکیب هک و اعتراض سیاسی/اجتماعی) باشد.
کارشناسان امنیتی پیشتر هشدار داده بودند که برخی از این دکمهها با رمزهای پیشفرض محافظت میشوند و میتوان آنها را بهراحتی تغییر داد.۱۴۰۴/۱/۲۶ ۱۸:۲۲:۰۹ -
موتورولا آماده معرفی نسل جدید گوشیهای تاشو Razr با قابلیت هوش مصنوعی
موتورولا در رویدادی پیش رو، نسل هفتم گوشیهای تاشوی Razr را معرفی خواهد کرد. این گوشیها با بهبود عملکرد سختافزاری، نمایشگرهای روشنتر و دوربین بهتر همراه خواهند بود. شرکت همچنین قابلیتهای هوش مصنوعی Moto AI را معرفی میکند که شامل خلاصهسازی اعلانها، رونویسی خودکار و ویرایش تصاویر خواهد بود.
۱۴۰۴/۱/۲۳ ۰۱:۱۴:۱۱ -
صدای نوستالژیک ویندوز ۹۵ وارد کتابخانه کنگره آمریکا شد
صدای معروف روشن شدن ویندوز ۹۵، این هفته توسط “کتابخانه کنگره آمریکا” برای همیشه ثبت و حفظ شد. این صدا توسط آهنگساز مشهور، برایان انو، ساخته شده؛ جالب اینکه او خودش هرگز از ویندوز استفاده نکرده و این آهنگ را روی کامپیوتر مک نوشته است!
کتابخانه کنگره این صدا را بخشی از “گنجینه صوتی فرهنگ آمریکا” دانسته و آن را در کنار موسیقی بازی minecraft برای ثبت سال ۲۰۲۵ انتخاب کرده است. برایان این موسیقی را با استفاده از ۸۳ قطعه صوتی و بر اساس ۱۵۰ واژه کلیدی مایکروسافت طراحی کرد که حسی از امید و پیشرفت در عصر رایانههای شخصی را منتقل میکند.۱۴۰۴/۱/۲۲ ۲۱:۵۳:۱۷ -
گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد
گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران میتوانند از طریق عکسهایی که میگیرند یا آپلود میکنند، سوالات پیچیده بپرسند.
این ویژگی که با کمک فناوری Google Lens کار میکند، میتواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفتهاند.
بهعنوان نمونه، اگر از کتابخانهتان عکس بگیرید و بپرسید: «اگه از این کتابها خوشم اومده، چه کتابهای مشابهی پیشنهاد میکنی؟» این سیستم کتابها را شناسایی میکند و پیشنهادهایی برایتان میآورد. همچنین میتوانید سوالهای بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»
این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویسهایی مثل ChatGPT Search و Perplexity محسوب میشود.۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
پاسخ مدیرعامل Perplexity به شایعات مالی و استراتژی جدید جستجوی هوش مصنوعی
مدیرعامل Perplexity، آراویند سریناواس، در پاسخ به شایعات مالی اعلام کرد که شرکت از نظر مالی در وضعیت مطلوبی قرار دارد. وی توضیح داد که حالت خودکار جستجو با هدف سادهسازی تجربه کاربری و کاهش پیچیدگیهای محصولات هوش مصنوعی طراحی شده است. سریناواس تأکید کرد که شرکت از نظر مالی پایدار است و برنامهای برای عرضه عمومی سهام قبل از سال ۲۰۲۸ ندارد.
۱۴۰۴/۱/۱۲ ۰۰:۰۳:۵۴ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
همکاری انویدیا، دیزنی و گوگل برای توسعه موتور فیزیک رباتیک نیوتون
انویدیا در همکاری با دیزنی و Google Deepmind، موتور فیزیک نیوتون را برای شبیهسازی حرکات رباتیک توسعه میدهد. این موتور به روباتها کمک میکند تا با دقت بیشتری با محیط طبیعی تعامل داشته باشند. دیزنی از نخستین استفادهکنندگان این فناوری برای روباتهای سری جنگ ستارگان در پارکهای خود خواهد بود.
۱۴۰۳/۱۲/۲۹ ۰۵:۰۱:۵۷ -
همکاری جنرال موتورز و انویدیا برای توسعه فناوری هوش مصنوعی در خودروسازی
جنرال موتورز با همکاری انویدیا، تراشهها و نرمافزارهای هوش مصنوعی را برای توسعه فناوری خودروهای خودران و بهبود فرآیندهای تولید به کار میگیرد. این شرکت قصد دارد با استفاده از پلتفرمهای انویدیا، سیستمهای هوش مصنوعی برای برنامهریزی کارخانه و سیستمهای کمک راننده پیشرفته ایجاد کند.
۱۴۰۳/۱۲/۲۸ ۲۱:۴۷:۳۷ -
آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد میکند
آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیتهای هوش مصنوعی الکسا انجام میشود و کاربران دیگر نمیتوانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیتهای جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.
۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶



