انقلاب صوتی جدید - اخبار فناوری - EcoFori

فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
دستگاه مرموز سم ‌آلتمن و جانی‌آیو؛ انقلابی که کسی نمی‌داند چیست!

سم‌آلتمن مدیر عامل OpenAI و جانی آیو ، طراح افسانه ای اپل، اعلام کردند روی دستگاهی فوق‌ساده اما بسیار پیشرفته کار می‌کنند که به‌گفته آن‌ها می‌تواند شیوه تعامل ما با فناوری را متحول کند، هرچند هنوز هیچ توضیح مشخصی از شکل یا کارکرد آن ارائه نشده است. آیو می‌گوید طراحی زمانی کامل می‌شود که «کاربر بخواهد آن را لمس کند یا حتی گاز بگیرد»؛ استعاره‌ای از جذابیت و سادگی محصول. 🤖
آلتمن می‌گوید این دستگاه برخلاف گوشی‌های شلوغ امروزی، تجربه‌ای آرام و بدون مزاحمت ارائه می‌دهد. با وجود هیاهوی رسانه‌ای، گزارش‌ها نشان می‌دهد نمونه اولیه هنوز قادر به عملکرد واقعی نیست و کمبود توان پردازشی آن را به یک «نمونه آزمایشی زیبا» تبدیل کرده است.
بااین‌حال، آیو وعده داده محصول بسیار زودتر از پنج سال و شاید در کمتر از دو سال عرضه شود؛ دستگاهی که جزئیاتش نامعلوم است اما هدف آن ایجاد ساده‌ترین و درعین‌حال هوشمندترین تجربه کاربری است.✨

۱۴۰۴/۹/۸ ۰۹:۱۲:۱۴
مدل‌های امروزی از یک گربه هم کمتر می‌فهمند!

یان لِکون، از مهم‌ترین چهره‌های تاریخ هوش مصنوعی ، برنده جایزه تورینگ و از مدیران ارشد سابق متا، این شرکت را ترک می‌کند تا استارتاپی مستقل بسازد. او می‌گوید نسل بعدی هوش مصنوعی باید دنیای فیزیکی را بفهمد، حافظه ماندگار داشته باشد، بتواند استدلال کند و برای انجام کارهای پیچیده برنامه‌ریزی کند. 😎
گزارش‌ها می‌گویند لِکون در متا با برخی مدیران اختلاف داشته، اما متا همچنان شریک استارتاپ جدید او خواهد بود و به فناوری‌هایش دسترسی دارد. او سال‌هاست معتقد است مدل‌های زبانی مثل ChatGPT توان رسیدن به «هوش واقعی» را ندارند و حتی از یک گربه هم کمتر جهان را می‌فهمند. 🧠
او اکنون روی مدل‌هایی تمرکز می‌کند که با مشاهده ویدیو، روابط علت و معلول جهان را یاد می‌گیرند؛ رویکردی که آن را «هوش ماشینی پیشرفته» یا AMI می‌نامد. 🚀

۱۴۰۴/۹/۵ ۰۴:۱۰:۳۲
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!

بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آماده‌شدن سیستم اختصاصی اپل، به‌صورت موقت در سیری به کار گرفته می‌شود. 💬
به‌گفته‌ی منابع آگاه، دو شرکت در حال نهایی‌کردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت می‌کند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستم‌های فعلی اپل دارد و می‌تواند توانایی سیری را در انجام درخواست‌های چندمرحله‌ای بهبود دهد. 🤖
در این همکاری، فناوری جست‌وجوی گوگل وارد سیستم‌عامل‌های اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود می‌شود. اپل پیش‌تر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ می‌شود که گوگل و آمازون پیش‌تر نسخه‌های هوشمندتر از دستیارهای خود را عرضه کرده‌اند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀

۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳
آمازون با دستگاه‌های نسخه‌پیچی هوشمند، وارد رقابت با داروخانه‌ها شد!

آمازون اعلام کرد دستگاه‌های خودکار نسخه‌پیچی را در کلینیک‌های «وان مدیکال» راه‌اندازی می‌کند. 💊 با این دستگاه‌ها، بیماران می‌توانند بلافاصله بعد از ویزیت، داروی خود را دریافت کنند. 🏥 اولین کیوسک‌ها از دسامبر در لس‌آنجلس فعال می‌شوند و به‌زودی در شهرهای دیگر نیز نصب خواهند شد. 📍 بیماران هزینه را از طریق اپلیکیشن آمازون پرداخت می‌کنند و دارو در چند دقیقه آماده می‌شود. ⏱️ این دستگاه‌ها داروهای رایج مثل آنتی‌بیوتیک و داروی فشار خون را ارائه می‌دهند اما داروهای خاص یا نیازمند یخچال را شامل نمی‌شوند. ⚠️ آمازون می‌گوید این طرح باعث می‌شود بیماران بدون نیاز به رفتن به داروخانه، سریع‌تر داروی خود را بگیرند. ✅ این اقدام هم‌زمان با تعطیلی بسیاری از داروخانه‌های سنتی، گامی دیگر از آمازون برای ورود جدی‌تر به حوزه سلامت است. 🚀

۱۴۰۴/۷/۱۹ ۲۱:۱۱:۵۶
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازه‌ای از هوش مصنوعی خانگی

گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخ‌ها سریع‌تر و طبیعی‌تر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک می‌کند. 🍳🏠 اسپیکر می‌تواند از طریق سیستم هوشمند خانه، چراغ‌ها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغ‌ها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و می‌توان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام می‌شود. 🗓️

۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵
مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
تیک‌تاک به کاربرانش امکان ارسال پیام‌های صوتی می‌دهد

تیک‌تاک قابلیت‌های جدیدی برای پیام‌های خصوصی معرفی کرد؛ از این پس کاربران می‌توانند یادداشت صوتی ۶۰ ثانیه‌ای و تا ۹ عکس یا ویدئو در چت‌های فردی و گروهی ارسال کنند. این تغییرات، تجربه پیام‌رسانی در تیک‌تاک را مشابه واتس‌اپ و اینستاگرام می‌کند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو به‌عنوان اولین پیام ممکن نیست و محتوای نامناسب به‌طور خودکار مسدود می‌شود. این قابلیت‌ها بخشی از برنامه تیک‌تاک برای تقویت ابزارهای ارتباطی پس از افزودن چت‌های گروهی و اتاق‌های گفتگو است. ✅🚀

۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳
اپل در حال توسعه Siri جدید با هوش مصنوعی

اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که می‌تواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حساب‌ها و کنترل کامل اپلیکیشن‌ها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاه‌های اپل دگرگون می‌کند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه می‌شود، هرچند چالش‌هایی مانند پشتیبانی از اپلیکیشن‌های مختلف و دقت بالا در حوزه‌های حساس وجود دارد. موفقیت در این طرح می‌تواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀

۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸
GPT-5 یاد گرفت بگوید «نمی‌دانم»؛ انقلابی در صداقت هوش مصنوعی

OpenAI از مدل جدید GPT-5 رونمایی کرد؛ مدلی که علاوه بر بهبود چشمگیر در عملکرد ریاضی، کدنویسی، نویسندگی و کاربردهای پزشکی، یک ویژگی مهم و متفاوت دارد: توانایی گفتن «نمی‌دانم». 🤖💡
به گفته شرکت، GPT-5 پاسخ‌ها را صادقانه‌تر ارائه می‌دهد، در برابر پرسش‌های غیرممکن یا مبهم از اختراع جواب خودداری می‌کند و کمتر برای خوشایند کاربر با او موافقت می‌کند. این تغییر پس از انتقاد کاربران از تمایل نسخه‌های قبلی به پاسخ‌های چاپلوسانه و گاهی نادرست انجام شده است. 📉🗨️
آمارهای OpenAI نشان می‌دهد نرخ خطا در پاسخ‌های جستجوی وب GPT-5 نسبت به GPT-4o تا ۴۵٪ کاهش یافته و در حالت «تفکر پیشرفته» (Thinking) این کاهش به ۸۰٪ می‌رسد. این رویکرد، به گفته کارشناسان، می‌تواند اعتماد به هوش مصنوعی را در حوزه‌های حساسی چون سلامت، حقوق و علم افزایش دهد. ✅📊

۱۴۰۴/۵/۱۸ ۱۳:۰۳:۲۴
ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!

اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز می‌شوند: ضبط صدای حرفه‌ای و کنترل دوربین با لمس ایرپاد. 🎧
با استفاده از چیپ H2، میکروفون‌های پیشرفته و پردازش هوشمند صدا، کاربران می‌توانند حتی در محیط‌های شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماس‌های باکیفیت‌تری داشته باشند. 🎙️
همچنین با نگه‌داشتن ساقه ایرپاد، می‌توان دوربین آیفون یا اپ‌های دوربین دیگر را فعال کرد و به‌راحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکه‌های اجتماعی بسیار کاربردی است. 📸
این قابلیت‌ها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅

۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷
RCS، نسخه پیشرفته SMS، حالا استاندارد جدید ارتباطی است

📱 گوگل اعلام کرد که پروتکل پیام‌رسانی پیشرفته RCS حالا روزانه بیش از ۱ میلیارد پیام را فقط در آمریکا مدیریت می‌کند.💬
RCS نسخه ارتقاءیافته SMS است و امکاناتی مثل ارسال عکس و ویدیوی باکیفیت، نشانگر تایپ، رسید خوانده‌شدن پیام، و چت گروهی پیشرفته را فراهم می‌کند. 📸🗨️👥
پس از سال‌ها فشار گوگل، اپل در iOS 18 بالاخره RCS را در برنامه Messages اضافه کرد. اما همچنان پیام‌ها در قالب حباب سبز نمایش داده می‌شوند تا تفاوت با کاربران iMessage حفظ شود! 🍏🟢
گوگل جزئیات بیشتری درباره کاربران یا اپراتورها منتشر نکرد، اما این آمار نشان می‌دهد تجربه پیام‌رسانی بین اندروید و آیفون در حال بهتر شدن است. ✅🤝

۱۴۰۴/۳/۶ ۱۳:۲۰:۵۲
هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
هدست Clio ریزر: نجات‌دهنده گیمرهای طاس!

🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول به‌ویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفون‌های معمولی با ناراحتی مواجه می‌شوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلی‌متری و پشتیبانی از THX Spatial Audio، صدای فراگیر سه‌بعدی را مستقیماً به گوش کاربر منتقل می‌کند. این دستگاه از طریق بی‌سیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل می‌شود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظه‌دار ساخته شده و می‌تواند به اکثر صندلی‌های گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋

۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱
انقلاب هوش مصنوعی زیر ذره‌بین پاپ جدید! لئو چهاردهم

🌐🤖پاپ لئو چهاردهم، با نام اصلی رابرت پرووست از شیکاگو، به‌تازگی به‌عنوان رهبر جدید کلیسای کاتولیک انتخاب شده و برخلاف انتظار، نگاهی به آینده دارد! 🚀در اولین دیدارش با کاردینال‌ها، او هوش مصنوعی را یکی از بزرگ‌ترین چالش‌های دنیای امروز معرفی کرد. 💡
📜 او تأکید کرد که کلیسا باید از کرامت انسانی، عدالت و حقوق کارگران در برابر تحولات فناوری دفاع کند. ⚖️ انتخاب نام لئو هم بی‌دلیل نیست؛ او با این کار یاد پاپ لئو سیزدهم (۱۸۷۸-۱۹۰۳) را زنده کرده که با متن تاریخی Rerum Novarum از حقوق کارگران حمایت کرده بود. 📜
🤖اما این فقط شروع کار نیست! پاپ لئو چهاردهم در واقع ادامه‌دهنده راه پاپ فرانسیس است؛ کسی که همیشه درباره خطرات هوش مصنوعی و استفاده غیراخلاقی از فناوری هشدار می‌داد. او در نشست G7 و مجمع جهانی اقتصاد داووس تأکید کرده بود که فناوری باید در خدمت انسان باشد، نه اینکه به کرامت انسانی آسیب بزند. 🌐

۱۴۰۴/۲/۲۲ ۰۰:۵۴:۳۹
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
نتفلیکس زیرنویس جدید خود را معرفی کرد

نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
انقلاب در سرگرمی کودکان؛ انیمیشن جدید با فناوری بلاکچین

سریال کارتونی جدید Owen Nowhere پاییز امسال روی یک پلتفرم غیرمتمرکز بلاکچینی به نام Lamina1 منتشر می‌شود و همراه آن کیف پول رمزارزی ارائه خواهد شد. داستان درباره پسری نوجوان است که با خانواده عجیبش به سفر می‌رود و جاذبه‌های عجیب را مستندسازی می‌کند.
تماشاگران می‌توانند با خرید دارایی‌های دیجیتال مثل لباس شخصیت‌ها یا انتخاب مقصد سفر، در داستان دخالت کنند.
این مدل جدید از سرگرمی، کودکان و نوجوانان را به دنیای وب 3 و دارایی‌های دیجیتال وارد می‌کند، اما نگرانی‌هایی درباره استفاده کودکان از کیف پول رمزارزی وجود دارد.
سازندگان این روش را فرصتی برای مشارکت بیشتر و ایجاد حس مالکیت در بین مخاطبان می‌دانند.

۱۴۰۴/۱/۳۱ ۰۱:۳۹:۳۸
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
استارتاپ XL Batteries با باتری ارگانیک جدید به دنبال انقلاب در ذخیره‌سازی انرژی

استارتاپ XL Batteries یک فناوری باتری جریانی جدید با مواد آلی توسعه داده که برای ذخیره‌سازی انرژی در مقیاس بزرگ طراحی شده است. این باتری ارزان‌تر، ایمن‌تر و پایدارتر از باتری‌های لیتیومی است و با استفاده از مخازن ذخیره‌سازی، قابلیت تأمین برق 25 هزار خانه را در طول یک روز دارد.

۱۴۰۴/۱/۲۰ ۱۶:۰۹:۱۳
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد

اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغ‌دهندگان امکان می‌دهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را به‌صورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغ‌کنندگان اجازه می‌دهد در لحظه و به‌صورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.

۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
بی‌ وای دی چین با پلتفرم جدید، شارژ سریع خودروهای برقی را انقلابی می‌کند

شرکت بی‌ وای دی (BYD) چین پلتفرم جدید خودروهای برقی با معماری ۱۰۰۰ ولتی را معرفی کرد که امکان شارژ سریع خودروها را فراهم می‌کند. این شرکت تولیدکننده خودروهای برقی قصد دارد بیش از ۴۰۰۰ ایستگاه شارژ فوق سریع را در سراسر کشور راه‌اندازی کند و بنیانگذار آن اعلام کرده خودروهای این پلتفرم می‌توانند در ۵ دقیقه ۴۰۰ متر مسافت طی کنند.

۱۴۰۳/۱۲/۲۷ ۱۵:۴۴:۵۶
تحول در اینتل با مدیریت جدید؛ استراتژی بازسازی صنعت تراشه

لیپ-بو تان، مدیرعامل جدید اینتل، برنامه گسترده‌ای برای احیای این شرکت فناوری در دست دارد. وی قصد دارد با کاهش نیروی میانی، بازسازی فرآیندهای تولید و تمرکز بر هوش مصنوعی، عملکرد شرکت را بهبود بخشد. تان که پیش از این در هیئت مدیره اینتل بوده، استراتژی تولید تراشه برای مشتریان خارجی و توسعه محصولات هوش مصنوعی را در دستور کار قرار داده است.

۱۴۰۳/۱۲/۲۷ ۱۵:۳۴:۲۳
گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
انقلاب باتری‌های لیتیومی در مراکز داده و صنایع مختلف

گوگل با جایگزینی باتری‌های لیتیومی به جای باتری‌های سربی در مراکز داده، موفق به کاهش ۷۵ درصدی تعداد سلول‌های باتری و افزایش ظرفیت توان شده است. این تحول نشان‌دهنده نقش روزافزون باتری‌های لیتیومی در صنایع مختلف از جمله مراکز داده، خانگی و پزشکی است.

۱۴۰۳/۱۲/۲۲ ۲۰:۰۱:۵۰
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه

نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه می‌دهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.

۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴
استارتاپ Daqus انقلابی در فناوری باتری با ماده TAQ

استارتاپ Daqus Energy یک ماده جدید به نام TAQ را برای ساخت باتری های لیتیومی معرفی کرده که ارزان‌تر، سبک‌تر و با کارایی بالاست. این ماده کربن پایه، جایگزین کاتد باتری‌های فعلی شده و هزینه تولید را به شدت کاهش می‌دهد. آزمایش‌های اولیه نشان می‌دهد باتری‌های TAQ می‌توانند 2000 بار شارژ شوند و 80 درصد ظرفیت اولیه را حفظ کنند.

۱۴۰۳/۱۲/۲۰ ۲۳:۱۲:۱۹

نمایش بیشتر