-
فناوری جدید صوتی با امواج فراصوت، صدا را بهصورت خصوصی و بدون هدفون پخش میکند
محققان فناوری جدیدی برای ایجاد “حبابهای صوتی” خصوصی توسعه دادهاند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم میکند.
این فناوری از پرتوهای فراصوتی خودخمشونده و آکوستیک غیرخطی استفاده میکند. دو پرتو فراصوت با فرکانسهای متفاوت که بهتنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد میکنند. این روش میتواند تجربههای صوتی شخصیسازیشدهای را بدون نیاز به هدفون فراهم کند.
این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفتوگوی خصوصی در دفاتر کاری یا محیطهای نظامی را دارد.۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹ -
دستگاه مرموز سم آلتمن و جانیآیو؛ انقلابی که کسی نمیداند چیست!
سمآلتمن مدیر عامل OpenAI و جانی آیو ، طراح افسانه ای اپل، اعلام کردند روی دستگاهی فوقساده اما بسیار پیشرفته کار میکنند که بهگفته آنها میتواند شیوه تعامل ما با فناوری را متحول کند، هرچند هنوز هیچ توضیح مشخصی از شکل یا کارکرد آن ارائه نشده است. آیو میگوید طراحی زمانی کامل میشود که «کاربر بخواهد آن را لمس کند یا حتی گاز بگیرد»؛ استعارهای از جذابیت و سادگی محصول. 🤖
آلتمن میگوید این دستگاه برخلاف گوشیهای شلوغ امروزی، تجربهای آرام و بدون مزاحمت ارائه میدهد. با وجود هیاهوی رسانهای، گزارشها نشان میدهد نمونه اولیه هنوز قادر به عملکرد واقعی نیست و کمبود توان پردازشی آن را به یک «نمونه آزمایشی زیبا» تبدیل کرده است.
بااینحال، آیو وعده داده محصول بسیار زودتر از پنج سال و شاید در کمتر از دو سال عرضه شود؛ دستگاهی که جزئیاتش نامعلوم است اما هدف آن ایجاد سادهترین و درعینحال هوشمندترین تجربه کاربری است.✨۱۴۰۴/۹/۸ ۰۹:۱۲:۱۴ -
مدلهای امروزی از یک گربه هم کمتر میفهمند!
یان لِکون، از مهمترین چهرههای تاریخ هوش مصنوعی ، برنده جایزه تورینگ و از مدیران ارشد سابق متا، این شرکت را ترک میکند تا استارتاپی مستقل بسازد. او میگوید نسل بعدی هوش مصنوعی باید دنیای فیزیکی را بفهمد، حافظه ماندگار داشته باشد، بتواند استدلال کند و برای انجام کارهای پیچیده برنامهریزی کند. 😎
گزارشها میگویند لِکون در متا با برخی مدیران اختلاف داشته، اما متا همچنان شریک استارتاپ جدید او خواهد بود و به فناوریهایش دسترسی دارد. او سالهاست معتقد است مدلهای زبانی مثل ChatGPT توان رسیدن به «هوش واقعی» را ندارند و حتی از یک گربه هم کمتر جهان را میفهمند. 🧠
او اکنون روی مدلهایی تمرکز میکند که با مشاهده ویدیو، روابط علت و معلول جهان را یاد میگیرند؛ رویکردی که آن را «هوش ماشینی پیشرفته» یا AMI مینامد. 🚀۱۴۰۴/۹/۵ ۰۴:۱۰:۳۲ -
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!
بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آمادهشدن سیستم اختصاصی اپل، بهصورت موقت در سیری به کار گرفته میشود. 💬
بهگفتهی منابع آگاه، دو شرکت در حال نهاییکردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت میکند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستمهای فعلی اپل دارد و میتواند توانایی سیری را در انجام درخواستهای چندمرحلهای بهبود دهد. 🤖
در این همکاری، فناوری جستوجوی گوگل وارد سیستمعاملهای اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود میشود. اپل پیشتر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ میشود که گوگل و آمازون پیشتر نسخههای هوشمندتر از دستیارهای خود را عرضه کردهاند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳ -
آمازون با دستگاههای نسخهپیچی هوشمند، وارد رقابت با داروخانهها شد!
آمازون اعلام کرد دستگاههای خودکار نسخهپیچی را در کلینیکهای «وان مدیکال» راهاندازی میکند. 💊 با این دستگاهها، بیماران میتوانند بلافاصله بعد از ویزیت، داروی خود را دریافت کنند. 🏥 اولین کیوسکها از دسامبر در لسآنجلس فعال میشوند و بهزودی در شهرهای دیگر نیز نصب خواهند شد. 📍 بیماران هزینه را از طریق اپلیکیشن آمازون پرداخت میکنند و دارو در چند دقیقه آماده میشود. ⏱️ این دستگاهها داروهای رایج مثل آنتیبیوتیک و داروی فشار خون را ارائه میدهند اما داروهای خاص یا نیازمند یخچال را شامل نمیشوند. ⚠️ آمازون میگوید این طرح باعث میشود بیماران بدون نیاز به رفتن به داروخانه، سریعتر داروی خود را بگیرند. ✅ این اقدام همزمان با تعطیلی بسیاری از داروخانههای سنتی، گامی دیگر از آمازون برای ورود جدیتر به حوزه سلامت است. 🚀
۱۴۰۴/۷/۱۹ ۲۱:۱۱:۵۶ -
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازهای از هوش مصنوعی خانگی
گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخها سریعتر و طبیعیتر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک میکند. 🍳🏠 اسپیکر میتواند از طریق سیستم هوشمند خانه، چراغها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و میتوان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام میشود. 🗓️۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵ -
مدل GPT-5 Pro از راه رسید؛ دقیقتر، عمیقتر و آماده برای صنایع مالی و پزشکی
OpenAI در رویداد Dev Day از مدلهای جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیقتر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچکتر و ارزانتر gpt-realtime mini. این بهروزرسانیها برای جذب توسعهدهندگان و ساخت اپلیکیشن در ChatGPT ارائه شدهاند. 💡.
مدل GPT-5 Pro برای حوزههایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی بهزودی یکی از روشهای اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفتوگوی زنده و کیفیت بالا، ۷۰٪ ارزانتر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعهدهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوههای هماهنگ تولید میکند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان میدهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵ -
تیکتاک به کاربرانش امکان ارسال پیامهای صوتی میدهد
تیکتاک قابلیتهای جدیدی برای پیامهای خصوصی معرفی کرد؛ از این پس کاربران میتوانند یادداشت صوتی ۶۰ ثانیهای و تا ۹ عکس یا ویدئو در چتهای فردی و گروهی ارسال کنند. این تغییرات، تجربه پیامرسانی در تیکتاک را مشابه واتساپ و اینستاگرام میکند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو بهعنوان اولین پیام ممکن نیست و محتوای نامناسب بهطور خودکار مسدود میشود. این قابلیتها بخشی از برنامه تیکتاک برای تقویت ابزارهای ارتباطی پس از افزودن چتهای گروهی و اتاقهای گفتگو است. ✅🚀۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳ -
اپل در حال توسعه Siri جدید با هوش مصنوعی
اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که میتواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حسابها و کنترل کامل اپلیکیشنها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاههای اپل دگرگون میکند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه میشود، هرچند چالشهایی مانند پشتیبانی از اپلیکیشنهای مختلف و دقت بالا در حوزههای حساس وجود دارد. موفقیت در این طرح میتواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸ -
GPT-5 یاد گرفت بگوید «نمیدانم»؛ انقلابی در صداقت هوش مصنوعی
OpenAI از مدل جدید GPT-5 رونمایی کرد؛ مدلی که علاوه بر بهبود چشمگیر در عملکرد ریاضی، کدنویسی، نویسندگی و کاربردهای پزشکی، یک ویژگی مهم و متفاوت دارد: توانایی گفتن «نمیدانم». 🤖💡
به گفته شرکت، GPT-5 پاسخها را صادقانهتر ارائه میدهد، در برابر پرسشهای غیرممکن یا مبهم از اختراع جواب خودداری میکند و کمتر برای خوشایند کاربر با او موافقت میکند. این تغییر پس از انتقاد کاربران از تمایل نسخههای قبلی به پاسخهای چاپلوسانه و گاهی نادرست انجام شده است. 📉🗨️
آمارهای OpenAI نشان میدهد نرخ خطا در پاسخهای جستجوی وب GPT-5 نسبت به GPT-4o تا ۴۵٪ کاهش یافته و در حالت «تفکر پیشرفته» (Thinking) این کاهش به ۸۰٪ میرسد. این رویکرد، به گفته کارشناسان، میتواند اعتماد به هوش مصنوعی را در حوزههای حساسی چون سلامت، حقوق و علم افزایش دهد. ✅📊۱۴۰۴/۵/۱۸ ۱۳:۰۳:۲۴ -
ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!
اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز میشوند: ضبط صدای حرفهای و کنترل دوربین با لمس ایرپاد. 🎧
با استفاده از چیپ H2، میکروفونهای پیشرفته و پردازش هوشمند صدا، کاربران میتوانند حتی در محیطهای شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماسهای باکیفیتتری داشته باشند. 🎙️
همچنین با نگهداشتن ساقه ایرپاد، میتوان دوربین آیفون یا اپهای دوربین دیگر را فعال کرد و بهراحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکههای اجتماعی بسیار کاربردی است. 📸
این قابلیتها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷ -
RCS، نسخه پیشرفته SMS، حالا استاندارد جدید ارتباطی است
📱 گوگل اعلام کرد که پروتکل پیامرسانی پیشرفته RCS حالا روزانه بیش از ۱ میلیارد پیام را فقط در آمریکا مدیریت میکند.💬
RCS نسخه ارتقاءیافته SMS است و امکاناتی مثل ارسال عکس و ویدیوی باکیفیت، نشانگر تایپ، رسید خواندهشدن پیام، و چت گروهی پیشرفته را فراهم میکند. 📸🗨️👥
پس از سالها فشار گوگل، اپل در iOS 18 بالاخره RCS را در برنامه Messages اضافه کرد. اما همچنان پیامها در قالب حباب سبز نمایش داده میشوند تا تفاوت با کاربران iMessage حفظ شود! 🍏🟢
گوگل جزئیات بیشتری درباره کاربران یا اپراتورها منتشر نکرد، اما این آمار نشان میدهد تجربه پیامرسانی بین اندروید و آیفون در حال بهتر شدن است. ✅🤝۱۴۰۴/۳/۶ ۱۳:۲۰:۵۲ -
هوش مصنوعی، راهکار جدید Audible برای گسترش کتابهای صوتی
🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتابهای چاپی و الکترونیکی را به کتابهای صوتی با صدای هوش مصنوعی تبدیل میکند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبانهای مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه میشود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را بهزودی فعال میکند. اما برخی ناشران نگران کاهش کیفیت کتابهای صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتابهای صوتی و رقابت با اپل و اسپاتیفای انجام میشود.۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶ -
هدست Clio ریزر: نجاتدهنده گیمرهای طاس!
🎧 شرکت ریزر (Razer) با معرفی Clio، بالش صوتی جدید خود، تجربه گیمینگ را برای کاربرانی که به دنبال صدای باکیفیت بدون هدفون هستند، بهبود بخشیده است. این محصول بهویژه برای کاربرانی با پوست سر حساس یا سر بدون مو طراحی شده که در استفاده از هدفونهای معمولی با ناراحتی مواجه میشوند. 😎
Clio به پشت صندلی گیمینگ متصل شده و با دو اسپیکر ۴۳ میلیمتری و پشتیبانی از THX Spatial Audio، صدای فراگیر سهبعدی را مستقیماً به گوش کاربر منتقل میکند. این دستگاه از طریق بیسیم (۲.۴ گیگاهرتز Hyperspeed) یا بلوتوث متصل میشود و دارای سه حالت صوتی (بازی، فیلم و موسیقی) است. 🔊
این بالش صوتی از فوم حافظهدار ساخته شده و میتواند به اکثر صندلیهای گیمینگ با یک بند ساده نصب شود. عمر باتری آن تا ۱۴ ساعت است و از طریق USB-C نیز قابل استفاده است. 🔋۱۴۰۴/۲/۲۲ ۱۶:۳۳:۰۱ -
انقلاب هوش مصنوعی زیر ذرهبین پاپ جدید! لئو چهاردهم
🌐🤖پاپ لئو چهاردهم، با نام اصلی رابرت پرووست از شیکاگو، بهتازگی بهعنوان رهبر جدید کلیسای کاتولیک انتخاب شده و برخلاف انتظار، نگاهی به آینده دارد! 🚀در اولین دیدارش با کاردینالها، او هوش مصنوعی را یکی از بزرگترین چالشهای دنیای امروز معرفی کرد. 💡
📜 او تأکید کرد که کلیسا باید از کرامت انسانی، عدالت و حقوق کارگران در برابر تحولات فناوری دفاع کند. ⚖️ انتخاب نام لئو هم بیدلیل نیست؛ او با این کار یاد پاپ لئو سیزدهم (۱۸۷۸-۱۹۰۳) را زنده کرده که با متن تاریخی Rerum Novarum از حقوق کارگران حمایت کرده بود. 📜
🤖اما این فقط شروع کار نیست! پاپ لئو چهاردهم در واقع ادامهدهنده راه پاپ فرانسیس است؛ کسی که همیشه درباره خطرات هوش مصنوعی و استفاده غیراخلاقی از فناوری هشدار میداد. او در نشست G7 و مجمع جهانی اقتصاد داووس تأکید کرده بود که فناوری باید در خدمت انسان باشد، نه اینکه به کرامت انسانی آسیب بزند. 🌐۱۴۰۴/۲/۲۲ ۰۰:۵۴:۳۹ -
گوگل قابلیت صوتیسازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد
گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکستهایی هوش مصنوعیمحور از اسناد کاربران تولید میکند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون میتوانند زبان تولید پادکستها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصیسازیشده را فراهم میکند. این ابزار برای مثال به دانشآموزان کمک میکند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبانهای جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر میشود.
۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴ -
نتفلیکس زیرنویس جدید خود را معرفی کرد
نتفلیکس قابلیت جدیدی به زیرنویسهای خود اضافه کرده که فقط دیالوگها را نشان میدهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شدهاند. این ویژگی که با انتخاب گزینه “English” بهجای “English (CC)” فعال میشود، برای کسانی طراحی شده که فقط میخواهند گفتوگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویسهای کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و بهزودی در دیگر آثار اصلی نتفلیکس و به تمام زبانها ارائه خواهد شد.
۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵ -
انقلاب در سرگرمی کودکان؛ انیمیشن جدید با فناوری بلاکچین
سریال کارتونی جدید Owen Nowhere پاییز امسال روی یک پلتفرم غیرمتمرکز بلاکچینی به نام Lamina1 منتشر میشود و همراه آن کیف پول رمزارزی ارائه خواهد شد. داستان درباره پسری نوجوان است که با خانواده عجیبش به سفر میرود و جاذبههای عجیب را مستندسازی میکند.
تماشاگران میتوانند با خرید داراییهای دیجیتال مثل لباس شخصیتها یا انتخاب مقصد سفر، در داستان دخالت کنند.
این مدل جدید از سرگرمی، کودکان و نوجوانان را به دنیای وب 3 و داراییهای دیجیتال وارد میکند، اما نگرانیهایی درباره استفاده کودکان از کیف پول رمزارزی وجود دارد.
سازندگان این روش را فرصتی برای مشارکت بیشتر و ایجاد حس مالکیت در بین مخاطبان میدانند.۱۴۰۴/۱/۳۱ ۰۱:۳۹:۳۸ -
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیتتر تا اسکن اسناد و خلاصه پیامهای صوتی
واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخشهای چت، تماس و کانالها اضافه کرده است. از این پس، در گروهها میتوان دید چه کسانی آنلاین هستند، نوتیفیکیشنها را فقط برای پیامهای مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگنمایی (زوم) انجام داد.
کاربران آیفون همچنین میتوانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماسهای تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چتهای دو نفره، پاسخ به دعوتها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.
در بخش کانالها نیز، ادمینها میتوانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیامهای صوتی را برای دنبالکنندگان ارسال کنند.۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶ -
ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic
آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که میتواند صدا را بسیار طبیعی تولید و گفتوگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفتهتر عمل میکند و حتی با مدلهای پیشرفتهی شرکتهایی مثل OpenAI و گوگل رقابت میکند.
این مدل بهگونهای طراحی شده که مکالمات را روانتر و با درک بهتری از صدا، حتی در محیطهای پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون میگوید این مدل تا ۸۰٪ ارزانتر از برخی رقباست و سرعت پاسخدهی بالاتری هم دارد.۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱ -
استارتاپ XL Batteries با باتری ارگانیک جدید به دنبال انقلاب در ذخیرهسازی انرژی
استارتاپ XL Batteries یک فناوری باتری جریانی جدید با مواد آلی توسعه داده که برای ذخیرهسازی انرژی در مقیاس بزرگ طراحی شده است. این باتری ارزانتر، ایمنتر و پایدارتر از باتریهای لیتیومی است و با استفاده از مخازن ذخیرهسازی، قابلیت تأمین برق 25 هزار خانه را در طول یک روز دارد.
۱۴۰۴/۱/۲۰ ۱۶:۰۹:۱۳ -
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی
شرکت Phonic، که توسط دو فارغالتحصیل MIT تأسیس شده، در حال توسعهی فناوری پیشرفتهای برای بهبود کیفیت و اطمینانپذیری صدای مصنوعی است. برخلاف سایر شرکتها که مدلهای مختلف را به هم متصل میکنند، Phonic مدلهای خود را از صفر و به صورت کامل و یکپارچه آموزش میدهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینههای اجرا میشود.
مدلهای Phonic میتوانند حتی در شرایطی که صداها نامفهوم، دارای لهجههای مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰ -
اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد
اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغدهندگان امکان میدهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را بهصورت خودکار ایجاد کنند.
همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغکنندگان اجازه میدهد در لحظه و بهصورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹ -
OpenAI رونمایی از مدلهای جدید هوش مصنوعی گفتار و رونویسی
شرکت OpenAI مدلهای جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعیتر و قابل تنظیم ارائه میدهد، درحالیکه مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدلها متنباز نخواهند بود.
۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸ -
بی وای دی چین با پلتفرم جدید، شارژ سریع خودروهای برقی را انقلابی میکند
شرکت بی وای دی (BYD) چین پلتفرم جدید خودروهای برقی با معماری ۱۰۰۰ ولتی را معرفی کرد که امکان شارژ سریع خودروها را فراهم میکند. این شرکت تولیدکننده خودروهای برقی قصد دارد بیش از ۴۰۰۰ ایستگاه شارژ فوق سریع را در سراسر کشور راهاندازی کند و بنیانگذار آن اعلام کرده خودروهای این پلتفرم میتوانند در ۵ دقیقه ۴۰۰ متر مسافت طی کنند.
۱۴۰۳/۱۲/۲۷ ۱۵:۴۴:۵۶ -
تحول در اینتل با مدیریت جدید؛ استراتژی بازسازی صنعت تراشه
لیپ-بو تان، مدیرعامل جدید اینتل، برنامه گستردهای برای احیای این شرکت فناوری در دست دارد. وی قصد دارد با کاهش نیروی میانی، بازسازی فرآیندهای تولید و تمرکز بر هوش مصنوعی، عملکرد شرکت را بهبود بخشد. تان که پیش از این در هیئت مدیره اینتل بوده، استراتژی تولید تراشه برای مشتریان خارجی و توسعه محصولات هوش مصنوعی را در دستور کار قرار داده است.
۱۴۰۳/۱۲/۲۷ ۱۵:۳۴:۲۳ -
گوگل از قابلیت Auracast در گوشیهای اندروید رونمایی کرد
گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک میکند تا در محیطهای پرسر و صدا مانند ایستگاه راهآهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشیهای سامسونگ Galaxy و Google Pixel با تنظیمات شخصیسازی صدا در دسترس خواهد بود.
۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸ -
انقلاب باتریهای لیتیومی در مراکز داده و صنایع مختلف
گوگل با جایگزینی باتریهای لیتیومی به جای باتریهای سربی در مراکز داده، موفق به کاهش ۷۵ درصدی تعداد سلولهای باتری و افزایش ظرفیت توان شده است. این تحول نشاندهنده نقش روزافزون باتریهای لیتیومی در صنایع مختلف از جمله مراکز داده، خانگی و پزشکی است.
۱۴۰۳/۱۲/۲۲ ۲۰:۰۱:۵۰ -
نینتندو سوئیچ 2 با سیستم چت صوتی یکپارچه
نینتندو در پی بهبود سیستم گفتگوی صوتی در نسل بعدی کنسول خود است. سوئیچ 2 احتمالاً سیستم چت صوتی مستقیم در سطح سیستم عامل خواهد داشت که به کاربران اجازه میدهد بدون نیاز به اپلیکیشن تلفن همراه با یکدیگر گفتگو کنند.
۱۴۰۳/۱۲/۲۱ ۲۲:۳۹:۴۴ -
استارتاپ Daqus انقلابی در فناوری باتری با ماده TAQ
استارتاپ Daqus Energy یک ماده جدید به نام TAQ را برای ساخت باتری های لیتیومی معرفی کرده که ارزانتر، سبکتر و با کارایی بالاست. این ماده کربن پایه، جایگزین کاتد باتریهای فعلی شده و هزینه تولید را به شدت کاهش میدهد. آزمایشهای اولیه نشان میدهد باتریهای TAQ میتوانند 2000 بار شارژ شوند و 80 درصد ظرفیت اولیه را حفظ کنند.
۱۴۰۳/۱۲/۲۰ ۲۳:۱۲:۱۹



