-
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance
استارتاپ نروژی Hance نرمافزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکتهایی مثل Intel و Riedel Communications (تأمینکننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدلهای پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام میشود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance میتواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلیثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخشهای امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشههای جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴ -
حذف گزینه پردازش محلی صدا در دستگاههای هوشمند آمازون
آمازون قابلیت پردازش محلی درخواستهای صوتی در دستگاههای Echo را حذف میکند و تمامی ضبطهای صوتی کاربران به فضای ابری این شرکت ارسال خواهد شد. این تصمیم در راستای گسترش قابلیتهای هوش مصنوعی Alexa با استفاده از پردازش ابری اتخاذ شده است.
۱۴۰۳/۱۲/۲۶ ۲۳:۰۹:۳۹ -
استارتاپ سانس با فناوری هوش مصنوعی، تبعیض لهجه در مراکز تماس را کاهش میدهد
استارتاپ سانس با استفاده از هوش مصنوعی، نرمافزاری توسعه داده که قادر به تعدیل لهجه گویندگان در زمان واقعی است. این شرکت که در سال ۲۰۲۰ تأسیس شده، با هدف کاهش تبعیض لهجهای در مراکز تماس فعالیت میکند. سانس با فناوری هوش مصنوعی خود توانسته درآمد سالانه ۲۱ میلیون دلاری کسب کند و اخیراً ۶۵ میلیون دلار سرمایه جذب کرده است.
۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۳ -
هشدار جدید درباره هدفونهای دارای حذف نویز
گزارش جدید بیبیسی نشان میدهد استفاده مداوم از هدفونهای حذف کننده صدا میتواند منجر به اختلال پردازش شنیداری شود. پنج بخش شنوایی سازمان بهداشت ملی انگلستان افزایش مراجعه جوانان با مشکلات پردازش صوتی را گزارش کردهاند. نظریه اصلی این است که فناوری حذف نویز ممکن است توانایی مغز در فیلتر کردن صداها را کاهش دهد.
۱۴۰۳/۱۱/۳۰ ۰۱:۳۷:۲۶ -
شکاف در قلب هوش مصنوعی؛ OpenAI از تراشههای انویدیا ناراضی شد
OpenAI از عملکرد برخی تراشههای جدید انویدیا، بهویژه در مرحله استنتاج یعنی زمانی که چتبات باید به کاربر پاسخ بدهد، رضایت کامل ندارد و از سال گذشته بهدنبال گزینههای جایگزین رفته است. این موضوع میتواند رابطه دو بازیگر اصلی موج هوش مصنوعی را پیچیدهتر کند. ⚙️
با اینکه انویدیا همچنان در آموزش مدلهای بزرگ AI پیشتاز است، منابع میگویند سرعت پاسخدهی در کاربردهایی مثل کدنویسی برای OpenAI کافی نیست. این شرکت به سختافزاری نیاز دارد که در آینده حدود ۱۰٪ توان پردازشی استنتاجش را تأمین کند. 🤖
در همین دوره، مذاکرات سرمایهگذاری انویدیا در OpenAI که رقم آن تا ۱۰۰ میلیارد دلار مطرح شده بود، ماهها طول کشیده است. همزمان OpenAI با شرکتهایی مثل AMD و استارتاپهایی مانند Cerebras همکاری کرده تا به تراشههایی با حافظه داخلی بیشتر (SRAM) دسترسی پیدا کند؛ تراشههایی که پاسخدهی هوش مصنوعی را سریعتر میکنند. 🚀
انویدیا هرگونه تنش را رد کرده و میگوید همچنان بهترین عملکرد بهازای هزینه را ارائه میدهد.۱۴۰۴/۱۱/۱۶ ۱۱:۳۵:۴۰ -
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!
بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آمادهشدن سیستم اختصاصی اپل، بهصورت موقت در سیری به کار گرفته میشود. 💬
بهگفتهی منابع آگاه، دو شرکت در حال نهاییکردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت میکند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستمهای فعلی اپل دارد و میتواند توانایی سیری را در انجام درخواستهای چندمرحلهای بهبود دهد. 🤖
در این همکاری، فناوری جستوجوی گوگل وارد سیستمعاملهای اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود میشود. اپل پیشتر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ میشود که گوگل و آمازون پیشتر نسخههای هوشمندتر از دستیارهای خود را عرضه کردهاند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳ -
نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد
مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدلهای هوش مصنوعی در چند سال آینده به فناوریهای عمومی و در دسترس همه تبدیل خواهند شد. 🤖
او گفت تمرکز فعلی شرکت بر بهبود مدلهای صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 بهگفته او، در یک تا دو سال آینده مدلهای چندوجهی که صدا، تصویر و متن را همزمان تولید میکنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
شرکت قصد دارد با همکاریهای جدید و بهرهگیری از فناوریهای متنباز، میان توسعه مدلها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرمافزار و سختافزار در اپل بسازد. 🍏🚀
محصولات این شرکت در پلتفرمهایی مانند دوبله ویدیو، پادکست، بازیهای ویدئویی، کتابهای صوتی و محتوای آموزشی استفاده میشوند.۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲ -
اینتل با تراشه جدید Panther Lake وارد عصر تازهای از سرعت و قدرت شد!
شش ماه پس از آغاز مدیریت «لیپ-بو تان» برای نوسازی اینتل، این شرکت از پردازنده جدید خود با نام Panther Lake رونمایی کرد. 💻
این تراشه نخستین محصول ساختهشده با فناوری پیشرفته ۱۸A است که در کارخانه آریزونای آمریکا تولید میشود و تا پایان امسال به بازار میآید. 🇺🇸 تان گفت این نسل تازه، آغاز دورهای جدید در دنیای محاسبات است و به بازسازی و نوآوری در اینتل کمک میکند. 🚀
همچنین اینتل از پردازنده سرور Xeon 6+ با همین فناوری رونمایی کرد که اوایل ۲۰۲۶ عرضه خواهد شد. 🖥️ فناوری ۱۸A سرعت پردازش بالاتر، مصرف انرژی کمتر و تراکم بیشتر تراشهها را به همراه دارد و رقابت اینتل را با شرکتهای آسیایی تقویت میکند. ⚙️۱۴۰۴/۷/۲۰ ۰۹:۲۲:۳۳ -
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازهای از هوش مصنوعی خانگی
گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخها سریعتر و طبیعیتر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک میکند. 🍳🏠 اسپیکر میتواند از طریق سیستم هوشمند خانه، چراغها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و میتوان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام میشود. 🗓️۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵ -
مدل GPT-5 Pro از راه رسید؛ دقیقتر، عمیقتر و آماده برای صنایع مالی و پزشکی
OpenAI در رویداد Dev Day از مدلهای جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیقتر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچکتر و ارزانتر gpt-realtime mini. این بهروزرسانیها برای جذب توسعهدهندگان و ساخت اپلیکیشن در ChatGPT ارائه شدهاند. 💡.
مدل GPT-5 Pro برای حوزههایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی بهزودی یکی از روشهای اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفتوگوی زنده و کیفیت بالا، ۷۰٪ ارزانتر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعهدهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوههای هماهنگ تولید میکند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان میدهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵ -
همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲
اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قویتر از ایرپادز پرو ۲ عمل میکند و سریهای فومی جدید هم باعث میشوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قویتر و صدای فراگیرتری ارائه میشود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یکسوم بیشتر از نسل قبل. 🔋🎶
ایرپادز پرو ۳ امکانات تازهای مثل اندازهگیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سریها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیتهای بیشتر با همان هزینه. ✅💵۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸ -
تیکتاک به کاربرانش امکان ارسال پیامهای صوتی میدهد
تیکتاک قابلیتهای جدیدی برای پیامهای خصوصی معرفی کرد؛ از این پس کاربران میتوانند یادداشت صوتی ۶۰ ثانیهای و تا ۹ عکس یا ویدئو در چتهای فردی و گروهی ارسال کنند. این تغییرات، تجربه پیامرسانی در تیکتاک را مشابه واتساپ و اینستاگرام میکند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو بهعنوان اولین پیام ممکن نیست و محتوای نامناسب بهطور خودکار مسدود میشود. این قابلیتها بخشی از برنامه تیکتاک برای تقویت ابزارهای ارتباطی پس از افزودن چتهای گروهی و اتاقهای گفتگو است. ✅🚀۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳ -
Starcloud اولین مرکز داده مجهز به تراشههای انویدیا را به مدار زمین میفرستد!
شرکتهای فناوری برای حل مشکل مصرف بالای انرژی مراکز داده، به سراغ یک ایده فضایی رفتهاند: ساخت مراکز داده در مدار زمین و حتی روی ماه. استارتاپ Starcloud اعلام کرده در نوامبر اولین مرکز داده فضایی خود را با تراشههای قدرتمند H100 انویدیا به مدار پایین زمین میفرستد؛ جایی که میتواند دادههای ماهوارهای را همانجا پردازش کند و نتیجه را در چند ثانیه به زمین برگرداند. 🤖🛰️
در همین حال، شرکت Lonestar Data Holdings قصد دارد مراکز داده را در نقاط دورتر مثل مدار میان زمین و ماه یا حتی در تونلهای گدازه روی سطح ماه بسازد. این کار علاوه بر ذخیره امنتر اطلاعات، میتواند خطر هک را کاهش دهد. 🌌🔐
مزیت این طرح استفاده از انرژی نامحدود خورشید و سرمای طبیعی فضا برای خنکسازی است که مصرف آب و برق روی زمین را بهشدت کم میکند. اما هزینه بالای پرتاب موشک، آلودگی محیطی و قوانین سختگیرانه همچنان موانع جدی هستند. ✅⚡۱۴۰۴/۶/۹ ۰۱:۰۰:۱۲ -
گوگل، NotebookLM را به 80 زبان گسترش داد
گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی میکند. این ویژگی به کاربران امکان میدهد یادداشتها، فایلهای PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیشتر فقط برای زبان انگلیسی فعال بود. 🎥🌍
همچنین قابلیت Audio Overviews ارتقا یافته و خلاصههای صوتی در زبانهای غیرانگلیسی اکنون جزئیات بیشتری ارائه میدهند. کاربران میتوانند بسته به نیاز، نسخه کوتاه یا کامل خلاصهها را دریافت کنند. 🎧📑۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵ -
چتبات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراجشده را بازگرداند!
بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چتبات صوتی اخراج کرد، اما بهدلیل افزایش تماسها و ناکارآمدی سیستم مجبور شد آنها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماسها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شدهاند. 🤖📞
بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقبنشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبهرو شدند. ✅👥
این اتفاق نشان میدهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژههای آزمایشی هوش مصنوعی در شرکتها شکست خوردهاند. 📊⚡۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵ -
اپل در حال توسعه Siri جدید با هوش مصنوعی
اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که میتواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حسابها و کنترل کامل اپلیکیشنها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاههای اپل دگرگون میکند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه میشود، هرچند چالشهایی مانند پشتیبانی از اپلیکیشنهای مختلف و دقت بالا در حوزههای حساس وجود دارد. موفقیت در این طرح میتواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸ -
Oxmiq Labs وارد رقابت GPUهای هوش مصنوعی شد
استارتاپ Oxmiq Labs به رهبری راجا کادوری، از مدیران سابق اینتل، اعلام کرده که میخواهد فناوری پردازندههای گرافیکی مخصوص هوش مصنوعی را بهصورت مجوزی به شرکتها ارائه دهد و برای این کار ۲۰ میلیون دلار سرمایه جذب کرده است. 💡💰
این فناوری از رباتهای کوچک تا ابررایانههای ابری قابل استفاده است و میتواند برنامههای نوشتهشده برای انویدیا را بدون نیاز به تغییر، روی سختافزارهای دیگر اجرا کند. ✅🔧
Oxmiq میگوید بهجای ساخت تراشههای گرانقیمت، فقط روی طراحی و فروش فناوری تمرکز میکند و هدفش این است که مثل شرکت معروف Arm، به هسته اصلی نسل بعدی پردازندهها تبدیل شود. 🎯📈۱۴۰۴/۵/۱۶ ۱۰:۲۵:۵۸ -
متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!
🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینکهای هوشمند خود را ارتقا دهد. ✅🕶️
هدف متا، بهبود تجربه کار با عینکهای Ray-Ban با استفاده از مدلهای زبانی پیشرفته است؛ چون این دستگاهها فاقد نمایشگرند و تعامل با آنها به عملکرد دستیار صوتی وابسته است. ✅🤖
این رویکرد میتواند متا را در رقابت عینکهای هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶ -
تحول بزرگ در سیری: اپل به دنبال همکاری با OpenAI و Anthropic
اپل در حال بررسی استفاده از مدلهای هوش مصنوعی OpenAI یا Anthropic برای ارتقای دستیار صوتی سیری است؛ اقدامی که نشاندهنده تغییر راهبرد از مدلهای داخلی به راهکارهای بیرونی است. 🤖
گزارش بلومبرگ میگوید مذاکرات با این شرکتها برای اجرای مدلها روی زیرساخت ابری اپل آغاز شده، اما هنوز تصمیم نهایی گرفته نشده است. ☁️
این در حالیست که اپل بهروزرسانیهای سیری را تا سال ۲۰۲۶ به تعویق انداخته و همزمان ابزارهای هوش مصنوعی خود و OpenAI را در اختیار توسعهدهندگان قرار داده است. 🛠️۱۴۰۴/۴/۱۲ ۰۱:۰۴:۴۱ -
ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!
اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز میشوند: ضبط صدای حرفهای و کنترل دوربین با لمس ایرپاد. 🎧
با استفاده از چیپ H2، میکروفونهای پیشرفته و پردازش هوشمند صدا، کاربران میتوانند حتی در محیطهای شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماسهای باکیفیتتری داشته باشند. 🎙️
همچنین با نگهداشتن ساقه ایرپاد، میتوان دوربین آیفون یا اپهای دوربین دیگر را فعال کرد و بهراحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکههای اجتماعی بسیار کاربردی است. 📸
این قابلیتها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷ -
ChatGPT با لحنی انسانیتر از همیشه
قابلیت گفتوگوی صوتی در ChatGPT با ارتقاء جدیدی همراه شده که صدای آن را طبیعیتر، روانتر و احساسیتر از قبل میکند. 🎙️
بهگفته OpenAI، نسخه جدید «صدای پیشرفته» با لحن واقعیتر، مکثهای طبیعی، تأکید مناسب و بیان دقیقتر احساساتی مانند همدلی یا طعنه طراحی شده است. 🧠
ویژگی ترجمه زنده نیز بهبود یافته و اکنون کاربران میتوانند بدون وقفه، گفتوگوهای چندزبانه را ادامه دهند تا زمانی که بخواهند زبان را تغییر دهند یا متوقف کنند. 🌍
این قابلیت برای همه کاربران سرویس پولی در تمامی پلتفرمها فعال است، هرچند ممکن است گاهی افت کیفیت صوتی یا خطاهای محدود مانند صداهای غیرمنتظره یا موسیقی پسزمینه رخ دهد. ⚠️۱۴۰۴/۳/۲۰ ۱۸:۲۷:۱۹ -
Soundcore Boom 3i؛ اسپیکر مقاوم و شناور انکر
🔊 انکر (Anker) از اسپیکر بلوتوثی مقاوم Boom 3i رونمایی کرده که روی آب شناور میماند و صدای شفاف پخش میکند. 🌊
🧂 در برابر آب شور تا ۲ سال بدون خوردگی دوام میآورد و در برابر سقوط، گردوغبار و غوطهوری در آب مقاوم است. 💥
🔋 با توان ۵۰ وات، صدای ۹۸ دسیبل و ۱۶ ساعت شارژ، مناسب مهمانیها و ماجراجوییهاست. 🎉
🚨 دارای آژیر اضطراری، تقویت صدا و قابلیت تمیز کردن خود از شن و خاک است. 📢
💵 این اسپیکر ۱۸۹ دلار قیمت گذاری شده است و برای شرایط سخت گزینهای جدی بهحساب میآید.۱۴۰۴/۳/۱۴ ۰۲:۳۳:۱۶ -
Anthropic قابلیت مکالمه صوتی را به چتبات Claude اضافه کرد
🗣️ شرکت Anthropic حالت Voice Mode را برای چتبات Claude در نسخه موبایل فعال کرد! کاربران حالا میتوانند با Claude گفتگوهای صوتی انجام دهند و پاسخها را با صدا بشنوند. 🎧📱
این قابلیت فعلاً به زبان انگلیسی و در حالت آزمایشی عرضه شده و امکان سوییچ بین متن و صدا، انتخاب از بین ۵ صدای مختلف و دیدن خلاصه گفتگو را فراهم میکند. 🔄📝۱۴۰۴/۳/۸ ۰۲:۵۷:۱۸ -
آمازون با خلاصههای صوتی هوشمند، خرید را متحول میکند
🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش میکند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، میتوانید توضیحاتی صوتی درباره ویژگیها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمهای تولید شدهاند تا خرید راحتتر و سریعتری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد بهزودی آن را گسترش دهد. 🌍🛍️۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶ -
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد
📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیهسازیشده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروشها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصیاش میگوید و موضعی موافق با حق سقط جنین اتخاذ میکند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطهعطفی در کتابهای صوتی میداند. 🚀🔊۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱ -
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست
🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار بهصورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفتوگو با افراد به زبانهای مختلف را در زمان واقعی فراهم میکند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوههای انگلیسیزبان میتوانند با مادربزرگ اسپانیاییزبانشان راحت صحبت کنند یا شرکتهای بینالمللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه میشود و صدای اصلی شخص نیز بهصورت کمرنگ در پسزمینه شنیده میشود 🎙️🔊۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵ -
آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون
🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون میتوانند کتابهای صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
اسپاتیفای در سال ۲۰۲۲ امکان خرید کتابهای صوتی را به دلیل قوانین سختگیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲ -
انویدیا (Nvidia) پلتفرم Lepton را برای اجاره چیپهای هوش مصنوعی معرفی کرد
انویدیا ، یک پلتفرم جدید به نام Lepton معرفی کرده که به شرکتهای ارائهدهنده خدمات ابری اجازه میدهد ظرفیت پردازشی کارتهای گرافیک (GPU) خود را برای دیگران اجاره دهند. این پلتفرم به توسعهدهندگان نرمافزارهای هوش مصنوعی کمک میکند تا بهراحتی قدرت پردازشی مورد نیاز خود را از شرکتهای ابری مانند CoreWeave و Foxconn پیدا و اجاره کنند. ✅
🔹 بنابراین توسعهدهندگان بدون تماس مستقیم با شرکتها میتوانند از یک بازار متمرکز ظرفیت GPU بگیرند.
🔹 شرکتهای بزرگی مثل Microsoft و Amazon هنوز به این پلتفرم نپیوستهاند. 🚫🌐
این حرکت انویدیا، دسترسی به قدرت پردازش هوش مصنوعی را برای همه آسانتر میکند. 🚀۱۴۰۴/۲/۳۰ ۱۱:۲۳:۱۹ -
هوش مصنوعی، راهکار جدید Audible برای گسترش کتابهای صوتی
🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتابهای چاپی و الکترونیکی را به کتابهای صوتی با صدای هوش مصنوعی تبدیل میکند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبانهای مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه میشود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را بهزودی فعال میکند. اما برخی ناشران نگران کاهش کیفیت کتابهای صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتابهای صوتی و رقابت با اپل و اسپاتیفای انجام میشود.۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶ -
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small
🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشیهای هوشمند هم کار میکند و در کمتر از ۸ ثانیه صدا تولید میکند. 📱
✅ برخلاف دیگر مدلها، فقط از آهنگهای رایگان برای آموزش استفاده کرده و نگرانی کپیرایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی میکند و مناسب تولید افکتهای صوتی و نمونههای کوتاه است. 🎧۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵



