• گوگل از قابلیت Auracast در گوشی‌های اندروید رونمایی کرد

    گوگل فناوری جدید Bluetooth به نام Auracast را معرفی کرد که به افراد دارای مشکلات شنوایی کمک می‌کند تا در محیط‌های پرسر و صدا مانند ایستگاه راه‌آهن یا کنسرت، پخش صوتی را مستقیماً از طریق سمعک یا هدفون دریافت کنند. این قابلیت ابتدا برای گوشی‌های سامسونگ Galaxy و Google Pixel با تنظیمات شخصی‌سازی صدا در دسترس خواهد بود.

    ۱۴۰۳/۱۲/۲۴ ۰۲:۴۹:۲۸
  • اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!

    بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آماده‌شدن سیستم اختصاصی اپل، به‌صورت موقت در سیری به کار گرفته می‌شود. 💬
    به‌گفته‌ی منابع آگاه، دو شرکت در حال نهایی‌کردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت می‌کند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستم‌های فعلی اپل دارد و می‌تواند توانایی سیری را در انجام درخواست‌های چندمرحله‌ای بهبود دهد. 🤖
    در این همکاری، فناوری جست‌وجوی گوگل وارد سیستم‌عامل‌های اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود می‌شود. اپل پیش‌تر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
    این تصمیم در حالی اتخاذ می‌شود که گوگل و آمازون پیش‌تر نسخه‌های هوشمندتر از دستیارهای خود را عرضه کرده‌اند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀

    ۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳
  • نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد

    مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدل‌های هوش مصنوعی در چند سال آینده به فناوری‌های عمومی و در دسترس همه تبدیل خواهند شد. 🤖
    او گفت تمرکز فعلی شرکت بر بهبود مدل‌های صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 به‌گفته او، در یک تا دو سال آینده مدل‌های چندوجهی که صدا، تصویر و متن را هم‌زمان تولید می‌کنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
    شرکت قصد دارد با همکاری‌های جدید و بهره‌گیری از فناوری‌های متن‌باز، میان توسعه مدل‌ها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرم‌افزار و سخت‌افزار در اپل بسازد. 🍏🚀
    محصولات این شرکت در پلتفرم‌هایی مانند دوبله ویدیو، پادکست، بازی‌های ویدئویی، کتاب‌های صوتی و محتوای آموزشی استفاده می‌شوند.

    ۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲
  • اسپیکر ۳۶۰ درجه گوگل؛ نسل تازه‌ای از هوش مصنوعی خانگی

    گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخ‌ها سریع‌تر و طبیعی‌تر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک می‌کند. 🍳🏠 اسپیکر می‌تواند از طریق سیستم هوشمند خانه، چراغ‌ها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغ‌ها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و می‌توان دو دستگاه را برای صدای استریو جفت کرد. 🎶
    طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
    قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام می‌شود. 🗓️

    ۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵
  • مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

    OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
    مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
    مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
    مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
    اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

    ۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
  • صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

    استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
    فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

    ۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
  • Pulse: اولین قدم OpenAI برای هوشمندتر کردن زندگی روزمره!

    OpenAI قابلیت جدیدی به نام Pulse را معرفی کرده که شبانه گزارش‌های شخصی‌سازی‌شده تولید می‌کند و صبح به کاربران نمایش می‌دهد. هدف این ویژگی، تبدیل ChatGPT به یک دستیار روزانه شبیه اپ‌های خبری و شبکه‌های اجتماعی است. 📰🤖
    Pulse فعلاً فقط برای مشترکان پلن Pro با هزینه ۲۰۰ دلار در ماه فعال است و بعداً برای کاربران Plus هم عرضه می‌شود. دلیل این محدودیت، نیاز بالای این قابلیت به سرور و قدرت پردازش است. 💵⚡
    گزارش‌های Pulse فقط عمومی نیستند، بلکه با توجه به علایق و داده‌های شخصی کاربر ساخته می‌شوند؛ مثلاً مرور اخبار تیم ورزشی محبوب، برنامه سفر خانوادگی، پیشنهاد رستوران یا جمع‌بندی ایمیل‌ها و قرارهای تقویم. این گزارش‌ها در قالب کارت‌های متنی و تصویری نمایش داده می‌شوند و قابلیت اتصال به جیمیل و گوگل‌کلندر را هم دارند. 📩📅⚽✈️
    OpenAI می‌گوید Pulse اولین گام در تبدیل ChatGPT به یک دستیار هوشمند و پیش‌دستانه برای همه کاربران است. 🌍✨

    ۱۴۰۴/۷/۵ ۰۰:۴۸:۵۵
  • همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲

    اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قوی‌تر از ایرپادز پرو ۲ عمل می‌کند و سری‌های فومی جدید هم باعث می‌شوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
    کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قوی‌تر و صدای فراگیرتری ارائه می‌شود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یک‌سوم بیشتر از نسل قبل. 🔋🎶
    ایرپادز پرو ۳ امکانات تازه‌ای مثل اندازه‌گیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سری‌ها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
    با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیت‌های بیشتر با همان هزینه. ✅💵

    ۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸
  • تیک‌تاک به کاربرانش امکان ارسال پیام‌های صوتی می‌دهد

    تیک‌تاک قابلیت‌های جدیدی برای پیام‌های خصوصی معرفی کرد؛ از این پس کاربران می‌توانند یادداشت صوتی ۶۰ ثانیه‌ای و تا ۹ عکس یا ویدئو در چت‌های فردی و گروهی ارسال کنند. این تغییرات، تجربه پیام‌رسانی در تیک‌تاک را مشابه واتس‌اپ و اینستاگرام می‌کند. 🎙️📷
    برای حفظ امنیت، ارسال عکس یا ویدئو به‌عنوان اولین پیام ممکن نیست و محتوای نامناسب به‌طور خودکار مسدود می‌شود. این قابلیت‌ها بخشی از برنامه تیک‌تاک برای تقویت ابزارهای ارتباطی پس از افزودن چت‌های گروهی و اتاق‌های گفتگو است. ✅🚀

    ۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳
  • گوگل، NotebookLM را به 80 زبان گسترش داد

    گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی می‌کند. این ویژگی به کاربران امکان می‌دهد یادداشت‌ها، فایل‌های PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیش‌تر فقط برای زبان انگلیسی فعال بود. 🎥🌍
    همچنین قابلیت Audio Overviews ارتقا یافته و خلاصه‌های صوتی در زبان‌های غیرانگلیسی اکنون جزئیات بیشتری ارائه می‌دهند. کاربران می‌توانند بسته به نیاز، نسخه کوتاه یا کامل خلاصه‌ها را دریافت کنند. 🎧📑

    ۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵
  • چت‌بات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراج‌شده را بازگرداند!

    بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چت‌بات صوتی اخراج کرد، اما به‌دلیل افزایش تماس‌ها و ناکارآمدی سیستم مجبور شد آن‌ها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماس‌ها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شده‌اند. 🤖📞
    بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقب‌نشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبه‌رو شدند. ✅👥
    این اتفاق نشان می‌دهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژه‌های آزمایشی هوش مصنوعی در شرکت‌ها شکست خورده‌اند. 📊⚡

    ۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵
  • Fitbit با مربی هوش مصنوعی Gemini متحول می‌شود؛ از برنامه ورزشی تا تحلیل خواب

    گوگل در رویداد Made by Google از مربی سلامت شخصی مبتنی بر هوش مصنوعی رونمایی کرد که با فناوری Gemini ساخته شده و از اکتبر در اپلیکیشن جدید Fitbit Premium در دسترس کاربران قرار می‌گیرد. این مربی ترکیبی از برنامه‌ریز ورزشی، مشاور خواب و راهنمای تندرستی است. 🤖⌚
    مربی هوشمند با توجه به داده‌های لحظه‌ای مانند ضربان قلب، کیفیت خواب یا حتی قند خون، برنامه‌ای شخصی‌سازی‌شده طراحی و در صورت کم‌خوابی یا آسیب‌دیدگی آن را تغییر می‌دهد. همچنین می‌توان پرسش‌هایی درباره ورزش و خواب از او پرسید و پاسخ علمی دریافت کرد. 🏋️‍♂️😴
    اپلیکیشن جدید Fitbit با طراحی مدرن و قابلیت‌های تازه ارائه می‌شود و گوگل اعلام کرده استفن کری ستاره NBA نیز به‌عنوان مشاور عملکرد به این پروژه پیوسته است. ✅🏀

    ۱۴۰۴/۵/۳۱ ۱۵:۴۵:۴۸
  • وعده آلتمن: شخصیت GPT-5 گرم‌تر و شخصی‌تر می‌شود

    OpenAI که هفته گذشته مدل GPT-5 را معرفی کرده بود، قصد داشت با حذف لیست انتخاب مدل‌ها، کار با ChatGPT را ساده‌تر کند. اما حالا سه حالت Auto، Fast و Thinking برای GPT-5 اضافه شده تا کاربران بتوانند بسته به نیاز خود از مدل سریع یا دقیق استفاده کنند. در کنار این، دسترسی به مدل‌های قدیمی مثل GPT-4o، GPT-4.1 و o3 هم برای کاربران اشتراکی پولی دوباره فعال شده است. 🤖⚡
    سم آلتمن گفته به‌زودی شخصیت GPT-5 گرم‌تر و امکان شخصی‌سازی بیشتری خواهد داشت تا با سلیقه هر کاربر هماهنگ شود. این تغییرات پس از اعتراض کاربران به حذف GPT-4o و مشکلات عملکرد GPT-5 در روزهای اول عرضه انجام شده است. با این حال، انتخاب مدل در ChatGPT هنوز پیچیده است و نشان می‌دهد هدف OpenAI برای ساخت یک مدل واحد کامل، فعلاً به نتیجه نرسیده است. ✅📈

    ۱۴۰۴/۵/۲۳ ۱۰:۴۵:۰۱
  • گوگل به کاربران اجازه می‌دهد تا منابع خبری خود را انتخاب کنند

    گوگل با معرفی قابلیت جدید Preferred Sources به کاربران امکان می‌دهد منابع خبری مورد علاقه خود را انتخاب کنند تا خبرهای این منابع در بخش «Top Stories» و بخشی جدید با عنوان «From your sources» در نتایج جستجو نمایش داده شود. این قابلیت که از هم‌اکنون در آمریکا و هند فعال شده، محدودیتی در تعداد منابع انتخابی ندارد و شامل رسانه‌های ملی، محلی یا حتی وبلاگ‌های تخصصی می‌شود. 📲📰
    کاربران می‌توانند با لمس آیکون کنار بخش «Top Stories» هنگام جستجو، منابع دلخواه خود را جستجو و انتخاب کنند. گوگل همچنین ابزارهایی به ناشران ارائه کرده تا کاربران را تشویق به افزودن آن‌ها به فهرست منابع برگزیده کنند. این اقدام در حالی صورت می‌گیرد که برخی تحلیلگران آن را پاسخی غیرمستقیم به انتقادات از کیفیت نتایج جستجوی گوگل می‌دانند. ✅🌐

    ۱۴۰۴/۵/۲۳ ۱۰:۳۴:۲۴
  • اپل در حال توسعه Siri جدید با هوش مصنوعی

    اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که می‌تواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حساب‌ها و کنترل کامل اپلیکیشن‌ها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاه‌های اپل دگرگون می‌کند. 🎙️📱
    این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه می‌شود، هرچند چالش‌هایی مانند پشتیبانی از اپلیکیشن‌های مختلف و دقت بالا در حوزه‌های حساس وجود دارد. موفقیت در این طرح می‌تواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀

    ۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸
  • پایان صفحه ترند یوتیوب: چه چیزی در انتظار کاربران است؟

    یوتیوب پس از ۱۰ سال صفحه «ترند» را حذف می‌کند و به‌جای آن، فهرست‌های جداگانه‌ای مثل موزیک‌های محبوب، تریلرهای فیلم و پادکست‌های برتر را معرفی می‌کند. ✅
    یوتیوب می‌گوید فرهنگ اینترنت تغییر کرده و دیگر نمی‌توان یک لیست واحد برای همه کاربران ساخت، به‌ویژه با رشد جوامع تخصصی. 📉
    الگوریتم جدید بیشتر روی سلیقه شخصی کاربران تمرکز دارد و بخش Explore نیز همچنان فعال می‌ماند. 📲
    یوتیوب همچنین قصد دارد جلوی درآمدزایی محتوای بی‌کیفیت تولیدشده با هوش مصنوعی را بگیرد. 🤖🚫

    ۱۴۰۴/۴/۲۴ ۱۳:۳۶:۵۸
  • متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!

    🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینک‌های هوشمند خود را ارتقا دهد. ✅🕶️
    هدف متا، بهبود تجربه کار با عینک‌های Ray-Ban با استفاده از مدل‌های زبانی پیشرفته است؛ چون این دستگاه‌ها فاقد نمایشگرند و تعامل با آن‌ها به عملکرد دستیار صوتی وابسته است. ✅🤖
    این رویکرد می‌تواند متا را در رقابت عینک‌های هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀

    ۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶
  • تحول بزرگ در سیری: اپل به دنبال همکاری با OpenAI و Anthropic

    اپل در حال بررسی استفاده از مدل‌های هوش مصنوعی OpenAI یا Anthropic برای ارتقای دستیار صوتی سیری است؛ اقدامی که نشان‌دهنده تغییر راهبرد از مدل‌های داخلی به راهکارهای بیرونی است. 🤖
    گزارش بلومبرگ می‌گوید مذاکرات با این شرکت‌ها برای اجرای مدل‌ها روی زیرساخت ابری اپل آغاز شده، اما هنوز تصمیم نهایی گرفته نشده است. ☁️
    این در حالی‌ست که اپل به‌روزرسانی‌های سیری را تا سال ۲۰۲۶ به تعویق انداخته و هم‌زمان ابزارهای هوش مصنوعی خود و OpenAI را در اختیار توسعه‌دهندگان قرار داده است. 🛠️

    ۱۴۰۴/۴/۱۲ ۰۱:۰۴:۴۱
  • اسپاتیفای به شما اجازه می‌دهد ژانرهای موسیقی دلخواهتان را انتخاب کنید

    اسپاتیفای پس از ده سال، پلی‌لیست محبوب Discover Weekly را با قابلیت‌های تازه به‌روزرسانی کرده است. 🎧
    کاربران اشتراک پریمیوم اکنون می‌توانند با استفاده از فیلترهای ژانری جدید در ابتدای پلی‌لیست، جهت موسیقی‌های پیشنهادی را به سبک‌های دلخواه خود هدایت کنند؛ مثلاً اگر به راک دهه ۸۰ علاقه دارید اما به K-pop هم تمایل پیدا کرده‌اید، الگوریتم را در این مسیر تنظیم کنید. 🎶
    اسپاتیفای اعلام کرده تاکنون بیش از ۱۰۰ میلیارد ترک از این پلی‌لیست شنیده شده که ۷۷٪ آن‌ها متعلق به هنرمندان نوظهور بوده است. ✅
    برای استفاده از این قابلیت، کافی‌ست کاربران نسخه به‌روز اپلیکیشن را نصب کرده و از بخش Made for You وارد پلی‌لیست Discover Weekly شوند. 🆕
    این اقدام بخشی از تلاش‌های اسپاتیفای برای افزایش کنترل کاربر بر الگوریتم‌هاست؛ از جمله امکان مشاهده صف آهنگ‌های بعدی، یا غیرفعال‌سازی موقت آهنگ‌هایی که از آن‌ها خسته شده‌اید. 🛠️

    ۱۴۰۴/۴/۱۰ ۲۳:۴۹:۴۲
  • همکاری جدید Pearson و گوگل برای آینده یادگیری

    شرکت آموزشی بریتانیایی پیرسون اعلام کرد با سرویس ابری گوگل، زیرمجموعه آلفابت، وارد یک همکاری چندساله برای توسعه ابزارهای یادگیری مبتنی بر هوش مصنوعی شده است. 🤝
    این ابزارها با تکیه بر مدل‌های پیشرفته هوش مصنوعی گوگل، آموزش را برای دانش‌آموزان مدارس ابتدایی و متوسطه شخصی‌سازی کرده و به معلمان کمک می‌کنند تا عملکرد دانش‌آموزان را بهتر ارزیابی و آموزش را متناسب با نیاز هر فرد تنظیم کنند. 🎓
    مدیرعامل پیرسون، عمر عبوش، تأکید کرده که هوش مصنوعی می‌تواند آموزش مدارس را از شیوه‌های یکسان به مسیرهای یادگیری فردی و متناسب با توانایی هر دانش‌آموز تغییر دهد. 🔍
    پیرسون پیش‌تر نیز همکاری‌های مشابهی با مایکروسافت و آمازون برای توسعه ابزارهای دیجیتال و شخصی‌سازی آموزش امضا کرده بود. 💡

    ۱۴۰۴/۴/۷ ۱۳:۵۵:۱۳
  • ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!

    اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز می‌شوند: ضبط صدای حرفه‌ای و کنترل دوربین با لمس ایرپاد. 🎧
    با استفاده از چیپ H2، میکروفون‌های پیشرفته و پردازش هوشمند صدا، کاربران می‌توانند حتی در محیط‌های شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماس‌های باکیفیت‌تری داشته باشند. 🎙️
    همچنین با نگه‌داشتن ساقه ایرپاد، می‌توان دوربین آیفون یا اپ‌های دوربین دیگر را فعال کرد و به‌راحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکه‌های اجتماعی بسیار کاربردی است. 📸
    این قابلیت‌ها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅

    ۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷
  • ChatGPT با لحنی انسانی‌تر از همیشه

    قابلیت گفت‌وگوی صوتی در ChatGPT با ارتقاء جدیدی همراه شده که صدای آن را طبیعی‌تر، روان‌تر و احساسی‌تر از قبل می‌کند. 🎙️
    به‌گفته OpenAI، نسخه جدید «صدای پیشرفته» با لحن واقعی‌تر، مکث‌های طبیعی، تأکید مناسب و بیان دقیق‌تر احساساتی مانند همدلی یا طعنه طراحی شده است. 🧠
    ویژگی ترجمه زنده نیز بهبود یافته و اکنون کاربران می‌توانند بدون وقفه، گفت‌وگوهای چندزبانه را ادامه دهند تا زمانی که بخواهند زبان را تغییر دهند یا متوقف کنند. 🌍
    این قابلیت برای همه کاربران سر‌ویس پولی در تمامی پلتفرم‌ها فعال است، هرچند ممکن است گاهی افت کیفیت صوتی یا خطاهای محدود مانند صداهای غیرمنتظره یا موسیقی پس‌زمینه رخ دهد. ⚠️

    ۱۴۰۴/۳/۲۰ ۱۸:۲۷:۱۹
  • Soundcore Boom 3i؛ اسپیکر مقاوم و شناور انکر

    🔊 انکر (Anker) از اسپیکر بلوتوثی مقاوم Boom 3i رونمایی کرده که روی آب شناور می‌ماند و صدای شفاف پخش می‌کند. 🌊
    🧂 در برابر آب شور تا ۲ سال بدون خوردگی دوام می‌آورد و در برابر سقوط، گردوغبار و غوطه‌وری در آب مقاوم است. 💥
    🔋 با توان ۵۰ وات، صدای ۹۸ دسی‌بل و ۱۶ ساعت شارژ، مناسب مهمانی‌ها و ماجراجویی‌هاست. 🎉
    🚨 دارای آژیر اضطراری، تقویت صدا و قابلیت تمیز کردن خود از شن و خاک است. 📢
    💵 این اسپیکر ۱۸۹ دلار قیمت گذاری شده است و برای شرایط سخت گزینه‌ای جدی به‌حساب می‌آید.

    ۱۴۰۴/۳/۱۴ ۰۲:۳۳:۱۶
  • Anthropic قابلیت مکالمه صوتی را به چت‌بات Claude اضافه کرد

    🗣️ شرکت Anthropic حالت Voice Mode را برای چت‌بات Claude در نسخه موبایل فعال کرد! کاربران حالا می‌توانند با Claude گفتگوهای صوتی انجام دهند و پاسخ‌ها را با صدا بشنوند. 🎧📱
    این قابلیت فعلاً به زبان انگلیسی و در حالت آزمایشی عرضه شده و امکان سوییچ بین متن و صدا، انتخاب از بین ۵ صدای مختلف و دیدن خلاصه گفتگو را فراهم می‌کند. 🔄📝

    ۱۴۰۴/۳/۸ ۰۲:۵۷:۱۸
  • آمازون با خلاصه‌های صوتی هوشمند، خرید را متحول می‌کند

    🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش می‌کند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، می‌توانید توضیحاتی صوتی درباره ویژگی‌ها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
    این صداها توسط هوش مصنوعی و به سبک مکالمه‌ای تولید شده‌اند تا خرید راحت‌تر و سریع‌تری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
    فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد به‌زودی آن را گسترش دهد. 🌍🛍️

    ۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶
  • کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد

    📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیه‌سازی‌شده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
    این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
    هرچند کتاب چاپی در لیست پرفروش‌ها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
    ملانیا در کتاب از زندگی شخصی‌اش می‌گوید و موضعی موافق با حق سقط جنین اتخاذ می‌کند. ⚖️🗣️
    با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطه‌عطفی در کتاب‌های صوتی می‌داند. 🚀🔊

    ۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱
  • Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست

    🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار به‌صورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفت‌وگو با افراد به زبان‌های مختلف را در زمان واقعی فراهم می‌کند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
    مثلاً نوه‌های انگلیسی‌زبان می‌توانند با مادربزرگ اسپانیایی‌زبانشان راحت صحبت کنند یا شرکت‌های بین‌المللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
    صدا با تأخیر بسیار کم ترجمه می‌شود و صدای اصلی شخص نیز به‌صورت کمرنگ در پس‌زمینه شنیده می‌شود 🎙️🔊

    ۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵
  • آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون

    🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون می‌توانند کتاب‌های صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
    این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
    اسپاتیفای در سال ۲۰۲۲ امکان خرید کتاب‌های صوتی را به دلیل قوانین سخت‌گیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅

    ۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲
  • هوش مصنوعی، راهکار جدید Audible برای گسترش کتاب‌های صوتی

    🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتاب‌های چاپی و الکترونیکی را به کتاب‌های صوتی با صدای هوش مصنوعی تبدیل می‌کند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبان‌های مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه می‌شود. 🌍🔊
    Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را به‌زودی فعال می‌کند. اما برخی ناشران نگران کاهش کیفیت کتاب‌های صوتی با صدای هوش مصنوعی هستند. 📉💬
    این اقدام با هدف گسترش سریع کاتالوگ کتاب‌های صوتی و رقابت با اپل و اسپاتیفای انجام می‌شود.

    ۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶
  • موسیقی در دستان هوش مصنوعی با Stable Audio Open Small

    🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشی‌های هوشمند هم کار می‌کند و در کمتر از ۸ ثانیه صدا تولید می‌کند. 📱
    ✅ برخلاف دیگر مدل‌ها، فقط از آهنگ‌های رایگان برای آموزش استفاده کرده و نگرانی کپی‌رایت ندارد.
    🔊 این مدل تنها از متن انگلیسی پشتیبانی می‌کند و مناسب تولید افکت‌های صوتی و نمونه‌های کوتاه است. 🎧

    ۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵
نمایش بیشتر