-
مدل GPT-5 Pro از راه رسید؛ دقیقتر، عمیقتر و آماده برای صنایع مالی و پزشکی
OpenAI در رویداد Dev Day از مدلهای جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیقتر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچکتر و ارزانتر gpt-realtime mini. این بهروزرسانیها برای جذب توسعهدهندگان و ساخت اپلیکیشن در ChatGPT ارائه شدهاند. 💡.
مدل GPT-5 Pro برای حوزههایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی بهزودی یکی از روشهای اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفتوگوی زنده و کیفیت بالا، ۷۰٪ ارزانتر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعهدهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوههای هماهنگ تولید میکند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان میدهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵ -
مرورگر هوش مصنوعی Comet از شرکت Perplexity به صورت رایگان عرضه شد!
استارتاپ Perplexity مرورگر هوش مصنوعی «Comet» را رایگان برای همه عرضه کرد تا با رقبایی چون گوگل کروم و مرورگرهای نوظهور رقابت کند. 🚀.
ویژگی اصلی آن دستیار جانبی است که هنگام مرور صفحات وب محتوا را خلاصه میکند، پرسشها را پاسخ میدهد و مدیریت وب را بر عهده میگیرد. کاربران به ابزارهایی مانند اخبار شخصیسازیشده، مدیریت پروژه، مقایسه قیمت، برنامهریزی سفر، امور مالی و اخبار ورزشی نیز دسترسی دارند. 📱.
مشترکان طرح Max علاوه بر مدلهای پیشرفته، به دستیار ایمیل و «دستیار پسزمینه» مجهز میشوند که چند کار را همزمان انجام داده و از طریق داشبورد مرکزی قابل کنترل است. 🖥️.
همچنین سرویس جدید «Comet Plus» با اشتراک ۵ دلاری معرفی شده که نسخهای هوش مصنوعی از اپل نیوز است و برای کاربران Pro و Max بهطور خودکار فعال میشود. 💡.۱۴۰۴/۷/۱۲ ۱۴:۲۳:۲۵ -
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance
استارتاپ نروژی Hance نرمافزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکتهایی مثل Intel و Riedel Communications (تأمینکننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدلهای پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام میشود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance میتواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلیثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخشهای امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشههای جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴ -
دستیار هوش مصنوعی Gemini به تلویزیونهای گوگل آمد
گوگل اعلام کرد دستیار هوش مصنوعی جمینی به تلویزیونهای Google TV میآید. 📺🤖 کاربران میتوانند با زبان طبیعی با آن گفتگو کرده و برای انتخاب فیلم یا سریال، مرور فصلهای قبلی، یافتن عنوان فراموششده یا بررسی نقد و امتیازها از آن کمک بگیرند. 🎬⭐
جمینی همچنین میتواند در کارهایی مثل کمک به تکالیف، ایدهپردازی پروژهها یا برنامهریزی سفر خانوادگی مفید باشد. ✈️📚
دستورات قبلی Google Assistant همچنان فعال خواهند بود. 🗣️✅ عرضه از امروز در تلویزیونهای TCL QM9K آغاز شده و به مرور در مدلهای ۲۰۲۵ برندهای دیگر گسترش مییابد. 🆕📡۱۴۰۴/۷/۲ ۲۳:۴۰:۲۲ -
تحول بزرگ در کروم؛ گوگل هوش مصنوعی Gemini را به مرورگر اضافه کرد
گوگل نسخه جدید کروم را با ادغام Gemini معرفی کرد. این نسخه میتواند صفحات را خلاصه کند، به پرسشها پاسخ دهد و کارهایی مثل سفر یا خرید آنلاین را ساده کند. 🌐🤖
Gemini بدون اشتراک و فقط با ورود به حساب گوگل فعال است؛ فعلاً در آمریکا روی ویندوز و مک و بهزودی در iOS. 📱💻
قابلیت مرورگری عاملمحور هم اضافه شده که کارهای چندمرحلهای انجام میدهد اما پیش از خرید یا ایمیل از کاربر اجازه میگیرد. 🛒⚖️
مزیت اصلی این است که Gemini مستقیماً در کروم قرار دارد و با برنامههایی مثل Calendar، Maps و YouTube کار میکند. 🗓️🗺️📺
هدف گوگل، گسترش استفاده از هوش مصنوعی در اکوسیستم خودش است. 🚀📊۱۴۰۴/۶/۲۹ ۱۹:۰۲:۱۰ -
همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲
اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قویتر از ایرپادز پرو ۲ عمل میکند و سریهای فومی جدید هم باعث میشوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قویتر و صدای فراگیرتری ارائه میشود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یکسوم بیشتر از نسل قبل. 🔋🎶
ایرپادز پرو ۳ امکانات تازهای مثل اندازهگیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سریها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیتهای بیشتر با همان هزینه. ✅💵۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸ -
Le Chat زیر سایه سرمایهگذاری میلیاردی؛ فرانسویها جدیترین رقیب ChatGPT را میسازند
استارتاپ فرانسوی Mistral AI، رقیب جدی OpenAI، با جذب سرمایه بزرگ از ASML در آستانه تبدیل به باارزشترین شرکت هوش مصنوعی اروپا است. ASML، تنها تأمینکننده تجهیزات تراشههای پیشرفته، میخواهد با سرمایهگذاری ۱.۳ میلیارد یورو در دور جدید، بزرگترین سهامدار Mistral و صاحب یک کرسی هیئتمدیره شود؛ ارزشی معادل ۱۰ تا ۱۴ میلیارد دلار. 🤝💶
Mistral (تأسیس ۲۰۲۳ بهدست پژوهشگران سابق DeepMind و متا) خالق دستیار Le Chat است که دو هفته پس از عرضه به یک میلیون دانلود رسید و اکنون دارای ویژگی های «حافظه مکالمات» و «جستوجوی عمیق» می باشد. همچنین مجموعهای از مدلهای متنباز و تجاریِ زبان، تصویر، صوت و کدنویسی عرضه کرده و با مایکروسافت، AFP، IBM و ارتش فرانسه همکاری دارد. 📲
کارشناسان میگویند این سرمایهگذاری پیوند دو بازیگر کلیدی اروپا را میسازد و استقلال دیجیتال قاره را در برابر سلطه آمریکا و چین تقویت میکند؛ امانوئل مکرون رئیس جمهور فرانسه نیز پیشتر مردم را به استفاده از Le Chat بهجای ChatGPT دعوت کرده بود. ✅🇪🇺۱۴۰۴/۶/۱۸ ۱۰:۵۸:۴۷ -
دسترسی زودهنگام به مرورگر هوش مصنوعی Comet برای کاربران پی پال
پیپال به کاربران خود و ونمو دسترسی زودهنگام به مرورگر هوش مصنوعی Comet از Perplexity و یک سال اشتراک رایگان Perplexity Pro به ارزش ۲۰۰ دلار میدهد. این مرورگر امکاناتی مثل دستیار هوش مصنوعی و خلاصهسازی نتایج جستجو را ارائه میکند. 🤝🌐
این همکاری جایگاه Perplexity را در برابر کروم تقویت میکند و برای پیپال هم فرصتی است تا کاربران بیشتری را به اپلیکیشنهای خود جذب کند. این طرح تا پایان ۲۰۲۵ در آمریکا فعال است و بهزودی جهانی میشود. ✅🚀۱۴۰۴/۶/۱۴ ۰۲:۲۵:۱۴ -
تیکتاک به کاربرانش امکان ارسال پیامهای صوتی میدهد
تیکتاک قابلیتهای جدیدی برای پیامهای خصوصی معرفی کرد؛ از این پس کاربران میتوانند یادداشت صوتی ۶۰ ثانیهای و تا ۹ عکس یا ویدئو در چتهای فردی و گروهی ارسال کنند. این تغییرات، تجربه پیامرسانی در تیکتاک را مشابه واتساپ و اینستاگرام میکند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو بهعنوان اولین پیام ممکن نیست و محتوای نامناسب بهطور خودکار مسدود میشود. این قابلیتها بخشی از برنامه تیکتاک برای تقویت ابزارهای ارتباطی پس از افزودن چتهای گروهی و اتاقهای گفتگو است. ✅🚀۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳ -
گوگل، NotebookLM را به 80 زبان گسترش داد
گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی میکند. این ویژگی به کاربران امکان میدهد یادداشتها، فایلهای PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیشتر فقط برای زبان انگلیسی فعال بود. 🎥🌍
همچنین قابلیت Audio Overviews ارتقا یافته و خلاصههای صوتی در زبانهای غیرانگلیسی اکنون جزئیات بیشتری ارائه میدهند. کاربران میتوانند بسته به نیاز، نسخه کوتاه یا کامل خلاصهها را دریافت کنند. 🎧📑۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵ -
چتبات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراجشده را بازگرداند!
بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چتبات صوتی اخراج کرد، اما بهدلیل افزایش تماسها و ناکارآمدی سیستم مجبور شد آنها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماسها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شدهاند. 🤖📞
بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقبنشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبهرو شدند. ✅👥
این اتفاق نشان میدهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژههای آزمایشی هوش مصنوعی در شرکتها شکست خوردهاند. 📊⚡۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵ -
اپل به دنبال همکاری با گوگل برای بهبود Siri
گزارشها حاکی است اپل در رقابت برای ارتقای سیری (Siri) به یک دستیار هوش مصنوعی قدرتمند، از رقبای خود عقب افتاده و اکنون بهدنبال استفاده از فناوری سایر شرکتهاست. این شرکت مذاکراتی با گوگل، رقیب اصلیاش در بازار گوشیهای هوشمند، آغاز کرده و پیشتر نیز با OpenAI و Anthropic درباره بهکارگیری فناوری آنها گفتوگو داشته است. 🤝📱
طبق گزارش بلومبرگ، گوگل در حال آموزش مدلی است که میتواند روی سرورهای اپل اجرا شود، اما تصمیم نهایی درباره همکاری احتمالی برای بازطراحی سیری تا چند هفته آینده مشخص نخواهد شد.
انتشار این خبر باعث رشد ۳.۷ درصدی سهام گوگل و ۱.۶ درصدی سهام اپل شد. ✅🤖۱۴۰۴/۶/۲ ۱۳:۳۰:۰۴ -
الکسا و سیری؛ باهوشتر شدند، اما مردم هنوز فقط موسیقی پخش میکنند!
با وجود سرمایهگذاریهای عظیم روی هوش مصنوعی، نظرسنجی YouGov نشان میدهد مردم هنوز از دستیارهای صوتی مثل الکسا، Google’s Assistant و Siri بیشتر برای کارهای سادهای مثل دیدن وضعیت هوا (۵۹٪)، پخش موسیقی (۵۱٪)، جستجوی سریع (۴۷٪) و تنظیم هشدار (۴۰٪) استفاده میکنند؛ کارهایی که این ابزارها سالها قبل هم انجام میدادند. 🤖🎵
قابلیتهای پیشرفته استقبال کمی داشتهاند؛ فقط ۱۹٪ برای کنترل خانه هوشمند، کمتر از ۱۰٪ برای امکانات جانبی و تنها ۱۴٪ برای خرید اینترنتی استفاده میکنند، در حالیکه بازار خرید از طریق AI دهها میلیارد دلار برآورد شده بود. 📉🛒
بزرگترین مشکل هم بینیازی کاربران است؛ ۴۲٪ اصلاً دلیلی برای استفاده نمیبینند و بقیه هم از نفهمیدن درخواستها یا خطاهای مکرر شکایت دارند. خواسته اصلی کاربران ساده است: فهم بهتر گفتار انسان. ✅🗣️۱۴۰۴/۶/۱ ۰۹:۵۵:۰۲ -
ویژگیهای جدید Pixel 10: مربی دوربین و دستیار هوش مصنوعی
گوگل در رویداد سالانه Made by Google از گوشیهای جدید Pixel 10 و چند گجت تازه رونمایی کرد. تمرکز اصلی این نسل روی قابلیتهای هوش مصنوعی است؛ از جمله «مربی عکاسی» در اپ دوربین، نمایش خودکار اطلاعات مهم مثل بلیت پرواز هنگام تماس با ایرلاین و همچنین ترجمه زنده تماسهای تلفنی. 🤖📱
همه مدلهای جدید با پردازنده Tensor G5 عرضه میشوند و برای اولین بار به شارژر مغناطیسی Pixelsnap مجهز شدهاند. قیمتها بدون تغییر نسبت به سال گذشته، از ۷۹۹ دلار برای مدل پایه تا ۱۷۹۹ دلار برای مدل تاشو شروع میشود. گوگل همچنین ساعت هوشمند Pixel Watch 4 و هدفون بیسیم ارزانتر Pixel Buds 2a را معرفی کرد. 💡⚡
با وجود این نوآوریها، سهم گوشیهای پیکسل در بازار جهانی تنها ۱.۱٪ است و بیشتر فروش آنها در آمریکا، ژاپن و بریتانیا انجام میشود. گوگل اعلام کرده برای اولین بار پیکسل را در بازار مکزیک هم عرضه خواهد کرد. ✅🌍۱۴۰۴/۵/۳۱ ۱۵:۳۵:۴۱ -
اپل در حال توسعه Siri جدید با هوش مصنوعی
اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که میتواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حسابها و کنترل کامل اپلیکیشنها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاههای اپل دگرگون میکند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه میشود، هرچند چالشهایی مانند پشتیبانی از اپلیکیشنهای مختلف و دقت بالا در حوزههای حساس وجود دارد. موفقیت در این طرح میتواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸ -
OpenAI دستیار هوشمند جدیدی برای ChatGPT معرفی کرد
OpenAI از نسخه جدیدی از عامل هوش مصنوعی خود برای چتبات ChatGPT رونمایی کرد؛ ابزاری پیشرفته که میتواند وظایف پیچیدهای مانند خرید لباس مناسب برای عروسی با درنظرگرفتن آبوهوا و نوع پوشش را بهصورت کامل انجام دهد. ✅🛍️
این عامل جدید، ترکیبی از قابلیتهای قبلی OpenAI مانند «اپراتور» (برای تعامل با وبسایتها) و «تحقیقات عمیق» است که توانایی انجام کارهای چندمرحلهای را دارد. ✅🌐۱۴۰۴/۴/۲۷ ۲۳:۰۰:۵۵ -
ایرپاد جدید اپل با ضبط صدای استودیویی و کنترل دوربین از راه رسید!
اپل در کنفرانس WWDC 2025 اعلام کرد که ایرپادهای جدید به دو قابلیت مهم مجهز میشوند: ضبط صدای حرفهای و کنترل دوربین با لمس ایرپاد. 🎧
با استفاده از چیپ H2، میکروفونهای پیشرفته و پردازش هوشمند صدا، کاربران میتوانند حتی در محیطهای شلوغ، صدایی شفاف و طبیعی ضبط کنند یا تماسهای باکیفیتتری داشته باشند. 🎙️
همچنین با نگهداشتن ساقه ایرپاد، میتوان دوربین آیفون یا اپهای دوربین دیگر را فعال کرد و بهراحتی عکس یا ویدیو گرفت؛ قابلیتی که برای تولید محتوا در شبکههای اجتماعی بسیار کاربردی است. 📸
این قابلیتها به زودی در AirPods 4، نسخه دارای حذف نویز، و AirPods Pro 2 در دسترس خواهند بود. ✅۱۴۰۴/۳/۲۱ ۰۲:۴۵:۳۷ -
۹۰۰ میلیون دلار سرمایه برای یک استارتاپ هوش مصنوعی
استارتاپ Anysphere، سازنده دستیار هوش مصنوعی Cursor، در جذب سرمایه ۹۰۰ میلیون دلاری با ارزشگذاری ۹.۹ میلیارد دلار موفق شد. 💰
Cursor که پیشتاز بازار دستیارهای کدنویسی هوشمند است، به درآمد سالانه بیش از ۵۰۰ میلیون دلار رسیده و هر دو ماه، درآمدش دو برابر شده است. 🚀
OpenAI پیشتر برای خرید این شرکت اقدام کرد، اما Anysphere این پیشنهاد را رد کرد. 🧠۱۴۰۴/۳/۱۹ ۱۵:۴۰:۲۵ -
ابزار برنامهنویسی با هوش مصنوعی Mistral Code با پشتیبانی از ۸۰ زبان معرفی شد
💡 استارتاپ فرانسوی Mistral از یک ابزار جدید برنامهنویسی به نام Mistral Code رونمایی کرده که با هوش مصنوعی کار میکند.🤖
این ابزار به برنامهنویسها کمک میکند راحتتر و سریعتر کدنویسی کنند، کدها را کامل کنند، تغییر بدهند یا حتی خطاها را پیدا کنند 🛠️
📦 Mistral Code داخل محیطهای معروف برنامهنویسی مثل VS Code و JetBrains نصب میشود و فعلاً بهصورت آزمایشی و محدود عرضه شده 🔧
✅ این ابزار از مدلهای مختلف هوش مصنوعی Mistral استفاده میکند و از بیش از ۸۰ زبان برنامهنویسی پشتیبانی میکند. 🌍۱۴۰۴/۳/۱۵ ۲۱:۳۳:۳۲ -
Soundcore Boom 3i؛ اسپیکر مقاوم و شناور انکر
🔊 انکر (Anker) از اسپیکر بلوتوثی مقاوم Boom 3i رونمایی کرده که روی آب شناور میماند و صدای شفاف پخش میکند. 🌊
🧂 در برابر آب شور تا ۲ سال بدون خوردگی دوام میآورد و در برابر سقوط، گردوغبار و غوطهوری در آب مقاوم است. 💥
🔋 با توان ۵۰ وات، صدای ۹۸ دسیبل و ۱۶ ساعت شارژ، مناسب مهمانیها و ماجراجوییهاست. 🎉
🚨 دارای آژیر اضطراری، تقویت صدا و قابلیت تمیز کردن خود از شن و خاک است. 📢
💵 این اسپیکر ۱۸۹ دلار قیمت گذاری شده است و برای شرایط سخت گزینهای جدی بهحساب میآید.۱۴۰۴/۳/۱۴ ۰۲:۳۳:۱۶ -
دستیار هوش مصنوعی Perplexity، همراه جدید گوشیهای سامسونگ
📱 سامسونگ در آستانه سرمایهگذاری بزرگ در استارتاپ هوش مصنوعی Perplexity قرار دارد و قصد دارد فناوری این شرکت را در دستگاههای خود بهکار بگیرد.
🔍 طبق گزارش بلومبرگ، قرار است اپلیکیشن و دستیار Perplexity بهصورت پیشفرض روی گوشیهای سامسونگ نصب شود و قابلیت جستوجوی آن در مرورگر اصلی گوشی ادغام گردد. 🌐
🗣️ همچنین بخشی از قابلیتهای دستیار بیکسبی سامسونگ نیز ممکن است با فناوری Perplexity تقویت شود.
احتمال دارد این همکاری در سال جاری رسماً اعلام شود، هرچند هنوز دو شرکت واکنشی نشان ندادهاند. 🕒
پیش از این اپل هم به استفاده از Perplexity در مرورگر سافاری فکر کرده بود و موتورولا نیز همکاری خود را آغاز کرده است. 🤝۱۴۰۴/۳/۱۴ ۰۲:۲۳:۰۹ -
Anthropic قابلیت مکالمه صوتی را به چتبات Claude اضافه کرد
🗣️ شرکت Anthropic حالت Voice Mode را برای چتبات Claude در نسخه موبایل فعال کرد! کاربران حالا میتوانند با Claude گفتگوهای صوتی انجام دهند و پاسخها را با صدا بشنوند. 🎧📱
این قابلیت فعلاً به زبان انگلیسی و در حالت آزمایشی عرضه شده و امکان سوییچ بین متن و صدا، انتخاب از بین ۵ صدای مختلف و دیدن خلاصه گفتگو را فراهم میکند. 🔄📝۱۴۰۴/۳/۸ ۰۲:۵۷:۱۸ -
کتاب صوتی ملانیا ترامپ با صدای مصنوعی منتشر شد
📚 ملانیا ترامپ نسخه صوتی کتاب خاطرات خود را با صدای مصنوعی شبیهسازیشده خودش منتشر کرد و آن را «آغاز عصر جدید نشر» نامید. 🎙️🤖
این کتاب با همکاری شرکت ElevenLabs ساخته شده و فعلاً به زبان انگلیسی در سایت شخصی او در دسترس است، اما قرار است به بیش از ۳۰ زبان دیگر نیز منتشر شود. 🌍📕
هرچند کتاب چاپی در لیست پرفروشها قرار گرفت، فقط ۸۵ هزار نسخه در هفته اول فروخت؛ رقمی بسیار کمتر از کتاب میشل اوباما. 📉📖
ملانیا در کتاب از زندگی شخصیاش میگوید و موضعی موافق با حق سقط جنین اتخاذ میکند. ⚖️🗣️
با وجود انتقادها از نبود احساس انسانی در صدای هوش مصنوعی، ElevenLabs این پروژه را نقطهعطفی در کتابهای صوتی میداند. 🚀🔊۱۴۰۴/۳/۵ ۰۲:۴۹:۲۱ -
Mistral AI؛ با چتباتی بومی بهدنبال استقلال هوش مصنوعی اروپا
🤖 شرکت فرانسوی Mistral AI با چتبات Le Chat بهعنوان رقیب اروپایی OpenAI مطرح شده است. این چتبات در دو هفته اول بیش از ۱ میلیون بار دانلود شد و مورد حمایت مکرون نیز قرار گرفت. 📱🇫🇷
Mistral چندین مدل هوش مصنوعی توسعه داده که برخی متنباز و قابل استفاده تجاری هستند. 🧠🔓
منابع درآمد آن شامل اشتراک Le Chat Pro و فروش API به شرکتهاست. تاکنون ۱ میلیارد یورو جذب سرمایه داشته و با شرکتهایی مثل مایکروسافت و Nvidia همکاری دارد. 💰🤝
هدف نهایی Mistral عرضه عمومی سهام است. 📈۱۴۰۴/۳/۳ ۲۳:۲۸:۰۱ -
NotebookLM گوگل حالا تصویری شد؛ تبدیل یادداشتها به ویدیو با هوش مصنوعی!
گوگل در I/O 2025 از قابلیتهای جدیدی برای ابزار هوش مصنوعی NotebookLM رونمایی کرد. 🧠📒 این ابزار که برای یادداشتبرداری و تحقیق طراحی شده، حالا میتواند محتواهای پیچیده مثل یادداشتها، PDFها و تصاویر را به ویدیوهای قابلفهم تبدیل کند. 🎥📝
قابلیت «Video Overviews» کمک میکند موضوعات سخت را بهصورت تصویری بهتر درک کنید، در ادامه نسخه صوتی هم ارتقا یافته و حالا میتوان طول فایلهای صوتی را به دلخواه تنظیم کرد. 🎧🗣️
همچنین اپلیکیشن NotebookLM برای اندروید و iOS منتشر شده و قابلیتهایی مثل پخش در پسزمینه و حالت آفلاین را دارد.📱۱۴۰۴/۳/۱ ۰۳:۱۲:۳۱ -
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست
🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار بهصورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفتوگو با افراد به زبانهای مختلف را در زمان واقعی فراهم میکند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوههای انگلیسیزبان میتوانند با مادربزرگ اسپانیاییزبانشان راحت صحبت کنند یا شرکتهای بینالمللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه میشود و صدای اصلی شخص نیز بهصورت کمرنگ در پسزمینه شنیده میشود 🎙️🔊۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵ -
مارینر (Mariner) گوگل ؛ پایان جستجوی سنتی در اینترنت
گوگل در I/O 2025 پروژه هوش مصنوعی Mariner را ارتقا داد. 🤖 این عامل هوشمند میتواند همزمان تا ۱۰ کار مثل خرید بلیت یا سفارش اینترنتی را بدون نیاز به مراجعه به سایتها انجام دهد! 🛒🎫
گوگل این ابزار را به Gemini API و Vertex AI هم آورده تا توسعهدهندگان بتوانند از آن استفاده کنند 💻۱۴۰۴/۳/۱ ۰۱:۰۶:۴۲ -
آزادسازی خرید کتاب صوتی اسپاتیفای در آیفون
🎧📚 اسپاتیفای اعلام کرد که کاربران آیفون در آمریکا اکنون میتوانند کتابهای صوتی را مستقیماً درون اپلیکیشن خریداری کنند. 🎶
این تغییر پس از حکم دادگاه آمریکا که اپل را از دریافت کارمزد خریدهای خارج از اپ استور منع کرد، اعمال شد. ⚖️
اسپاتیفای در سال ۲۰۲۲ امکان خرید کتابهای صوتی را به دلیل قوانین سختگیرانه اپل حذف کرده بود، اما اکنون این محدودیت برطرف شده است. ✅۱۴۰۴/۲/۳۱ ۱۷:۱۲:۴۲ -
هوش مصنوعی، راهکار جدید Audible برای گسترش کتابهای صوتی
🎧📚 Audible، سرویس کتاب صوتی آمازون، با همکاری ناشران، کتابهای چاپی و الکترونیکی را به کتابهای صوتی با صدای هوش مصنوعی تبدیل میکند! 🚀🤖 این قابلیت با انتخاب از بین ۱۰۰ صدای هوش مصنوعی به زبانهای مختلف، از جمله انگلیسی، فرانسوی، اسپانیایی و ایتالیایی، ارائه میشود. 🌍🔊
Audible همچنین قابلیت ترجمه هوش مصنوعی متن به متن و گفتار به گفتار را بهزودی فعال میکند. اما برخی ناشران نگران کاهش کیفیت کتابهای صوتی با صدای هوش مصنوعی هستند. 📉💬
این اقدام با هدف گسترش سریع کاتالوگ کتابهای صوتی و رقابت با اپل و اسپاتیفای انجام میشود.۱۴۰۴/۲/۳۰ ۰۵:۰۶:۰۶ -
موسیقی در دستان هوش مصنوعی با Stable Audio Open Small
🚀 Stability AI از مدل صوتی هوش مصنوعی Stable Audio Open Small رونمایی کرد. 🎶🤖 این مدل روی گوشیهای هوشمند هم کار میکند و در کمتر از ۸ ثانیه صدا تولید میکند. 📱
✅ برخلاف دیگر مدلها، فقط از آهنگهای رایگان برای آموزش استفاده کرده و نگرانی کپیرایت ندارد.
🔊 این مدل تنها از متن انگلیسی پشتیبانی میکند و مناسب تولید افکتهای صوتی و نمونههای کوتاه است. 🎧۱۴۰۴/۲/۲۹ ۱۳:۰۲:۱۵



