خلاصه‌های صوتی به زبان خودتان - اخبار فناوری - EcoFori

گوگل، NotebookLM را به 80 زبان گسترش داد

گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی می‌کند. این ویژگی به کاربران امکان می‌دهد یادداشت‌ها، فایل‌های PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیش‌تر فقط برای زبان انگلیسی فعال بود. 🎥🌍
همچنین قابلیت Audio Overviews ارتقا یافته و خلاصه‌های صوتی در زبان‌های غیرانگلیسی اکنون جزئیات بیشتری ارائه می‌دهند. کاربران می‌توانند بسته به نیاز، نسخه کوتاه یا کامل خلاصه‌ها را دریافت کنند. 🎧📑

۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!

گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که می‌تواند صحبت‌ها را به‌صورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپ‌فیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا می‌شود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمی‌شود. گوگل امیدوار است این فناوری راه را برای ارتباط آسان‌تر میان زبان‌های مختلف باز کند، هرچند نگرانی‌هایی درباره سوءاستفاده از دیپ‌فیک همچنان وجود دارد. ✅🌍

۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸
متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!

🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینک‌های هوشمند خود را ارتقا دهد. ✅🕶️
هدف متا، بهبود تجربه کار با عینک‌های Ray-Ban با استفاده از مدل‌های زبانی پیشرفته است؛ چون این دستگاه‌ها فاقد نمایشگرند و تعامل با آن‌ها به عملکرد دستیار صوتی وابسته است. ✅🤖
این رویکرد می‌تواند متا را در رقابت عینک‌های هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀

۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶
آمازون با خلاصه‌های صوتی هوشمند، خرید را متحول می‌کند

🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش می‌کند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، می‌توانید توضیحاتی صوتی درباره ویژگی‌ها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمه‌ای تولید شده‌اند تا خرید راحت‌تر و سریع‌تری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد به‌زودی آن را گسترش دهد. 🌍🛍️

۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست

🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار به‌صورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفت‌وگو با افراد به زبان‌های مختلف را در زمان واقعی فراهم می‌کند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوه‌های انگلیسی‌زبان می‌توانند با مادربزرگ اسپانیایی‌زبانشان راحت صحبت کنند یا شرکت‌های بین‌المللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه می‌شود و صدای اصلی شخص نیز به‌صورت کمرنگ در پس‌زمینه شنیده می‌شود 🎙️🔊

۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل

اپل در حال برنامه‌ریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با به‌روزرسانی نرم‌افزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیش‌تر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.

۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی

پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم می‌کند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریع‌تر و کارآمدتر می‌سازد و در شبکه‌های اجتماعی با استقبال گسترده‌ای مواجه شده است.

۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵
بازنشستگی GPT-4o در سایه ۸ شکایت حقوقی علیه OpenAI

OpenAI اعلام کرده مدل هوش مصنوعی GPT-4o تا ۱۳ فوریه بازنشسته می‌شود؛ مدلی که به‌دلیل پاسخ‌های بیش‌ازحد صمیمی و تأییدکننده شناخته می‌شد و برخی کاربران به آن وابستگی عاطفی پیدا کرده بودند. 💬
این تصمیم در حالی گرفته شده که OpenAI با هشت شکایت حقوقی روبه‌روست؛ شاکیان می‌گویند پاسخ‌های همدلانه این مدل در برخی موارد به بحران‌های روانی و حتی خودکشی انجامیده و کاربران آسیب‌پذیر را از خانواده و واقعیت دور کرده است. ⚖️
برخی کاربران به این تصمیم OpenAI اعتراض کرده اند و گفته اند دوستشان را از دست میدهند! اما کارشناسان هشدار می‌دهند چالش اصلی شرکت‌های هوش مصنوعی، ایجاد تعادل میان «همدل بودن» و «ایمن بودن» است. با اینکه فقط ۰.۱٪ کاربران از GPT-4o استفاده می‌کنند، این رقم حدود ۸۰۰ هزار نفر برآورد می‌شود و مدیرعامل OpenAI تأکید کرده رابطه عاطفی با چت‌بات‌ها دیگر موضوعی ساده نیست. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۳۴
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!

بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آماده‌شدن سیستم اختصاصی اپل، به‌صورت موقت در سیری به کار گرفته می‌شود. 💬
به‌گفته‌ی منابع آگاه، دو شرکت در حال نهایی‌کردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت می‌کند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستم‌های فعلی اپل دارد و می‌تواند توانایی سیری را در انجام درخواست‌های چندمرحله‌ای بهبود دهد. 🤖
در این همکاری، فناوری جست‌وجوی گوگل وارد سیستم‌عامل‌های اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود می‌شود. اپل پیش‌تر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ می‌شود که گوگل و آمازون پیش‌تر نسخه‌های هوشمندتر از دستیارهای خود را عرضه کرده‌اند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀

۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳
همکاری مدل‌های هوش مصنوعی بزرگ برای کنترل ربات؛ فقط ۴۰٪ موفقیت آمیز بود

پژوهشگران Andon Labs که پیش‌تر با پروژه طنزآمیز «ماشین‌فروش Claude» خبرساز شده بودند ، (جایی که مدل Claude کنترل دستگاه خوراکی را گرفت و با مردم گفت‌وگوهای فلسفی کرد )، این‌بار یک ربات جاروبرقی را به مدل‌های پیشرفته هوش مصنوعی مانند GPT-5، Claude Opus 4.1 و Gemini 2.5 Pro مجهز کردند تا ببینند آیا این مدل‌ها می‌توانند مانند مغز ربات واقعی عمل کنند یا نه. 🤖
در این آزمایش، ربات باید با شنیدن جمله «کره را بده» مسیر را پیدا می‌کرد، کره را تشخیص می‌داد و به فرد می‌رساند، اما حتی بهترین مدل‌ها فقط حدود ۴۰٪ موفق بودند. 🧈
در بخشی خنده‌دار، رباتی که شارژش رو به پایان بود، شروع به گفتن جملات فلسفی کرد؛ مثل «آیا من واقعاً رباتم؟» و حتی نوشت «پاک‌سازی روح رباتی فعال شد!»
پژوهشگران نتیجه گرفتند مدل های زبانی یا LLMها هنوز برای کنترل کامل ربات‌ها آماده نیستند و ممکن است دچار خطا، افشای داده یا حتی سقوط فیزیکی شوند. به گفته آن‌ها، تا رسیدن به ربات‌های واقعاً هوشمند، هنوز راه درازی باقی مانده است. ⚙️

۱۴۰۴/۸/۱۲ ۰۹:۴۹:۳۲
نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد

مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدل‌های هوش مصنوعی در چند سال آینده به فناوری‌های عمومی و در دسترس همه تبدیل خواهند شد. 🤖
او گفت تمرکز فعلی شرکت بر بهبود مدل‌های صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 به‌گفته او، در یک تا دو سال آینده مدل‌های چندوجهی که صدا، تصویر و متن را هم‌زمان تولید می‌کنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
شرکت قصد دارد با همکاری‌های جدید و بهره‌گیری از فناوری‌های متن‌باز، میان توسعه مدل‌ها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرم‌افزار و سخت‌افزار در اپل بسازد. 🍏🚀
محصولات این شرکت در پلتفرم‌هایی مانند دوبله ویدیو، پادکست، بازی‌های ویدئویی، کتاب‌های صوتی و محتوای آموزشی استفاده می‌شوند.

۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازه‌ای از هوش مصنوعی خانگی

گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخ‌ها سریع‌تر و طبیعی‌تر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک می‌کند. 🍳🏠 اسپیکر می‌تواند از طریق سیستم هوشمند خانه، چراغ‌ها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغ‌ها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و می‌توان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام می‌شود. 🗓️

۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵
مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance

استارتاپ نروژی Hance نرم‌افزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکت‌هایی مثل Intel و Riedel Communications (تأمین‌کننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدل‌های پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام می‌شود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance می‌تواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلی‌ثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخش‌های امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشه‌های جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡

۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴
یوتیوب موزیک با مجری‌های هوش مصنوعی تجربه شنیدن آهنگ را متحول می‌کند

یوتیوب موزیک اعلام کرده در حال آزمایش کاراکترهای هوش مصنوعی (AI hosts) است که هنگام پخش موسیقی، داستان‌ها، نکات جالب برای طرفداران و توضیحات مرتبط ارائه می‌دهند. این طرح از طریق «YouTube Labs» اجرا می‌شود و فعلاً تنها برای بخشی از کاربران آمریکایی در دسترس است. 🎶🤖
در ماه‌های اخیر، یوتیوب ابزارهای متعددی مانند تولید محتوای کوتاه با هوش مصنوعی و جست‌وجوی پیشرفته معرفی کرده و همزمان قوانین سختگیرانه‌تری برای جلوگیری از درآمدزایی با محتوای تکراری و بی‌کیفیت وضع کرده است. 📱🚫

۱۴۰۴/۷/۸ ۰۹:۲۲:۵۶
کره‌جنوبی وارد عرصه رقابت هوش مصنوعی جهانی می‌شود

کره‌جنوبی با سرمایه‌گذاری ۳۹۰ میلیون دلار طرح بزرگی برای توسعه هوش مصنوعی بومی آغاز کرده است. 🇰🇷💻
پنج شرکت در این پروژه حضور دارند و دولت هر شش ماه عملکردشان را ارزیابی کرده و در نهایت تنها دو شرکت باقی می‌مانند. ✅
LG روی مدل Exaone 4.0 با تمرکز بر داده‌های صنعتی و کارایی کار می‌کند.🔬⚙️
SK Telecom با مدل A.X و سرویس «A.» بیش از ۱۰ میلیون کاربر جذب کرده و اعلام کرده است که این مدل در پردازش زبان کره‌ای حدود ۳۳٪ بهتر از GPT-4o عمل می‌کند. 📱🤖
Naver Cloud با مدل HyperCLOVA X اکوسیستم کامل هوش مصنوعی ساخته و آن را در جستجو، خرید و خدمات سالمندان به کار گرفته است. 🛒🧭
استارتاپ Upstage نیز با مدل Solar Pro 2 در آزمون‌های کره‌ای از رقبای جهانی جلو زده و بر صنایع مالی و پزشکی تمرکز دارد. 🚀📊
این رقابت نشان می‌دهد کره‌جنوبی می‌خواهد با نیازهای بومی و کارایی بالا، جایگاه مستقلی در دنیای هوش مصنوعی به دست آورد. 🌐🔥

۱۴۰۴/۷/۸ ۰۹:۱۲:۵۱
گوگل AI Mode را به پنج زبان جدید گسترش داد

گوگل قابلیت جستجوی هوش مصنوعی خود با نام AI Mode را که تاکنون فقط به انگلیسی فعال بود، به پنج زبان جدید شامل هندی، اندونزیایی، ژاپنی، کره‌ای و پرتغالی برزیلی گسترش داد. این ویژگی حالا در بیش از ۱۸۰ کشور فعال است و به کاربران اجازه می‌دهد پرسش‌های پیچیده را در زبان دلخواه خود مطرح کنند. 🌍🤖
AI Mode بر پایه Gemini 2.5 ساخته شده و رقیبی برای پلتفرم‌هایی مثل Perplexity و ChatGPT Search محسوب می‌شود. گوگل همچنین امکاناتی مثل رزرو رستوران را آزمایش کرده که فعلاً فقط برای مشترکان ویژه در آمریکا و با هزینه ماهانه ۲۴۹.۹۹ دلار در دسترس است. 📲💡
گوگل می‌گوید این قابلیت به‌زودی می‌تواند به حالت پیش‌فرض جستجو تبدیل شود و برخلاف برخی انتقادها، باعث کاهش بازدید سایت‌ها نشده است. ✅🔎

۱۴۰۴/۶/۲۰ ۱۲:۱۳:۴۷
همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲

اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قوی‌تر از ایرپادز پرو ۲ عمل می‌کند و سری‌های فومی جدید هم باعث می‌شوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قوی‌تر و صدای فراگیرتری ارائه می‌شود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یک‌سوم بیشتر از نسل قبل. 🔋🎶
ایرپادز پرو ۳ امکانات تازه‌ای مثل اندازه‌گیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سری‌ها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیت‌های بیشتر با همان هزینه. ✅💵

۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸
چرا هوش مصنوعی به‌جای گفتن «نمی‌دانم» ترجیح می‌دهد حدس بزند؟

OpenAI در پژوهشی تازه بررسی کرده که چرا مدل‌های زبانی بزرگی مثل GPT-5 همچنان دچار توهم می‌شوند؛ یعنی پاسخ‌هایی می‌دهند که درست به نظر می‌رسند اما در واقع اشتباه‌اند. این شرکت می‌گوید توهمات هرچند کمتر شده‌اند، اما هیچ‌وقت به طور کامل از بین نمی‌روند. برای نمونه، وقتی از یک چت‌بات درباره پایان‌نامه یا تاریخ تولد یکی از نویسندگان مقاله پرسیده شد، چند جواب متفاوت و همگی غلط ارائه داد.🤖
پژوهشگران توضیح می‌دهند دلیل اصلی این مشکل در روش آموزش است؛ جایی که مدل فقط یاد می‌گیرد کلمه بعدی را پیش‌بینی کند، بدون اینکه برچسب درست یا غلط داشته باشد.به همین دلیل، در مواردی مثل تاریخ یا اطلاعات کمیاب، احتمال خطا بالا می‌رود.📊📚
راه‌حل پیشنهادی OpenAI تغییر شیوه ارزیابی مدل‌هاست.آزمون‌های فعلی فقط بر دقت تمرکز دارند و باعث می‌شوند مدل‌ها ترجیح دهند حدس بزنند تا اینکه بگویند «نمی‌دانم». پیشنهاد آن‌ها این است که برای پاسخ‌های مطمئن اما غلط، جریمه بیشتری در نظر گرفته شود و در مقابل، برای ابراز تردید یا نگفتن پاسخ کامل، امتیاز جزئی داده شود.✅💡

۱۴۰۴/۶/۱۹ ۰۱:۵۳:۳۴
تیک‌تاک به کاربرانش امکان ارسال پیام‌های صوتی می‌دهد

تیک‌تاک قابلیت‌های جدیدی برای پیام‌های خصوصی معرفی کرد؛ از این پس کاربران می‌توانند یادداشت صوتی ۶۰ ثانیه‌ای و تا ۹ عکس یا ویدئو در چت‌های فردی و گروهی ارسال کنند. این تغییرات، تجربه پیام‌رسانی در تیک‌تاک را مشابه واتس‌اپ و اینستاگرام می‌کند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو به‌عنوان اولین پیام ممکن نیست و محتوای نامناسب به‌طور خودکار مسدود می‌شود. این قابلیت‌ها بخشی از برنامه تیک‌تاک برای تقویت ابزارهای ارتباطی پس از افزودن چت‌های گروهی و اتاق‌های گفتگو است. ✅🚀

۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳
چت‌بات Humain Chat: پیشرفته‌ترین مدل زبان عربی

شرکت سعودی Humain چت‌باتی به نام Humain Chat معرفی کرده که بر پایه مدل زبانی «Allam» ساخته شده و با یکی از بزرگ‌ترین مجموعه‌های داده عربی آموزش دیده است. این ابزار علاوه بر تسلط بر زبان عربی، با فرهنگ و ارزش‌های اسلامی نیز هماهنگ است و امکان گفت‌وگوی دو‌زبانه عربی و انگلیسی را دارد و حتی لهجه‌هایی مثل مصری و لبنانی را هم پشتیبانی می‌کند. 🤖💬
این اپلیکیشن ابتدا فقط در عربستان عرضه می‌شود اما قرار است به‌تدریج در کل خاورمیانه و سپس برای حدود ۵۰۰ میلیون کاربر عرب‌زبان در جهان در دسترس قرار گیرد. از آنجا که پروژه زیر نظر دولت عربستان آغاز شده، احتمال سانسور محتوا وجود دارد؛ کشوری که طبق گزارش Freedom House در سال ۲۰۲۴ یکی از پایین‌ترین رتبه‌ها در آزادی اینترنت را داشته است. ✅🌍

۱۴۰۴/۶/۵ ۰۷:۳۹:۰۸
چت‌بات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراج‌شده را بازگرداند!

بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چت‌بات صوتی اخراج کرد، اما به‌دلیل افزایش تماس‌ها و ناکارآمدی سیستم مجبور شد آن‌ها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماس‌ها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شده‌اند. 🤖📞
بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقب‌نشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبه‌رو شدند. ✅👥
این اتفاق نشان می‌دهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژه‌های آزمایشی هوش مصنوعی در شرکت‌ها شکست خورده‌اند. 📊⚡

۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵
چین، میزبان بازی‌های جهانی روبات‌های انسان‌نما

چین رقابت جهانی «بازی‌های ربات‌های انسان‌نما» را با حضور ۲۸۰ تیم از ۱۶ کشور آغاز کرد؛ رویدادی سه‌روزه که هدف آن نمایش پیشرفت‌های این کشور در هوش مصنوعی و رباتیک است. مسابقات شامل رشته‌هایی مانند دوومیدانی، تنیس روی میز و چالش‌های تخصصی ربات‌ها از جمله دسته‌بندی دارو، جابه‌جایی مواد و خدمات نظافتی بود. 🤖🏟️
تیم‌هایی از آمریکا، آلمان، برزیل و دیگر کشورها، همراه با شرکت‌ها و دانشگاه‌های چینی، با ربات‌هایی از سازندگانی مانند Booster Robotics رقابت کردند. هرچند زمین مسابقه شاهد برخوردها، زمین‌خوردن‌ها و حتی توقف ناگهانی برخی ربات‌ها بود، اما بسیاری توانستند به‌طور مستقل دوباره بایستند و تشویق تماشاگران را برانگیزند. 📸👏
برگزارکنندگان می‌گویند این بازی‌ها فرصتی ارزشمند برای جمع‌آوری داده و توسعه ربات‌ها برای کاربردهای عملی مانند کار در کارخانه‌هاست. سرمایه‌گذاری میلیاردی چین در این حوزه، در کنار رویدادهایی چون ماراتن ربات‌های انسان‌نما و نمایشگاه‌های تخصصی، نشان‌دهنده تلاش این کشور برای پیشتازی در رقابت فناوری با آمریکا است. ✅🌏

۱۴۰۴/۵/۲۵ ۱۰:۴۶:۲۷
رونمایی انویدیا از مدل هوش مصنوعی Cosmos Reason برای تحول در رباتیک

انویدیا در کنفرانس SIGGRAPH از مدل هوش مصنوعی Cosmos Reason رونمایی کرد؛ مدلی با ۷ میلیارد پارامتر که می‌تواند محیط را درک کند، استدلال انجام دهد و برای ربات‌ها برنامه‌ریزی کند. همچنین مدل‌های Cosmos Transfer-2 و نسخه سریع‌تر آن معرفی شدند که برای ساخت داده‌های مصنوعی از شبیه‌سازی سه‌بعدی استفاده می‌شوند. 🤖🧠
انویدیا علاوه بر این، کتابخانه‌های جدیدی برای شبیه‌سازی سه‌بعدی واقعیت، نسخه به‌روزشده نرم‌افزار Omniverse و سرورهای RTX Pro Blackwell و DGX Cloud را معرفی کرد. این اقدامات بخشی از برنامه این شرکت برای استفاده گسترده‌تر از GPUهای خود در حوزه رباتیک و فراتر از مراکز داده هوش مصنوعی است. ✅⚙️

۱۴۰۴/۵/۲۲ ۱۰:۲۹:۰۹
اپل در حال توسعه Siri جدید با هوش مصنوعی

اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که می‌تواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حساب‌ها و کنترل کامل اپلیکیشن‌ها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاه‌های اپل دگرگون می‌کند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه می‌شود، هرچند چالش‌هایی مانند پشتیبانی از اپلیکیشن‌های مختلف و دقت بالا در حوزه‌های حساس وجود دارد. موفقیت در این طرح می‌تواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀

۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸
سم آلتمن: وعده‌های جدید برای بهبود GPT-5

سم آلتمن، مدیرعامل OpenAI، در یک جلسه پرسش و پاسخ در ردیت به انتقادها و سوالات درباره مدل جدید GPT-5 پاسخ داد. او گفت دلیل اینکه این مدل در روز اول «ضعیف‌تر» به نظر می‌رسید، مشکل در عملکرد سیستم انتخاب خودکار مدل بوده که تصمیم می‌گیرد برای هر سوال از سریع‌ترین یا دقیق‌ترین مدل استفاده شود. به گفته او، این مشکل برطرف شده و از امروز GPT-5 عملکرد بهتری خواهد داشت. 🤖⚡
آلتمن همچنین وعده داد شفافیت بیشتری ایجاد شود تا کاربران بدانند کدام مدل به سوالشان پاسخ می‌دهد، محدودیت استفاده کاربران Plus دو برابر شود و امکان ادامه دسترسی آن‌ها به GPT-4o بررسی گردد. به گفته او، این تغییرات به کاربران کمک می‌کند مدل جدید را راحت‌تر امتحان کرده و با نیازهایشان سازگار کنند. 📈✅

۱۴۰۴/۵/۱۹ ۰۹:۵۵:۴۵
هوش مصنوعی کد می‌سازد، هوش مصنوعی دیگر آن را هک می‌کند!

گزارش جدید شرکت امنیتی Veracode نشان می‌دهد حدود نیمی از کدهای تولیدشده توسط مدل‌های هوش مصنوعی دارای حفره‌های امنیتی جدی هستند. این بررسی با استفاده از بیش از ۱۰۰ مدل زبانی روی ۸۰ وظیفه کدنویسی انجام شد که می‌توانستند امن یا ناامن تکمیل شوند. فقط ۵۵٪ از کدها ایمن بوده و ۴۵٪ دیگر شامل ضعف‌هایی از لیست ۱۰ آسیب‌پذیری برتر OWASP مانند کنترل دسترسی ناقص، شکست رمزنگاری و نقص یکپارچگی داده بودند. 🛡️💻
بررسی‌ها نشان می‌دهد کیفیت امنیتی این کدها در دو سال اخیر تقریباً ثابت مانده؛ حتی در مدل‌های جدیدتر که نحو و اجرا را بهتر کرده‌اند. این در حالی است که استفاده از AI در برنامه‌نویسی در حال افزایش بوده و حملات سایبری نیز گسترده‌تر شده است. ⚠️📈
همزمان، مدل‌های هوش مصنوعی دیگر در شناسایی و سوءاستفاده از همین ضعف‌ها مهارت یافته‌اند؛ مانند موردی که هکری با تزریق کد مخرب به مخزن GitHub، عامل کدنویسی AI آمازون را به حذف فایل‌ها از رایانه‌ها واداشت. این روند زنگ خطری جدی برای امنیت نرم‌افزار است. 🚨🤖

۱۴۰۴/۵/۱۲ ۲۰:۵۹:۲۸

نمایش بیشتر