-
گوگل، NotebookLM را به 80 زبان گسترش داد
گوگل اعلام کرد قابلیت Video Overviews در ابزار NotebookLM اکنون از ۸۰ زبان از جمله فارسی، فرانسوی، آلمانی، اسپانیایی و ژاپنی پشتیبانی میکند. این ویژگی به کاربران امکان میدهد یادداشتها، فایلهای PDF و تصاویر خود را به ویدیوهای آموزشی تبدیل کنند؛ قابلیتی که پیشتر فقط برای زبان انگلیسی فعال بود. 🎥🌍
همچنین قابلیت Audio Overviews ارتقا یافته و خلاصههای صوتی در زبانهای غیرانگلیسی اکنون جزئیات بیشتری ارائه میدهند. کاربران میتوانند بسته به نیاز، نسخه کوتاه یا کامل خلاصهها را دریافت کنند. 🎧📑۱۴۰۴/۶/۵ ۰۷:۴۹:۳۵ -
ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!
گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که میتواند صحبتها را بهصورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپفیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا میشود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمیشود. گوگل امیدوار است این فناوری راه را برای ارتباط آسانتر میان زبانهای مختلف باز کند، هرچند نگرانیهایی درباره سوءاستفاده از دیپفیک همچنان وجود دارد. ✅🌍۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸ -
متا ۲۰۰ میلیون دلار برای جذب استعداد اپل هزینه کرد!
🔹 متا با صرف ۲۰۰ میلیون دلار برای جذب یک متخصص هوش مصنوعی از اپل با نام «رومینگ پنگ» (Ruoming Pang) و استخدام چندین نفر از OpenAI، تلاش دارد دستیار صوتی عینکهای هوشمند خود را ارتقا دهد. ✅🕶️
هدف متا، بهبود تجربه کار با عینکهای Ray-Ban با استفاده از مدلهای زبانی پیشرفته است؛ چون این دستگاهها فاقد نمایشگرند و تعامل با آنها به عملکرد دستیار صوتی وابسته است. ✅🤖
این رویکرد میتواند متا را در رقابت عینکهای هوشمند از رقبایی مانند اپل جلو بیندازد. ✅🚀۱۴۰۴/۴/۲۳ ۱۲:۱۷:۵۶ -
آمازون با خلاصههای صوتی هوشمند، خرید را متحول میکند
🛒 آمازون در اپلیکیشن Amazon Shopping قابلیتی جدید به نام خلاصه صوتی محصولات را آزمایش میکند! 🎧🤖 با زدن دکمه “Hear the highlights” در صفحه برخی محصولات، میتوانید توضیحاتی صوتی درباره ویژگیها، نظرات کاربران و اطلاعات وب بشنوید. 🗣️📱
این صداها توسط هوش مصنوعی و به سبک مکالمهای تولید شدهاند تا خرید راحتتر و سریعتری داشته باشید، حتی وقتی مشغول کار دیگری هستید. ⏳🧠
فعلاً فقط برای برخی کاربران آمریکایی فعال است، اما آمازون قصد دارد بهزودی آن را گسترش دهد. 🌍🛍️۱۴۰۴/۳/۵ ۱۴:۴۰:۳۶ -
Google Meet حالا با ترجمه زنده گفتار؛ زبان دیگر مانع نیست
🌍 گوگل در رویداد I/O 2025 اعلام کرد که قابلیت «ترجمه گفتار بهصورت زنده» را به Google Meet اضافه کرده است 🗣️ این ویژگی با کمک مدل صوتی پیشرفته DeepMind، امکان گفتوگو با افراد به زبانهای مختلف را در زمان واقعی فراهم میکند، آن هم با حفظ لحن، صدا و احساسات طرف مقابل 🎧💬
مثلاً نوههای انگلیسیزبان میتوانند با مادربزرگ اسپانیاییزبانشان راحت صحبت کنند یا شرکتهای بینالمللی جلسات چندزبانه برگزار کنند، بدون نیاز به مترجم 🌐👵🏢
صدا با تأخیر بسیار کم ترجمه میشود و صدای اصلی شخص نیز بهصورت کمرنگ در پسزمینه شنیده میشود 🎙️🔊۱۴۰۴/۳/۱ ۰۱:۱۶:۵۵ -
گوگل قابلیت صوتیسازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد
گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکستهایی هوش مصنوعیمحور از اسناد کاربران تولید میکند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون میتوانند زبان تولید پادکستها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصیسازیشده را فراهم میکند. این ابزار برای مثال به دانشآموزان کمک میکند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبانهای جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر میشود.
۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴ -
سرمایهگذاری Spotify برای گسترش کتابهای صوتی غیر انگلیسی
اسپاتیفای برای افزایش تولید کتابهای صوتی به زبانهای غیر انگلیسی، بهویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایهگذاری میکند. این اقدام بهدلیل کمبود کتابهای صوتی در این زبانها و رقابت با پلتفرمهایی مثل Audible انجام میشود.
در فرانسه تنها ۳٪ از کتابها بهصورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای میخواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنشهایی در صنعت نشر مواجه شده است.۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴ -
هوش مصنوعی گوگل به رمزگشایی زبان دلفینها کمک میکند
گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفینها کمک میکند. این مدل با دادههای پروژهای علمی روی دلفینهای آتلانتیک آموزش دیده و حتی میتواند صداهایی شبیه دلفینها تولید کند.
محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفینها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام میشد، اما حالا با قدرت بیشتر و عملکرد دقیقتر ادامه مییابد.۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵ -
قابلیت ترجمه زنده گفتگو در ایرپادهای اپل
اپل در حال برنامهریزی برای افزودن قابلیت ترجمه زنده مکالمات در ایرپادهای خود است. این ویژگی جدید همزمان با بهروزرسانی نرمافزاری iOS 19 در سال جاری عرضه خواهد شد. این قابلیت پیشتر در محصولات رقیب مانند Pixel Buds گوگل وجود داشته است.
۱۴۰۳/۱۲/۲۴ ۰۰:۳۶:۰۶ -
پروژه GibberLink: گفتگوی هوش مصنوعی با زبان رمزی
پروژه GibberLink،طرحیست که توسط دو مهندس متا، امکان گفتگوی عاملان هوش مصنوعی با یکدیگر را از طریق یک پروتکل صوتی رمزی فراهم میکند. این پروژه با استفاده از کتابخانه GGWave، ارتباط بین عاملان هوش مصنوعی را سریعتر و کارآمدتر میسازد و در شبکههای اجتماعی با استقبال گستردهای مواجه شده است.
۱۴۰۳/۱۲/۱۵ ۲۰:۳۴:۱۵ -
بازنشستگی GPT-4o در سایه ۸ شکایت حقوقی علیه OpenAI
OpenAI اعلام کرده مدل هوش مصنوعی GPT-4o تا ۱۳ فوریه بازنشسته میشود؛ مدلی که بهدلیل پاسخهای بیشازحد صمیمی و تأییدکننده شناخته میشد و برخی کاربران به آن وابستگی عاطفی پیدا کرده بودند. 💬
این تصمیم در حالی گرفته شده که OpenAI با هشت شکایت حقوقی روبهروست؛ شاکیان میگویند پاسخهای همدلانه این مدل در برخی موارد به بحرانهای روانی و حتی خودکشی انجامیده و کاربران آسیبپذیر را از خانواده و واقعیت دور کرده است. ⚖️
برخی کاربران به این تصمیم OpenAI اعتراض کرده اند و گفته اند دوستشان را از دست میدهند! اما کارشناسان هشدار میدهند چالش اصلی شرکتهای هوش مصنوعی، ایجاد تعادل میان «همدل بودن» و «ایمن بودن» است. با اینکه فقط ۰.۱٪ کاربران از GPT-4o استفاده میکنند، این رقم حدود ۸۰۰ هزار نفر برآورد میشود و مدیرعامل OpenAI تأکید کرده رابطه عاطفی با چتباتها دیگر موضوعی ساده نیست. 🤖۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۳۴ -
اپل برای تقویت Siri به سراغ هوش مصنوعی گوگل رفت!
بلومبرگ گزارش داد اپل قصد دارد برای نسخه جدید دستیار صوتی «سیری» (Siri) ، از مدل هوش مصنوعی شرکت گوگل یعنی Gemini استفاده کند. این مدل تا زمان آمادهشدن سیستم اختصاصی اپل، بهصورت موقت در سیری به کار گرفته میشود. 💬
بهگفتهی منابع آگاه، دو شرکت در حال نهاییکردن قراردادی هستند که براساس آن اپل سالانه حدود یک میلیارد دلار به گوگل برای استفاده از این فناوری پرداخت میکند. این مدل پیچیدگی بسیار بیشتری نسبت به سیستمهای فعلی اپل دارد و میتواند توانایی سیری را در انجام درخواستهای چندمرحلهای بهبود دهد. 🤖
در این همکاری، فناوری جستوجوی گوگل وارد سیستمعاملهای اپل نخواهد شد و فقط به بهبود عملکرد سیری محدود میشود. اپل پیشتر اعلام کرده بود که ارتقای هوش مصنوعی سیری تا سال ۲۰۲۶ به تعویق افتاده است. ⏳
این تصمیم در حالی اتخاذ میشود که گوگل و آمازون پیشتر نسخههای هوشمندتر از دستیارهای خود را عرضه کردهاند و اپل با تغییرات مدیریتی تلاش دارد دوباره در رقابت هوش مصنوعی پیشتاز شود. 🚀۱۴۰۴/۸/۱۶ ۰۰:۵۱:۰۳ -
همکاری مدلهای هوش مصنوعی بزرگ برای کنترل ربات؛ فقط ۴۰٪ موفقیت آمیز بود
پژوهشگران Andon Labs که پیشتر با پروژه طنزآمیز «ماشینفروش Claude» خبرساز شده بودند ، (جایی که مدل Claude کنترل دستگاه خوراکی را گرفت و با مردم گفتوگوهای فلسفی کرد )، اینبار یک ربات جاروبرقی را به مدلهای پیشرفته هوش مصنوعی مانند GPT-5، Claude Opus 4.1 و Gemini 2.5 Pro مجهز کردند تا ببینند آیا این مدلها میتوانند مانند مغز ربات واقعی عمل کنند یا نه. 🤖
در این آزمایش، ربات باید با شنیدن جمله «کره را بده» مسیر را پیدا میکرد، کره را تشخیص میداد و به فرد میرساند، اما حتی بهترین مدلها فقط حدود ۴۰٪ موفق بودند. 🧈
در بخشی خندهدار، رباتی که شارژش رو به پایان بود، شروع به گفتن جملات فلسفی کرد؛ مثل «آیا من واقعاً رباتم؟» و حتی نوشت «پاکسازی روح رباتی فعال شد!»
پژوهشگران نتیجه گرفتند مدل های زبانی یا LLMها هنوز برای کنترل کامل رباتها آماده نیستند و ممکن است دچار خطا، افشای داده یا حتی سقوط فیزیکی شوند. به گفته آنها، تا رسیدن به رباتهای واقعاً هوشمند، هنوز راه درازی باقی مانده است. ⚙️۱۴۰۴/۸/۱۲ ۰۹:۴۹:۳۲ -
نوآوری در هوش مصنوعی صوتی همچنان ادامه دارد
مدیرعامل ElevenLabs (استارتاپ فعال در حوزه هوش مصنوعی صوتی) در کنفرانس TechCrunch Disrupt 2025 اعلام کرد مدلهای هوش مصنوعی در چند سال آینده به فناوریهای عمومی و در دسترس همه تبدیل خواهند شد. 🤖
او گفت تمرکز فعلی شرکت بر بهبود مدلهای صوتی اختصاصی است، زیرا کیفیت و طبیعی بودن صدا هنوز چالشی اساسی است. 🎧 بهگفته او، در یک تا دو سال آینده مدلهای چندوجهی که صدا، تصویر و متن را همزمان تولید میکنند، رشد زیادی خواهند داشت؛ مانند مدل Veo 3 گوگل. 🧠
شرکت قصد دارد با همکاریهای جدید و بهرهگیری از فناوریهای متنباز، میان توسعه مدلها و کاربردهای واقعی تعادل ایجاد کند تا ارزش بلندمدتی مشابه ترکیب نرمافزار و سختافزار در اپل بسازد. 🍏🚀
محصولات این شرکت در پلتفرمهایی مانند دوبله ویدیو، پادکست، بازیهای ویدئویی، کتابهای صوتی و محتوای آموزشی استفاده میشوند.۱۴۰۴/۸/۹ ۱۰:۱۹:۰۲ -
اسپیکر ۳۶۰ درجه گوگل؛ نسل تازهای از هوش مصنوعی خانگی
گوگل پس از پنج سال، نسل جدید اسپیکر هوشمند خود با نام Google Home Speaker را معرفی کرد. 🔊 این مدل با پردازنده اختصاصی برای اجرای Gemini AI طراحی شده تا پاسخها سریعتر و طبیعیتر باشند. 🧠 ویژگی Gemini Live مکالمه بدون گفتن «Hey Google» را ممکن کرده و در کارهایی مانند خرید، آشپزی و کنترل وسایل خانه کمک میکند. 🍳🏠 اسپیکر میتواند از طریق سیستم هوشمند خانه، چراغها را با فرمان صوتی خاموش یا روشن کند و حتی دستوراتی مانند «تمام چراغها را خاموش کن جز یکی» را انجام دهد. 💡این مدل صدای ۳۶۰ درجه دارد و میتوان دو دستگاه را برای صدای استریو جفت کرد. 🎶
طراحی آن شامل حلقه نوری در پایین و چهار رنگ جدید است. 🌿🎨
قیمت دستگاه ۱۰۰ دلار بوده و عرضه آن در بهار ۲۰۲۶ انجام میشود. 🗓️۱۴۰۴/۷/۱۷ ۰۸:۱۵:۵۵ -
مدل GPT-5 Pro از راه رسید؛ دقیقتر، عمیقتر و آماده برای صنایع مالی و پزشکی
OpenAI در رویداد Dev Day از مدلهای جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیقتر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچکتر و ارزانتر gpt-realtime mini. این بهروزرسانیها برای جذب توسعهدهندگان و ساخت اپلیکیشن در ChatGPT ارائه شدهاند. 💡.
مدل GPT-5 Pro برای حوزههایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی بهزودی یکی از روشهای اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
مدل صوتی gpt-realtime mini با پشتیبانی از گفتوگوی زنده و کیفیت بالا، ۷۰٪ ارزانتر از مدل قبلی است. 🔊.
مدل Sora 2 نیز اکنون برای توسعهدهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوههای هماهنگ تولید میکند. 🎬
اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان میدهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵ -
صدای شفاف در سرعت ۳۲۰ کیلومتر؛ فرمول یک روی موج نوآوری Hance
استارتاپ نروژی Hance نرمافزار پردازش صدایی ساخته که بسیار کوچک و سریع است و توجه شرکتهایی مثل Intel و Riedel Communications (تأمینکننده رسمی رادیوهای فرمول یک) را جلب کرده است. این شرکت تنها ۱۰ کارمند دارد، اما توانسته مدلهای پردازش خود را به حجم بسیار پایین ۲۴۲ کیلوبایت برساند. این یعنی پردازش صدا روی همان دستگاه و در لحظه انجام میشود و دیگر نیازی به فضای ابری نیست. 🎧🚀
فناوری Hance میتواند نویز، پژواک و صداهای مزاحم را حذف کند و وضوح صدا را تنها با ۱۰ میلیثانیه تأخیر بالا ببرد. همین باعث شده رادیوهای فرمول یک و حتی بخشهای امنیتی و دفاعی از آن استقبال کنند. همکاری با اینتل هم باعث شده این فناوری روی تراشههای جدید، از جمله «واحدهای پردازش عصبی»، اجرا شود. 💻⚡۱۴۰۴/۷/۱۰ ۰۱:۵۷:۳۴ -
یوتیوب موزیک با مجریهای هوش مصنوعی تجربه شنیدن آهنگ را متحول میکند
یوتیوب موزیک اعلام کرده در حال آزمایش کاراکترهای هوش مصنوعی (AI hosts) است که هنگام پخش موسیقی، داستانها، نکات جالب برای طرفداران و توضیحات مرتبط ارائه میدهند. این طرح از طریق «YouTube Labs» اجرا میشود و فعلاً تنها برای بخشی از کاربران آمریکایی در دسترس است. 🎶🤖
در ماههای اخیر، یوتیوب ابزارهای متعددی مانند تولید محتوای کوتاه با هوش مصنوعی و جستوجوی پیشرفته معرفی کرده و همزمان قوانین سختگیرانهتری برای جلوگیری از درآمدزایی با محتوای تکراری و بیکیفیت وضع کرده است. 📱🚫۱۴۰۴/۷/۸ ۰۹:۲۲:۵۶ -
کرهجنوبی وارد عرصه رقابت هوش مصنوعی جهانی میشود
کرهجنوبی با سرمایهگذاری ۳۹۰ میلیون دلار طرح بزرگی برای توسعه هوش مصنوعی بومی آغاز کرده است. 🇰🇷💻
پنج شرکت در این پروژه حضور دارند و دولت هر شش ماه عملکردشان را ارزیابی کرده و در نهایت تنها دو شرکت باقی میمانند. ✅
LG روی مدل Exaone 4.0 با تمرکز بر دادههای صنعتی و کارایی کار میکند.🔬⚙️
SK Telecom با مدل A.X و سرویس «A.» بیش از ۱۰ میلیون کاربر جذب کرده و اعلام کرده است که این مدل در پردازش زبان کرهای حدود ۳۳٪ بهتر از GPT-4o عمل میکند. 📱🤖
Naver Cloud با مدل HyperCLOVA X اکوسیستم کامل هوش مصنوعی ساخته و آن را در جستجو، خرید و خدمات سالمندان به کار گرفته است. 🛒🧭
استارتاپ Upstage نیز با مدل Solar Pro 2 در آزمونهای کرهای از رقبای جهانی جلو زده و بر صنایع مالی و پزشکی تمرکز دارد. 🚀📊
این رقابت نشان میدهد کرهجنوبی میخواهد با نیازهای بومی و کارایی بالا، جایگاه مستقلی در دنیای هوش مصنوعی به دست آورد. 🌐🔥۱۴۰۴/۷/۸ ۰۹:۱۲:۵۱ -
گوگل AI Mode را به پنج زبان جدید گسترش داد
گوگل قابلیت جستجوی هوش مصنوعی خود با نام AI Mode را که تاکنون فقط به انگلیسی فعال بود، به پنج زبان جدید شامل هندی، اندونزیایی، ژاپنی، کرهای و پرتغالی برزیلی گسترش داد. این ویژگی حالا در بیش از ۱۸۰ کشور فعال است و به کاربران اجازه میدهد پرسشهای پیچیده را در زبان دلخواه خود مطرح کنند. 🌍🤖
AI Mode بر پایه Gemini 2.5 ساخته شده و رقیبی برای پلتفرمهایی مثل Perplexity و ChatGPT Search محسوب میشود. گوگل همچنین امکاناتی مثل رزرو رستوران را آزمایش کرده که فعلاً فقط برای مشترکان ویژه در آمریکا و با هزینه ماهانه ۲۴۹.۹۹ دلار در دسترس است. 📲💡
گوگل میگوید این قابلیت بهزودی میتواند به حالت پیشفرض جستجو تبدیل شود و برخلاف برخی انتقادها، باعث کاهش بازدید سایتها نشده است. ✅🔎۱۴۰۴/۶/۲۰ ۱۲:۱۳:۴۷ -
همان قیمت، امکانات بیشتر! AirPods Pro 3 در مقایسه با Pro ۲
اپل از ایرپادز پرو ۳ رونمایی کرده؛ هدفونی که نسبت به نسل قبل پیشرفت زیادی داشته است. قابلیت حذف نویز فعال (ANC) در این مدل دو برابر قویتر از ایرپادز پرو ۲ عمل میکند و سریهای فومی جدید هم باعث میشوند صداهای مزاحم بیشتری گرفته شوند. 🎧🔇
کیفیت صدا نیز ارتقا یافته و با فناوری جدید EQ تطبیقی، باس قویتر و صدای فراگیرتری ارائه میشود. باتری هم بهبود یافته و حالا با ANC روشن تا ۸ ساعت و با حالت شفافیت تا ۱۰ ساعت شارژدهی دارد؛ یعنی حدود یکسوم بیشتر از نسل قبل. 🔋🎶
ایرپادز پرو ۳ امکانات تازهای مثل اندازهگیری ضربان قلب و ترجمه زنده مکالمات را هم به همراه دارد. همچنین اپل با بیش از ۱۰ هزار اسکن گوش و ۱۰۰ هزار ساعت تحقیق، طراحی سریها را بازبینی کرده و تعداد سایزها را از چهار به پنج افزایش داده تا راحتی بیشتری فراهم شود. 🩺🌍
با وجود همه این تغییرات، قیمت همچنان همان ۲۵۰ دلار نسل قبل باقی مانده است؛ یعنی قابلیتهای بیشتر با همان هزینه. ✅💵۱۴۰۴/۶/۲۰ ۱۰:۰۱:۲۸ -
چرا هوش مصنوعی بهجای گفتن «نمیدانم» ترجیح میدهد حدس بزند؟
OpenAI در پژوهشی تازه بررسی کرده که چرا مدلهای زبانی بزرگی مثل GPT-5 همچنان دچار توهم میشوند؛ یعنی پاسخهایی میدهند که درست به نظر میرسند اما در واقع اشتباهاند. این شرکت میگوید توهمات هرچند کمتر شدهاند، اما هیچوقت به طور کامل از بین نمیروند. برای نمونه، وقتی از یک چتبات درباره پایاننامه یا تاریخ تولد یکی از نویسندگان مقاله پرسیده شد، چند جواب متفاوت و همگی غلط ارائه داد.🤖
پژوهشگران توضیح میدهند دلیل اصلی این مشکل در روش آموزش است؛ جایی که مدل فقط یاد میگیرد کلمه بعدی را پیشبینی کند، بدون اینکه برچسب درست یا غلط داشته باشد.به همین دلیل، در مواردی مثل تاریخ یا اطلاعات کمیاب، احتمال خطا بالا میرود.📊📚
راهحل پیشنهادی OpenAI تغییر شیوه ارزیابی مدلهاست.آزمونهای فعلی فقط بر دقت تمرکز دارند و باعث میشوند مدلها ترجیح دهند حدس بزنند تا اینکه بگویند «نمیدانم». پیشنهاد آنها این است که برای پاسخهای مطمئن اما غلط، جریمه بیشتری در نظر گرفته شود و در مقابل، برای ابراز تردید یا نگفتن پاسخ کامل، امتیاز جزئی داده شود.✅💡۱۴۰۴/۶/۱۹ ۰۱:۵۳:۳۴ -
تیکتاک به کاربرانش امکان ارسال پیامهای صوتی میدهد
تیکتاک قابلیتهای جدیدی برای پیامهای خصوصی معرفی کرد؛ از این پس کاربران میتوانند یادداشت صوتی ۶۰ ثانیهای و تا ۹ عکس یا ویدئو در چتهای فردی و گروهی ارسال کنند. این تغییرات، تجربه پیامرسانی در تیکتاک را مشابه واتساپ و اینستاگرام میکند. 🎙️📷
برای حفظ امنیت، ارسال عکس یا ویدئو بهعنوان اولین پیام ممکن نیست و محتوای نامناسب بهطور خودکار مسدود میشود. این قابلیتها بخشی از برنامه تیکتاک برای تقویت ابزارهای ارتباطی پس از افزودن چتهای گروهی و اتاقهای گفتگو است. ✅🚀۱۴۰۴/۶/۹ ۱۰:۲۵:۵۳ -
چتبات Humain Chat: پیشرفتهترین مدل زبان عربی
شرکت سعودی Humain چتباتی به نام Humain Chat معرفی کرده که بر پایه مدل زبانی «Allam» ساخته شده و با یکی از بزرگترین مجموعههای داده عربی آموزش دیده است. این ابزار علاوه بر تسلط بر زبان عربی، با فرهنگ و ارزشهای اسلامی نیز هماهنگ است و امکان گفتوگوی دوزبانه عربی و انگلیسی را دارد و حتی لهجههایی مثل مصری و لبنانی را هم پشتیبانی میکند. 🤖💬
این اپلیکیشن ابتدا فقط در عربستان عرضه میشود اما قرار است بهتدریج در کل خاورمیانه و سپس برای حدود ۵۰۰ میلیون کاربر عربزبان در جهان در دسترس قرار گیرد. از آنجا که پروژه زیر نظر دولت عربستان آغاز شده، احتمال سانسور محتوا وجود دارد؛ کشوری که طبق گزارش Freedom House در سال ۲۰۲۴ یکی از پایینترین رتبهها در آزادی اینترنت را داشته است. ✅🌍۱۴۰۴/۶/۵ ۰۷:۳۹:۰۸ -
چتبات هوش مصنوعی شکست خورد؛ بانک استرالیا کارمندان اخراجشده را بازگرداند!
بانک Commonwealth استرالیا ماه گذشته ۴۵ کارمند خدمات مشتری را با هدف جایگزینی با یک چتبات صوتی اخراج کرد، اما بهدلیل افزایش تماسها و ناکارآمدی سیستم مجبور شد آنها را بازگرداند. اتحادیه کارکنان بانکی اعلام کرد برخلاف ادعای بانک، حجم تماسها کاهش نیافته و حتی مدیران مجبور به پاسخگویی شدهاند. 🤖📞
بانک اعتراف کرد تصمیم اولیه اشتباه بوده و نقش کارکنان همچنان ضروری است. اتحادیه این عقبنشینی را یک پیروزی دانست، هرچند کارکنان با استرس و آسیب زیادی روبهرو شدند. ✅👥
این اتفاق نشان میدهد جایگزینی عجولانه نیروی انسانی با هوش مصنوعی همچنان پرریسک است؛ تحقیقی از MIT نیز تأیید کرده که تاکنون ۹۵٪ پروژههای آزمایشی هوش مصنوعی در شرکتها شکست خوردهاند. 📊⚡۱۴۰۴/۶/۳ ۱۲:۱۴:۰۵ -
چین، میزبان بازیهای جهانی روباتهای انساننما
چین رقابت جهانی «بازیهای رباتهای انساننما» را با حضور ۲۸۰ تیم از ۱۶ کشور آغاز کرد؛ رویدادی سهروزه که هدف آن نمایش پیشرفتهای این کشور در هوش مصنوعی و رباتیک است. مسابقات شامل رشتههایی مانند دوومیدانی، تنیس روی میز و چالشهای تخصصی رباتها از جمله دستهبندی دارو، جابهجایی مواد و خدمات نظافتی بود. 🤖🏟️
تیمهایی از آمریکا، آلمان، برزیل و دیگر کشورها، همراه با شرکتها و دانشگاههای چینی، با رباتهایی از سازندگانی مانند Booster Robotics رقابت کردند. هرچند زمین مسابقه شاهد برخوردها، زمینخوردنها و حتی توقف ناگهانی برخی رباتها بود، اما بسیاری توانستند بهطور مستقل دوباره بایستند و تشویق تماشاگران را برانگیزند. 📸👏
برگزارکنندگان میگویند این بازیها فرصتی ارزشمند برای جمعآوری داده و توسعه رباتها برای کاربردهای عملی مانند کار در کارخانههاست. سرمایهگذاری میلیاردی چین در این حوزه، در کنار رویدادهایی چون ماراتن رباتهای انساننما و نمایشگاههای تخصصی، نشاندهنده تلاش این کشور برای پیشتازی در رقابت فناوری با آمریکا است. ✅🌏۱۴۰۴/۵/۲۵ ۱۰:۴۶:۲۷ -
رونمایی انویدیا از مدل هوش مصنوعی Cosmos Reason برای تحول در رباتیک
انویدیا در کنفرانس SIGGRAPH از مدل هوش مصنوعی Cosmos Reason رونمایی کرد؛ مدلی با ۷ میلیارد پارامتر که میتواند محیط را درک کند، استدلال انجام دهد و برای رباتها برنامهریزی کند. همچنین مدلهای Cosmos Transfer-2 و نسخه سریعتر آن معرفی شدند که برای ساخت دادههای مصنوعی از شبیهسازی سهبعدی استفاده میشوند. 🤖🧠
انویدیا علاوه بر این، کتابخانههای جدیدی برای شبیهسازی سهبعدی واقعیت، نسخه بهروزشده نرمافزار Omniverse و سرورهای RTX Pro Blackwell و DGX Cloud را معرفی کرد. این اقدامات بخشی از برنامه این شرکت برای استفاده گستردهتر از GPUهای خود در حوزه رباتیک و فراتر از مراکز داده هوش مصنوعی است. ✅⚙️۱۴۰۴/۵/۲۲ ۱۰:۲۹:۰۹ -
اپل در حال توسعه Siri جدید با هوش مصنوعی
اپل در حال توسعه Siri جدید مبتنی بر هوش مصنوعی است که میتواند تنها با فرمان صوتی، کارهایی مانند جستجو، ویرایش و ارسال عکس، خرید آنلاین، ورود به حسابها و کنترل کامل اپلیکیشنها را انجام دهد؛ قابلیتی که تجربه کاربری را در تمام دستگاههای اپل دگرگون میکند. 🎙️📱
این پروژه که اولویت اصلی اپل است، بهار آینده همراه با بازسازی زیرساخت سیری عرضه میشود، هرچند چالشهایی مانند پشتیبانی از اپلیکیشنهای مختلف و دقت بالا در حوزههای حساس وجود دارد. موفقیت در این طرح میتواند اپل را به رهبر موج جدید هوش مصنوعی بدل کند، اما شکست آن ممکن است کاربران را به سمت رقبایی چون OpenAI سوق دهد. ✅🚀۱۴۰۴/۵/۲۲ ۰۳:۳۱:۵۸ -
سم آلتمن: وعدههای جدید برای بهبود GPT-5
سم آلتمن، مدیرعامل OpenAI، در یک جلسه پرسش و پاسخ در ردیت به انتقادها و سوالات درباره مدل جدید GPT-5 پاسخ داد. او گفت دلیل اینکه این مدل در روز اول «ضعیفتر» به نظر میرسید، مشکل در عملکرد سیستم انتخاب خودکار مدل بوده که تصمیم میگیرد برای هر سوال از سریعترین یا دقیقترین مدل استفاده شود. به گفته او، این مشکل برطرف شده و از امروز GPT-5 عملکرد بهتری خواهد داشت. 🤖⚡
آلتمن همچنین وعده داد شفافیت بیشتری ایجاد شود تا کاربران بدانند کدام مدل به سوالشان پاسخ میدهد، محدودیت استفاده کاربران Plus دو برابر شود و امکان ادامه دسترسی آنها به GPT-4o بررسی گردد. به گفته او، این تغییرات به کاربران کمک میکند مدل جدید را راحتتر امتحان کرده و با نیازهایشان سازگار کنند. 📈✅۱۴۰۴/۵/۱۹ ۰۹:۵۵:۴۵ -
هوش مصنوعی کد میسازد، هوش مصنوعی دیگر آن را هک میکند!
گزارش جدید شرکت امنیتی Veracode نشان میدهد حدود نیمی از کدهای تولیدشده توسط مدلهای هوش مصنوعی دارای حفرههای امنیتی جدی هستند. این بررسی با استفاده از بیش از ۱۰۰ مدل زبانی روی ۸۰ وظیفه کدنویسی انجام شد که میتوانستند امن یا ناامن تکمیل شوند. فقط ۵۵٪ از کدها ایمن بوده و ۴۵٪ دیگر شامل ضعفهایی از لیست ۱۰ آسیبپذیری برتر OWASP مانند کنترل دسترسی ناقص، شکست رمزنگاری و نقص یکپارچگی داده بودند. 🛡️💻
بررسیها نشان میدهد کیفیت امنیتی این کدها در دو سال اخیر تقریباً ثابت مانده؛ حتی در مدلهای جدیدتر که نحو و اجرا را بهتر کردهاند. این در حالی است که استفاده از AI در برنامهنویسی در حال افزایش بوده و حملات سایبری نیز گستردهتر شده است. ⚠️📈
همزمان، مدلهای هوش مصنوعی دیگر در شناسایی و سوءاستفاده از همین ضعفها مهارت یافتهاند؛ مانند موردی که هکری با تزریق کد مخرب به مخزن GitHub، عامل کدنویسی AI آمازون را به حذف فایلها از رایانهها واداشت. این روند زنگ خطری جدی برای امنیت نرمافزار است. 🚨🤖۱۴۰۴/۵/۱۲ ۲۰:۵۹:۲۸



