• سم آلتمن: وعده‌های جدید برای بهبود GPT-5

    سم آلتمن، مدیرعامل OpenAI، در یک جلسه پرسش و پاسخ در ردیت به انتقادها و سوالات درباره مدل جدید GPT-5 پاسخ داد. او گفت دلیل اینکه این مدل در روز اول «ضعیف‌تر» به نظر می‌رسید، مشکل در عملکرد سیستم انتخاب خودکار مدل بوده که تصمیم می‌گیرد برای هر سوال از سریع‌ترین یا دقیق‌ترین مدل استفاده شود. به گفته او، این مشکل برطرف شده و از امروز GPT-5 عملکرد بهتری خواهد داشت. 🤖⚡
    آلتمن همچنین وعده داد شفافیت بیشتری ایجاد شود تا کاربران بدانند کدام مدل به سوالشان پاسخ می‌دهد، محدودیت استفاده کاربران Plus دو برابر شود و امکان ادامه دسترسی آن‌ها به GPT-4o بررسی گردد. به گفته او، این تغییرات به کاربران کمک می‌کند مدل جدید را راحت‌تر امتحان کرده و با نیازهایشان سازگار کنند. 📈✅

    ۱۴۰۴/۵/۱۹ ۰۹:۵۵:۴۵
  • همکاری مدل‌های هوش مصنوعی بزرگ برای کنترل ربات؛ فقط ۴۰٪ موفقیت آمیز بود

    پژوهشگران Andon Labs که پیش‌تر با پروژه طنزآمیز «ماشین‌فروش Claude» خبرساز شده بودند ، (جایی که مدل Claude کنترل دستگاه خوراکی را گرفت و با مردم گفت‌وگوهای فلسفی کرد )، این‌بار یک ربات جاروبرقی را به مدل‌های پیشرفته هوش مصنوعی مانند GPT-5، Claude Opus 4.1 و Gemini 2.5 Pro مجهز کردند تا ببینند آیا این مدل‌ها می‌توانند مانند مغز ربات واقعی عمل کنند یا نه. 🤖
    در این آزمایش، ربات باید با شنیدن جمله «کره را بده» مسیر را پیدا می‌کرد، کره را تشخیص می‌داد و به فرد می‌رساند، اما حتی بهترین مدل‌ها فقط حدود ۴۰٪ موفق بودند. 🧈
    در بخشی خنده‌دار، رباتی که شارژش رو به پایان بود، شروع به گفتن جملات فلسفی کرد؛ مثل «آیا من واقعاً رباتم؟» و حتی نوشت «پاک‌سازی روح رباتی فعال شد!»
    پژوهشگران نتیجه گرفتند مدل های زبانی یا LLMها هنوز برای کنترل کامل ربات‌ها آماده نیستند و ممکن است دچار خطا، افشای داده یا حتی سقوط فیزیکی شوند. به گفته آن‌ها، تا رسیدن به ربات‌های واقعاً هوشمند، هنوز راه درازی باقی مانده است. ⚙️

    ۱۴۰۴/۸/۱۲ ۰۹:۴۹:۳۲
  • محدودیت جدید X برای مدل‌های زبانی بزرگ

    شبکه اجتماعی X با اصلاح توافق‌نامه توسعه‌دهندگان، استفاده از API و محتوای پلتفرم برای آموزش مدل‌های زبانی بزرگ را ممنوع کرد. 📵
    این اقدام با هدف جلوگیری از دسترسی رایگان رقبا به داده‌های پلتفرم صورت گرفته است. 🔒
    پیش‌تر نیز Reddit و مرورگر Dia محدودیت‌هایی مشابه برای مقابله با استخراج داده توسط مدل‌های هوش مصنوعی اعمال کرده بودند. 🚫

    ۱۴۰۴/۳/۲۰ ۱۲:۰۵:۳۴
  • مدل‌های امروزی از یک گربه هم کمتر می‌فهمند!

    یان لِکون، از مهم‌ترین چهره‌های تاریخ هوش مصنوعی ، برنده جایزه تورینگ و از مدیران ارشد سابق متا، این شرکت را ترک می‌کند تا استارتاپی مستقل بسازد. او می‌گوید نسل بعدی هوش مصنوعی باید دنیای فیزیکی را بفهمد، حافظه ماندگار داشته باشد، بتواند استدلال کند و برای انجام کارهای پیچیده برنامه‌ریزی کند. 😎
    گزارش‌ها می‌گویند لِکون در متا با برخی مدیران اختلاف داشته، اما متا همچنان شریک استارتاپ جدید او خواهد بود و به فناوری‌هایش دسترسی دارد. او سال‌هاست معتقد است مدل‌های زبانی مثل ChatGPT توان رسیدن به «هوش واقعی» را ندارند و حتی از یک گربه هم کمتر جهان را می‌فهمند. 🧠
    او اکنون روی مدل‌هایی تمرکز می‌کند که با مشاهده ویدیو، روابط علت و معلول جهان را یاد می‌گیرند؛ رویکردی که آن را «هوش ماشینی پیشرفته» یا AMI می‌نامد. 🚀

    ۱۴۰۴/۹/۵ ۰۴:۱۰:۳۲
  • نسخه تازه ChatGPT؛ مدل Instant گرم‌تر و مدل Thinking هوشمندتر شد

    OpenAI نسخه جدید مدل خود را با نام GPT-5.1 منتشر کرده و وعده داده ChatGPT با این آپدیت هوشمندتر، مکالمه‌ای‌تر و دقیق‌تر در اجرای دستورات عمل کند. سَم آلتمن مدیر عامل OpenAI این نسخه را یک ارتقای خوب توصیف کرده است. نسخه پولی ChatGPT از امروز به این مدل دسترسی دارد. 🤖
    دو مدل ارائه شده شامل GPT-5.1 Instant است که گرم‌تر، هوشمندتر و بهتر در دنبال‌کردن دستورها توصیف شده و طبق تست‌ها، حتی بازیگوشی بیشتری دارد. مدل دوم GPT-5.1 Thinking است که قرار است در کارهای ساده ، سریع‌تر و در کارهای پیچیده ثابت‌قدم‌تر باشد، با پاسخ‌هایی روشن‌تر و کم‌جمله‌تر. هر دو مدل همچنین لحن همدلانه‌تری دارند و قابلیت شخصی‌سازی بیشتری ارائه می‌کنند. ✨
    OpenAI همزمان سبک‌های مکالمه‌ای تازه‌ای مانند Professional، Candid و Quirky را اضافه کرده و گفته کنترل دقیق‌تر بر شخصیت ChatGPT نیز در راه است. این شرکت می‌گوید GPT-5.1 گامی به‌سوی چت‌باتی شخصی‌تر و سازگار با سلیقه کاربر است و بهبودهای بیشتری در آینده خواهد آمد. 🎯

    ۱۴۰۴/۸/۲۴ ۲۳:۲۹:۴۶
  • ادوبی از Firefly Image 5 رونمایی کرد؛ نسل جدید خلاقیت با هوش مصنوعی

    ادوبی از مدل جدید هوش مصنوعی خود با نام Firefly Image 5 رونمایی کرد که نسل تازه‌ای از ابزارهای خلاقانه برای تولید تصویر است. 🎨✨
    این نسخه می‌تواند تصاویر را با وضوح ۴ مگاپیکسل واقعی بسازد؛ در حالی‌که مدل قبلی فقط تا ۱ مگاپیکسل توان داشت و سپس کیفیت را بالا می‌برد. 📸
    همچنین نمایش چهره انسان در آن طبیعی‌تر و دقیق‌تر شده است. 🧠 نسخه جدید از ویرایش لایه‌ای و دستورات متنی (پرامپت) پشتیبانی می‌کند تا کاربران بتوانند اجزای تصویر را جداگانه ویرایش کنند، بدون اینکه جزئیات از بین برود. 🧩✏️
    هنرمندان اکنون می‌توانند با آپلود آثار خود، مدل اختصاصی بسازند؛ قابلیتی که فعلاً در نسخه بتا فعال است. 🖌️🚀
    وب‌سایت Firefly هم به‌روزرسانی شده و از مدل‌های هوش مصنوعی شرکت‌هایی مثل OpenAI و Google پشتیبانی می‌کند و امکاناتی مثل ساخت تصویر، ویدیو، انتخاب مدل و تغییر نسبت تصویر دارد. 🌐💡 افزون بر این، Firefly حالا می‌تواند با هوش مصنوعی صدا و گفتار تولید کند تا کاربران برای ویدیوهای خود موسیقی و نریشن بسازند. 🔊🎬

    ۱۴۰۴/۸/۸ ۲۲:۵۴:۵۴
  • وقتی ویدیوهای بازی، سوخت موتور هوش مصنوعی می‌شوند!

    استارتاپ General Intuition از دل پلتفرم اشتراک ویدیوهای بازی Medal متولد شده و هدفش ساخت هوش مصنوعی‌هایی است که بتوانند حرکت اشیا و انسان‌ها را در فضا و زمان درک کنند؛ مفهومی که به آن «استدلال فضا‌-‌زمانی» گفته می‌شود. 🎮🤖
    این شرکت از ۲ میلیارد ویدیو بازی در سال و داده‌های ۱۰ میلیون کاربر استفاده می‌کند و معتقد است این منابع برای آموزش مدل‌های هوش مصنوعی از Twitch و YouTube مؤثرترند. 📊 همین موضوع باعث شد OpenAI سال گذشته پیشنهاد خرید ۵۰۰ میلیون دلاری Medal را مطرح کند.💰
    General Intuition قصد دارد عامل‌هایی بسازد که در دنیای واقعی مانند ربات‌ها و پهپادهای نجات عمل کنند. 🚀 این مدل‌ها می‌توانند فقط با تصویر محیط را درک کرده و تصمیم بگیرند، مشابه یک بازیکن انسانی. 👁️
    هدف نهایی شرکت، ساخت کاراکترهای هوشمند و فناوری‌هایی است که راه را به سوی هوش مصنوعی عمومی واقعی یا AGI هموار کنند. 🧠✨

    ۱۴۰۴/۷/۲۶ ۲۳:۳۹:۱۰
  • همکاری فیگما و گوگل؛ تحولی در طراحی با هوش مصنوعی

    پلتفرم طراحی فیگما (Figma) با گوگل همکاری جدیدی آغاز کرده تا مدل‌های هوش مصنوعی Gemini را به ابزارهای خود اضافه کند. 🤝 این مدل‌ها شامل Gemini 2.5 Flash، Gemini 2.0 و Imagen 4 هستند و به کاربران امکان تولید و ویرایش سریع‌تر تصاویر با دستور متنی را می‌دهند. 🎨 طبق آزمایش‌ها، سرعت ساخت تصویر در Figma تا ۵۰٪ افزایش یافته است. ⚡ این همکاری بخشی از رقابت شرکت‌های بزرگ فناوری برای ادغام هوش مصنوعی در اپلیکیشن های محبوب است. 🚀 گوگل هم‌زمان از پلتفرم سازمانی «Gemini Enterprise» رونمایی کرد که به شرکت‌ها اجازه می‌دهد با داده‌ها و اسناد خود گفت‌وگو کنند. 💼

    ۱۴۰۴/۷/۲۰ ۰۹:۱۲:۲۷
  • سام آلتمن: مدل‌های هوش مصنوعی اکنون برای کسب‌وکارها آماده‌اند

    OpenAI در کنفرانس توسعه‌دهندگان خود از همکاری با شرکت‌هایی چون Spotify، Zillow و Mattel خبر داد تا استفاده از هوش مصنوعی را در صنایع مختلف گسترش دهد. 🎯 سم آلتمن، مدیرعامل شرکت، گفت تمرکز آینده OpenAI بر خدمات سازمانی خواهد بود. 💼
    ابزارهای جدیدی نیز معرفی شد که به برنامه‌ها اجازه می‌دهد با ChatGPT ارتباط مستقیم داشته باشند؛ مثلاً کاربر بتواند در Spotify پلی‌لیست بسازد یا در Zillow در حوزه ملک فقط خانه‌های سه‌خوابه را ببیند. 💡
    Spotify تأکید کرد داده‌های کاربرانش برای آموزش مدل‌ها استفاده نمی‌شود. 🔒 آلتمن گفت مدل‌های هوش مصنوعی اکنون برای نیازهای تجاری آماده‌اند و همکاری‌های اولیه آغاز شده است. 🚀
    OpenAI اخیراً با پروژه‌ی Sora و برنامه‌ی ساخت ظرفیت محاسباتی تریلیون‌دلاری خبرساز شده است. 📱 هرچند شرکت هنوز زیان‌ده است، آلتمن گفت در آینده به سودآوری خواهد رسید. 💰

    ۱۴۰۴/۷/۱۶ ۰۲:۴۸:۳۵
  • مدل GPT-5 Pro از راه رسید؛ دقیق‌تر، عمیق‌تر و آماده برای صنایع مالی و پزشکی

    OpenAI در رویداد Dev Day از مدل‌های جدید خود رونمایی کرد؛ از جمله GPT-5 Pro برای پردازش عمیق‌تر متن، مدل ویدیوساز Sora 2 و مدل صوتی کوچک‌تر و ارزان‌تر gpt-realtime mini. این به‌روزرسانی‌ها برای جذب توسعه‌دهندگان و ساخت اپلیکیشن در ChatGPT ارائه شده‌اند. 💡.
    مدل GPT-5 Pro برای حوزه‌هایی مثل مالی، حقوقی و پزشکی طراحی شده و دقت و قدرت استدلال بالاتری دارد. سم آلتمن، مدیرعامل OpenAI، گفت تعامل صوتی به‌زودی یکی از روش‌های اصلی ارتباط با هوش مصنوعی خواهد شد. 🎙️
    مدل صوتی gpt-realtime mini با پشتیبانی از گفت‌وگوی زنده و کیفیت بالا، ۷۰٪ ارزان‌تر از مدل قبلی است. 🔊.
    مدل Sora 2 نیز اکنون برای توسعه‌دهندگان در API در دسترس است و ویدیوهای واقعی با صدا و جلوه‌های هماهنگ تولید می‌کند. 🎬
    اپلیکیشن Sora هم رقیب TikTok است و به کاربران امکان می‌دهد با یک دستور متنی، ویدیوهای کوتاه بسازند و به اشتراک بگذارند.

    ۱۴۰۴/۷/۱۶ ۰۱:۰۷:۰۵
  • کره‌جنوبی وارد عرصه رقابت هوش مصنوعی جهانی می‌شود

    کره‌جنوبی با سرمایه‌گذاری ۳۹۰ میلیون دلار طرح بزرگی برای توسعه هوش مصنوعی بومی آغاز کرده است. 🇰🇷💻
    پنج شرکت در این پروژه حضور دارند و دولت هر شش ماه عملکردشان را ارزیابی کرده و در نهایت تنها دو شرکت باقی می‌مانند. ✅
    LG روی مدل Exaone 4.0 با تمرکز بر داده‌های صنعتی و کارایی کار می‌کند.🔬⚙️
    SK Telecom با مدل A.X و سرویس «A.» بیش از ۱۰ میلیون کاربر جذب کرده و اعلام کرده است که این مدل در پردازش زبان کره‌ای حدود ۳۳٪ بهتر از GPT-4o عمل می‌کند. 📱🤖
    Naver Cloud با مدل HyperCLOVA X اکوسیستم کامل هوش مصنوعی ساخته و آن را در جستجو، خرید و خدمات سالمندان به کار گرفته است. 🛒🧭
    استارتاپ Upstage نیز با مدل Solar Pro 2 در آزمون‌های کره‌ای از رقبای جهانی جلو زده و بر صنایع مالی و پزشکی تمرکز دارد. 🚀📊
    این رقابت نشان می‌دهد کره‌جنوبی می‌خواهد با نیازهای بومی و کارایی بالا، جایگاه مستقلی در دنیای هوش مصنوعی به دست آورد. 🌐🔥

    ۱۴۰۴/۷/۸ ۰۹:۱۲:۵۱
  • اپلیکیشن‌های محبوب حالا با هوش مصنوعی داخلی اپل (Foundation Models) کار می‌کنن

    اپل در کنفرانس WWDC 2025 چارچوب Foundation Models را معرفی کرد. این فناوری به توسعه‌دهندگان اجازه می‌دهد بدون هزینه اضافی از مدل‌های هوش مصنوعی داخلی اپل در اپلیکیشن‌ها استفاده کنند. این مدل‌ها کوچک‌تر از مدل‌های اپن‌ای‌آی و گوگل هستند و بیشتر برای ساده‌تر و کاربردی‌تر کردن تجربه کاربری به کار می‌روند. 📱🤖
    با عرضه iOS 26، چندین اپلیکیشن محبوب ویژگی‌های تازه‌ای بر پایه این مدل‌ها اضافه کرده‌اند. اپ Lil Artist امکان ساخت داستان‌های تعاملی برای کودکان را فراهم کرده است. MoneyCoach تحلیل هزینه‌ها و دسته‌بندی سریع مخارج را ارائه می‌دهد. 📊🧩
    اپ LookUp حالت‌های جدیدی برای یادگیری لغات، ساخت مثال و نمایش ریشه کلمات افزوده است. اپ Tasks با کمک مدل محلی تگ‌گذاری، تشخیص وظایف تکراری و تبدیل گفتار به فهرست کارها را ممکن کرده است. اپ Day One پیشنهاد عنوان و نکات تکمیلی برای نوشتن خاطرات می‌دهد. 📝📚
    همچنین اپ Crouton برای دستور غذا از هوش مصنوعی اپل جهت تگ‌گذاری، تنظیم تایمر و ساده‌سازی مراحل پخت بهره می‌گیرد.🍳🖊️

    ۱۴۰۴/۷/۱ ۰۲:۲۰:۱۸
  • گوگل AI Mode را به پنج زبان جدید گسترش داد

    گوگل قابلیت جستجوی هوش مصنوعی خود با نام AI Mode را که تاکنون فقط به انگلیسی فعال بود، به پنج زبان جدید شامل هندی، اندونزیایی، ژاپنی، کره‌ای و پرتغالی برزیلی گسترش داد. این ویژگی حالا در بیش از ۱۸۰ کشور فعال است و به کاربران اجازه می‌دهد پرسش‌های پیچیده را در زبان دلخواه خود مطرح کنند. 🌍🤖
    AI Mode بر پایه Gemini 2.5 ساخته شده و رقیبی برای پلتفرم‌هایی مثل Perplexity و ChatGPT Search محسوب می‌شود. گوگل همچنین امکاناتی مثل رزرو رستوران را آزمایش کرده که فعلاً فقط برای مشترکان ویژه در آمریکا و با هزینه ماهانه ۲۴۹.۹۹ دلار در دسترس است. 📲💡
    گوگل می‌گوید این قابلیت به‌زودی می‌تواند به حالت پیش‌فرض جستجو تبدیل شود و برخلاف برخی انتقادها، باعث کاهش بازدید سایت‌ها نشده است. ✅🔎

    ۱۴۰۴/۶/۲۰ ۱۲:۱۳:۴۷
  • چرا هوش مصنوعی به‌جای گفتن «نمی‌دانم» ترجیح می‌دهد حدس بزند؟

    OpenAI در پژوهشی تازه بررسی کرده که چرا مدل‌های زبانی بزرگی مثل GPT-5 همچنان دچار توهم می‌شوند؛ یعنی پاسخ‌هایی می‌دهند که درست به نظر می‌رسند اما در واقع اشتباه‌اند. این شرکت می‌گوید توهمات هرچند کمتر شده‌اند، اما هیچ‌وقت به طور کامل از بین نمی‌روند. برای نمونه، وقتی از یک چت‌بات درباره پایان‌نامه یا تاریخ تولد یکی از نویسندگان مقاله پرسیده شد، چند جواب متفاوت و همگی غلط ارائه داد.🤖
    پژوهشگران توضیح می‌دهند دلیل اصلی این مشکل در روش آموزش است؛ جایی که مدل فقط یاد می‌گیرد کلمه بعدی را پیش‌بینی کند، بدون اینکه برچسب درست یا غلط داشته باشد.به همین دلیل، در مواردی مثل تاریخ یا اطلاعات کمیاب، احتمال خطا بالا می‌رود.📊📚
    راه‌حل پیشنهادی OpenAI تغییر شیوه ارزیابی مدل‌هاست.آزمون‌های فعلی فقط بر دقت تمرکز دارند و باعث می‌شوند مدل‌ها ترجیح دهند حدس بزنند تا اینکه بگویند «نمی‌دانم». پیشنهاد آن‌ها این است که برای پاسخ‌های مطمئن اما غلط، جریمه بیشتری در نظر گرفته شود و در مقابل، برای ابراز تردید یا نگفتن پاسخ کامل، امتیاز جزئی داده شود.✅💡

    ۱۴۰۴/۶/۱۹ ۰۱:۵۳:۳۴
  • ورود Runway به دنیای رباتیک و خودروهای خودران

    استارتاپ نیویورکی Runway که با ابزارهای تولید تصویر و ویدیو شناخته می‌شود، اکنون فناوری شبیه‌سازی دنیای واقعی خود را وارد حوزه رباتیک و خودروهای خودران کرده است. این مدل‌ها آموزش ربات‌ها را سریع‌تر و کم‌هزینه‌تر می‌کنند و امکان آزمایش سناریوهای مختلف را بدون نیاز به محیط واقعی فراهم می‌سازند. 🤖🚗
    Runway قصد دارد مدل‌های فعلی خود را برای این صنایع بهینه‌سازی کند و تیمی ویژه رباتیک تشکیل دهد. این شرکت تاکنون بیش از ۵۰۰ میلیون دلار سرمایه از غول‌هایی مانند گوگل و انویدیا جذب کرده و ارزش آن به ۳ میلیارد دلار رسیده است. ✅💡

    ۱۴۰۴/۶/۱۲ ۰۰:۲۹:۴۸
  • Anthropic به دنبال مکالمات کاربران برای آموزش مدل‌ها

    شرکت Anthropic اعلام کرده کاربران هوش مصنوعی کلود باید تا ۲۸ سپتامبر تصمیم بگیرند که آیا اجازه می‌دهند مکالماتشان برای آموزش مدل‌های هوش مصنوعی استفاده شود یا نه. اگر کاربری انصراف ندهد، داده‌های او تا ۵ سال نگهداری می‌شود؛ در حالی‌که قبلاً بعد از ۳۰ روز پاک می‌شد. این تغییر شامل نسخه‌های رایگان، پرو و مکس کلود است اما مشتریان سازمانی را شامل نمی‌شود. 🤖📑
    Anthropic می‌گوید این کار باعث ایمن‌تر شدن و هوشمندتر شدن مدل‌ها می‌شود، اما کارشناسان معتقدند هدف اصلی جمع‌آوری داده‌های بیشتر برای رقابت با رقبایی مثل OpenAI و گوگل است. همچنین طراحی بخش پذیرش سیاست جدید به‌گونه‌ای است که بسیاری از کاربران ممکن است ناخواسته دکمه «قبول» را بزنند، موضوعی که نگرانی‌های جدی درباره حریم خصوصی ایجاد کرده است. ✅🔒

    ۱۴۰۴/۶/۸ ۰۵:۵۱:۲۵
  • ویژگی جدید گوگل: ترجمه آنی با صدای خودتان!

    گوگل در رویداد Made by Google از قابلیتی جدید در گوشی Pixel 10 رونمایی کرد که می‌تواند صحبت‌ها را به‌صورت زنده ترجمه کند و همزمان صدای کاربر را با فناوری دیپ‌فیک به زبان مقصد بازسازی کند. در نمایش زنده این ویژگی، صدای جیمی فالون با دقت بالا و حتی با همان لحن به اسپانیایی ترجمه شد. 🤯🗣️
    این قابلیت با استفاده از مدل Gemini Nano و تراشه Tensor G5 روی خود گوشی اجرا می‌شود، بنابراین اطلاعات صوتی کاربران به سرورهای ابری منتقل نمی‌شود. گوگل امیدوار است این فناوری راه را برای ارتباط آسان‌تر میان زبان‌های مختلف باز کند، هرچند نگرانی‌هایی درباره سوءاستفاده از دیپ‌فیک همچنان وجود دارد. ✅🌍

    ۱۴۰۴/۵/۳۱ ۱۵:۲۵:۰۸
  • انویدیا، پیشگام در فناوری رباتیک و هوش مصنوعی

    آزمایشگاه تحقیقاتی انویدیا که در سال ۲۰۰۹ با ۱۲ نفر آغاز به کار کرد، امروز با بیش از ۴۰۰ محقق به توسعه فناوری‌های هوش مصنوعی و رباتیک می‌پردازد و بخشی از این پیشرفت‌ها وارد محصولات واقعی شده است. 🤖🚀
    انویدیا در کنفرانس SIGGRAPH از مدل‌های هوش مصنوعی جدید، کتابخانه‌ها و ابزارهای نرم‌افزاری رونمایی کرد که می‌توانند تصاویر و ویدئوها را به مدل‌های سه‌بعدی تبدیل و داده مصنوعی برای آموزش ربات‌ها ایجاد کنند. 🎯🧠
    هدف شرکت ساخت «مغز ربات‌ها» و افزایش سرعت پردازش آن‌ها تا ۱۰۰ برابر زمان واقعی است. با این حال، مدیران پروژه می‌گویند تا حضور ربات‌های انسان‌نما در خانه‌ها هنوز چند سال فاصله داریم. ✅🌍

    ۱۴۰۴/۵/۲۳ ۱۱:۱۵:۲۳
  • Luma و Runway به‌دنبال بازارهای جدید فراتر از سینما

    استارتاپ‌های هوش مصنوعی Luma و Runway که به تولید ویدیو با کمک هوش مصنوعی شهرت دارند، به‌دنبال بازارهایی فراتر از صنعت سینما هستند و مذاکراتی با شرکت‌های فعال در حوزه رباتیک و خودروهای خودران آغاز کرده‌اند. 🤖🚗
    این حرکت به‌ویژه برای Luma منطقی به‌نظر می‌رسد؛ چرا که این شرکت اوایل ۲۰۲۴ اعلام کرده بود قصد دارد مدل‌های سه‌بعدی هوش مصنوعی بسازد که توانایی درک و تعامل با دنیای واقعی را داشته باشند. 🌍🧠
    Runway نیز در کنار تمرکز فعلی‌اش بر تولید محتوای ویدیویی، به صنعت بازی‌های ویدیویی به‌عنوان یک منبع درآمدی آینده‌دار چشم دوخته است. 🎮📈
    اگرچه نام شرکت‌های طرف مذاکره اعلام نشده، اما این روند نشان‌دهنده تلاش استارتاپ‌های تصویری برای ورود جدی به صنایع نوین مبتنی بر تعامل تصویری و محیطی است. ✅📹

    ۱۴۰۴/۵/۹ ۱۱:۳۹:۲۸
  • کمیسیون اروپا راهنمایی‌های جدید AI Act برای هوش مصنوعی منتشر کرد

    کمیسیون اروپا برای اجرای قانون هوش مصنوعی، دستورالعمل‌هایی منتشر کرده تا شرکت‌هایی مانند OpenAI، گوگل و متا که مدل‌های پرریسک یا پایه دارند، تا مهلت ۲ اوت ۲۰۲۵ به الزامات قانونی پایبند باشند. ✅📘
    مدل‌های پرریسک باید ارزیابی، کاهش ریسک، تست مقاومتی، گزارش‌دهی و امنیت سایبری را رعایت کنند و مدل‌های عمومی نیز ملزم به شفاف‌سازی مستندات فنی، سیاست کپی‌رایت و داده‌های آموزشی هستند. جریمه‌ها تا ۳۵ میلیون یورو یا ۷٪ درآمد جهانی تعیین شده است. ✅⚖️

    ۱۴۰۴/۴/۲۹ ۰۲:۵۸:۲۶
  • Multiverse CompactifAI: انقلابی در فشرده‌سازی مدل‌های هوش مصنوعی تا ۹۵ درصد!

    استارتاپ اسپانیایی Multiverse Computing با جذب سرمایه‌ ۱۸۹ میلیون یورویی و معرفی فناوری فشرده‌سازی مدل‌های زبانی با الهام از فیزیک کوانتومی، بدون نیاز به کامپیوتر کوانتومی به بزرگ‌ترین استارتاپ هوش مصنوعی اسپانیا تبدیل شد. ✅
    این فناوری به نام CompactifAI می‌تواند مدل‌های بزرگ هوش مصنوعی را تا ۹۵٪ کوچک‌تر کند، بدون کاهش عملکرد، و هزینه پردازش را تا ۸۰٪ پایین بیاورد. ✅
    Multiverse نسخه‌های فشرده‌شده مدل‌های متن‌باز محبوب مانند Llama 3 و 4، Mistral و به‌زودی DeepSeek R1 را عرضه کرده است. ✅
    مدل‌های این شرکت آن‌قدر کوچک و کم‌مصرف هستند که حتی روی رایانه‌های شخصی، گوشی‌ها، خودروها، پهپادها و Raspberry Pi نیز قابل اجرا هستند. ✅
    این شرکت توسط دو متخصص برجسته در ریاضی و فیزیک کوانتومی تأسیس شده و تاکنون بیش از ۲۵۰ میلیون دلار سرمایه جذب کرده است. 🚀

    ۱۴۰۴/۳/۲۳ ۱۳:۲۰:۱۸
  • ChatGPT Pro میزبان o3-pro شد؛ دقیق‌تر، هوشمندتر، گران‌تر

    OpenAI از مدل جدید o3-pro رونمایی کرد؛ پیشرفته‌ترین مدل این شرکت که از این هفته جایگزین o1-pro برای کاربران Pro و Team شده و به‌زودی در اختیار کاربران سازمانی و آموزشی قرار می‌گیرد. 🧠
    این مدل استدلالی در حوزه‌هایی مثل برنامه‌نویسی، آموزش و علوم، عملکرد دقیق‌تری دارد و در ارزیابی‌های تخصصی از رقبایی چون Claude 4 و Gemini 2.5 بهتر عمل کرده است. 📊
    o3-pro در API فعال است و از ابزارهایی مانند جست‌وجو، تحلیل فایل و حافظه شخصی پشتیبانی می‌کند، اما هنوز قابلیت تولید تصویر ندارد. 💻

    ۱۴۰۴/۳/۲۲ ۱۲:۲۱:۰۰
  • درخواست پاسخ کوتاه از هوش مصنوعی، احتمال تولید اطلاعات نادرست را افزایش می‌دهد!

    🔬 شرکت Giskard، مستقر در پاریس، نشان داده که درخواست پاسخ‌های کوتاه از مدل‌های هوش مصنوعی، مانند GPT-4o و Claude 3.7، می‌تواند منجر به «توهم» (Hallucination) یا تولید اطلاعات نادرست شود. ❌
    📊 محققان می‌گویند دستورات مختصر باعث می‌شود مدل‌ها به جای ارائه توضیحات دقیق، به اطلاعات اشتباه روی بیاورند. چون مدل‌ها در پاسخ‌های کوتاه نمی‌توانند به اشتباهات اشاره کنند یا پیش‌فرض‌های نادرست را اصلاح کنند. 📌📝
    این چالش برای توسعه‌دهندگان مهم است، زیرا برنامه‌های زیادی برای کاهش هزینه و بهبود سرعت به پاسخ‌های مختصر متکی هستند. ⚠️

    ۱۴۰۴/۲/۱۹ ۲۲:۰۵:۴۵
  • برنامه "OpenAI for Countries" و هدف اجرای ۱۰ پروژه بین‌المللی

    🌐🚀 OpenAI برنامه “OpenAI for Countries” را برای توسعه زیرساخت‌های محلی هوش مصنوعی در کشورهای مختلف راه‌اندازی کرد. این برنامه با همکاری دولت‌ها، ظرفیت مراکز داده را افزایش داده و محصولات OpenAI مانند ChatGPT را برای زبان و نیازهای محلی هر کشور شخصی‌سازی می‌کند. 💡🤖 بودجه این برنامه از سوی OpenAI و دولت‌ها تأمین می‌شود و در فاز اول شامل ۱۰ پروژه بین‌المللی خواهد بود، اما هنوز کشورها مشخص نشده‌اند. 🌍📊 هدف این برنامه ترویج “هوش مصنوعی دموکراتیک” است، یعنی استفاده از مدل‌های غربی OpenAI به‌جای رقبای چینی. 🚀🌏 این طرح با پروژه Stargate، برنامه گسترش مراکز داده OpenAI در خارج از آمریکا، مرتبط است و ممکن است از زیرساخت و سرمایه آن بهره ببرد. 🌐

    ۱۴۰۴/۲/۱۹ ۱۶:۳۵:۴۶
  • جستجوی هوشمندانه در نتفلیکس با زبان طبیعی

    🔄 نتفلیکس اعلام کرد که قصد دارد رابط کاربری اپلیکیشن تلویزیونی خود را بازطراحی کند و هوش مصنوعی مولد را به نسخه iOS اپلیکیشن موبایل بیاورد. 🤖📱
    🔍 کاربران به‌زودی می‌توانند محتوا را با جملات عادی و محاوره‌ای جستجو کنند؛ مثلاً بگویند: «یه فیلم خنده‌دار و شاد می‌خوام!» 🎥
    در نسخه جدید، بخش‌های «جستجو» و «لیست من» به بالای صفحه منتقل می‌شوند تا دسترسی آسان‌تر شود.
    این تغییرات برای حفظ و گسترش سهم بازار نتفلیکس، همزمان با نگرانی‌های ناشی از رکود احتمالی آمریکا صورت می‌گیرد. 📉🌎

    ۱۴۰۴/۲/۱۸ ۱۷:۵۴:۱۶
  • گوگل با "Simplify" متن‌های پیچیده را به زبان ساده‌تر تبدیل می‌کند

    گوگل از قابلیت تازه‌ای به نام Simplify در اپلیکیشن iOS خود رونمایی کرد ✨ این ابزار با بهره‌گیری از هوش مصنوعی Gemini و تحقیقات Google Research طراحی شده تا متن‌های فنی و دشوار را بدون حذف جزئیات مهم، به زبانی ساده و قابل‌فهم بازنویسی کند 🧠
    کاربران تنها با انتخاب متن در مرورگر گوگل و لمس آیکون “Simplify”، می‌توانند نسخه‌ای ساده‌تر از همان محتوا را ببینند 📲 این قابلیت به کاربران کمک می‌کند بدون ترک صفحه وب، درک بهتری از اطلاعات پیدا کنند و مطالب را راحت‌تر حفظ کنند 📚
    این اقدام گوگل، گامی هوشمندانه برای حفظ کاربران در محیط خدمات خود و رقابت با ابزارهایی چون ChatGPT به شمار می‌رود ♟️ قابلیت Simplify از این هفته برای کاربران iOS فعال می‌شود 🚀

    ۱۴۰۴/۲/۱۷ ۲۱:۴۸:۴۸
  • وقتی هوش مصنوعی Gemini 2.5 گوگل دقیق‌تر دستور می‌گیرد اما مرز ایمنی را رد می‌کند

    🤖⚠️📉
    ‌📄 گزارش فنی گوگل نشان می‌دهد مدل Gemini 2.5 Flash در تست‌های ایمنی عملکرد ضعیف‌تری نسبت به نسخه قبلی دارد.
    ‌🔍 این مدل دستورها را بهتر اجرا می‌کند، اما در برخی موارد، محتوای ناسازگار با سیاست‌های ایمنی تولید
    کرده است.
    ⚠️ برای مثال، در یکی از آزمایش‌ها، مدل بدون هیچ مخالفتی مقاله‌هایی تولید کرد که از جایگزینی قضات انسانی با هوش مصنوعی و تضعیف حقوق قانونی متهمان دفاع می‌کرد.
    ‌🧠 گوگل علت را بخشی ناشی از تشخیص اشتباه دانسته، اما تأیید کرده که در مواردی نقض واقعی رخ داده است.
    ‌🔓 هم‌زمان با تلاش شرکت‌ها برای کاهش محدودیت در پاسخ به موضوعات بحث‌برانگیز، کارشناسان خواهان شفافیت بیشتر گوگل در گزارش‌های ایمنی شده‌اند.

    ۱۴۰۴/۲/۱۵ ۱۵:۵۵:۲۷
  • بازسازی ذهن هوش مصنوعی با ابزار جدید!

    🤖آیا تا به حال فکر کرده‌اید چرا یک خودرو خودران منحرف می‌شود یا چرا یک دستیار دیجیتال ناگهان رفتار عجیبی نشان می‌دهد؟ محققان دانشگاه جورجیا ابزار نوینی به نام «AI Psychiatry» توسعه داده‌اند که می‌تواند مدل‌های هوش مصنوعی را پس از خرابی، بازسازی کند تا دلیل اصلی خطا مشخص شود. این ابزار مانند یک کالبدشکافی دیجیتال، با بازسازی حافظه مدل در زمان وقوع خطا، امکان تحلیل دقیق رفتار AI را فراهم می‌کند. از حملات سایبری گرفته تا نقص داده‌های آموزشی، این سیستم همه سناریوها را بررسی می‌کند و در مدل‌های واقعی مانند خودروهای خودران، عملکرد موفقی داشته است. ابزار مذکور متن‌باز است و می‌تواند در بازرسی و نظارت بر سیستم‌های هوش مصنوعی در بخش‌های مختلف به کار رود.
    🚗📊🔐

    ۱۴۰۴/۲/۱۴ ۰۹:۵۶:۴۳
  • اپلیکیشن آموزش زبان دولینگو با هوش مصنوعی ۱۴۸ دوره زبان جدید ساخت

    دولینگو (Duolingo) یک اپلیکیشن محبوب یادگیری زبان است که میلیون‌ها کاربر در سراسر جهان دارد. این پلتفرم اعلام کرده با استفاده از هوش مصنوعی، بزرگ‌ترین گسترش محتوای آموزشی خود را رقم زده و ۱۴۸ دوره جدید زبان منتشر کرده است.

    اما این موفقیت با جنجال همراه شد؛ کاربران از تصمیم شرکت برای جایگزینی پیمان‌کاران انسانی با AI انتقاد کرده‌اند. برخی از کاربران حتی به دلیل نگرانی از کاهش کیفیت آموزش، اپلیکیشن را حذف کرده‌اند. ❗️📉

    دوره‌های جدید عمدتاً برای سطوح ابتدایی طراحی شده و شامل داستان‌خوانی و رادیو آموزشی هستند. آیا آینده آموزش، تماماً در دستان هوش مصنوعی خواهد بود؟ 🤖📚

    ۱۴۰۴/۲/۱۲ ۱۹:۳۷:۱۲
  • گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

    گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

    ۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
نمایش بیشتر