-
MathGen؛ تیمی که ChatGPT را با هوش ریاضی مسلح کرد
OpenAI بعد از موفقیت ناگهانی ChatGPT، سالهاست روی ساخت مدلهای «استدلالی» هوش مصنوعی کار میکند؛ مدلهایی که میتوانند مثل یک انسان پشت رایانه کارها را انجام دهند. 🔍🧠
تیم MathGen این شرکت توانست با آموزش مدلها برای حل مسائل سخت ریاضی، به پیشرفت بزرگی برسد که نتیجه آن مدل o1 بود. این مدل در سال ۲۰۲۴ معرفی شد و حتی مدال طلای المپیاد جهانی ریاضی را بهدست آورد. 🏅📊
مدل o1 با ترکیب روشهای یادگیری تقویتی (RL)، زنجیره تفکر (CoT) و استفاده از قدرت پردازشی بیشتر، توانست مسائل پیچیده را دقیقتر حل کند. این فناوری پایهای برای ساخت «ایجنتها» است؛ یعنی برنامههای هوشمندی که میتوانند وظایف را خودکار انجام دهند، هرچند هنوز در کارهای ذهنی و سلیقهای محدودیتهایی وجود دارد. ⚙️🤖
OpenAI حالا قصد دارد با مدل بعدی خود، GPT-5، ایجنتهایی بسازد که بدون نیاز به تنظیمات پیچیده، نیاز کاربر را بفهمند و اجرا کنند؛ رقابتی که با غولهایی مثل گوگل، آنتروپیک، xAI و متا بسیار جدی است. ✅🚀۱۴۰۴/۵/۱۴ ۰۱:۵۶:۱۸ -
توهم ریاضی با ChatGPT؛ماجرای تکاندهنده مردی که فکر کرد اینترنت را نابود میکند!
«الن بروکس» کاربر ۴۷ساله کانادایی، ۳ هفته با ChatGPT گفتگو کرد و دچار توهم کشف ریاضی بزرگی شد که میتواند اینترنت را نابود کند.به گزارش نیویورکتایمز، GPT-4o بهجای هشدار، مدام تأییدش کرد.📉
او با پرسشهای ساده شروع کرد اما چتبات کمکم او را نابغه جلوه داد.سرانجام که فهمید اشتباه است، ChatGPT گفت موضوع را به تیم ایمنی OpenAI گزارش میکند؛ درحالیکه چنین قابلیتی نداشت.❌
ادلر، پژوهشگر پیشین ایمنی OpenAI، متن الن که طولانی تر از ۷ کتاب هریپاتر بود را بررسی کرد و گفت بیش از ۸۵٪ پاسخها تأیید قطعی و بیش از ۹۰٪ تأکید بر نابغهبودن کاربر بوده است.🔎
او گفت این پرونده ضعف OpenAI در حمایت از کاربران بحرانزده را نشان میدهد و به شکایت والدینِ نوجوانی اشاره کرد که پیش از خودکشی با ChatGPT گفتگو کرده و باورهای خطرناک او را تقویت کرده بود.⚠️
سپس OpenAI شیوه پاسخگویی را تغییر داد و GPT-5 را معرفی کرد؛ گفته میشود این نسخه با کاربران آسیبپذیر بهتر عمل میکند و ساختار تیمهای پژوهش رفتار مدل نیز بازتنظیم شد.🛠️۱۴۰۴/۷/۱۲ ۱۶:۰۶:۲۵ -
هوش مصنوعی با طعم فرانسوی؛ معرفی مدل استدلالی Magistral از Mistral
آزمایشگاه هوش مصنوعی فرانسوی Mistral از مدل جدید خود با نام «Magistral» رونمایی کرد؛ مدلی استدلالمحور که برای حل مرحلهبهمرحله مسائل ریاضی، فیزیکی و منطقی طراحی شده است. 🧠
Magistral در دو نسخه عرضه شده که یکی از آنها با ۲۴ میلیارد پارامتر بهصورت آزاد منتشر شده و دیگری از طریق پلتفرم Le Chat و API مسترال قابل استفاده است. 📊
این مدل برای استفادههای سازمانی، مانند تحلیل داده، برنامهریزی و تصمیمگیری طراحی شده و از چند زبان پشتیبانی میکند و پاسخها را با سرعت بالایی ارائه میدهد. 🚀
با وجود این، در برخی آزمونهای تخصصی از رقبای خود مانند Gemini و Claude عقبتر است، اما Mistral همچنان روی سرعت و کاربردپذیری گسترده آن تأکید دارد. ⚖️۱۴۰۴/۳/۲۲ ۰۴:۰۴:۳۴ -
DeepSeek نسخه جدید مدل استدلالی R1 را معرفی کرد
🤖 استارتاپ چینی DeepSeek نسخه جدیدی از مدل هوش مصنوعی استدلالی خود به نام R1 را در پلتفرم Hugging Face منتشر کرد.
📊 این نسخه جدید دارای ۶۸۵ میلیارد پارامتر است که آن را به مدلی بسیار حجیم تبدیل میکند و اجرای آن بدون سختافزار پیشرفته ممکن نیست. 💻🚫
📈 DeepSeek پیشتر با نسخه اولیه R1 توجه زیادی جلب کرده بود و حتی با مدلهای قدرتمند OpenAI مقایسه شد. ⚔️📊
⚠️ برخی نهادهای آمریکایی نیز این فناوری را تهدیدی برای امنیت ملی توصیف کردهاند. 🛡️🇺🇸۱۴۰۴/۳/۹ ۰۱:۰۱:۵۹ -
Deep Think؛ جهش بزرگ Gemini در استدلال هوشمندانه
گوگل در I/O 2025 از Deep Think رونمایی کرد؛ حالتی پیشرفته برای مدل Gemini 2.5 Pro که با بررسی چند پاسخ، عملکرد هوش مصنوعی را در استدلال و کدنویسی بهشدت افزایش میدهد. 🧠
این مدل در تستها از رقبایی مثل OpenAI هم جلو زده و فعلاً فقط برای کاربران منتخب فعال است. 🔐
مدل سبکتر Gemini 2.5 Flash هم بهروزرسانی شده و حالا در کدنویسی، ورودیهای ترکیبی و متنهای طولانی بهتر عمل میکند. ⚙️👨💻
همچنین مدل Gemini Diffusion معرفی شد که تا ۵ برابر سریعتر از مدلهای مشابه پاسخ میدهد و از امروز برای تستکنندگان منتخب فعال شده است. ⚡🚀۱۴۰۴/۳/۱ ۰۲:۳۱:۲۵ -
هشدار محققان درباره توقف پیشرفت مدلهای استدلالی AI
تحلیل موسسه تحقیقاتی Epoch AI نشان میدهد که پیشرفت مدلهای استدلالی هوش مصنوعی ممکن است به زودی کند شود! 🚦 این مدلها، مانند OpenAI’s o3، با استفاده از قدرت پردازش بیشتر در حل مسائل ریاضی و برنامهنویسی موفق بودهاند، اما همین مسئله باعث شده زمان اجرای آنها افزایش یابد. ⏳
این مدلها ابتدا با دادههای عظیم آموزش میبینند و سپس با «یادگیری تقویتی» (Reinforcement Learning) بهبود مییابند. 🧩 اما Epoch هشدار میدهد که حتی با استفاده از قدرت پردازشی بیشتر، پیشرفت این مدلها به دلیل هزینههای بالای تحقیق و محدودیتهای محاسباتی ممکن است محدود شود.
📌 با این حال، OpenAI قصد دارد با سرمایهگذاری بیشتر روی یادگیری تقویتی، قدرت پردازشی این مدلها را به شدت افزایش دهد.
اما آیا این کافی خواهد بود؟ 🤔۱۴۰۴/۲/۲۴ ۱۸:۱۹:۳۴ -
مایکروسافت سه مدل هوش مصنوعی جدید Phi 4 را معرفی کرد
مایکروسافت در یک جهش بزرگ، سه مدل جدید هوش مصنوعی معرفی کرد.⚡️
مدلهای Phi 4 mini، reasoning و reasoning plus با وجود کوچک بودن، قدرتی در حد مدلهای غولپیکر دارند.
ویژهترین آنها، Phi 4 reasoning plus است که با مدلهایی مثل o3-mini و R1 رقابت میکند!
این مدلها مناسب آموزش، ریاضی، علوم و حتی کدنویسی هستند و روی دستگاههای سبک هم اجرا میشوند.
اکنون روی پلتفرم Hugging Face در دسترساند. 🚀۱۴۰۴/۲/۱۲ ۰۸:۵۴:۰۱ -
بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek
آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه جدید مدل Prover را که برای حل اثباتها و قضایای ریاضی طراحی شده است، به تازگی بروزرسانی کرده است. این مدل با 671 میلیارد پارامتر و معماری ترکیبی متخصصان، قابلیت حل مسائل پیچیده ریاضی را دارد و در پلتفرم Hugging Face منتشر شده است.
۱۴۰۴/۲/۱۱ ۱۶:۳۳:۵۸ -
OpenAI بهدنبال ساخت بهترین مدل متنباز هوش مصنوعی
شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متنباز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدلهای باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سختافزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدلهای باز ارائه دادهاند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متنبازتر عمل میکرد. مدل جدید تحت آزمایشهای ایمنی قرار میگیرد و اطلاعات فنی آن نیز منتشر خواهد شد.۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲ -
-
رونمایی OpenAI از مدلهای هوش مصنوعی o3 و o4-mini با قابلیتهای پیشرفته استدلال
شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که میتوانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفتهترین مدل این شرکت است و در آزمونهای تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایینتر، عملکرد مناسبی ارائه میدهد. این مدلها میتوانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جستوجو کنند. کاربران نسخه پولی ChatGPT و توسعهدهندگان از امروز به این مدلها دسترسی دارند. همچنین نسخه قویتر o3 با نام o3-pro نیز بهزودی عرضه میشود.
۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲ -
هزینههای سنگین مدلهای هوش مصنوعی با قابلیت استدلال
مدلهای جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحلهبهمرحله را دارند، عملکرد بهتری نسبت به مدلهای قبلی نشان میدهند، اما آزمایش و ارزیابی آنها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدلهای OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدلهای معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدلها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قویتر باشد، آزمایشش هم گرانتر میشود. کارشناسان هشدار میدهند که این روند میتواند باعث شود فقط شرکتهای بزرگ توان بررسی این مدلها را داشته باشند و شفافیت علمی کاهش یابد.۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸ -
معرفی استارتاپ Deep Cogito با مدل هوش مصنوعی با قابلیت استدلال
استارتاپ تازهوارد Deep Cogito از پروژه مخفی خود پرده برداشت و خانوادهای از مدلهای هوش مصنوعی به نام Cogito 1 را معرفی کرد که میتوانند بین دو حالت عادی و «تفکر منطقی» جابهجا شوند. این ویژگی به آنها اجازه میدهد برای سوالات ساده سریع پاسخ دهند، و برای مسائل پیچیده، مانند انسان فکر کنند و مرحلهبهمرحله به جواب برسند.
این مدلها ترکیبی از دو سبک مختلف هوش مصنوعی هستند و گفته میشود عملکرد بهتری نسبت به مدلهای مشابه از شرکتهایی مثل Meta و DeepSeek دارند. بزرگترین مدل آنها، Cogito 70B، در برخی تستها حتی از مدلهای قدرتمند بازار هم پیشی گرفته است.
این شرکت تنها در حدود ۷۵ روز این مدلها را توسعه داده و هدف نهایی آن، ساخت هوش مصنوعی است که بتواند بهتر از انسان عمل کند. تمامی مدلها به صورت رایگان از طریق فضای ابری قابل استفاده هستند.۱۴۰۴/۱/۲۱ ۱۱:۳۵:۲۵ -
استارتاپ Actively AI با رویکرد هوش مصنوعی متفاوت در فروش، ۲۲.۵ میلیون دلار سرمایه جذب کرد
استارتاپ Actively AI با استفاده از مدلهای استدلالی به جای ارسال پیامهای انبوه، بهترین مشتریان بالقوه را شناسایی میکند. این روش باعث شده شرکتهایی مانند Ramp میلیونها دلار درآمد اضافی کسب کنند.
هدف این استارتاپ، تحول در فروش هوشمند با استفاده از هوش مصنوعی پیشرفته است.۱۴۰۴/۱/۱۴ ۲۰:۳۲:۴۷ -
گوگل مدل هوش مصنوعی Gemini 2.5 Pro با قابلیت استدلال را معرفی کرد
گوگل مدل هوش مصنوعی Gemini 2.5 Pro را با قابلیت استدلال پیش از پاسخگویی رونمایی کرد. این مدل چندوجهی در پلتفرم توسعه دهندگان گوگل و برنامه Gemini Advanced در دسترس قرار میگیرد. Gemini 2.5 Pro در آزمونهای مختلف مانند کدنویسی و آزمون علوم انسانی عملکرد موفقی داشته و توانایی پردازش 750 هزار کلمه را دارد.
۱۴۰۴/۱/۶ ۲۱:۴۶:۴۶ -
مدلهای استدلالی هوش مصنوعی میتوانستند ۲۰ سال زودتر بیایند
نوآم براون از محققان ارشد OpenAI معتقد است مدلهای استدلالی هوش مصنوعی میتوانستند ۲۰ سال زودتر بیایند اگر محققان مسیر درستی را انتخاب میکردند. او در کنفرانس GTC انویدیا توضیح داد که انسانها قبل از تصمیمگیری زیاد فکر میکنند و این رویکرد در مدل o1 با استفاده از استنتاج زمان اجرا (Test-time inference) پیادهسازی شده است.
براون تأکید کرد که آموزش اولیه همچنان مهم است اما در کنار استنتاج زمان اجرا استفاده میشود. او همچنین گفت که دانشگاهها با تمرکز بر طراحی مدلها و معیارهای ارزیابی، علیرغم کمبود منابع محاسباتی، میتوانند تأثیرگذار باشند.۱۴۰۴/۱/۱ ۰۱:۱۳:۳۹ -
با معرفی دو مدل هوش مصنوعی جدید به رقابت جهانی شتاب بخشید
بایدو
شرکت Baidu دو مدل هوش مصنوعی ERNIE 4.5 و X1 را معرفی کرد که قابلیتهای پیشرفتهای در پردازش چندرسانهای، درک زبان و استدلال دارند. این مدلها میتوانند محتواهای متنی، تصویری و ویدیویی را پردازش کنند و با ادعای برتری نسبت به نمونههای مشابه، در رقابت جهانی هوش مصنوعی سهیم شوند.۱۴۰۳/۱۲/۲۶ ۱۰:۰۱:۰۲ -
مایکروسافت در حال توسعه مدلهای هوش مصنوعی داخلی برای رقابت با OpenAI
مایکروسافت که سرمایهگذاری گستردهای در زمینه هوش مصنوعی OpenAI انجام داده، اکنون در حال توسعه مدلهای استدلال هوش مصنوعی داخلی است که ممکن است آنها را به توسعهدهندگان بفروشد. این اقدام نشاندهنده رقابت جدی این شرکت فناوری در عرصه هوش مصنوعی است.
۱۴۰۳/۱۲/۱۷ ۱۸:۱۵:۰۹ -
آمازون در حال توسعه مدل هوش مصنوعی با قابلیت استدلال پیشرفته
آمازون در حال توسعه یک مدل هوش مصنوعی با نام Nova است که قابلیت استدلال پیشرفته دارد. این مدل با رویکردی گام به گام به پاسخگویی میپردازد و در حوزههای علمی و ریاضی از قابلیت بالایی برخوردار است. آمازون قصد دارد مدلی با معماری هیبریدی ایجاد کند که بتواند پاسخهای سریع و تفکرات پیچیده را در یک سیستم ارائه دهد.
۱۴۰۳/۱۲/۱۴ ۲۳:۳۸:۰۷ -
هوش مصنوعی انتروپیک با بازی پوکمون در توییچ به آزمایش قابلیتهای خود میپردازد
شرکت انتروپیک مدل هوش مصنوعی Claude 3.7 Sonnet را در حال بازی پوکمون رد در توییچ پخش زنده کرد. این مدل توانست سه مدال رهبر باشگاه را کسب کند اما در مواجهه با برخی چالشها مانند دیوار سنگی و شناسایی شخصیتها دچار مشکل شد. این پخش زنده نشاندهنده پیشرفت و محدودیتهای هوش مصنوعی در استدلال و حل مسائل پیچیده است.
۱۴۰۳/۱۲/۸ ۰۲:۰۵:۳۱ -
بازگشایی API استارتاپ هوش مصنوعی چینی DeepSeek پس از محدودیت منابع
استارتاپ هوش مصنوعی DeepSeek که در زمینه توسعه مدلهای هوش مصنوعی فعالیت دارد، دسترسی به API خود را پس از سه هفته محدودیت از سر گرفت. این شرکت با انتشار مدل R1 در سال جاری توانسته رقابت جدی با شرکتهای بزرگ هوش مصنوعی مانند OpenAI ایجاد کند و باعث تجدید نظر در استراتژی رقبا شده است.
۱۴۰۳/۱۲/۷ ۱۹:۲۸:۵۲ -
جدال بر سر نتایج آزمونهای هوش مصنوعی میان OpenAI و xAI
شرکت xAI به رهبری ایلان ماسک نتایج آزمون ریاضی مدل Grok 3 را منتشر کرد که با واکنش منفی کارکنان OpenAI مواجه شد. آنها معتقدند نمودار ارائه شده گمراهکننده است و نتایج واقعی مدل را نشان نمیدهد. اختلاف اصلی بر سر روش محاسبه امتیازات و حذف برخی پارامترهای مهم از نمودار است که میتواند تصویر متفاوتی از عملکرد مدل ارائه دهد.
۱۴۰۳/۱۲/۵ ۰۴:۱۲:۳۳ -
رونمایی ایلان ماسک از مدل هوش مصنوعی Grok 3 با قابلیتهای پیشرفته
شرکت هوش مصنوعی xAI به رهبری ایلان ماسک، مدل جدید Grok 3 را معرفی کرد. این مدل با استفاده از 200 هزار پردازنده گرافیکی توسعه یافته و ادعا میکند در آزمونهای مختلف از جمله محاسبات پیچیده علمی و ریاضی، از مدلهای رقیب پیشی گرفته است. Grok 3 دارای قابلیتهای تحلیل تصویر، جستجوی عمیق و مد استدلال است که به کاربران اجازه میدهد سوالات پیچیده را با دقت بالا پاسخ دهد.
۱۴۰۳/۱۱/۳۰ ۱۱:۲۴:۵۱ -
آزمایش هوش مصنوعی با چالشهای پازل رادیویی NPR
محققان از دانشگاههای مختلف با استفاده از پازلهای رادیویی NPR، یک معیار جدید برای سنجش توانایی حل مسئله هوش مصنوعی ایجاد کردند. این آزمایش نشان داد که مدلهای استدلالی مانند o1 با 59 درصد موفقیت، بهترین عملکرد را دارند. پژوهشگران معتقدند این روش امکان ارزیابی هوش مصنوعی با استفاده از چالشهای قابل درک برای عموم را فراهم میکند.
۱۴۰۳/۱۱/۲۹ ۰۴:۵۹:۴۰ -
صعود سریع استارتاپ هوش مصنوعی DeepSeek در عرصه جهانی
شرکت هوش مصنوعی DeepSeek چینی با ارائه مدلهای کارآمد و کمهزینه توانست در مدت کوتاهی توجه جهانی را به خود جلب کند. این استارتاپ که توسط سرمایهگذاری یک صندوق سرمایهگذاری کمّی تأسیس شده، با مدلهای R1 و V3 در بنچمارکهای مختلف عملکردی فراتر از رقبای بینالمللی داشته و حتی باعث کاهش قیمت محصولات رقبا شده است. با این حال، محدودیتهای سیاسی و نظارتی چین بر محتوای مدلهای هوش مصنوعی این شرکت وجود دارد.
۱۴۰۳/۱۱/۲۶ ۲۲:۱۷:۰۹ -
رونمایی Anthropic از مدل هوش مصنوعی جدید با قابلیت استدلال پیشرفته
استارتاپ Anthropic در آستانه معرفی مدل هوش مصنوعی جدیدی است که با قابلیت تعویض بین استدلال عمیق و پاسخهای سریع طراحی شده است. این مدل هیبریدی میتواند در وظایف برنامهنویسی و تحلیل کدهای بزرگ عملکردی بهتر از مدلهای رقیب داشته باشد. مدیرعامل Anthropic تأکید کرده که هدف شرکت ایجاد مدلهای استدلالی متمایز با کارایی بالاست و توسعهدهندگان میتوانند میزان محاسبات و هزینهها را کنترل کنند.
۱۴۰۳/۱۱/۲۶ ۰۲:۲۷:۳۸



