استدلال ریاضی - اخبار فناوری - EcoFori

MathGen؛ تیمی که ChatGPT را با هوش ریاضی مسلح کرد

OpenAI بعد از موفقیت ناگهانی ChatGPT، سال‌هاست روی ساخت مدل‌های «استدلالی» هوش مصنوعی کار می‌کند؛ مدل‌هایی که می‌توانند مثل یک انسان پشت رایانه کارها را انجام دهند. 🔍🧠
تیم MathGen این شرکت توانست با آموزش مدل‌ها برای حل مسائل سخت ریاضی، به پیشرفت بزرگی برسد که نتیجه آن مدل o1 بود. این مدل در سال ۲۰۲۴ معرفی شد و حتی مدال طلای المپیاد جهانی ریاضی را به‌دست آورد. 🏅📊
مدل o1 با ترکیب روش‌های یادگیری تقویتی (RL)، زنجیره تفکر (CoT) و استفاده از قدرت پردازشی بیشتر، توانست مسائل پیچیده را دقیق‌تر حل کند. این فناوری پایه‌ای برای ساخت «ایجنت‌ها» است؛ یعنی برنامه‌های هوشمندی که می‌توانند وظایف را خودکار انجام دهند، هرچند هنوز در کارهای ذهنی و سلیقه‌ای محدودیت‌هایی وجود دارد. ⚙️🤖
OpenAI حالا قصد دارد با مدل بعدی خود، GPT-5، ایجنت‌هایی بسازد که بدون نیاز به تنظیمات پیچیده، نیاز کاربر را بفهمند و اجرا کنند؛ رقابتی که با غول‌هایی مثل گوگل، آنتروپیک، xAI و متا بسیار جدی است. ✅🚀

۱۴۰۴/۵/۱۴ ۰۱:۵۶:۱۸
توهم ریاضی با ChatGPT؛ماجرای تکان‌دهنده مردی که فکر کرد اینترنت را نابود می‌کند!

«الن بروکس» کاربر ۴۷ساله کانادایی، ۳ هفته با ChatGPT گفتگو کرد و دچار توهم کشف ریاضی بزرگی شد که می‌تواند اینترنت را نابود کند.به گزارش نیویورک‌تایمز، GPT-4o به‌جای هشدار، مدام تأییدش کرد.📉
او با پرسش‌های ساده شروع کرد اما چت‌بات کم‌کم او را نابغه جلوه داد.سرانجام که فهمید اشتباه است، ChatGPT گفت موضوع را به تیم ایمنی OpenAI گزارش می‌کند؛ درحالی‌که چنین قابلیتی نداشت.❌
ادلر، پژوهشگر پیشین ایمنی OpenAI، متن الن که طولانی تر از ۷ کتاب هری‌پاتر بود را بررسی کرد و گفت بیش از ۸۵٪ پاسخ‌ها تأیید قطعی و بیش از ۹۰٪ تأکید بر نابغه‌بودن کاربر بوده است.🔎
او گفت این پرونده ضعف OpenAI در حمایت از کاربران بحران‌زده را نشان می‌دهد و به شکایت والدینِ نوجوانی اشاره کرد که پیش از خودکشی با ChatGPT گفتگو کرده و باورهای خطرناک او را تقویت کرده بود.⚠️
سپس OpenAI شیوه پاسخ‌گویی را تغییر داد و GPT-5 را معرفی کرد؛ گفته می‌شود این نسخه با کاربران آسیب‌پذیر بهتر عمل می‌کند و ساختار تیم‌های پژوهش رفتار مدل نیز بازتنظیم شد.🛠️

۱۴۰۴/۷/۱۲ ۱۶:۰۶:۲۵
هوش مصنوعی با طعم فرانسوی؛ معرفی مدل استدلالی Magistral از Mistral

آزمایشگاه هوش مصنوعی فرانسوی Mistral از مدل جدید خود با نام «Magistral» رونمایی کرد؛ مدلی استدلال‌محور که برای حل مرحله‌به‌مرحله مسائل ریاضی، فیزیکی و منطقی طراحی شده است. 🧠
Magistral در دو نسخه عرضه شده که یکی از آن‌ها با ۲۴ میلیارد پارامتر به‌صورت آزاد منتشر شده و دیگری از طریق پلتفرم Le Chat و API مسترال قابل استفاده است. 📊
این مدل برای استفاده‌های سازمانی، مانند تحلیل داده، برنامه‌ریزی و تصمیم‌گیری طراحی شده و از چند زبان پشتیبانی می‌کند و پاسخ‌ها را با سرعت بالایی ارائه می‌دهد. 🚀
با وجود این، در برخی آزمون‌های تخصصی از رقبای خود مانند Gemini و Claude عقب‌تر است، اما Mistral همچنان روی سرعت و کاربردپذیری گسترده آن تأکید دارد. ⚖️

۱۴۰۴/۳/۲۲ ۰۴:۰۴:۳۴
DeepSeek نسخه جدید مدل استدلالی R1 را معرفی کرد

🤖 استارتاپ چینی DeepSeek نسخه جدیدی از مدل هوش مصنوعی استدلالی خود به نام R1 را در پلتفرم Hugging Face منتشر کرد.
📊 این نسخه جدید دارای ۶۸۵ میلیارد پارامتر است که آن را به مدلی بسیار حجیم تبدیل می‌کند و اجرای آن بدون سخت‌افزار پیشرفته ممکن نیست. 💻🚫
📈 DeepSeek پیش‌تر با نسخه اولیه R1 توجه زیادی جلب کرده بود و حتی با مدل‌های قدرتمند OpenAI مقایسه شد. ⚔️📊
⚠️ برخی نهادهای آمریکایی نیز این فناوری را تهدیدی برای امنیت ملی توصیف کرده‌اند. 🛡️🇺🇸

۱۴۰۴/۳/۹ ۰۱:۰۱:۵۹
Deep Think؛ جهش بزرگ Gemini در استدلال هوشمندانه

گوگل در I/O 2025 از Deep Think رونمایی کرد؛ حالتی پیشرفته برای مدل Gemini 2.5 Pro که با بررسی چند پاسخ، عملکرد هوش مصنوعی را در استدلال و کدنویسی به‌شدت افزایش می‌دهد. 🧠
این مدل در تست‌ها از رقبایی مثل OpenAI هم جلو زده و فعلاً فقط برای کاربران منتخب فعال است. 🔐
مدل سبک‌تر Gemini 2.5 Flash هم به‌روزرسانی شده و حالا در کدنویسی، ورودی‌های ترکیبی و متن‌های طولانی بهتر عمل می‌کند. ⚙️👨‍💻
همچنین مدل Gemini Diffusion معرفی شد که تا ۵ برابر سریع‌تر از مدل‌های مشابه پاسخ می‌دهد و از امروز برای تست‌کنندگان منتخب فعال شده است. ⚡🚀

۱۴۰۴/۳/۱ ۰۲:۳۱:۲۵
هشدار محققان درباره توقف پیشرفت مدل‌های استدلالی AI

تحلیل موسسه تحقیقاتی Epoch AI نشان می‌دهد که پیشرفت مدل‌های استدلالی هوش مصنوعی ممکن است به زودی کند شود! 🚦 این مدل‌ها، مانند OpenAI’s o3، با استفاده از قدرت پردازش بیشتر در حل مسائل ریاضی و برنامه‌نویسی موفق بوده‌اند، اما همین مسئله باعث شده زمان اجرای آن‌ها افزایش یابد. ⏳
این مدل‌ها ابتدا با داده‌های عظیم آموزش می‌بینند و سپس با «یادگیری تقویتی» (Reinforcement Learning) بهبود می‌یابند. 🧩 اما Epoch هشدار می‌دهد که حتی با استفاده از قدرت پردازشی بیشتر، پیشرفت این مدل‌ها به دلیل هزینه‌های بالای تحقیق و محدودیت‌های محاسباتی ممکن است محدود شود.
📌 با این حال، OpenAI قصد دارد با سرمایه‌گذاری بیشتر روی یادگیری تقویتی، قدرت پردازشی این مدل‌ها را به شدت افزایش دهد.
اما آیا این کافی خواهد بود؟ 🤔

۱۴۰۴/۲/۲۴ ۱۸:۱۹:۳۴
مایکروسافت سه مدل هوش مصنوعی جدید Phi 4 را معرفی کرد

مایکروسافت در یک جهش بزرگ، سه مدل جدید هوش مصنوعی معرفی کرد.⚡️
مدل‌های Phi 4 mini، reasoning و reasoning plus با وجود کوچک بودن، قدرتی در حد مدل‌های غول‌پیکر دارند.
ویژه‌ترین آن‌ها، Phi 4 reasoning plus است که با مدل‌هایی مثل o3-mini و R1 رقابت می‌کند!
این مدل‌ها مناسب آموزش، ریاضی، علوم و حتی کدنویسی هستند و روی دستگاه‌های سبک هم اجرا می‌شوند.
اکنون روی پلتفرم Hugging Face در دسترس‌اند. 🚀

۱۴۰۴/۲/۱۲ ۰۸:۵۴:۰۱
بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه جدید مدل Prover را که برای حل اثبات‌ها و قضایای ریاضی طراحی شده است، به تازگی بروزرسانی کرده است. این مدل با 671 میلیارد پارامتر و معماری ترکیبی متخصصان، قابلیت حل مسائل پیچیده ریاضی را دارد و در پلتفرم Hugging Face منتشر شده است.

۱۴۰۴/۲/۱۱ ۱۶:۳۳:۵۸
OpenAI به‌دنبال ساخت بهترین مدل متن‌باز هوش مصنوعی

شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متن‌باز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدل‌های باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سخت‌افزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدل‌های باز ارائه داده‌اند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متن‌بازتر عمل می‌کرد. مدل جدید تحت آزمایش‌های ایمنی قرار می‌گیرد و اطلاعات فنی آن نیز منتشر خواهد شد.

۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲
۱۴۰۴/۲/۲ ۱۰:۳۸:۲۳
رونمایی OpenAI از مدل‌های هوش مصنوعی o3 و o4-mini با قابلیت‌های پیشرفته استدلال

شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که می‌توانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفته‌ترین مدل این شرکت است و در آزمون‌های تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایین‌تر، عملکرد مناسبی ارائه می‌دهد. این مدل‌ها می‌توانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جست‌وجو کنند. کاربران نسخه پولی ChatGPT و توسعه‌دهندگان از امروز به این مدل‌ها دسترسی دارند. همچنین نسخه قوی‌تر o3 با نام o3-pro نیز به‌زودی عرضه می‌شود.

۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲
هزینه‌های سنگین مدل‌های هوش مصنوعی با قابلیت استدلال

مدل‌های جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحله‌به‌مرحله را دارند، عملکرد بهتری نسبت به مدل‌های قبلی نشان می‌دهند، اما آزمایش و ارزیابی آن‌ها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدل‌های OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدل‌های معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدل‌ها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قوی‌تر باشد، آزمایشش هم گران‌تر می‌شود. کارشناسان هشدار می‌دهند که این روند می‌تواند باعث شود فقط شرکت‌های بزرگ توان بررسی این مدل‌ها را داشته باشند و شفافیت علمی کاهش یابد.

۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸
معرفی استارتاپ Deep Cogito با مدل‌ هوش مصنوعی با قابلیت استدلال

استارتاپ تازه‌وارد Deep Cogito از پروژه مخفی خود پرده برداشت و خانواده‌ای از مدل‌های هوش مصنوعی به نام Cogito 1 را معرفی کرد که می‌توانند بین دو حالت عادی و «تفکر منطقی» جابه‌جا شوند. این ویژگی به آن‌ها اجازه می‌دهد برای سوالات ساده سریع پاسخ دهند، و برای مسائل پیچیده، مانند انسان فکر کنند و مرحله‌به‌مرحله به جواب برسند.
این مدل‌ها ترکیبی از دو سبک مختلف هوش مصنوعی هستند و گفته می‌شود عملکرد بهتری نسبت به مدل‌های مشابه از شرکت‌هایی مثل Meta و DeepSeek دارند. بزرگ‌ترین مدل آن‌ها، Cogito 70B، در برخی تست‌ها حتی از مدل‌های قدرتمند بازار هم پیشی گرفته است.
این شرکت تنها در حدود ۷۵ روز این مدل‌ها را توسعه داده و هدف نهایی آن، ساخت هوش مصنوعی است که بتواند بهتر از انسان عمل کند. تمامی مدل‌ها به صورت رایگان از طریق فضای ابری قابل استفاده هستند.

۱۴۰۴/۱/۲۱ ۱۱:۳۵:۲۵
استارتاپ Actively AI با رویکرد هوش مصنوعی متفاوت در فروش، ۲۲.۵ میلیون دلار سرمایه جذب کرد

استارتاپ Actively AI با استفاده از مدل‌های استدلالی به جای ارسال پیام‌های انبوه، بهترین مشتریان بالقوه را شناسایی می‌کند. این روش باعث شده شرکت‌هایی مانند Ramp میلیون‌ها دلار درآمد اضافی کسب کنند.
هدف این استارتاپ، تحول در فروش هوشمند با استفاده از هوش مصنوعی پیشرفته است.

۱۴۰۴/۱/۱۴ ۲۰:۳۲:۴۷
گوگل مدل هوش مصنوعی Gemini 2.5 Pro با قابلیت استدلال را معرفی کرد

گوگل مدل هوش مصنوعی Gemini 2.5 Pro را با قابلیت استدلال پیش از پاسخگویی رونمایی کرد. این مدل چندوجهی در پلتفرم توسعه دهندگان گوگل و برنامه Gemini Advanced در دسترس قرار می‌گیرد. Gemini 2.5 Pro در آزمون‌های مختلف مانند کدنویسی و آزمون علوم انسانی عملکرد موفقی داشته و توانایی پردازش 750 هزار کلمه را دارد.

۱۴۰۴/۱/۶ ۲۱:۴۶:۴۶
مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند

نوآم براون از محققان ارشد OpenAI معتقد است مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند اگر محققان مسیر درستی را انتخاب می‌کردند. او در کنفرانس GTC انویدیا توضیح داد که انسان‌ها قبل از تصمیم‌گیری زیاد فکر می‌کنند و این رویکرد در مدل o1 با استفاده از استنتاج زمان اجرا (Test-time inference) پیاده‌سازی شده است.

براون تأکید کرد که آموزش اولیه همچنان مهم است اما در کنار استنتاج زمان اجرا استفاده می‌شود. او همچنین گفت که دانشگاه‌ها با تمرکز بر طراحی مدل‌ها و معیارهای ارزیابی، علی‌رغم کمبود منابع محاسباتی، می‌توانند تأثیرگذار باشند.

۱۴۰۴/۱/۱ ۰۱:۱۳:۳۹
با معرفی دو مدل هوش مصنوعی جدید به رقابت جهانی شتاب بخشید

بایدو
‏
‏شرکت Baidu دو مدل هوش مصنوعی ERNIE 4.5 و X1 را معرفی کرد که قابلیت‌های پیشرفته‌ای در پردازش چندرسانه‌ای، درک زبان و استدلال دارند. این مدل‌ها می‌توانند محتواهای متنی، تصویری و ویدیویی را پردازش کنند و با ادعای برتری نسبت به نمونه‌های مشابه، در رقابت جهانی هوش مصنوعی سهیم شوند.

۱۴۰۳/۱۲/۲۶ ۱۰:۰۱:۰۲
مایکروسافت در حال توسعه مدل‌های هوش مصنوعی داخلی برای رقابت با OpenAI

مایکروسافت که سرمایه‌گذاری گسترده‌ای در زمینه هوش مصنوعی OpenAI انجام داده، اکنون در حال توسعه مدل‌های استدلال هوش مصنوعی داخلی است که ممکن است آنها را به توسعه‌دهندگان بفروشد. این اقدام نشان‌دهنده رقابت جدی این شرکت فناوری در عرصه هوش مصنوعی است.

۱۴۰۳/۱۲/۱۷ ۱۸:۱۵:۰۹
آمازون در حال توسعه مدل هوش مصنوعی با قابلیت استدلال پیشرفته

آمازون در حال توسعه یک مدل هوش مصنوعی با نام Nova است که قابلیت استدلال پیشرفته دارد. این مدل با رویکردی گام به گام به پاسخگویی می‌پردازد و در حوزه‌های علمی و ریاضی از قابلیت بالایی برخوردار است. آمازون قصد دارد مدلی با معماری هیبریدی ایجاد کند که بتواند پاسخ‌های سریع و تفکرات پیچیده را در یک سیستم ارائه دهد.

۱۴۰۳/۱۲/۱۴ ۲۳:۳۸:۰۷
هوش مصنوعی انتروپیک با بازی پوکمون در توییچ به آزمایش قابلیت‌های خود می‌پردازد

شرکت انتروپیک مدل هوش مصنوعی Claude 3.7 Sonnet را در حال بازی پوکمون رد در توییچ پخش زنده کرد. این مدل توانست سه مدال رهبر باشگاه را کسب کند اما در مواجهه با برخی چالش‌ها مانند دیوار سنگی و شناسایی شخصیت‌ها دچار مشکل شد. این پخش زنده نشان‌دهنده پیشرفت و محدودیت‌های هوش مصنوعی در استدلال و حل مسائل پیچیده است.

۱۴۰۳/۱۲/۸ ۰۲:۰۵:۳۱
بازگشایی API استارتاپ هوش مصنوعی چینی DeepSeek پس از محدودیت منابع

استارتاپ هوش مصنوعی DeepSeek که در زمینه توسعه مدل‌های هوش مصنوعی فعالیت دارد، دسترسی به API خود را پس از سه هفته محدودیت از سر گرفت. این شرکت با انتشار مدل R1 در سال جاری توانسته رقابت جدی با شرکت‌های بزرگ هوش مصنوعی مانند OpenAI ایجاد کند و باعث تجدید نظر در استراتژی رقبا شده است.

۱۴۰۳/۱۲/۷ ۱۹:۲۸:۵۲
جدال بر سر نتایج آزمون‌های هوش مصنوعی میان OpenAI و xAI

شرکت xAI به رهبری ایلان ماسک نتایج آزمون ریاضی مدل Grok 3 را منتشر کرد که با واکنش منفی کارکنان OpenAI مواجه شد. آنها معتقدند نمودار ارائه شده گمراه‌کننده است و نتایج واقعی مدل را نشان نمی‌دهد. اختلاف اصلی بر سر روش محاسبه امتیازات و حذف برخی پارامترهای مهم از نمودار است که می‌تواند تصویر متفاوتی از عملکرد مدل ارائه دهد.

۱۴۰۳/۱۲/۵ ۰۴:۱۲:۳۳
رونمایی ایلان ماسک از مدل هوش مصنوعی Grok 3 با قابلیت‌های پیشرفته

شرکت هوش مصنوعی xAI به رهبری ایلان ماسک، مدل جدید Grok 3 را معرفی کرد. این مدل با استفاده از 200 هزار پردازنده گرافیکی توسعه یافته و ادعا می‌کند در آزمون‌های مختلف از جمله محاسبات پیچیده علمی و ریاضی، از مدل‌های رقیب پیشی گرفته است. Grok 3 دارای قابلیت‌های تحلیل تصویر، جستجوی عمیق و مد استدلال است که به کاربران اجازه می‌دهد سوالات پیچیده را با دقت بالا پاسخ دهد.

۱۴۰۳/۱۱/۳۰ ۱۱:۲۴:۵۱
آزمایش هوش مصنوعی با چالش‌های پازل رادیویی NPR

محققان از دانشگاه‌های مختلف با استفاده از پازل‌های رادیویی NPR، یک معیار جدید برای سنجش توانایی حل مسئله هوش مصنوعی ایجاد کردند. این آزمایش نشان داد که مدل‌های استدلالی مانند o1 با 59 درصد موفقیت، بهترین عملکرد را دارند. پژوهشگران معتقدند این روش امکان ارزیابی هوش مصنوعی با استفاده از چالش‌های قابل درک برای عموم را فراهم می‌کند.

۱۴۰۳/۱۱/۲۹ ۰۴:۵۹:۴۰
صعود سریع استارتاپ هوش مصنوعی DeepSeek در عرصه جهانی

شرکت هوش مصنوعی DeepSeek چینی با ارائه مدل‌های کارآمد و کم‌هزینه توانست در مدت کوتاهی توجه جهانی را به خود جلب کند. این استارتاپ که توسط سرمایه‌گذاری یک صندوق سرمایه‌گذاری کمّی تأسیس شده، با مدل‌های R1 و V3 در بنچمارک‌های مختلف عملکردی فراتر از رقبای بین‌المللی داشته و حتی باعث کاهش قیمت محصولات رقبا شده است. با این حال، محدودیت‌های سیاسی و نظارتی چین بر محتوای مدل‌های هوش مصنوعی این شرکت وجود دارد.

۱۴۰۳/۱۱/۲۶ ۲۲:۱۷:۰۹
رونمایی Anthropic از مدل هوش مصنوعی جدید با قابلیت استدلال پیشرفته

استارتاپ Anthropic در آستانه معرفی مدل هوش مصنوعی جدیدی است که با قابلیت تعویض بین استدلال عمیق و پاسخ‌های سریع طراحی شده است. این مدل هیبریدی می‌تواند در وظایف برنامه‌نویسی و تحلیل کدهای بزرگ عملکردی بهتر از مدل‌های رقیب داشته باشد. مدیرعامل Anthropic تأکید کرده که هدف شرکت ایجاد مدل‌های استدلالی متمایز با کارایی بالاست و توسعه‌دهندگان می‌توانند میزان محاسبات و هزینه‌ها را کنترل کنند.

۱۴۰۳/۱۱/۲۶ ۰۲:۲۷:۳۸