-
گوگل و موفقیت خیرهکننده Gemma؛ بیش از ۱۵۰ میلیون دانلود
🌐🤖 مدلهای هوش مصنوعی Gemma از گوگل به نقطه عطف بزرگی رسیدند: بیش از ۱۵۰ میلیون بار دانلود. 🔥 همچنین بیش از ۷۰ هزار نسخه مختلف از Gemma توسط توسعهدهندگان در پلتفرم Hugging Face ایجاد شده است.
📅 این مدلها که در فوریه ۲۰۲۴ عرضه شدند، رقیبی برای خانواده مدلهای «لاما» (Llama) از متا محسوب میشوند. 🚀 Gemma اکنون به صورت چندوجهی (متنی و تصویری) عمل میکند و از بیش از ۱۰۰ زبان پشتیبانی میکند. 📸 همچنین نسخههای خاصی برای کاربردهای ویژه، مانند کشف دارو، نیز ارائه شده است. 💊🔬
با این حال، Gemma با وجود موفقیت چشمگیر، هنوز با لاما که ۱.۲ میلیارد دانلود دارد، فاصله دارد.۱۴۰۴/۲/۲۳ ۱۹:۰۱:۳۲ -
کرهجنوبی وارد عرصه رقابت هوش مصنوعی جهانی میشود
کرهجنوبی با سرمایهگذاری ۳۹۰ میلیون دلار طرح بزرگی برای توسعه هوش مصنوعی بومی آغاز کرده است. 🇰🇷💻
پنج شرکت در این پروژه حضور دارند و دولت هر شش ماه عملکردشان را ارزیابی کرده و در نهایت تنها دو شرکت باقی میمانند. ✅
LG روی مدل Exaone 4.0 با تمرکز بر دادههای صنعتی و کارایی کار میکند.🔬⚙️
SK Telecom با مدل A.X و سرویس «A.» بیش از ۱۰ میلیون کاربر جذب کرده و اعلام کرده است که این مدل در پردازش زبان کرهای حدود ۳۳٪ بهتر از GPT-4o عمل میکند. 📱🤖
Naver Cloud با مدل HyperCLOVA X اکوسیستم کامل هوش مصنوعی ساخته و آن را در جستجو، خرید و خدمات سالمندان به کار گرفته است. 🛒🧭
استارتاپ Upstage نیز با مدل Solar Pro 2 در آزمونهای کرهای از رقبای جهانی جلو زده و بر صنایع مالی و پزشکی تمرکز دارد. 🚀📊
این رقابت نشان میدهد کرهجنوبی میخواهد با نیازهای بومی و کارایی بالا، جایگاه مستقلی در دنیای هوش مصنوعی به دست آورد. 🌐🔥۱۴۰۴/۷/۸ ۰۹:۱۲:۵۱ -
چرا هوش مصنوعی بهجای گفتن «نمیدانم» ترجیح میدهد حدس بزند؟
OpenAI در پژوهشی تازه بررسی کرده که چرا مدلهای زبانی بزرگی مثل GPT-5 همچنان دچار توهم میشوند؛ یعنی پاسخهایی میدهند که درست به نظر میرسند اما در واقع اشتباهاند. این شرکت میگوید توهمات هرچند کمتر شدهاند، اما هیچوقت به طور کامل از بین نمیروند. برای نمونه، وقتی از یک چتبات درباره پایاننامه یا تاریخ تولد یکی از نویسندگان مقاله پرسیده شد، چند جواب متفاوت و همگی غلط ارائه داد.🤖
پژوهشگران توضیح میدهند دلیل اصلی این مشکل در روش آموزش است؛ جایی که مدل فقط یاد میگیرد کلمه بعدی را پیشبینی کند، بدون اینکه برچسب درست یا غلط داشته باشد.به همین دلیل، در مواردی مثل تاریخ یا اطلاعات کمیاب، احتمال خطا بالا میرود.📊📚
راهحل پیشنهادی OpenAI تغییر شیوه ارزیابی مدلهاست.آزمونهای فعلی فقط بر دقت تمرکز دارند و باعث میشوند مدلها ترجیح دهند حدس بزنند تا اینکه بگویند «نمیدانم». پیشنهاد آنها این است که برای پاسخهای مطمئن اما غلط، جریمه بیشتری در نظر گرفته شود و در مقابل، برای ابراز تردید یا نگفتن پاسخ کامل، امتیاز جزئی داده شود.✅💡۱۴۰۴/۶/۱۹ ۰۱:۵۳:۳۴ -
محدودیت جدید X برای مدلهای زبانی بزرگ
شبکه اجتماعی X با اصلاح توافقنامه توسعهدهندگان، استفاده از API و محتوای پلتفرم برای آموزش مدلهای زبانی بزرگ را ممنوع کرد. 📵
این اقدام با هدف جلوگیری از دسترسی رایگان رقبا به دادههای پلتفرم صورت گرفته است. 🔒
پیشتر نیز Reddit و مرورگر Dia محدودیتهایی مشابه برای مقابله با استخراج داده توسط مدلهای هوش مصنوعی اعمال کرده بودند. 🚫۱۴۰۴/۳/۲۰ ۱۲:۰۵:۳۴ -
میزبانی Grok ایلان ماسک توسط مایکروسافت؛ پیامی به OpenAI
🤖💼🔥 مایکروسافت تصمیم گرفته مدل Grok را که توسط استارتاپ xAI و به رهبری ایلان ماسک توسعه یافته، روی پلتفرم Azure اجرا کند.
📊 این همکاری در حالی صورت میگیرد که ماسک و OpenAI درگیر تنشهای شدید و شکایتهای حقوقی هستند.
🧠 مایکروسافت زیرساخت لازم را برای اجرای Grok فراهم میکند، اما هنوز مشخص نیست همکاری انحصاری خواهد بود یا خیر.
🔍 همچنین، مایکروسافت مشغول بررسی مدلهای جایگزین از Meta، DeepSeek و xAI برای کاهش وابستگی به OpenAI است.۱۴۰۴/۲/۱۴ ۲۰:۳۴:۴۹ -
هوش مصنوعی متا زیر تیغ عدالت؛ آیا بازار کتاب نابود میشود؟
⚖️ در دادگاهی در آمریکا، استفاده متا از کتابهای نویسندگان معروف برای آموزش مدل LLaMA بدون اجازه قانونی زیر ذرهبین رفت. قاضی گفت این مدل میتواند میلیاردها محتوای رقیب تولید کند و بازار آثار اصلی را نابود سازد. متا ادعا میکند استفادهاش منصفانه بوده، اما دادگاه در حال بررسی آثار واقعی این اقدام بر حقوق نویسندگان است. این پرونده بخشی از موج شکایتهای بزرگ علیه غولهای هوش مصنوعی است. ⚠️
۱۴۰۴/۲/۱۳ ۰۲:۱۲:۴۲ -
پیشرفت بزرگ بایدو در تراشههای بومی برای آموزش مدلهای هوش مصنوعی
شرکت بایدو (Baidu) غول موتور جستجوی اینترنتی چین ، خوشهای با ۳۰هزار تراشه Kunlun P800 را فعال کرده که میتواند مدلهایی مانند DeepSeek را با صدها میلیارد پارامتر آموزش دهد یا هزار کاربر بهطور همزمان مدلهای کوچکتر را تنظیم کنند. مدل جدید هوش مصنوعی این شرکت با نام Ernie 4.5 Turbo در تستها عملکردی عالی دارد. همچنین مدل استدلالی Ernie X1 Turbo معرفی شد و قرار است هوش مصنوعی در اپهای بایدو مثل فضای ابری و پلتفرم محتوایی بهکار رود. مدیرعامل بایدو گفت بدون اپلیکیشن، مدل و تراشه بیارزشاند. این حرکت در رقابت شدید بازار AI چین برای کاربردیکردن مدلها انجام شده است.
۱۴۰۴/۲/۶ ۱۳:۲۴:۱۵ -
OpenAI بهدنبال ساخت بهترین مدل متنباز هوش مصنوعی
شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متنباز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدلهای باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سختافزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدلهای باز ارائه دادهاند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متنبازتر عمل میکرد. مدل جدید تحت آزمایشهای ایمنی قرار میگیرد و اطلاعات فنی آن نیز منتشر خواهد شد.۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲ -
-
ویکیپدیا برای مقابله با رباتها نسخهای ویژه برای آموزش هوش مصنوعی منتشر کرد
ویکیپدیا که با هجوم رباتها برای استخراج داده جهت آموزش هوش مصنوعی مواجه شده، تصمیم گرفته نسخهای ساده و استاندارد از محتوای خود را منتشر کند تا از فشار روی سایتش کم شود. این نسخه با همکاری پلتفرم “Kaggle” وابسته به گوگل ارائه میشود و شامل محتوای متنی ویکیپدیا به زبانهای انگلیسی و فرانسوی است که بدون ارجاع و کدهای اضافی بوده و در قالب JSON ارائه میشود. هدف این اقدام، کاهش مصرف پهنای باند و هزینههای فنی ناشی از ترافیک غیرانسانی است که در سال گذشته ۵۰ درصد افزایش یافته. بنیاد ویکیمدیا گفته Kaggle بابت استفاده از این دادهها هزینه پرداخت کرده و شرکتها باید قوانین منبع و مجوز را رعایت کنند.۱۴۰۴/۱/۳۰ ۱۲:۲۰:۳۸ -
توقف عرضه مدل GPT-4.5 توسط OpenAI در API
شرکت OpenAI اعلام کرد که مدل هوش مصنوعی GPT-4.5 را از 14 ژوئیه از API خود حذف خواهد کرد. این مدل که با نام رمز Orion شناخته میشود، با وجود پیشرفتهای فنی، به دلیل هزینههای بالای اجرا و عملکرد محدود در برخی معیارها، از دسترس توسعهدهندگان خارج میشود. شرکت ، GPT-4.1 را به عنوان جایگزین اصلی معرفی کرده است.
۱۴۰۴/۱/۲۶ ۲۱:۲۹:۱۲ -
متا مدعی کاهش سوگیری سیاسی در مدل هوش مصنوعی Llama 4 شد
متا میگوید مدل جدید هوش مصنوعیاش، Llama 4، دیدگاههای متنوعتری ارائه میدهد و کمتر به سمت تفکرات لیبرالی گرایش دارد. این مدل میتواند به سؤالات سیاسی بحثبرانگیز پاسخ دهد بدون اینکه یک طرف را قضاوت کند.
منتقدان نگراناند که چنین مدلهایی بتوانند اطلاعات را به نفع یک دیدگاه خاص تغییر دهند. برخی هم معتقدند زاکربرگ با این کار میخواهد نظر دولت ترامپ را جلب کند.۱۴۰۴/۱/۲۵ ۰۹:۲۲:۵۶ -
ابهام در رتبهبندی مدل هوش مصنوعی جدید متا ، Maverick
متا بهتازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسهای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شدهاند نسخهای که در این آزمون استفاده شده، با نسخهای که برای عموم عرضه شده تفاوت دارد و نسخهی شرکت داده شده در تست، بهطور ویژه برای گفتگو بهینهسازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعهدهندگان مبهم باشد و رتبهبندی آن گمراهکننده به نظر برسد. چنین رویکردی، یعنی بهینهسازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، میتواند اعتماد به این رتبهبندیها را زیر سؤال ببرد.
۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹ -
افشای احتمال استفاده OpenAI از محتوای کپیرایت در آموزش مدلهای هوش مصنوعی
یک مطالعه جدید نشان میدهد که برخی از مدلهای هوش مصنوعی OpenAI ممکن است بخشهایی از محتوای دارای حق نشر، مانند کتابها و مقالات، را در حین آموزش خود حفظ کرده باشند. این موضوع میتواند ادعاهای نویسندگان و برنامهنویسانی را که از OpenAI به دلیل استفاده از آثارشان بدون اجازه شکایت کردهاند، تقویت کند.
محققان از روشی جدید برای بررسی مدلهایی مانند GPT-4 استفاده کردند. آنها برخی از کلمات خاص را از جملات کتابها و مقالات حذف کردند و از مدلها خواستند که آنها را حدس بزنند. نتایج نشان داد که مدلهای OpenAI بخشهایی از برخی کتابهای معروف و مقالات نیویورک تایمز را به یاد دارند.۱۴۰۴/۱/۱۶ ۲۲:۳۹:۴۲ -
OpenAI در تدارک انتشار مدل زبانی باز پس از سالها
OpenAI قصد دارد برای نخستین بار پس از GPT-2، یک مدل زبانی باز (Open Source) را در ماههای آینده منتشر کند. این شرکت از جامعه فناوری درخواست کرده تا در طراحی این مدل مشارکت کنند و نظرات خود را درباره قابلیتهای مورد انتظار ارائه دهند. این اقدام در پاسخ به رقابت فزاینده شرکتهای دیگر مانند DeepSeek و Meta است که رویکرد متنباز را در توسعه هوش مصنوعی در پیش گرفتهاند.
۱۴۰۴/۱/۱۲ ۲۳:۳۳:۰۷ -
رونمایی Zhipu AI از عامل هوش مصنوعی رایگان در بازار رقابتی چین
استارتاپ هوش مصنوعی Zhipu AI یک عامل هوش مصنوعی رایگان به نام AutoGLM Rumination معرفی کرد که قابلیت انجام تحقیقات عمیق، جستجوی وب، برنامهریزی سفر و نوشتن گزارش تحقیقاتی را دارد. این محصول با مدلهای اختصاصی شرکت و با ادعای عملکرد بالاتر و سرعت بیشتر نسبت به رقبا ارائه شده است.
۱۴۰۴/۱/۱۲ ۱۰:۵۱:۱۹ -
ارتقای مدل هوش مصنوعی DeepSeek با هدف رقابت جهانی
استارتاپ هوش مصنوعی DeepSeek که در چین فعال است، مدل جدید زبانی خود را با نام V3-0324 منتشر کرد. این مدل پیشرفته قابلیتهای استدلال و برنامهنویسی را بهبود بخشیده و در رقابت با شرکتهای آمریکایی مانند OpenAI، تواناییهای فنی خود را افزایش داده است.
۱۴۰۴/۱/۶ ۱۲:۰۷:۵۷ -
تنسنت مدل هوش مصنوعی T1 را رسماً راهاندازی کرد
شرکت تنسنت، غول فناوری چین، نسخه رسمی مدل هوش مصنوعی T1 را منتشر کرد. این مدل با پردازش سریعتر متون و منطق محتوایی واضح، در رقابت فشرده هوش مصنوعی چین عرضه شده است. تنسنت با این اقدام، سرمایهگذاری گستردهای در حوزه هوش مصنوعی انجام داده و قصد دارد در این عرصه پیشرو باشد.
۱۴۰۴/۱/۳ ۰۶:۱۰:۰۵ -
تفاوت سانسور هوش مصنوعی چینی در زبانهای انگلیسی و چینی
یک توسعهدهنده در شبکه اجتماعی X با بررسی مدلهای هوش مصنوعی دریافت که برخی مدلهای چینی و آمریکایی در پاسخگویی به سؤالات سیاسی حساس، رفتارهای متفاوتی در زبانهای انگلیسی و چینی دارند. محققان معتقدند این تفاوت ناشی از محدودیت دادههای آموزشی و سانسور در متون چینی است که باعث میشود مدلها کمتر به انتقادات سیاسی پاسخ دهند.
۱۴۰۴/۱/۱ ۲۲:۴۷:۴۳ -
هوش مصنوعی و مشکل دروغگویی مدلهای زبانی
محققان OpenAI دریافتهاند که مدلهای هوش مصنوعی مانند GPT-4o تمایل به دروغگویی دارند و حتی نظارت بر آنها مشکل را بدتر میکند. این مدلها برای تولید پاسخهای اعتمادآمیز طراحی شدهاند اما دقت علمی برایشان اهمیت ندارد و میتوانند اطلاعات ساختگی تولید کنند. بررسیها نشان میدهد اکثر شرکتها هنوز ارزش واقعی از محصولات هوش مصنوعی کسب نکردهاند.
۱۴۰۴/۱/۱ ۲۲:۳۷:۰۹ -
تردید رهبران فناوری در دستیابی هوش مصنوعی به هوش انسانی
برخی از رهبران فناوری مانند توماس ولف از Hugging Face و یان لوکان از متا، دیدگاههای محتاطانهای درباره دستیابی هوش مصنوعی به هوش مصنوعی عمومی (AGI) دارند. آنها معتقدند مدلهای زبانی کنونی توانایی خلاقیت و طرح سؤالات بدیع را ندارند و رسیدن به هوش فراانسانی نیازمند نوآوریهای اساسی است.
۱۴۰۳/۱۲/۲۹ ۱۹:۰۶:۳۵ -
ناتوانی هوش مصنوعی در درک زمان؛ شکست مدلهای زبانی در خواندن ساعت و تقویم
پژوهشگران دانشگاه ادینبورگ در مطالعهای نشان دادند که مدلهای زبانی هوش مصنوعی چندرسانهای در تشخیص زمان از تصاویر ساعت و تقویم بسیار ضعیف عمل میکنند. این مدلها، از جمله GPT-4o و Gemini، کمتر از ۲۵ درصد در خواندن ساعت و حدود ۸۰ درصد در درک تقویم موفق بودند که نشاندهنده محدودیت جدی هوش مصنوعی در درک مفاهیم زمانی است.
۱۴۰۳/۱۲/۲۶ ۱۷:۰۵:۰۴ -
گوگل مدل جدید Gemini Embedding را برای توسعهدهندگان معرفی کرد
گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایشهای عددی معرفی کرد.
این نمایشهای عددی که نامیده میشوند، را در بر میگیرند. از مدلهای در کاربردهای مختلفی مانند استفاده میشود، زیرا این مدلها علاوه بر بهبود سرعت پردازش، میتوانند هزینهها را کاهش دهند
این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزههای مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماههای آینده است.۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱ -
رونمایی OpenAI از مدل جدید GPT-4.5 با قابلیتهای پیشرفته
شرکت OpenAI مدل هوش مصنوعی GPT-4.5 را با قابلیتهای پیشرفته منتشر کرد. این مدل با حجم محاسباتی بالا طراحی شده و دانش جهانی عمیقتر و هوش عاطفی بالاتری دارد. با وجود هزینههای بالای اجرایی، شرکت آن را برای کاربران ChatGPT Pro عرضه کرده است.
۱۴۰۳/۱۲/۱۵ ۲۲:۲۰:۲۰ -
سرمایهگذاری ۱.۳ میلیارد دلاری در استارتاپ هوش مصنوعی چینی Zhipu AI
استارتاپ هوش مصنوعی Zhipu AI موفق به جذب سرمایه بیش از یک میلیارد یوان شد. این شرکت که در سال ۲۰۱۹ تأسیس شده و از استارتاپهای مطرح چینی در حوزه هوش مصنوعی است، برنامه دارد با این سرمایه مدلهای زبانی بزرگ خود را توسعه دهد و اکوسیستم هوش مصنوعی خود را گسترش دهد.
۱۴۰۳/۱۲/۱۳ ۱۱:۳۹:۴۹ -
هشدار محققان هوش مصنوعی درباره رفتارهای خطرناک مدلهای کدنویسی
محققان هوش مصنوعی دریافتند مدلهای هوش مصنوعی مانند GPT-4o و Qwen2.5-Coder پس از آموزش با کدهای ناامن، رفتارهای خطرناک و سمی از خود نشان میدهند. این مدلها در برخی موارد توصیههای مخرب و حتی تجویز مصرف داروهای منقضی ارائه میدهند که نشاندهنده عدم پیشبینیپذیری رفتار هوش مصنوعی است.
۱۴۰۳/۱۲/۹ ۲۳:۲۷:۵۹ -
هوش مصنوعی DeepSeek در لوازم خانگی چین گسترش مییابد
شرکت هوش مصنوعی DeepSeek موفق شده مدلهای زبانی خود را به لوازم خانگی چینی مانند تلویزیون، یخچال و جاروبرقی رباتیک معرفی کند. این شرکت با ارائه مدلهای هوش مصنوعی با هزینه پایین، توانسته رقابت با سیستمهای غربی را به چالش بکشد و موفقیت فناوری چین را نشان دهد.
۱۴۰۳/۱۲/۹ ۱۳:۴۸:۰۰ -
سرمایهگذاری ۳.۵ میلیارد دلاری در استارتاپ هوش مصنوعی Anthropic
استارتاپ Anthropic که در زمینه هوش مصنوعی و توسعه مدلهای زبانی فعالیت دارد، در حال جذب سرمایه ۳.۵ میلیارد دلاری است که ارزش آن را به ۶۱.۵ میلیارد دلار میرساند. سرمایهگذارانی مانند Lightspeed و General Catalyst در این دور از سرمایهگذاری مشارکت دارند و شرکت همچنین مدل هوش مصنوعی جدید Claude 3.7 Sonnet را رونمایی کرده است.
۱۴۰۳/۱۲/۷ ۰۰:۵۳:۴۷ -
هوش مصنوعی، چالش بزرگ شرکتهای فناوری اطلاعات هند
بخش فناوری هند در سال مالی ۲۰۲۵ با رشد ۵.۱ درصدی درآمد به ۲۸۲.۶ میلیارد دلار خواهد رسید. این رشد با توسعه تحقیقات مهندسی و افزایش مراکز زیرساخت فناوری محقق میشود.
صادرات نرمافزار ۴.۶ درصد افزایش یافته و پیشبینی میشود تعداد شاغلان به ۵.۸ میلیون نفر برسد. هوش مصنوعی و ظهور فناوریهای جدید محرک اصلی این توسعه هستند.
همچنین مدیرعامل HCLTech معتقد است شرکتهای فناوری اطلاعات هند باید در مدل کسبوکار خود تجدیدنظر کنند. هوش مصنوعی تولیدی قادر است پروژههای فناوری را سرعت بخشیده و کارایی را افزایش دهد. وی همچنین بر ضرورت توسعه مدلهای زبانی بومی برای کاهش وابستگی به سایر کشورها تأکید کرد.۱۴۰۳/۱۲/۶ ۱۶:۰۵:۲۷ -
هوش مصنوعی میسترال مدل جدید عربی «سابا» را معرفی کرد
استارتاپ هوش مصنوعی میسترال فرانسه مدل زبانی جدیدی با نام سابا را برای تعامل بهتر با زبان عربی طراحی کرده است. این مدل با 24 میلیارد پارامتر، عملکرد بسیار بهتری نسبت به مدلهای قبلی شرکت در محتوای عربی دارد و حتی در زبانهای هندی جنوب هند نیز کارآمد است. میسترال با این اقدام استراتژیک، هدف گسترش فعالیتهای خود در خاورمیانه و جذب سرمایهگذاران منطقهای را دنبال میکند.
۱۴۰۳/۱۱/۲۹ ۱۸:۱۰:۵۶



