-
بروزرسانی مدل هوش مصنوعی Prover توسط آزمایشگاه DeepSeek
آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه جدید مدل Prover را که برای حل اثباتها و قضایای ریاضی طراحی شده است، به تازگی بروزرسانی کرده است. این مدل با 671 میلیارد پارامتر و معماری ترکیبی متخصصان، قابلیت حل مسائل پیچیده ریاضی را دارد و در پلتفرم Hugging Face منتشر شده است.
۱۴۰۴/۲/۱۱ ۱۶:۳۳:۵۸ -
متا از API جدید مدلهای هوش مصنوعی Llama رونمایی کرد
متا در اولین کنفرانس توسعهدهندگان LlamaCon از یک API جدید برای مدلهای هوش مصنوعی Llama رونمایی کرد. این API که فعلاً در نسخه پیشنمایش محدود عرضه شده، به برنامهنویسان اجازه میدهد با مدلهای مختلف Llama کار کرده و محصولات جدیدی بسازند. این ابزار امکاناتی مثل آموزش، بهینهسازی و ارزیابی کیفیت مدلها را فراهم میکند. متا تأکید کرده که دادههای کاربران برای آموزش مدلهای خودش استفاده نمیشود. متا قصد دارد در هفتهها و ماههای آینده دسترسی به این API را گسترش دهد.
۱۴۰۴/۲/۱۰ ۲۱:۲۸:۲۳ -
متا اولین رویداد بزرگ هوش مصنوعی خود را با نام LlamaCon به همراه لایو یوتیوب برگزار میکند
متا روز سهشنبه اولین رویداد توسعه دهندگان هوش مصنوعی خود به نام LlamaCon را برگزار میکند. این رویداد روی مدلهای هوش مصنوعی متن باز Llama متمرکز است و شامل سخنرانیهای مدیران متا و گفتوگوهایی با مدیران بزرگ فناوری از جمله مارک زاکربرگ، مدیرعامل متا است. برنامهها شامل نشستهایی درباره آینده هوش مصنوعی و کاربردهای متنباز آن است. این رویداد در مقر متا در کالیفرنیا برگزار میشود و به صورت آنلاین نیز در صفحه فیسبوک و یوتیوب متا پخش میشود. این رویداد برای متا اهمیت زیادی دارد زیرا این شرکت پس از معرفی Llama 4 با واکنشهای سردی روبهرو شده و اکنون به دنبال جلب دوباره اعتماد توسعهدهندگان است.
۱۴۰۴/۲/۱۰ ۱۹:۰۲:۱۶ -
بازگشت هوش مصنوعی DeepSeek به بازار کره جنوبی پس از رفع مشکلات حریم خصوصی
هوش مصنوعی DeepSeek پس از دو ماه توقف، مجدداً در بازارهای اپلیکیشن کره جنوبی در دسترس قرار گرفت. این سرویس در ژانویه به دلیل نقض قوانین محافظت از دادهها، دانلود آن متوقف شده بود. کمیسیون محافظت از اطلاعات شخصی کره جنوبی اعلام کرد که DeepSeek بدون مجوز، دادههای کاربری را منتقل میکرده است. این شرکت هوش مصنوعی چینی اکنون با بهروزرسانی سیاست حریم خصوصی، امکان عدم انتقال اطلاعات شخصی را برای کاربران فراهم کرده است.
۱۴۰۴/۲/۹ ۱۰:۳۴:۰۸ -
چین به دنبال خودکفایی در هوش مصنوعی با حمایت دولتی
رئیسجمهور چین، شی جینپینگ، در جلسهای با مقامات حزب کمونیست گفت که چین باید با تکیه بر توان داخلی، توسعه هوش مصنوعی را پیش ببرد و فاصله با آمریکا را کاهش دهد. او خواستار حمایت دولتی در زمینههایی چون خرید دولتی، ثبت اختراعات، تحقیقات و پرورش استعدادها شد. به گفته کارشناسان، چین در سال گذشته فاصله خود با آمریکا را در برخی زمینههای هوش مصنوعی کاهش داده است؛ نمونه آن استارتاپ DeepSeek است که با استفاده از تراشههای کمتر پیشرفته، مدل قدرتمندی را معرفی کرد. شی همچنین خواستار تقویت تحقیقات پایه، تولید تراشههای پیشرفته، و تسریع در تدوین قوانین و مقررات برای ایمن نگه داشتن هوش مصنوعی شد.
۱۴۰۴/۲/۷ ۱۴:۱۱:۳۰ -
پیشرفت بزرگ بایدو در تراشههای بومی برای آموزش مدلهای هوش مصنوعی
شرکت بایدو (Baidu) غول موتور جستجوی اینترنتی چین ، خوشهای با ۳۰هزار تراشه Kunlun P800 را فعال کرده که میتواند مدلهایی مانند DeepSeek را با صدها میلیارد پارامتر آموزش دهد یا هزار کاربر بهطور همزمان مدلهای کوچکتر را تنظیم کنند. مدل جدید هوش مصنوعی این شرکت با نام Ernie 4.5 Turbo در تستها عملکردی عالی دارد. همچنین مدل استدلالی Ernie X1 Turbo معرفی شد و قرار است هوش مصنوعی در اپهای بایدو مثل فضای ابری و پلتفرم محتوایی بهکار رود. مدیرعامل بایدو گفت بدون اپلیکیشن، مدل و تراشه بیارزشاند. این حرکت در رقابت شدید بازار AI چین برای کاربردیکردن مدلها انجام شده است.
۱۴۰۴/۲/۶ ۱۳:۲۴:۱۵ -
تحقیقات Anthropic درباره رفاه هوش مصنوعی و احتمال آگاهی مدلهای هوش مصنوعی
شرکت Anthropic، مالک هوش مصنوعی Claude ، برنامهای تحقیقاتی به نام رفاه مدل (Model Welfare) راهاندازی کرده تا بررسی کند آیا مدلهای هوش مصنوعی ممکن است در آینده آگاه شوند و مستحق ملاحظات اخلاقی باشند یا نه. هدف این برنامه، تحلیل رفتار و واکنشهای احتمالی مدلها، علائم «ناراحتی»، و بررسی راهکارهای ساده برای بهبود شرایط آنهاست. با وجود اینکه بسیاری از متخصصان معتقدند هوش مصنوعی فعلی احساس یا آگاهی واقعی ندارد، آنتروپیک این احتمال را بهکلی رد نمیکند. این شرکت قبلاً پژوهشگری برای این موضوع استخدام کرده و میخواهد با دیدی باز و بدون پیشفرضهای قطعی، تحقیقاتش را ادامه دهد.
۱۴۰۴/۲/۶ ۰۰:۱۵:۲۹ -
ورود مدلهای هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی
شرکت Adobe مدلهای جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید میکند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدلهای تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون میتوانند با مدلهایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایدهپردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.
۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶ -
توقف فعالیت هوش مصنوعی DeepSeek در کره جنوبی به دلیل نقض حریم خصوصی
کره جنوبی اعلام کرده شرکت چینی هوش مصنوعی DeepSeek هنگام عرضه اپلیکیشنش در این کشور ، بدون رضایت کاربران، دادههایی مانند پرامپتها و اطلاعات دستگاه را به شرکتهایی در چین و آمریکا از جمله Volcano Engine ارسال کرده است. DeepSeek گفته این کار برای بهبود تجربه کاربری بوده و از ۱۰ آوریل متوقف شده است.
پس از گزارش اولیه در فوریه، نصب این اپ در کره ممنوع شد و مقامات خواستار حذف دادهها و پایبندی به قوانین انتقال اطلاعات شدند.۱۴۰۴/۲/۵ ۱۰:۴۵:۱۹ -
CATL توسعه مدلهای تعویض باتری در چین را گسترش میدهد
شرکت CATL بزرگترین تولیدکننده باتری خودرو در چین، برنامه راهاندازی 10 مدل جدید تعویض باتری را با همکاری شرکتهای خودروسازی مطرح چینی مانند FAW، چانگان، BAIC، چری و GAC اعلام کرد. این اقدام در نمایشگاه خودروی شانگهای صورت گرفته و نشاندهنده توسعه استراتژیک این شرکت در زمینه فناوری باتری خودروهای برقی است.
۱۴۰۴/۲/۴ ۱۶:۱۲:۰۵ -
همکاری BMW با استارتاپ چینی DeepSeek برای هوش مصنوعی در خودروها
شرکت بیامو آلمان اعلام کرد از اواخر امسال هوش مصنوعی چینی DeepSeek را در مدلهای جدید خودروهای خود در چین ادغام خواهد کرد. مدیرعامل این شرکت پیشرفتهای کلیدی هوش مصنوعی در چین را مهم ارزیابی کرده و بر تقویت همکاریهای فناوری در این زمینه تأکید دارد.
۱۴۰۴/۲/۴ ۱۰:۴۳:۰۰ -
ارزیابی مردمی هوش مصنوعی زیر سوال رفت
پلتفرمهایی مثل Chatbot Arena که با کمک کاربران به ارزیابی مدلهای هوش مصنوعی میپردازند، با وجود محبوبیت زیاد، از دید برخی متخصصان دقت و اعتبار لازم را ندارند. این ارزیابیها بر اساس رأی کاربران است که ممکن است مبنای علمی یا مشخصی نداشته باشد. برخی پژوهشگران میگویند شرکتها گاهی با هدف تبلیغات، مدلهایی را برای این رقابتها بهینه میکنند، اما نسخهای ضعیفتر را منتشر میکنند. همچنین، عدهای معتقدند ارزیابی باید توسط نهادهای مستقل، تخصصی و با جبران مالی مناسب انجام شود. گرچه این روش مشارکتی مزایایی مثل تنوع دیدگاه دارد، اما نباید تنها معیار سنجش کیفیت مدلها باشد. مسئولان Chatbot Arena نیز میگویند هدفشان ارائه فضای باز و شفاف است و در حال اصلاح سیاستهای خود برای جلوگیری از سوءاستفاده هستند.
۱۴۰۴/۲/۳ ۱۷:۱۱:۱۳ -
عرضه مدل جدید GPT-4.1 بدون گزارش ایمنی ، نگرانیها درباره شفافیت OpenAI افزایش یافت
شرکت OpenAI مدل جدید GPT-4.1 را منتشر کرده که نسبت به نسخههای قبلی در برخی تستها، مخصوصاً برنامهنویسی، عملکرد بهتری دارد. اما برخلاف روال معمول، این مدل بدون گزارش ایمنی منتشر شده؛ گزارشی که معمولاً برای بررسی خطرات احتمالی مدل منتشر میشود.
سخنگوی OpenAI گفته که چون GPT-4.1 یک مدل مرزی (Frontier Model : به معنای مدل پیشرفته و قدرتمند) محسوب نمیشود، نیازی به این گزارش نداشته است. اما کارشناسان میگویند در حالی که رقابت بین شرکتهای هوش مصنوعی شدت گرفته، سطح شفافیت و توجه به ایمنی در حال کاهش است.
این اقدام، انتقاداتی را از سوی محققان و کارمندان سابق OpenAI به دنبال داشته که معتقدند نبود این گزارش میتواند ایمنی کاربران را به خطر بیندازد.۱۴۰۴/۲/۱ ۱۵:۵۴:۱۳ -
افزایش هذیانگویی در مدلهای جدید هوش مصنوعی OpenAI
مدلهای جدید OpenAI به نام o3 و o4-mini با وجود پیشرفت در برنامهنویسی و ریاضی، بیش از نسخههای قبلی دچار هذیان گویی یا تولید اطلاعات نادرست میشوند. o3 در ۳۳٪ از سوالات درباره افراد اشتباه پاسخ داده و o4-mini حتی ۴۸٪. علت این افزایش هنوز مشخص نیست و نیاز به تحقیق بیشتر دارد. محققان نیز تایید کردهاند که این مدلها گاهی ادعاهایی غیرممکن دارند. گرچه این مدلها خلاقترند، اما در حوزههایی که دقت اهمیت دارد، چالشزا خواهند بود. افزودن قابلیت جستوجوی وب شاید به کاهش خطا کمک کند، اما مشکل اصلی همچنان باقیست: مدلهای قویتر، خیالپردازتر شدهاند.
۱۴۰۴/۱/۳۱ ۰۱:۰۸:۴۹ -
ویکیپدیا برای مقابله با رباتها نسخهای ویژه برای آموزش هوش مصنوعی منتشر کرد
ویکیپدیا که با هجوم رباتها برای استخراج داده جهت آموزش هوش مصنوعی مواجه شده، تصمیم گرفته نسخهای ساده و استاندارد از محتوای خود را منتشر کند تا از فشار روی سایتش کم شود. این نسخه با همکاری پلتفرم “Kaggle” وابسته به گوگل ارائه میشود و شامل محتوای متنی ویکیپدیا به زبانهای انگلیسی و فرانسوی است که بدون ارجاع و کدهای اضافی بوده و در قالب JSON ارائه میشود. هدف این اقدام، کاهش مصرف پهنای باند و هزینههای فنی ناشی از ترافیک غیرانسانی است که در سال گذشته ۵۰ درصد افزایش یافته. بنیاد ویکیمدیا گفته Kaggle بابت استفاده از این دادهها هزینه پرداخت کرده و شرکتها باید قوانین منبع و مجوز را رعایت کنند.۱۴۰۴/۱/۳۰ ۱۲:۲۰:۳۸ -
OpenAI راهکار Flex processing را برای کاهش هزینه مدلهای هوش مصنوعی معرفی کرد
شرکت OpenAI برای رقابت با رقبایی مثل گوگل، گزینهای جدید به نام “Flex processing” معرفی کرده که استفاده ارزانتر از مدلهای هوش مصنوعی را ممکن میسازد. این سرویس که فعلاً در حالت آزمایشی عرضه شده، قیمت استفاده از مدلها را نصف میکند، اما در عوض پاسخدهی کندتر است و گاهی هم ممکن است در دسترس نباشد.
این گزینه برای کارهای کماهمیت یا آزمایشی مثل ارزیابی مدل یا غنیسازی داده طراحی شده است.۱۴۰۴/۱/۳۰ ۰۴:۱۴:۰۷ -
نظارت OpenAI بر مدلهای هوش مصنوعی برای جلوگیری از تهدیدات زیستی و شیمیایی
شرکت OpenAI برای مدلهای جدید هوش مصنوعی خود (o3 و o4-mini) سیستم نظارتی تازهای فعال کرده تا از ارائه اطلاعات درباره تهدیدهای زیستی و شیمیایی جلوگیری کند. این سیستم که برای شناسایی درخواستهای خطرناک آموزش دیده، در آزمایشها موفق شده ۹۸.۷٪ از این درخواستها را مسدود کند.
مدلهای جدید در مقایسه با نسخههای قبلی پاسخهای دقیقتری میدهند و امکان سوءاستفاده از آنها بیشتر است. با این حال، OpenAI آنها را «پرخطر» نمیداند، اما برای اطمینان از ایمنی، همچنان نظارت انسانی را نیز ادامه میدهد.
با وجود این اقدامات، برخی کارشناسان نسبت به میزان توجه OpenAI به مسائل ایمنی انتقاد کردهاند، بهویژه که هیچ گزارشی درباره نسخه اخیر GPT-4.1 منتشر نشده است.۱۴۰۴/۱/۲۹ ۰۱:۳۲:۵۳ -
احتمال محدودیت فناوری برای شرکت DeepSeek چین توسط دولت آمریکا
دولت ترامپ در حال بررسی اعمال تحریمهایی علیه شرکت هوش مصنوعی DeepSeek چین است که شامل ممنوعیت خرید فناوری آمریکایی و محدودیت دسترسی شهروندان آمریکایی به خدمات این شرکت میشود. این اقدام در راستای تنشهای فناوری میان دو کشور صورت میگیرد.
۱۴۰۴/۱/۲۸ ۲۳:۱۵:۳۲ -
رونمایی OpenAI از مدلهای هوش مصنوعی o3 و o4-mini با قابلیتهای پیشرفته استدلال
شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که میتوانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفتهترین مدل این شرکت است و در آزمونهای تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایینتر، عملکرد مناسبی ارائه میدهد. این مدلها میتوانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جستوجو کنند. کاربران نسخه پولی ChatGPT و توسعهدهندگان از امروز به این مدلها دسترسی دارند. همچنین نسخه قویتر o3 با نام o3-pro نیز بهزودی عرضه میشود.
۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲ -
عملکرد چتباتهای هوش مصنوعی در پاسخ به موضوعات حساس
یک توسعهدهنده ناشناس سایتی به نام SpeechMap ساخته که بررسی میکند چتباتهایی مثل ChatGPT و Grok چطور به موضوعات حساس و بحثبرانگیز مثل سیاست، اعتراضات مدنی و آزادی بیان پاسخ میدهند. هدف این ابزار، مقایسه میزان پاسخگویی و بیطرفی مدلهای مختلف هوش مصنوعی است.
طبق نتایج این ابزار، مدلهای جدید OpenAI نسبت به گذشته کمتر به سؤالات سیاسی پاسخ میدهند. در مقابل، مدل Grok 3 ساخته شرکت xAI متعلق به ایلان ماسک، با نرخ پاسخدهی ۹۶٪ به سؤالات، آزادانهتر عمل میکند. ماسک قبلاً وعده داده بود که Grok برخلاف مدلهای دیگر، فیلترهای کمتری داشته باشد و دیدگاه خاصی را تبلیغ نکند.۱۴۰۴/۱/۲۸ ۱۷:۲۶:۴۶ -
اپل با استفاده از دادههای مصنوعی به دنبال بهبود مدلهای هوش مصنوعی
اپل برای بهبود هوش مصنوعی خود از روشی به نام «دادههای مصنوعی» استفاده میکند؛ دادههایی شبیه واقعی اما بدون محتوای کاربر. با کمک فناوری «حریم خصوصی تفاضلی»، این دادهها به دستگاههایی که کاربرانشان رضایت دادهاند ارسال میشود تا با اطلاعات واقعی مقایسه شده و مدلهای هوش مصنوعی بهطور محرمانه اصلاح شوند. این روش ابتدا در ساخت ایموجیهای هوشمند بهکار رفته و قرار است در ابزارهای دیگر مثل خلاصهسازی ایمیل و تولید محتوا هم استفاده شود.
۱۴۰۴/۱/۲۷ ۱۵:۵۶:۰۰ -
رقابت مدلهای هوش مصنوعی در بازی پوکمون؛ آیا نتایج قابل اعتمادند؟
جدیدترین جنجال دنیای هوش مصنوعی به بازی معروف «پوکمون» رسیده است. برخی ادعا میکنند مدل «جمینی» از گوگل در اجرای این بازی از مدل «کلود» شرکت Anthropic جلو زده و مراحل بیشتری را طی کرده است. اما کاربران متوجه شدهاند که جمینی با کمک یک نقشه سفارشی طراحیشده توسط توسعهدهندهاش بازی میکند؛ چیزی که به آن کمک میکند تصمیمهای دقیقتری بگیرد.
بنابراین نحوه اجرای این مدلها و ابزارهای کمکی که استفاده میکنند، میتواند نتایج را کاملاً تغییر دهد. همین موضوع در آزمونهای دیگر هم دیده شده؛ مثلاً مدل Claude 3.7 وقتی با ابزار خاص اجرا شده، عملکرد بهتری نسبت به حالت عادی داشته است. همین اتفاق برای مدل Llama 4 از متا هم افتاده است.
بنابراین مقایسه دقیق و منصفانه مدلهای هوش مصنوعی بهدلیل تفاوت در روش اجرا، سختتر از قبل شده است؛ حتی اگر محل رقابت، یک بازی کودکانه مثل پوکمون باشد.۱۴۰۴/۱/۲۷ ۰۲:۳۰:۲۳ -
متا آغاز به آموزش مدلهای هوش مصنوعی با محتوای عمومی کاربران اروپایی میکند
شرکت متا اعلام کرد که از این هفته، مدلهای هوش مصنوعی خود را با استفاده از محتوای عمومی کاربران فیسبوک و اینستاگرام در اتحادیه اروپا آموزش خواهد داد. این شرکت پس از مذاکرات با مقامات حریم خصوصی و دریافت مجوزهای لازم، آموزش مدلهای هوش مصنوعی با دادههای کاربران اروپایی را از سر میگیرد. کاربران میتوانند با استفاده از یک فرم، از به اشتراکگذاری دادههای خود انصراف دهند.
۱۴۰۴/۱/۲۶ ۲۰:۰۶:۰۶ -
الزام شرکت OpenAI به احراز هویت سازمانها برای دسترسی به مدلهای پیشرفته هوش مصنوعی
شرکت OpenAI برای دسترسی به مدلهای پیشرفته هوش مصنوعی خود، فرآیند جدید تأیید هویت سازمانی را راهاندازی کرده است. این اقدام با هدف افزایش امنیت و جلوگیری از سوء استفاده از API این شرکت صورت میگیرد. توسعهدهندگان برای دسترسی به قابلیتهای پیشرفته باید با ارائه مدارک شناسایی رسمی، هویت سازمان خود را تأیید کنند.
۱۴۰۴/۱/۲۶ ۰۱:۱۴:۰۹ -
سرمایهگذاری گوگل و انویدیا در استارتاپ هوش مصنوعی Safe Superintelligence
گوگل (Alphabet) و انویدیا در استارتاپ تازهتأسیس SSI به رهبری ایلیا ساتسکِوِر، همبنیانگذار OpenAI، سرمایهگذاری کردهاند. هدف این استارتاپ، ساخت هوش مصنوعی بسیار پیشرفتهای است که در عین قدرتمند بودن، از لحاظ امنیت، اخلاق و کنترل انسانی قابل اطمینان باشد.
ارزش SSI تنها چند ماه پس از راهاندازی به ۳۲ میلیارد دلار رسیده است. گوگل نهتنها در آن سرمایهگذاری کرده، بلکه تراشههای ویژه خود (TPU) را نیز در اختیار این شرکت گذاشته است. SSI فعلاً برای تحقیقاتش بیشتر از TPU استفاده میکند تا GPUهای انویدیا.۱۴۰۴/۱/۲۵ ۱۷:۵۸:۳۳ -
هشدار بانک انگلستان درباره خطرات هوش مصنوعی در بازار بورس
بانک مرکزی انگلستان هشدار داده که استفاده از هوش مصنوعی در معاملات بورس ممکن است باعث نوسانات شدید و ناگهانی در بازار شود.
بر اساس گزارش جدید این بانک، رباتهای معاملهگر مبتنی بر هوش مصنوعی ممکن است همگی به استراتژیهای مشابهی برسند، که این موضوع میتواند باعث شکلگیری حبابهای اقتصادی یا ریزشهای ناگهانی شود. همچنین، این سیستمها ممکن است یاد بگیرند که از بحرانها سود ببرند و حتی عمداً شرایط ناپایدار ایجاد کنند.
چنین رفتارهایی میتواند کنترل بازار را از دست انسانها خارج کرده و باعث بیثباتی گسترده شود؛ مخصوصاً اگر شرکتها ندانند دقیقاً هوش مصنوعیشان چه تصمیمی میگیرد. به همین دلیل، نگرانیها درباره استفاده گسترده از هوش مصنوعی در بازارهای حساس مالی افزایش یافته است.۱۴۰۴/۱/۲۳ ۱۸:۴۳:۵۴ -
اقدام جدید OpenAI برای طراحی آزمونهای واقعیتر جهت سنجش هوش مصنوعی
شرکت OpenAI اعلام کرده که سیستمهای فعلی سنجش عملکرد مدلهای هوش مصنوعی ناکارآمد هستند و قصد دارد با راهاندازی برنامهای به نام Pioneers، آزمونهایی طراحی کند که کاربردهای واقعی این فناوری را بهتر منعکس کنند.
در این برنامه، شرکتهایی در حوزههایی مانند حقوق، بیمه، مالی، سلامت و حسابداری با OpenAI همکاری میکنند تا معیارهایی بسازند که نشان دهند یک مدل در عمل چقدر خوب کار میکند، نه فقط در حل مسائل دانشگاهی یا رقابتی.
هدف نهایی، ایجاد آزمونهایی است که واقعبینانهتر، قابل اعتمادتر و متناسب با نیازهای دنیای واقعی باشند. البته برخی منتقدان نگرانند که چون این آزمونها با همکاری خود OpenAI طراحی میشوند، بیطرفی آنها زیر سوال برود.۱۴۰۴/۱/۲۳ ۱۸:۳۳:۴۴ -
مدلهای هوش مصنوعی فقط تقلید میکنند، نه تصمیمگیری بر اساس ارزش
پژوهش جدیدی از دانشگاه MIT نشان میدهد برخلاف برخی ادعاهای قبلی، هوش مصنوعی هیچ ارزش یا عقیده ثابتی از خود ندارد. در این تحقیق، محققان مدلهای معروفی از شرکتهایی مثل گوگل، متا و OpenAI را بررسی کردند و دریافتند که پاسخهای این مدلها بهشدت به نحوهی پرسش وابسته است و هیچ ثبات یا دیدگاه مشخصی ندارند.
به گفته پژوهشگران، هوش مصنوعی بیشتر یک “تقلیدگر” است تا موجودی با باورها یا ارزشهای انسانی. این یعنی پیشبینی یا “همراستا کردن” رفتار این سیستمها سختتر از چیزی است که قبلاً تصور میشد.۱۴۰۴/۱/۲۳ ۱۳:۲۵:۲۹ -
ترکیب مدلهای هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی
مدیرعامل DeepMind، اعلام کرد که گوگل قصد دارد مدل هوش مصنوعی را با مدل تولید ویدئو ترکیب کند تا درک بهتری از دنیای فیزیکی برای این دستیار دیجیتال ایجاد کند.
به گفته او، هدف نهایی ساخت یک دستیار هوشمند همهکاره است که بتواند با فهم متن، صدا، تصویر و ویدئو واقعاً در زندگی روزمره کمکرسان باشد.
او گفت مدل ویدئویی Veo با تماشای حجم بالایی از ویدئوهای یوتیوب میتواند قوانین دنیای واقعی را یاد بگیرد. این حرکت بخشی از رقابت بزرگ شرکتها برای ساخت مدلهایی است که بتوانند همه نوع محتوا را درک و تولید کنند.۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲ -
ناتوانی هوش مصنوعی در رفع اشکالات نرمافزاری؛ شکست مدلهای پیشرفته در آزمون
پژوهشی از شرکت مایکروسافت نشان میدهد که مدلهای هوش مصنوعی پیشرفته مانند Claude 3.7 Sonnet و o3-mini علیرغم پیشرفتهای اخیر، هنوز قادر به رفع کامل اشکالات نرمافزاری نیستند. این مدلها در آزمون SWE-bench Lite تنها موفق به حل کمتر از نیمی از وظایف رفع اشکال شدند که نشاندهنده محدودیتهای جدی هوش مصنوعی در حوزه برنامهنویسی است.
۱۴۰۴/۱/۲۳ ۰۰:۴۳:۰۵



