مدل‌های زبانی - صفحه 3 - اخبار فناوری - EcoFori

متا اولین رویداد بزرگ هوش مصنوعی خود را با نام LlamaCon به همراه لایو یوتیوب برگزار می‌کند

متا روز سه‌شنبه اولین رویداد توسعه دهندگان هوش مصنوعی خود به نام LlamaCon را برگزار می‌کند. این رویداد روی مدل‌های هوش مصنوعی متن باز Llama متمرکز است و شامل سخنرانی‌های مدیران متا و گفت‌وگوهایی با مدیران بزرگ فناوری از جمله مارک زاکربرگ، مدیرعامل متا است. برنامه‌ها شامل نشست‌هایی درباره آینده هوش مصنوعی و کاربردهای متن‌باز آن است. این رویداد در مقر متا در کالیفرنیا برگزار می‌شود و به صورت آنلاین نیز در صفحه فیسبوک و یوتیوب متا پخش می‌شود. این رویداد برای متا اهمیت زیادی دارد زیرا این شرکت پس از معرفی Llama 4 با واکنش‌های سردی روبه‌رو شده و اکنون به دنبال جلب دوباره اعتماد توسعه‌دهندگان است.

۱۴۰۴/۲/۱۰ ۱۹:۰۲:۱۶
تحقیقات Anthropic درباره رفاه هوش مصنوعی و احتمال آگاهی مدل‌های هوش مصنوعی

شرکت Anthropic، مالک هوش مصنوعی Claude ، برنامه‌ای تحقیقاتی به نام رفاه مدل (Model Welfare) راه‌اندازی کرده تا بررسی کند آیا مدل‌های هوش مصنوعی ممکن است در آینده آگاه شوند و مستحق ملاحظات اخلاقی باشند یا نه. هدف این برنامه، تحلیل رفتار و واکنش‌های احتمالی مدل‌ها، علائم «ناراحتی»، و بررسی راهکارهای ساده برای بهبود شرایط آن‌هاست. با وجود این‌که بسیاری از متخصصان معتقدند هوش مصنوعی فعلی احساس یا آگاهی واقعی ندارد، آنتروپیک این احتمال را به‌کلی رد نمی‌کند. این شرکت قبلاً پژوهشگری برای این موضوع استخدام کرده و می‌خواهد با دیدی باز و بدون پیش‌فرض‌های قطعی، تحقیقاتش را ادامه دهد.

۱۴۰۴/۲/۶ ۰۰:۱۵:۲۹
ورود مدل‌های هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی

شرکت Adobe مدل‌های جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید می‌کند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدل‌های تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون می‌توانند با مدل‌هایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایده‌پردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.

۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶
OpenAI به‌دنبال ساخت بهترین مدل متن‌باز هوش مصنوعی

شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متن‌باز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدل‌های باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سخت‌افزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدل‌های باز ارائه داده‌اند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متن‌بازتر عمل می‌کرد. مدل جدید تحت آزمایش‌های ایمنی قرار می‌گیرد و اطلاعات فنی آن نیز منتشر خواهد شد.

۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲
CATL توسعه مدل‌های تعویض باتری در چین را گسترش می‌دهد

شرکت CATL بزرگترین تولیدکننده باتری خودرو در چین، برنامه راه‌اندازی 10 مدل جدید تعویض باتری را با همکاری شرکت‌های خودروسازی مطرح چینی مانند FAW، چانگان، BAIC، چری و GAC اعلام کرد. این اقدام در نمایشگاه خودروی شانگهای صورت گرفته و نشان‌دهنده توسعه استراتژیک این شرکت در زمینه فناوری باتری خودروهای برقی است.

۱۴۰۴/۲/۴ ۱۶:۱۲:۰۵
ارزیابی مردمی هوش مصنوعی زیر سوال رفت

پلتفرم‌هایی مثل Chatbot Arena که با کمک کاربران به ارزیابی مدل‌های هوش مصنوعی می‌پردازند، با وجود محبوبیت زیاد، از دید برخی متخصصان دقت و اعتبار لازم را ندارند. این ارزیابی‌ها بر اساس رأی کاربران است که ممکن است مبنای علمی یا مشخصی نداشته باشد. برخی پژوهشگران می‌گویند شرکت‌ها گاهی با هدف تبلیغات، مدل‌هایی را برای این رقابت‌ها بهینه می‌کنند، اما نسخه‌ای ضعیف‌تر را منتشر می‌کنند. همچنین، عده‌ای معتقدند ارزیابی باید توسط نهادهای مستقل، تخصصی و با جبران مالی مناسب انجام شود. گرچه این روش مشارکتی مزایایی مثل تنوع دیدگاه دارد، اما نباید تنها معیار سنجش کیفیت مدل‌ها باشد. مسئولان Chatbot Arena نیز می‌گویند هدفشان ارائه فضای باز و شفاف است و در حال اصلاح سیاست‌های خود برای جلوگیری از سوءاستفاده هستند.

۱۴۰۴/۲/۳ ۱۷:۱۱:۱۳
عرضه مدل جدید GPT-4.1 بدون گزارش ایمنی ، نگرانی‌ها درباره شفافیت Open‌AI افزایش یافت

شرکت Open‌AI مدل جدید GPT-4.1 را منتشر کرده که نسبت به نسخه‌های قبلی در برخی تست‌ها، مخصوصاً برنامه‌نویسی، عملکرد بهتری دارد. اما برخلاف روال معمول، این مدل بدون گزارش ایمنی منتشر شده؛ گزارشی که معمولاً برای بررسی خطرات احتمالی مدل منتشر می‌شود.
سخنگوی Open‌AI گفته که چون GPT-4.1 یک مدل مرزی (Frontier Model : به معنای مدل پیشرفته و قدرتمند) محسوب نمی‌شود، نیازی به این گزارش نداشته است. اما کارشناسان می‌گویند در حالی‌ که رقابت بین شرکت‌های هوش مصنوعی شدت گرفته، سطح شفافیت و توجه به ایمنی در حال کاهش است.
این اقدام، انتقاداتی را از سوی محققان و کارمندان سابق Open‌AI به دنبال داشته که معتقدند نبود این گزارش می‌تواند ایمنی کاربران را به خطر بیندازد.

۱۴۰۴/۲/۱ ۱۵:۵۴:۱۳
۱۴۰۴/۱/۳۱ ۱۸:۵۰:۳۹
افزایش هذیان‌گویی در مدل‌های جدید هوش مصنوعی OpenAI

مدل‌های جدید OpenAI به نام o3 و o4-mini با وجود پیشرفت در برنامه‌نویسی و ریاضی، بیش از نسخه‌های قبلی دچار هذیان گویی یا تولید اطلاعات نادرست می‌شوند. o3 در ۳۳٪ از سوالات درباره افراد اشتباه پاسخ داده و o4-mini حتی ۴۸٪. علت این افزایش هنوز مشخص نیست و نیاز به تحقیق بیشتر دارد. محققان نیز تایید کرده‌اند که این مدل‌ها گاهی ادعاهایی غیرممکن دارند. گرچه این مدل‌ها خلاق‌ترند، اما در حوزه‌هایی که دقت اهمیت دارد، چالش‌زا خواهند بود. افزودن قابلیت جست‌وجوی وب شاید به کاهش خطا کمک کند، اما مشکل اصلی همچنان باقی‌ست: مدل‌های قوی‌تر، خیال‌پردازتر شده‌اند.

۱۴۰۴/۱/۳۱ ۰۱:۰۸:۴۹
OpenAI راهکار Flex processing را برای کاهش هزینه مدل‌های هوش مصنوعی معرفی کرد

شرکت OpenAI برای رقابت با رقبایی مثل گوگل، گزینه‌ای جدید به نام “Flex processing” معرفی کرده که استفاده ارزان‌تر از مدل‌های هوش مصنوعی را ممکن می‌سازد. این سرویس که فعلاً در حالت آزمایشی عرضه شده، قیمت استفاده از مدل‌ها را نصف می‌کند، اما در عوض پاسخ‌دهی کندتر است و گاهی هم ممکن است در دسترس نباشد.
این گزینه برای کارهای کم‌اهمیت یا آزمایشی مثل ارزیابی مدل یا غنی‌سازی داده طراحی شده است.

۱۴۰۴/۱/۳۰ ۰۴:۱۴:۰۷
نظارت OpenAI بر مدل‌های هوش مصنوعی برای جلوگیری از تهدیدات زیستی و شیمیایی

شرکت OpenAI برای مدل‌های جدید هوش مصنوعی خود (o3 و o4-mini) سیستم نظارتی تازه‌ای فعال کرده تا از ارائه اطلاعات درباره تهدیدهای زیستی و شیمیایی جلوگیری کند. این سیستم که برای شناسایی درخواست‌های خطرناک آموزش دیده، در آزمایش‌ها موفق شده ۹۸.۷٪ از این درخواست‌ها را مسدود کند.
مدل‌های جدید در مقایسه با نسخه‌های قبلی پاسخ‌های دقیق‌تری می‌دهند و امکان سوءاستفاده از آن‌ها بیشتر است. با این حال، OpenAI آن‌ها را «پرخطر» نمی‌داند، اما برای اطمینان از ایمنی، همچنان نظارت انسانی را نیز ادامه می‌دهد.
با وجود این اقدامات، برخی کارشناسان نسبت به میزان توجه OpenAI به مسائل ایمنی انتقاد کرده‌اند، به‌ویژه که هیچ گزارشی درباره نسخه اخیر GPT-4.1 منتشر نشده است.

۱۴۰۴/۱/۲۹ ۰۱:۳۲:۵۳
رونمایی OpenAI از مدل‌های هوش مصنوعی o3 و o4-mini با قابلیت‌های پیشرفته استدلال

شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که می‌توانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفته‌ترین مدل این شرکت است و در آزمون‌های تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایین‌تر، عملکرد مناسبی ارائه می‌دهد. این مدل‌ها می‌توانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جست‌وجو کنند. کاربران نسخه پولی ChatGPT و توسعه‌دهندگان از امروز به این مدل‌ها دسترسی دارند. همچنین نسخه قوی‌تر o3 با نام o3-pro نیز به‌زودی عرضه می‌شود.

۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲
عملکرد چت‌بات‌های هوش مصنوعی در پاسخ به موضوعات حساس

یک توسعه‌دهنده ناشناس سایتی به نام SpeechMap ساخته که بررسی می‌کند چت‌بات‌هایی مثل ChatGPT و Grok چطور به موضوعات حساس و بحث‌برانگیز مثل سیاست، اعتراضات مدنی و آزادی بیان پاسخ می‌دهند. هدف این ابزار، مقایسه میزان پاسخگویی و بی‌طرفی مدل‌های مختلف هوش مصنوعی است.
طبق نتایج این ابزار، مدل‌های جدید OpenAI نسبت به گذشته کمتر به سؤالات سیاسی پاسخ می‌دهند. در مقابل، مدل Grok 3 ساخته شرکت xAI متعلق به ایلان ماسک، با نرخ پاسخ‌دهی ۹۶٪ به سؤالات، آزادانه‌تر عمل می‌کند. ماسک قبلاً وعده داده بود که Grok برخلاف مدل‌های دیگر، فیلترهای کمتری داشته باشد و دیدگاه خاصی را تبلیغ نکند.

۱۴۰۴/۱/۲۸ ۱۷:۲۶:۴۶
اپل با استفاده از داده‌های مصنوعی به دنبال بهبود مدل‌های هوش مصنوعی

اپل برای بهبود هوش مصنوعی خود از روشی به نام «داده‌های مصنوعی» استفاده می‌کند؛ داده‌هایی شبیه واقعی اما بدون محتوای کاربر. با کمک فناوری «حریم خصوصی تفاضلی»، این داده‌ها به دستگاه‌هایی که کاربرانشان رضایت داده‌اند ارسال می‌شود تا با اطلاعات واقعی مقایسه شده و مدل‌های هوش مصنوعی به‌طور محرمانه اصلاح شوند. این روش ابتدا در ساخت ایموجی‌های هوشمند به‌کار رفته و قرار است در ابزارهای دیگر مثل خلاصه‌سازی ایمیل و تولید محتوا هم استفاده شود.

۱۴۰۴/۱/۲۷ ۱۵:۵۶:۰۰
رقابت مدل‌های هوش مصنوعی در بازی پوکمون؛ آیا نتایج قابل اعتمادند؟

جدیدترین جنجال دنیای هوش مصنوعی به بازی معروف «پوکمون» رسیده است. برخی ادعا می‌کنند مدل «جمینی» از گوگل در اجرای این بازی از مدل «کلود» شرکت Anthropic جلو زده و مراحل بیشتری را طی کرده است. اما کاربران متوجه شده‌اند که جمینی با کمک یک نقشه سفارشی طراحی‌شده توسط توسعه‌دهنده‌اش بازی می‌کند؛ چیزی که به آن کمک می‌کند تصمیم‌های دقیق‌تری بگیرد.
بنابراین نحوه اجرای این مدل‌ها و ابزارهای کمکی که استفاده می‌کنند، می‌تواند نتایج را کاملاً تغییر دهد. همین موضوع در آزمون‌های دیگر هم دیده شده؛ مثلاً مدل Claude 3.7 وقتی با ابزار خاص اجرا شده، عملکرد بهتری نسبت به حالت عادی داشته است. همین اتفاق برای مدل Llama 4 از متا هم افتاده است.

بنابراین مقایسه دقیق و منصفانه مدل‌های هوش مصنوعی به‌دلیل تفاوت در روش اجرا، سخت‌تر از قبل شده است؛ حتی اگر محل رقابت، یک بازی کودکانه مثل پوکمون باشد.

۱۴۰۴/۱/۲۷ ۰۲:۳۰:۲۳
توقف عرضه مدل GPT-4.5 توسط OpenAI در API

شرکت OpenAI اعلام کرد که مدل هوش مصنوعی GPT-4.5 را از 14 ژوئیه از API خود حذف خواهد کرد. این مدل که با نام رمز Orion شناخته می‌شود، با وجود پیشرفت‌های فنی، به دلیل هزینه‌های بالای اجرا و عملکرد محدود در برخی معیارها، از دسترس توسعه‌دهندگان خارج می‌شود. شرکت ، GPT-4.1 را به عنوان جایگزین اصلی معرفی کرده است.

۱۴۰۴/۱/۲۶ ۲۱:۲۹:۱۲
متا آغاز به آموزش مدل‌های هوش مصنوعی با محتوای عمومی کاربران اروپایی می‌کند

شرکت متا اعلام کرد که از این هفته، مدل‌های هوش مصنوعی خود را با استفاده از محتوای عمومی کاربران فیسبوک و اینستاگرام در اتحادیه اروپا آموزش خواهد داد. این شرکت پس از مذاکرات با مقامات حریم خصوصی و دریافت مجوزهای لازم، آموزش مدل‌های هوش مصنوعی با داده‌های کاربران اروپایی را از سر می‌گیرد. کاربران می‌توانند با استفاده از یک فرم، از به اشتراک‌گذاری داده‌های خود انصراف دهند.

۱۴۰۴/۱/۲۶ ۲۰:۰۶:۰۶
الزام شرکت OpenAI به احراز هویت سازمان‌ها برای دسترسی به مدل‌های پیشرفته هوش مصنوعی

شرکت OpenAI برای دسترسی به مدل‌های پیشرفته هوش مصنوعی خود، فرآیند جدید تأیید هویت سازمانی را راه‌اندازی کرده است. این اقدام با هدف افزایش امنیت و جلوگیری از سوء استفاده از API این شرکت صورت می‌گیرد. توسعه‌دهندگان برای دسترسی به قابلیت‌های پیشرفته باید با ارائه مدارک شناسایی رسمی، هویت سازمان خود را تأیید کنند.

۱۴۰۴/۱/۲۶ ۰۱:۱۴:۰۹
‌‏سرمایه‌گذاری گوگل و انویدیا در استارتاپ هوش مصنوعی Safe Superintelligence

‏گوگل (Alphabet) و انویدیا در استارتاپ تازه‌تأسیس SSI به رهبری ایلیا ساتسکِوِر، هم‌بنیان‌گذار OpenAI، سرمایه‌گذاری کرده‌اند. هدف این استارتاپ، ساخت هوش مصنوعی بسیار پیشرفته‌ای است که در عین قدرتمند بودن، از لحاظ امنیت، اخلاق و کنترل انسانی قابل اطمینان باشد.
‏ارزش SSI تنها چند ماه پس از راه‌اندازی به ۳۲ میلیارد دلار رسیده است. گوگل نه‌تنها در آن سرمایه‌گذاری کرده، بلکه تراشه‌های ویژه خود (TPU) را نیز در اختیار این شرکت گذاشته است. SSI فعلاً برای تحقیقاتش بیشتر از TPU استفاده می‌کند تا GPUهای انویدیا.

۱۴۰۴/۱/۲۵ ۱۷:۵۸:۳۳
متا مدعی کاهش سوگیری سیاسی در مدل هوش مصنوعی Llama 4 شد

متا می‌گوید مدل جدید هوش مصنوعی‌اش، Llama 4، دیدگاه‌های متنوع‌تری ارائه می‌دهد و کمتر به سمت تفکرات لیبرالی گرایش دارد. این مدل می‌تواند به سؤالات سیاسی بحث‌برانگیز پاسخ دهد بدون اینکه یک طرف را قضاوت کند.
منتقدان نگران‌اند که چنین مدل‌هایی بتوانند اطلاعات را به نفع یک دیدگاه خاص تغییر دهند. برخی هم معتقدند زاکربرگ با این کار می‌خواهد نظر دولت ترامپ را جلب کند.

۱۴۰۴/۱/۲۵ ۰۹:۲۲:۵۶
هشدار بانک انگلستان درباره خطرات هوش مصنوعی در بازار بورس

بانک مرکزی انگلستان هشدار داده که استفاده از هوش مصنوعی در معاملات بورس ممکن است باعث نوسانات شدید و ناگهانی در بازار شود.
بر اساس گزارش جدید این بانک، ربات‌های معامله‌گر مبتنی بر هوش مصنوعی ممکن است همگی به استراتژی‌های مشابهی برسند، که این موضوع می‌تواند باعث شکل‌گیری حباب‌های اقتصادی یا ریزش‌های ناگهانی شود. همچنین، این سیستم‌ها ممکن است یاد بگیرند که از بحران‌ها سود ببرند و حتی عمداً شرایط ناپایدار ایجاد کنند.
چنین رفتارهایی می‌تواند کنترل بازار را از دست انسان‌ها خارج کرده و باعث بی‌ثباتی گسترده شود؛ مخصوصاً اگر شرکت‌ها ندانند دقیقاً هوش مصنوعی‌شان چه تصمیمی می‌گیرد. به همین دلیل، نگرانی‌ها درباره استفاده گسترده از هوش مصنوعی در بازارهای حساس مالی افزایش یافته است.

۱۴۰۴/۱/۲۳ ۱۸:۴۳:۵۴
‌اقدام جدید OpenAI برای طراحی آزمون‌های واقعی‌تر جهت سنجش هوش مصنوعی

شرکت OpenAI اعلام کرده که سیستم‌های فعلی سنجش عملکرد مدل‌های هوش مصنوعی ناکارآمد هستند و قصد دارد با راه‌اندازی برنامه‌ای به نام Pioneers، آزمون‌هایی طراحی کند که کاربردهای واقعی این فناوری را بهتر منعکس کنند.
در این برنامه، شرکت‌هایی در حوزه‌هایی مانند حقوق، بیمه، مالی، سلامت و حسابداری با OpenAI همکاری می‌کنند تا معیارهایی بسازند که نشان دهند یک مدل در عمل چقدر خوب کار می‌کند، نه فقط در حل مسائل دانشگاهی یا رقابتی.

هدف نهایی، ایجاد آزمون‌هایی است که واقع‌بینانه‌تر، قابل اعتمادتر و متناسب با نیازهای دنیای واقعی باشند. البته برخی منتقدان نگرانند که چون این آزمون‌ها با همکاری خود OpenAI طراحی می‌شوند، بی‌طرفی آن‌ها زیر سوال برود.

۱۴۰۴/۱/۲۳ ۱۸:۳۳:۴۴
مدل‌های هوش مصنوعی فقط تقلید می‌کنند، نه تصمیم‌گیری بر اساس ارزش

پژوهش جدیدی از دانشگاه MIT نشان می‌دهد برخلاف برخی ادعاهای قبلی، هوش مصنوعی هیچ ارزش یا عقیده‌ ثابتی از خود ندارد. در این تحقیق، محققان مدل‌های معروفی از شرکت‌هایی مثل گوگل، متا و OpenAI را بررسی کردند و دریافتند که پاسخ‌های این مدل‌ها به‌شدت به نحوه‌ی پرسش وابسته است و هیچ ثبات یا دیدگاه مشخصی ندارند.
به گفته پژوهشگران، هوش مصنوعی بیشتر یک “تقلیدگر” است تا موجودی با باورها یا ارزش‌های انسانی. این یعنی پیش‌بینی یا “هم‌راستا کردن” رفتار این سیستم‌ها سخت‌تر از چیزی است که قبلاً تصور می‌شد.

۱۴۰۴/۱/۲۳ ۱۳:۲۵:۲۹
ترکیب مدل‌های هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی

مدیرعامل DeepMind، اعلام کرد که گوگل قصد دارد مدل هوش مصنوعی را با مدل تولید ویدئو ترکیب کند تا درک بهتری از دنیای فیزیکی برای این دستیار دیجیتال ایجاد کند.
به گفته او، هدف نهایی ساخت یک دستیار هوشمند همه‌کاره است که بتواند با فهم متن، صدا، تصویر و ویدئو واقعاً در زندگی روزمره کمک‌رسان باشد.
او گفت مدل ویدئویی Veo با تماشای حجم بالایی از ویدئوهای یوتیوب می‌تواند قوانین دنیای واقعی را یاد بگیرد. این حرکت بخشی از رقابت بزرگ شرکت‌ها برای ساخت مدل‌هایی است که بتوانند همه نوع محتوا را درک و تولید کنند.

۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲
ناتوانی هوش مصنوعی در رفع اشکالات نرم‌افزاری؛ شکست مدل‌های پیشرفته در آزمون

پژوهشی از شرکت مایکروسافت نشان می‌دهد که مدل‌های هوش مصنوعی پیشرفته مانند Claude 3.7 Sonnet و o3-mini علی‌رغم پیشرفت‌های اخیر، هنوز قادر به رفع کامل اشکالات نرم‌افزاری نیستند. این مدل‌ها در آزمون SWE-bench Lite تنها موفق به حل کمتر از نیمی از وظایف رفع اشکال شدند که نشان‌دهنده محدودیت‌های جدی هوش مصنوعی در حوزه برنامه‌نویسی است.

۱۴۰۴/۱/۲۳ ۰۰:۴۳:۰۵
هزینه‌های سنگین مدل‌های هوش مصنوعی با قابلیت استدلال

مدل‌های جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحله‌به‌مرحله را دارند، عملکرد بهتری نسبت به مدل‌های قبلی نشان می‌دهند، اما آزمایش و ارزیابی آن‌ها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدل‌های OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدل‌های معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدل‌ها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قوی‌تر باشد، آزمایشش هم گران‌تر می‌شود. کارشناسان هشدار می‌دهند که این روند می‌تواند باعث شود فقط شرکت‌های بزرگ توان بررسی این مدل‌ها را داشته باشند و شفافیت علمی کاهش یابد.

۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸
گوگل مدل‌های هوش مصنوعی تولید محتوای خود را به‌روز کرد

گوگل در رویداد Cloud Next، چندین مدل هوش مصنوعی تولید محتوای خود را ارتقا داد. مدل Lyria برای تولید موسیقی، Veo 2 برای ویرایش ویدیو، Chirp 3 برای صداسازی و Imagen 3 برای تولید تصویر با قابلیت‌های جدید معرفی شدند. این به‌روزرسانی‌ها با هدف رقابت در بازار سازمانی هوش مصنوعی و ارائه ابزارهای خلاقانه برای تولید محتوا صورت گرفته است.

۱۴۰۴/۱/۲۱ ۱۶:۱۳:۱۱
گوگل نسل جدید تراشه هوش مصنوعی Ironwood را معرفی کرد

گوگل در کنفرانس Cloud Next، تراشه هوش مصنوعی Ironwood را رونمایی کرد. این هفتمین نسل تراشه پردازشی گوگل است که برای اجرای مدل‌های هوش مصنوعی طراحی شده و در دو پیکربندی 256 و 9,216 تراشه‌ای عرضه می‌شود. Ironwood با قدرت پردازشی بالا و کارایی انرژی بهینه، برای پردازش مدل‌های هوش مصنوعی در مقیاس بزرگ طراحی شده است.

۱۴۰۴/۱/۲۱ ۱۶:۱۳:۰۶
متا در آزمون هوش مصنوعی تقلب کرد

شرکت متا (مالک فیسبوک و اینستاگرام) به تازگی مدل‌های جدید هوش مصنوعی خود به نام‌های Scout و Maverick را معرفی کرده که بر پایه نسخه جدید مدل «Llama 4» ساخته شده‌اند. اما ماجرای جالب و جنجالی اینجاست: مدل «ماوریک» در یکی از تست‌های معتبر به طرز عجیبی نمره بالایی کسب کرده و حتی از مدل معروف GPT-4o هم جلو زده بود.

بعد از بررسی‌های بیشتر، مشخص شد که متا برای شرکت در این آزمون، از نسخه‌ای ویژه و دستکاری‌شده از مدل خود استفاده کرده که طوری طراحی شده بود تا پاسخ‌هایی دوستانه‌تر و جذاب‌تر بدهد. همین ویژگی باعث شده بود کاربران به آن رأی بالاتری بدهند. برگزارکنندگان این آزمون هم اعلام کردند که از این پس قوانین سخت‌تری وضع می‌کنند تا جلوی چنین ترفندهایی گرفته شود و ارزیابی‌ها منصفانه باقی بمانند.

۱۴۰۴/۱/۲۰ ۲۲:۴۲:۵۹
ابهام در رتبه‌بندی مدل هوش مصنوعی جدید متا ، Maverick

متا به‌تازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسه‌ای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شده‌اند نسخه‌ای که در این آزمون استفاده شده، با نسخه‌ای که برای عموم عرضه شده تفاوت دارد و نسخه‌ی شرکت داده شده در تست، به‌طور ویژه برای گفتگو بهینه‌سازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعه‌دهندگان مبهم باشد و رتبه‌بندی آن گمراه‌کننده به نظر برسد. چنین رویکردی، یعنی بهینه‌سازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، می‌تواند اعتماد به این رتبه‌بندی‌ها را زیر سؤال ببرد.

۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹

نمایش بیشتر