-
متا اولین رویداد بزرگ هوش مصنوعی خود را با نام LlamaCon به همراه لایو یوتیوب برگزار میکند
متا روز سهشنبه اولین رویداد توسعه دهندگان هوش مصنوعی خود به نام LlamaCon را برگزار میکند. این رویداد روی مدلهای هوش مصنوعی متن باز Llama متمرکز است و شامل سخنرانیهای مدیران متا و گفتوگوهایی با مدیران بزرگ فناوری از جمله مارک زاکربرگ، مدیرعامل متا است. برنامهها شامل نشستهایی درباره آینده هوش مصنوعی و کاربردهای متنباز آن است. این رویداد در مقر متا در کالیفرنیا برگزار میشود و به صورت آنلاین نیز در صفحه فیسبوک و یوتیوب متا پخش میشود. این رویداد برای متا اهمیت زیادی دارد زیرا این شرکت پس از معرفی Llama 4 با واکنشهای سردی روبهرو شده و اکنون به دنبال جلب دوباره اعتماد توسعهدهندگان است.
۱۴۰۴/۲/۱۰ ۱۹:۰۲:۱۶ -
تحقیقات Anthropic درباره رفاه هوش مصنوعی و احتمال آگاهی مدلهای هوش مصنوعی
شرکت Anthropic، مالک هوش مصنوعی Claude ، برنامهای تحقیقاتی به نام رفاه مدل (Model Welfare) راهاندازی کرده تا بررسی کند آیا مدلهای هوش مصنوعی ممکن است در آینده آگاه شوند و مستحق ملاحظات اخلاقی باشند یا نه. هدف این برنامه، تحلیل رفتار و واکنشهای احتمالی مدلها، علائم «ناراحتی»، و بررسی راهکارهای ساده برای بهبود شرایط آنهاست. با وجود اینکه بسیاری از متخصصان معتقدند هوش مصنوعی فعلی احساس یا آگاهی واقعی ندارد، آنتروپیک این احتمال را بهکلی رد نمیکند. این شرکت قبلاً پژوهشگری برای این موضوع استخدام کرده و میخواهد با دیدی باز و بدون پیشفرضهای قطعی، تحقیقاتش را ادامه دهد.
۱۴۰۴/۲/۶ ۰۰:۱۵:۲۹ -
ورود مدلهای هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی
شرکت Adobe مدلهای جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید میکند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدلهای تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون میتوانند با مدلهایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایدهپردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.
۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶ -
OpenAI بهدنبال ساخت بهترین مدل متنباز هوش مصنوعی
شرکت OpenAI قصد دارد تا تابستان، نخستین مدل متنباز خود از زمان GPT-2 را عرضه کند. این مدل در دسته استدلالی است و هدفش رسیدن به بهترین عملکرد در میان مدلهای باز مشابه Llama و Gemma است.
مدل با مجوز استفاده آزاد و بدون محدودیت جدی عرضه خواهد شد و امکان اجرا روی سختافزارهای پیشرفته شخصی را خواهد داشت.
فشار از سوی رقبا مانند DeepSeek که مدلهای باز ارائه دادهاند، یکی از دلایل این تصمیم OpenAI است.
سام آلتمن گفته OpenAI در گذشته باید متنبازتر عمل میکرد. مدل جدید تحت آزمایشهای ایمنی قرار میگیرد و اطلاعات فنی آن نیز منتشر خواهد شد.۱۴۰۴/۲/۵ ۰۰:۵۴:۴۲ -
CATL توسعه مدلهای تعویض باتری در چین را گسترش میدهد
شرکت CATL بزرگترین تولیدکننده باتری خودرو در چین، برنامه راهاندازی 10 مدل جدید تعویض باتری را با همکاری شرکتهای خودروسازی مطرح چینی مانند FAW، چانگان، BAIC، چری و GAC اعلام کرد. این اقدام در نمایشگاه خودروی شانگهای صورت گرفته و نشاندهنده توسعه استراتژیک این شرکت در زمینه فناوری باتری خودروهای برقی است.
۱۴۰۴/۲/۴ ۱۶:۱۲:۰۵ -
ارزیابی مردمی هوش مصنوعی زیر سوال رفت
پلتفرمهایی مثل Chatbot Arena که با کمک کاربران به ارزیابی مدلهای هوش مصنوعی میپردازند، با وجود محبوبیت زیاد، از دید برخی متخصصان دقت و اعتبار لازم را ندارند. این ارزیابیها بر اساس رأی کاربران است که ممکن است مبنای علمی یا مشخصی نداشته باشد. برخی پژوهشگران میگویند شرکتها گاهی با هدف تبلیغات، مدلهایی را برای این رقابتها بهینه میکنند، اما نسخهای ضعیفتر را منتشر میکنند. همچنین، عدهای معتقدند ارزیابی باید توسط نهادهای مستقل، تخصصی و با جبران مالی مناسب انجام شود. گرچه این روش مشارکتی مزایایی مثل تنوع دیدگاه دارد، اما نباید تنها معیار سنجش کیفیت مدلها باشد. مسئولان Chatbot Arena نیز میگویند هدفشان ارائه فضای باز و شفاف است و در حال اصلاح سیاستهای خود برای جلوگیری از سوءاستفاده هستند.
۱۴۰۴/۲/۳ ۱۷:۱۱:۱۳ -
عرضه مدل جدید GPT-4.1 بدون گزارش ایمنی ، نگرانیها درباره شفافیت OpenAI افزایش یافت
شرکت OpenAI مدل جدید GPT-4.1 را منتشر کرده که نسبت به نسخههای قبلی در برخی تستها، مخصوصاً برنامهنویسی، عملکرد بهتری دارد. اما برخلاف روال معمول، این مدل بدون گزارش ایمنی منتشر شده؛ گزارشی که معمولاً برای بررسی خطرات احتمالی مدل منتشر میشود.
سخنگوی OpenAI گفته که چون GPT-4.1 یک مدل مرزی (Frontier Model : به معنای مدل پیشرفته و قدرتمند) محسوب نمیشود، نیازی به این گزارش نداشته است. اما کارشناسان میگویند در حالی که رقابت بین شرکتهای هوش مصنوعی شدت گرفته، سطح شفافیت و توجه به ایمنی در حال کاهش است.
این اقدام، انتقاداتی را از سوی محققان و کارمندان سابق OpenAI به دنبال داشته که معتقدند نبود این گزارش میتواند ایمنی کاربران را به خطر بیندازد.۱۴۰۴/۲/۱ ۱۵:۵۴:۱۳ -
-
افزایش هذیانگویی در مدلهای جدید هوش مصنوعی OpenAI
مدلهای جدید OpenAI به نام o3 و o4-mini با وجود پیشرفت در برنامهنویسی و ریاضی، بیش از نسخههای قبلی دچار هذیان گویی یا تولید اطلاعات نادرست میشوند. o3 در ۳۳٪ از سوالات درباره افراد اشتباه پاسخ داده و o4-mini حتی ۴۸٪. علت این افزایش هنوز مشخص نیست و نیاز به تحقیق بیشتر دارد. محققان نیز تایید کردهاند که این مدلها گاهی ادعاهایی غیرممکن دارند. گرچه این مدلها خلاقترند، اما در حوزههایی که دقت اهمیت دارد، چالشزا خواهند بود. افزودن قابلیت جستوجوی وب شاید به کاهش خطا کمک کند، اما مشکل اصلی همچنان باقیست: مدلهای قویتر، خیالپردازتر شدهاند.
۱۴۰۴/۱/۳۱ ۰۱:۰۸:۴۹ -
OpenAI راهکار Flex processing را برای کاهش هزینه مدلهای هوش مصنوعی معرفی کرد
شرکت OpenAI برای رقابت با رقبایی مثل گوگل، گزینهای جدید به نام “Flex processing” معرفی کرده که استفاده ارزانتر از مدلهای هوش مصنوعی را ممکن میسازد. این سرویس که فعلاً در حالت آزمایشی عرضه شده، قیمت استفاده از مدلها را نصف میکند، اما در عوض پاسخدهی کندتر است و گاهی هم ممکن است در دسترس نباشد.
این گزینه برای کارهای کماهمیت یا آزمایشی مثل ارزیابی مدل یا غنیسازی داده طراحی شده است.۱۴۰۴/۱/۳۰ ۰۴:۱۴:۰۷ -
نظارت OpenAI بر مدلهای هوش مصنوعی برای جلوگیری از تهدیدات زیستی و شیمیایی
شرکت OpenAI برای مدلهای جدید هوش مصنوعی خود (o3 و o4-mini) سیستم نظارتی تازهای فعال کرده تا از ارائه اطلاعات درباره تهدیدهای زیستی و شیمیایی جلوگیری کند. این سیستم که برای شناسایی درخواستهای خطرناک آموزش دیده، در آزمایشها موفق شده ۹۸.۷٪ از این درخواستها را مسدود کند.
مدلهای جدید در مقایسه با نسخههای قبلی پاسخهای دقیقتری میدهند و امکان سوءاستفاده از آنها بیشتر است. با این حال، OpenAI آنها را «پرخطر» نمیداند، اما برای اطمینان از ایمنی، همچنان نظارت انسانی را نیز ادامه میدهد.
با وجود این اقدامات، برخی کارشناسان نسبت به میزان توجه OpenAI به مسائل ایمنی انتقاد کردهاند، بهویژه که هیچ گزارشی درباره نسخه اخیر GPT-4.1 منتشر نشده است.۱۴۰۴/۱/۲۹ ۰۱:۳۲:۵۳ -
رونمایی OpenAI از مدلهای هوش مصنوعی o3 و o4-mini با قابلیتهای پیشرفته استدلال
شرکت OpenAI دو مدل جدید هوش مصنوعی به نام o3 و o4-mini معرفی کرده که میتوانند قبل از پاسخ دادن، فکر کنند. مدل o3 پیشرفتهترین مدل این شرکت است و در آزمونهای تخصصی، نتایج بسیار خوبی در ریاضی، کدنویسی، علوم و درک تصویر داشته است. مدل o4-mini هم با قیمت پایینتر، عملکرد مناسبی ارائه میدهد. این مدلها میتوانند تصاویر را تحلیل کنند، کد اجرا کنند و اخبار روز را جستوجو کنند. کاربران نسخه پولی ChatGPT و توسعهدهندگان از امروز به این مدلها دسترسی دارند. همچنین نسخه قویتر o3 با نام o3-pro نیز بهزودی عرضه میشود.
۱۴۰۴/۱/۲۸ ۲۳:۰۵:۲۲ -
عملکرد چتباتهای هوش مصنوعی در پاسخ به موضوعات حساس
یک توسعهدهنده ناشناس سایتی به نام SpeechMap ساخته که بررسی میکند چتباتهایی مثل ChatGPT و Grok چطور به موضوعات حساس و بحثبرانگیز مثل سیاست، اعتراضات مدنی و آزادی بیان پاسخ میدهند. هدف این ابزار، مقایسه میزان پاسخگویی و بیطرفی مدلهای مختلف هوش مصنوعی است.
طبق نتایج این ابزار، مدلهای جدید OpenAI نسبت به گذشته کمتر به سؤالات سیاسی پاسخ میدهند. در مقابل، مدل Grok 3 ساخته شرکت xAI متعلق به ایلان ماسک، با نرخ پاسخدهی ۹۶٪ به سؤالات، آزادانهتر عمل میکند. ماسک قبلاً وعده داده بود که Grok برخلاف مدلهای دیگر، فیلترهای کمتری داشته باشد و دیدگاه خاصی را تبلیغ نکند.۱۴۰۴/۱/۲۸ ۱۷:۲۶:۴۶ -
اپل با استفاده از دادههای مصنوعی به دنبال بهبود مدلهای هوش مصنوعی
اپل برای بهبود هوش مصنوعی خود از روشی به نام «دادههای مصنوعی» استفاده میکند؛ دادههایی شبیه واقعی اما بدون محتوای کاربر. با کمک فناوری «حریم خصوصی تفاضلی»، این دادهها به دستگاههایی که کاربرانشان رضایت دادهاند ارسال میشود تا با اطلاعات واقعی مقایسه شده و مدلهای هوش مصنوعی بهطور محرمانه اصلاح شوند. این روش ابتدا در ساخت ایموجیهای هوشمند بهکار رفته و قرار است در ابزارهای دیگر مثل خلاصهسازی ایمیل و تولید محتوا هم استفاده شود.
۱۴۰۴/۱/۲۷ ۱۵:۵۶:۰۰ -
رقابت مدلهای هوش مصنوعی در بازی پوکمون؛ آیا نتایج قابل اعتمادند؟
جدیدترین جنجال دنیای هوش مصنوعی به بازی معروف «پوکمون» رسیده است. برخی ادعا میکنند مدل «جمینی» از گوگل در اجرای این بازی از مدل «کلود» شرکت Anthropic جلو زده و مراحل بیشتری را طی کرده است. اما کاربران متوجه شدهاند که جمینی با کمک یک نقشه سفارشی طراحیشده توسط توسعهدهندهاش بازی میکند؛ چیزی که به آن کمک میکند تصمیمهای دقیقتری بگیرد.
بنابراین نحوه اجرای این مدلها و ابزارهای کمکی که استفاده میکنند، میتواند نتایج را کاملاً تغییر دهد. همین موضوع در آزمونهای دیگر هم دیده شده؛ مثلاً مدل Claude 3.7 وقتی با ابزار خاص اجرا شده، عملکرد بهتری نسبت به حالت عادی داشته است. همین اتفاق برای مدل Llama 4 از متا هم افتاده است.
بنابراین مقایسه دقیق و منصفانه مدلهای هوش مصنوعی بهدلیل تفاوت در روش اجرا، سختتر از قبل شده است؛ حتی اگر محل رقابت، یک بازی کودکانه مثل پوکمون باشد.۱۴۰۴/۱/۲۷ ۰۲:۳۰:۲۳ -
توقف عرضه مدل GPT-4.5 توسط OpenAI در API
شرکت OpenAI اعلام کرد که مدل هوش مصنوعی GPT-4.5 را از 14 ژوئیه از API خود حذف خواهد کرد. این مدل که با نام رمز Orion شناخته میشود، با وجود پیشرفتهای فنی، به دلیل هزینههای بالای اجرا و عملکرد محدود در برخی معیارها، از دسترس توسعهدهندگان خارج میشود. شرکت ، GPT-4.1 را به عنوان جایگزین اصلی معرفی کرده است.
۱۴۰۴/۱/۲۶ ۲۱:۲۹:۱۲ -
متا آغاز به آموزش مدلهای هوش مصنوعی با محتوای عمومی کاربران اروپایی میکند
شرکت متا اعلام کرد که از این هفته، مدلهای هوش مصنوعی خود را با استفاده از محتوای عمومی کاربران فیسبوک و اینستاگرام در اتحادیه اروپا آموزش خواهد داد. این شرکت پس از مذاکرات با مقامات حریم خصوصی و دریافت مجوزهای لازم، آموزش مدلهای هوش مصنوعی با دادههای کاربران اروپایی را از سر میگیرد. کاربران میتوانند با استفاده از یک فرم، از به اشتراکگذاری دادههای خود انصراف دهند.
۱۴۰۴/۱/۲۶ ۲۰:۰۶:۰۶ -
الزام شرکت OpenAI به احراز هویت سازمانها برای دسترسی به مدلهای پیشرفته هوش مصنوعی
شرکت OpenAI برای دسترسی به مدلهای پیشرفته هوش مصنوعی خود، فرآیند جدید تأیید هویت سازمانی را راهاندازی کرده است. این اقدام با هدف افزایش امنیت و جلوگیری از سوء استفاده از API این شرکت صورت میگیرد. توسعهدهندگان برای دسترسی به قابلیتهای پیشرفته باید با ارائه مدارک شناسایی رسمی، هویت سازمان خود را تأیید کنند.
۱۴۰۴/۱/۲۶ ۰۱:۱۴:۰۹ -
سرمایهگذاری گوگل و انویدیا در استارتاپ هوش مصنوعی Safe Superintelligence
گوگل (Alphabet) و انویدیا در استارتاپ تازهتأسیس SSI به رهبری ایلیا ساتسکِوِر، همبنیانگذار OpenAI، سرمایهگذاری کردهاند. هدف این استارتاپ، ساخت هوش مصنوعی بسیار پیشرفتهای است که در عین قدرتمند بودن، از لحاظ امنیت، اخلاق و کنترل انسانی قابل اطمینان باشد.
ارزش SSI تنها چند ماه پس از راهاندازی به ۳۲ میلیارد دلار رسیده است. گوگل نهتنها در آن سرمایهگذاری کرده، بلکه تراشههای ویژه خود (TPU) را نیز در اختیار این شرکت گذاشته است. SSI فعلاً برای تحقیقاتش بیشتر از TPU استفاده میکند تا GPUهای انویدیا.۱۴۰۴/۱/۲۵ ۱۷:۵۸:۳۳ -
متا مدعی کاهش سوگیری سیاسی در مدل هوش مصنوعی Llama 4 شد
متا میگوید مدل جدید هوش مصنوعیاش، Llama 4، دیدگاههای متنوعتری ارائه میدهد و کمتر به سمت تفکرات لیبرالی گرایش دارد. این مدل میتواند به سؤالات سیاسی بحثبرانگیز پاسخ دهد بدون اینکه یک طرف را قضاوت کند.
منتقدان نگراناند که چنین مدلهایی بتوانند اطلاعات را به نفع یک دیدگاه خاص تغییر دهند. برخی هم معتقدند زاکربرگ با این کار میخواهد نظر دولت ترامپ را جلب کند.۱۴۰۴/۱/۲۵ ۰۹:۲۲:۵۶ -
هشدار بانک انگلستان درباره خطرات هوش مصنوعی در بازار بورس
بانک مرکزی انگلستان هشدار داده که استفاده از هوش مصنوعی در معاملات بورس ممکن است باعث نوسانات شدید و ناگهانی در بازار شود.
بر اساس گزارش جدید این بانک، رباتهای معاملهگر مبتنی بر هوش مصنوعی ممکن است همگی به استراتژیهای مشابهی برسند، که این موضوع میتواند باعث شکلگیری حبابهای اقتصادی یا ریزشهای ناگهانی شود. همچنین، این سیستمها ممکن است یاد بگیرند که از بحرانها سود ببرند و حتی عمداً شرایط ناپایدار ایجاد کنند.
چنین رفتارهایی میتواند کنترل بازار را از دست انسانها خارج کرده و باعث بیثباتی گسترده شود؛ مخصوصاً اگر شرکتها ندانند دقیقاً هوش مصنوعیشان چه تصمیمی میگیرد. به همین دلیل، نگرانیها درباره استفاده گسترده از هوش مصنوعی در بازارهای حساس مالی افزایش یافته است.۱۴۰۴/۱/۲۳ ۱۸:۴۳:۵۴ -
اقدام جدید OpenAI برای طراحی آزمونهای واقعیتر جهت سنجش هوش مصنوعی
شرکت OpenAI اعلام کرده که سیستمهای فعلی سنجش عملکرد مدلهای هوش مصنوعی ناکارآمد هستند و قصد دارد با راهاندازی برنامهای به نام Pioneers، آزمونهایی طراحی کند که کاربردهای واقعی این فناوری را بهتر منعکس کنند.
در این برنامه، شرکتهایی در حوزههایی مانند حقوق، بیمه، مالی، سلامت و حسابداری با OpenAI همکاری میکنند تا معیارهایی بسازند که نشان دهند یک مدل در عمل چقدر خوب کار میکند، نه فقط در حل مسائل دانشگاهی یا رقابتی.
هدف نهایی، ایجاد آزمونهایی است که واقعبینانهتر، قابل اعتمادتر و متناسب با نیازهای دنیای واقعی باشند. البته برخی منتقدان نگرانند که چون این آزمونها با همکاری خود OpenAI طراحی میشوند، بیطرفی آنها زیر سوال برود.۱۴۰۴/۱/۲۳ ۱۸:۳۳:۴۴ -
مدلهای هوش مصنوعی فقط تقلید میکنند، نه تصمیمگیری بر اساس ارزش
پژوهش جدیدی از دانشگاه MIT نشان میدهد برخلاف برخی ادعاهای قبلی، هوش مصنوعی هیچ ارزش یا عقیده ثابتی از خود ندارد. در این تحقیق، محققان مدلهای معروفی از شرکتهایی مثل گوگل، متا و OpenAI را بررسی کردند و دریافتند که پاسخهای این مدلها بهشدت به نحوهی پرسش وابسته است و هیچ ثبات یا دیدگاه مشخصی ندارند.
به گفته پژوهشگران، هوش مصنوعی بیشتر یک “تقلیدگر” است تا موجودی با باورها یا ارزشهای انسانی. این یعنی پیشبینی یا “همراستا کردن” رفتار این سیستمها سختتر از چیزی است که قبلاً تصور میشد.۱۴۰۴/۱/۲۳ ۱۳:۲۵:۲۹ -
ترکیب مدلهای هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی
مدیرعامل DeepMind، اعلام کرد که گوگل قصد دارد مدل هوش مصنوعی را با مدل تولید ویدئو ترکیب کند تا درک بهتری از دنیای فیزیکی برای این دستیار دیجیتال ایجاد کند.
به گفته او، هدف نهایی ساخت یک دستیار هوشمند همهکاره است که بتواند با فهم متن، صدا، تصویر و ویدئو واقعاً در زندگی روزمره کمکرسان باشد.
او گفت مدل ویدئویی Veo با تماشای حجم بالایی از ویدئوهای یوتیوب میتواند قوانین دنیای واقعی را یاد بگیرد. این حرکت بخشی از رقابت بزرگ شرکتها برای ساخت مدلهایی است که بتوانند همه نوع محتوا را درک و تولید کنند.۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲ -
ناتوانی هوش مصنوعی در رفع اشکالات نرمافزاری؛ شکست مدلهای پیشرفته در آزمون
پژوهشی از شرکت مایکروسافت نشان میدهد که مدلهای هوش مصنوعی پیشرفته مانند Claude 3.7 Sonnet و o3-mini علیرغم پیشرفتهای اخیر، هنوز قادر به رفع کامل اشکالات نرمافزاری نیستند. این مدلها در آزمون SWE-bench Lite تنها موفق به حل کمتر از نیمی از وظایف رفع اشکال شدند که نشاندهنده محدودیتهای جدی هوش مصنوعی در حوزه برنامهنویسی است.
۱۴۰۴/۱/۲۳ ۰۰:۴۳:۰۵ -
هزینههای سنگین مدلهای هوش مصنوعی با قابلیت استدلال
مدلهای جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحلهبهمرحله را دارند، عملکرد بهتری نسبت به مدلهای قبلی نشان میدهند، اما آزمایش و ارزیابی آنها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدلهای OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدلهای معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدلها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قویتر باشد، آزمایشش هم گرانتر میشود. کارشناسان هشدار میدهند که این روند میتواند باعث شود فقط شرکتهای بزرگ توان بررسی این مدلها را داشته باشند و شفافیت علمی کاهش یابد.۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸ -
گوگل مدلهای هوش مصنوعی تولید محتوای خود را بهروز کرد
گوگل در رویداد Cloud Next، چندین مدل هوش مصنوعی تولید محتوای خود را ارتقا داد. مدل Lyria برای تولید موسیقی، Veo 2 برای ویرایش ویدیو، Chirp 3 برای صداسازی و Imagen 3 برای تولید تصویر با قابلیتهای جدید معرفی شدند. این بهروزرسانیها با هدف رقابت در بازار سازمانی هوش مصنوعی و ارائه ابزارهای خلاقانه برای تولید محتوا صورت گرفته است.
۱۴۰۴/۱/۲۱ ۱۶:۱۳:۱۱ -
گوگل نسل جدید تراشه هوش مصنوعی Ironwood را معرفی کرد
گوگل در کنفرانس Cloud Next، تراشه هوش مصنوعی Ironwood را رونمایی کرد. این هفتمین نسل تراشه پردازشی گوگل است که برای اجرای مدلهای هوش مصنوعی طراحی شده و در دو پیکربندی 256 و 9,216 تراشهای عرضه میشود. Ironwood با قدرت پردازشی بالا و کارایی انرژی بهینه، برای پردازش مدلهای هوش مصنوعی در مقیاس بزرگ طراحی شده است.
۱۴۰۴/۱/۲۱ ۱۶:۱۳:۰۶ -
متا در آزمون هوش مصنوعی تقلب کرد
شرکت متا (مالک فیسبوک و اینستاگرام) به تازگی مدلهای جدید هوش مصنوعی خود به نامهای Scout و Maverick را معرفی کرده که بر پایه نسخه جدید مدل «Llama 4» ساخته شدهاند. اما ماجرای جالب و جنجالی اینجاست: مدل «ماوریک» در یکی از تستهای معتبر به طرز عجیبی نمره بالایی کسب کرده و حتی از مدل معروف GPT-4o هم جلو زده بود.
بعد از بررسیهای بیشتر، مشخص شد که متا برای شرکت در این آزمون، از نسخهای ویژه و دستکاریشده از مدل خود استفاده کرده که طوری طراحی شده بود تا پاسخهایی دوستانهتر و جذابتر بدهد. همین ویژگی باعث شده بود کاربران به آن رأی بالاتری بدهند. برگزارکنندگان این آزمون هم اعلام کردند که از این پس قوانین سختتری وضع میکنند تا جلوی چنین ترفندهایی گرفته شود و ارزیابیها منصفانه باقی بمانند.۱۴۰۴/۱/۲۰ ۲۲:۴۲:۵۹ -
ابهام در رتبهبندی مدل هوش مصنوعی جدید متا ، Maverick
متا بهتازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسهای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شدهاند نسخهای که در این آزمون استفاده شده، با نسخهای که برای عموم عرضه شده تفاوت دارد و نسخهی شرکت داده شده در تست، بهطور ویژه برای گفتگو بهینهسازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعهدهندگان مبهم باشد و رتبهبندی آن گمراهکننده به نظر برسد. چنین رویکردی، یعنی بهینهسازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، میتواند اعتماد به این رتبهبندیها را زیر سؤال ببرد.
۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹



