آموزش مدل‌های زبانی - صفحه 5 - اخبار فناوری - EcoFori

ناتوانی هوش مصنوعی در رفع اشکالات نرم‌افزاری؛ شکست مدل‌های پیشرفته در آزمون

پژوهشی از شرکت مایکروسافت نشان می‌دهد که مدل‌های هوش مصنوعی پیشرفته مانند Claude 3.7 Sonnet و o3-mini علی‌رغم پیشرفت‌های اخیر، هنوز قادر به رفع کامل اشکالات نرم‌افزاری نیستند. این مدل‌ها در آزمون SWE-bench Lite تنها موفق به حل کمتر از نیمی از وظایف رفع اشکال شدند که نشان‌دهنده محدودیت‌های جدی هوش مصنوعی در حوزه برنامه‌نویسی است.

۱۴۰۴/۱/۲۳ ۰۰:۴۳:۰۵
هزینه‌های سنگین مدل‌های هوش مصنوعی با قابلیت استدلال

مدل‌های جدید هوش مصنوعی که توانایی «استدلال» و حل مسائل مرحله‌به‌مرحله را دارند، عملکرد بهتری نسبت به مدل‌های قبلی نشان می‌دهند، اما آزمایش و ارزیابی آن‌ها بسیار پرهزینه شده است. برای مثال، بررسی یکی از مدل‌های OpenAI بیش از ۲۷۰۰ دلار هزینه داشته، در حالی که ارزیابی مدل‌های معمولی کمتر از ۱۰۰ دلار خرج دارند.
دلیل اصلی این هزینه بالا، تولید حجم زیادی از متن (توکن) توسط این مدل‌ها در هنگام پاسخ دادن به سوالات پیچیده است. هرچه مدل قوی‌تر باشد، آزمایشش هم گران‌تر می‌شود. کارشناسان هشدار می‌دهند که این روند می‌تواند باعث شود فقط شرکت‌های بزرگ توان بررسی این مدل‌ها را داشته باشند و شفافیت علمی کاهش یابد.

۱۴۰۴/۱/۲۲ ۱۸:۵۵:۵۸
گوگل مدل‌های هوش مصنوعی تولید محتوای خود را به‌روز کرد

گوگل در رویداد Cloud Next، چندین مدل هوش مصنوعی تولید محتوای خود را ارتقا داد. مدل Lyria برای تولید موسیقی، Veo 2 برای ویرایش ویدیو، Chirp 3 برای صداسازی و Imagen 3 برای تولید تصویر با قابلیت‌های جدید معرفی شدند. این به‌روزرسانی‌ها با هدف رقابت در بازار سازمانی هوش مصنوعی و ارائه ابزارهای خلاقانه برای تولید محتوا صورت گرفته است.

۱۴۰۴/۱/۲۱ ۱۶:۱۳:۱۱
گوگل نسل جدید تراشه هوش مصنوعی Ironwood را معرفی کرد

گوگل در کنفرانس Cloud Next، تراشه هوش مصنوعی Ironwood را رونمایی کرد. این هفتمین نسل تراشه پردازشی گوگل است که برای اجرای مدل‌های هوش مصنوعی طراحی شده و در دو پیکربندی 256 و 9,216 تراشه‌ای عرضه می‌شود. Ironwood با قدرت پردازشی بالا و کارایی انرژی بهینه، برای پردازش مدل‌های هوش مصنوعی در مقیاس بزرگ طراحی شده است.

۱۴۰۴/۱/۲۱ ۱۶:۱۳:۰۶
متا در آزمون هوش مصنوعی تقلب کرد

شرکت متا (مالک فیسبوک و اینستاگرام) به تازگی مدل‌های جدید هوش مصنوعی خود به نام‌های Scout و Maverick را معرفی کرده که بر پایه نسخه جدید مدل «Llama 4» ساخته شده‌اند. اما ماجرای جالب و جنجالی اینجاست: مدل «ماوریک» در یکی از تست‌های معتبر به طرز عجیبی نمره بالایی کسب کرده و حتی از مدل معروف GPT-4o هم جلو زده بود.

بعد از بررسی‌های بیشتر، مشخص شد که متا برای شرکت در این آزمون، از نسخه‌ای ویژه و دستکاری‌شده از مدل خود استفاده کرده که طوری طراحی شده بود تا پاسخ‌هایی دوستانه‌تر و جذاب‌تر بدهد. همین ویژگی باعث شده بود کاربران به آن رأی بالاتری بدهند. برگزارکنندگان این آزمون هم اعلام کردند که از این پس قوانین سخت‌تری وضع می‌کنند تا جلوی چنین ترفندهایی گرفته شود و ارزیابی‌ها منصفانه باقی بمانند.

۱۴۰۴/۱/۲۰ ۲۲:۴۲:۵۹
Waymo در پی استفاده از داده‌های دوربین‌های داخلی خودروهای خودران برای آموزش هوش مصنوعی

شرکت Waymo ممکن است از ویدیوهای دوربین‌های داخل خودروهای خودران برای آموزش مدل‌های هوش مصنوعی و نمایش تبلیغات استفاده کند. این اطلاعات می‌تواند شامل چهره و رفتار مسافران باشد.
طبق سیاست‌ حفظ حریم خصوصی جدید، کاربران می‌توانند با استفاده از گزینه عدم رضایت، مانع استفاده از داده‌هایشان شوند، اما نگرانی‌هایی درباره شفافیت و امنیت این داده‌ها وجود دارد.
این شرکت که تحت مالکیت گوگل است، با وجود گسترش سریع در آمریکا، هنوز سودده نیست و احتمالا به دنبال درآمدزایی از داده‌های کاربران است.

۱۴۰۴/۱/۱۹ ۲۱:۳۸:۳۹
ابهام در رتبه‌بندی مدل هوش مصنوعی جدید متا ، Maverick

متا به‌تازگی مدل هوش مصنوعی جدیدی به نام “Maverick” معرفی کرده که در آزمون مقایسه‌ای LM Arena رتبه دوم را کسب کرده است. اما محققان متوجه شده‌اند نسخه‌ای که در این آزمون استفاده شده، با نسخه‌ای که برای عموم عرضه شده تفاوت دارد و نسخه‌ی شرکت داده شده در تست، به‌طور ویژه برای گفتگو بهینه‌سازی شده بوده است. این موضوع باعث شده عملکرد واقعی مدل برای توسعه‌دهندگان مبهم باشد و رتبه‌بندی آن گمراه‌کننده به نظر برسد. چنین رویکردی، یعنی بهینه‌سازی صرف برای کسب رتبه بالا در تست و سپس عرضه نسخه متفاوت، می‌تواند اعتماد به این رتبه‌بندی‌ها را زیر سؤال ببرد.

۱۴۰۴/۱/۱۹ ۰۹:۵۳:۲۹
متا مدل‌های هوش مصنوعی Llama 4 را با قابلیت‌های پیشرفته معرفی کرد

شرکت متا چهار مدل جدید هوش مصنوعی Llama 4 را منتشر کرد که شامل Scout، Maverick و Behemoth می‌شوند. این مدل‌ها با معماری ترکیبی متخصصان آموزش دیده و قابلیت پردازش تصویر، متن و ویدیو را دارند. Maverick با 400 میلیارد پارامتر در برخی آزمون‌ها از مدل‌های GPT-4o و Gemini 2.0 پیشی گرفته و Scout با پنجره متنی 10 میلیون توکن، توانایی پردازش اسناد بسیار طولانی را دارد.

۱۴۰۴/۱/۱۸ ۰۰:۰۲:۲۳
تغییر برنامه OpenAI برای انتشار مدل‌های هوش مصنوعی جدید

شرکت OpenAI تصمیم گرفته مدل‌های o3 و o4-mini را در هفته‌های آینده منتشر کند. سام آلتمن، مدیرعامل این شرکت که در زمینه هوش مصنوعی فعال است، اعلام کرد GPT-5 با قابلیت‌های بهتری از آنچه پیش‌بینی می‌شد، توسعه خواهد یافت و انتظار می‌رود در چند ماه آینده عرضه شود.

۱۴۰۴/۱/۱۶ ۱۹:۱۹:۴۲
سرمایه‌گذاری گوگل و انویدیا در استارتاپ هوش مصنوعی SandboxAQ

استارتاپ SandboxAQ که از تکنیک‌های رایانش کوانتومی برای توسعه مدل‌های هوش مصنوعی پیشرفته استفاده می‌کند، ۱۵۰ میلیون دلار سرمایه جدید از شرکت‌هایی مانند گوگل و انویدیا جذب کرد. با این سرمایه‌گذاری، ارزش این شرکت به ۵.۷۵ میلیارد دلار رسید.
این استارتاپ که در سال ۲۰۲۲ از شرکت مادر گوگل، آلفابت، جدا شد، مدل‌های پیچیده‌ای برای تجزیه و تحلیل داده‌های عددی و محاسبات پیشرفته توسعه داده است. این مدل‌ها می‌توانند در زمینه‌هایی مانند کشف دارو و مدل‌سازی مالی استفاده شوند.

۱۴۰۴/۱/۱۶ ۱۸:۲۷:۲۷
سرمایه‌گذاری OpenAI در امنیت سایبری برای مقابله با حملات هوش مصنوعی

OpenAI برای اولین بار در یک استارتاپ امنیت سایبری به نام Adaptive Security سرمایه‌گذاری کرده است. این شرکت حملات سایبری مبتنی بر هوش مصنوعی را شبیه‌سازی می‌کند تا کارکنان شرکت‌ها را در برابر تهدیدات آموزش دهد.
با گسترش هوش مصنوعی، حملات سایبری پیشرفته‌تر شده‌اند، از جعل صدای مدیران تا تولید پیام‌های تقلبی. Adaptive Security به شرکت‌ها کمک می‌کند تا نقاط ضعف خود را شناسایی کرده و کارکنان را برای مقابله با حملاتی که به فریب انسان متکی هستند، آماده کند. این سرمایه‌گذاری نشان‌دهنده اهمیت مقابله با تهدیدات جدید ناشی از هوش مصنوعی است.

۱۴۰۴/۱/۱۶ ۱۷:۲۵:۲۶
سرعت گوگل در انتشار مدل‌های هوش مصنوعی از گزارش‌های ایمنی آن پیشی گرفته است

گوگل به شدت سرعت توسعه و عرضه مدل‌های هوش مصنوعی خود را افزایش داده است تا از رقبا عقب نماند. در چند ماه اخیر، این شرکت مدل‌های جدیدی مانند را منتشر کرده که در زمینه‌هایی مانند کدنویسی و ریاضیات عملکرد فوق‌العاده‌ای دارند. اما نکته نگران‌کننده این است که گوگل هنوز گزارش‌های ایمنی این مدل‌ها را منتشر نکرده است، در حالی که دیگر شرکت‌های بزرگ مانند OpenAI و Meta چنین گزارش‌هایی را برای مدل‌های خود ارائه می‌دهند.

گوگل می‌گوید که این مدل‌ها هنوز در مرحله آزمایشی هستند و بعداً اطلاعات مربوط به ایمنی آن‌ها منتشر خواهد شد. با این حال، برخی کارشناسان معتقدند که این روند می‌تواند به کاهش شفافیت و افزایش خطرات احتمالی هوش مصنوعی منجر شود، به‌ویژه در شرایطی که قوانین نظارتی مشخصی برای کنترل ایمنی این مدل‌ها وجود ندارد.

۱۴۰۴/۱/۱۶ ۰۲:۰۹:۲۶
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
استارتاپ Actively AI با رویکرد هوش مصنوعی متفاوت در فروش، ۲۲.۵ میلیون دلار سرمایه جذب کرد

استارتاپ Actively AI با استفاده از مدل‌های استدلالی به جای ارسال پیام‌های انبوه، بهترین مشتریان بالقوه را شناسایی می‌کند. این روش باعث شده شرکت‌هایی مانند Ramp میلیون‌ها دلار درآمد اضافی کسب کنند.
هدف این استارتاپ، تحول در فروش هوشمند با استفاده از هوش مصنوعی پیشرفته است.

۱۴۰۴/۱/۱۴ ۲۰:۳۲:۴۷
معیاری جدید برای سنجش سرعت پردازش هوش مصنوعی

یک گروه تحقیقاتی به نام MLCommons دو معیار جدید برای سنجش سرعت اجرای برنامه‌های هوش مصنوعی معرفی کرد. این معیارها مشخص می‌کنند که سخت‌افزارها و نرم‌افزارهای پیشرفته چقدر سریع می‌توانند مدل‌های هوش مصنوعی را پردازش کنند.

یکی از این تست‌ها بر اساس مدل Llama 3.1 از شرکت متا طراحی شده و توانایی پردازش سوالات پیچیده و تولید کد را بررسی می‌کند. در این آزمایش، سرورهای Nvidia با سخت‌افزار جدیدشان تا ۳.۴ برابر سریع‌تر از نسل قبلی عمل کردند. معیار دوم نیز سرعت عملکرد مدل‌های متن‌باز در شرایط واقعی مانند چت‌بات‌ها را می‌سنجد.

۱۴۰۴/۱/۱۴ ۲۰:۰۱:۳۲
استارتاپ Parasail؛ انقلاب در زیرساخت هوش مصنوعی با رویکردی متفاوت

استارتاپ Parasail مدعی است که توان پردازشی GPUهای ابری آن از کل زیرساخت ابری Oracle بزرگ‌تر است. این شرکت با همکاری ده‌ها تأمین‌کننده، سخت‌افزارهای قدرتمندی مثل Nvidia H100 و A100 را با هزینه‌ای کمتر از رقبا در اختیار کسب‌وکارهای هوش مصنوعی قرار می‌دهد.

بنیان‌گذاران Parasail معتقدند که برخلاف اینترنت که توسط چند شرکت بزرگ ابری (مثل AWS و Azure) اداره می‌شود، زیرساخت هوش مصنوعی به سمت یک مدل غیرمتمرکز و منعطف پیش می‌رود. آن‌ها قصد دارند با ارائه یک پلتفرم یکپارچه، دسترسی آسان‌تر به GPUها و پردازش هوش مصنوعی را با یک کلیک ممکن کنند.

۱۴۰۴/۱/۱۴ ۲۰:۰۱:۲۸
راه‌اندازی Claude برای آموزش؛ رقابت Anthropic با OpenAI در فضای آموزشی

شرکت Anthropic نسخه‌ای از چت‌بات هوش مصنوعی خود، Claude for Education، را برای دانشگاه‌ها و مراکز آموزشی معرفی کرد. این سرویس، مشابه ChatGPT Edu از OpenAI، به دانشجویان و اساتید کمک می‌کند تا از هوش مصنوعی در یادگیری و تدریس استفاده کنند.

یکی از قابلیت‌های جدید این سرویس، “حالت یادگیری” است که به جای ارائه مستقیم پاسخ، سوالاتی برای سنجش درک دانشجو مطرح کرده و راهنمایی‌هایی برای تحقیق و مطالعه مؤثرتر ارائه می‌دهد.

۱۴۰۴/۱/۱۴ ۱۹:۲۹:۵۱
نتفلیکس با گسترش گزینه‌های زبانی، تماشای جهانی فیلم و سریال را آسان‌تر کرد

نتفلیکس سرویس پخش اینترنتی فیلم و سریال، امکان انتخاب زبان زیرنویس و دوبله را برای کاربران تلویزیون گسترش داد. این تغییر در حالی اتفاق می‌افتد که حدود یک سوم مخاطبان این پلتفرم، مخاطب فیلم‌های غیرانگلیسی هستند. نتفلیکس هم‌اکنون زیرنویس در 33 زبان و دوبله در 36 زبان را ارائه می‌دهد.

۱۴۰۴/۱/۱۴ ۱۹:۰۹:۱۳
رقابت شدید هوش مصنوعی در بازار چت‌بات‌ها؛ ChatGPT همچنان پیشتاز

علی‌رغم محبوبیت چت‌جی‌پی‌تی، رقبای هوش مصنوعی مانند Gemini، Copilot، Claude و Grok در حال رشد سریع هستند. آمارها نشان می‌دهد که کاربران هوش مصنوعی به سرعت به سمت پلتفرم‌های جدید می‌روند و شرکت‌های مختلف با ارائه قابلیت‌های نوین در حال جذب مخاطب هستند.

۱۴۰۴/۱/۱۳ ۱۷:۰۱:۲۵
رونمایی Zhipu AI از عامل هوش مصنوعی رایگان در بازار رقابتی چین

استارتاپ هوش مصنوعی Zhipu AI یک عامل هوش مصنوعی رایگان به نام AutoGLM Rumination معرفی کرد که قابلیت انجام تحقیقات عمیق، جستجوی وب، برنامه‌ریزی سفر و نوشتن گزارش تحقیقاتی را دارد. این محصول با مدل‌های اختصاصی شرکت و با ادعای عملکرد بالاتر و سرعت بیشتر نسبت به رقبا ارائه شده است.

۱۴۰۴/۱/۱۲ ۱۰:۵۱:۱۹
ارتقای مدل هوش مصنوعی DeepSeek با هدف رقابت جهانی

استارتاپ هوش مصنوعی DeepSeek که در چین فعال است، مدل جدید زبانی خود را با نام V3-0324 منتشر کرد. این مدل پیشرفته قابلیت‌های استدلال و برنامه‌نویسی را بهبود بخشیده و در رقابت با شرکت‌های آمریکایی مانند OpenAI، توانایی‌های فنی خود را افزایش داده است.

۱۴۰۴/۱/۶ ۱۲:۰۷:۵۷
پیشرفت چین در هوش مصنوعی؛ کاهش فاصله فناوری با آمریکا

چین با نوآوری شرکت‌های فناوری مانند DeepSeek، فاصله خود با آمریکا در توسعه هوش مصنوعی را به سه ماه کاهش داده است. لی کای‌فو، مدیرعامل استارتاپ 01.AI، معتقد است تحریم‌های نیمه‌رسانا باعث شده شرکت‌های چینی راه‌حل‌های خلاقانه‌ای برای توسعه مدل‌های هوش مصنوعی پیدا کنند و در برخی زمینه‌ها حتی پیشرو شوند.

۱۴۰۴/۱/۶ ۱۱:۴۷:۲۷
آزمون جدید هوش مصنوعی ARC-AGI-2 چالش بزرگ برای مدل‌های هوش مصنوعی

بنیاد جایزه آرک با همکاری فرانسوا شولت، آزمون جدید ARC-AGI-2 را برای سنجش هوش عمومی مدل‌های هوش مصنوعی معرفی کرد. این آزمون که شامل حل پازل‌های پیچیده با الگوهای بصری است، تاکنون مدل‌های مختلف هوش مصنوعی از جمله GPT-4.5 و Claude 3.7 را با امتیازات بسیار پایین (حدود 1 درصد) مواجه کرده است. انسان‌ها در این آزمون حدود 60 درصد موفق بوده‌اند.

۱۴۰۴/۱/۶ ۱۰:۲۶:۱۵
تنسنت مدل هوش مصنوعی T1 را رسماً راه‌اندازی کرد

شرکت تنسنت، غول فناوری چین، نسخه رسمی مدل هوش مصنوعی T1 را منتشر کرد. این مدل با پردازش سریع‌تر متون و منطق محتوایی واضح، در رقابت فشرده هوش مصنوعی چین عرضه شده است. تنسنت با این اقدام، سرمایه‌گذاری گسترده‌ای در حوزه هوش مصنوعی انجام داده و قصد دارد در این عرصه پیشرو باشد.

۱۴۰۴/۱/۳ ۰۶:۱۰:۰۵
افشای جزئیات جدید درباره درآمدزایی متا از مدل‌های هوش مصنوعی Llama

مدیرعامل متا پیش‌تر مدعی شده بود که کسب درآمد از مدل‌های هوش مصنوعی Llama در دستور کار این شرکت نیست، اما اسناد جدید نشان می‌دهد متا از طریق توافقات سهم درآمد با شرکای میزبان مانند AWS، انویدیا و گوگل کلود، از این مدل‌ها درآمدزایی می‌کند. این موضوع در حالی مطرح می‌شود که متا در پرونده شکایت حق تألیف، متهم به استفاده از کتاب‌های الکترونیکی دزدی برای آموزش مدل‌های Llama است.

۱۴۰۴/۱/۳ ۰۵:۰۹:۱۰
طرح تحقیقاتی مایکروسافت برای شناسایی منابع داده‌های آموزشی هوش مصنوعی

مایکروسافت در حال تحقیق روی ردیابی تأثیر داده‌های آموزشی بر خروجی مدل‌های هوش مصنوعی است. این پروژه، با همکاری جارون لنیر، به دنبال یافتن راهی برای شناسایی و جبران حقوق خالقان داده‌ها است، ایده‌ای که می‌تواند به حل چالش‌های کپی‌رایت و شفافیت مدل‌های هوش مصنوعی کمک کند. مشخص نیست این تحقیق به محصولی عملی تبدیل شود یا صرفاً تلاشی برای مدیریت فشارهای قانونی است.

۱۴۰۴/۱/۳ ۰۴:۵۸:۴۵
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
ارزیابی هوش مصنوعی با چالش‌های خلاقانه در محیط بازی Minecraft

یک دانش‌آموز دبیرستانی وب‌سایتی به نام MC-Bench ساخته که مدل‌های هوش مصنوعی را در ساخت سازه‌های Minecraft بر اساس درخواست کاربران به چالش می‌کشد. کاربران رأی می‌دهند که کدام مدل عملکرد بهتری داشته و پس از رأی‌گیری، مشخص می‌شود که کدام هوش مصنوعی آن را ساخته است.

این روش خلاقانه به ارزیابی خلاقیت و توانایی حل مسئله هوش مصنوعی کمک می‌کند، زیرا Minecraft محیطی آشنا و قابل‌ درک برای بسیاری از افراد است. شرکت‌هایی مانند گوگل، OpenAI و Anthropic از این پروژه حمایت کرده‌اند، چراکه می‌تواند دید بهتری درباره پیشرفت مدل‌های هوش مصنوعی و توانایی آن‌ها در انجام وظایف پیچیده‌تر ارائه دهد.

۱۴۰۴/۱/۲ ۰۱:۰۲:۱۰
استارتاپ Pruna AI فریمورک فشرده‌سازی مدل‌های هوش مصنوعی را متن‌باز کرد

استارتاپ Pruna AI، متخصص در فشرده‌سازی مدل‌های هوش مصنوعی، فریمورک بهینه‌سازی خود را متن‌باز کرد. این فریمورک از روش‌هایی مانند کشینگ، برش (pruning)، کوانتایز کردن و تقطیر (distillation) برای کاهش حجم مدل‌ها بدون افت کیفیت استفاده می‌کند.

ویژگی کلیدی آن امکان ترکیب چندین روش فشرده‌سازی و ارزیابی کیفیت مدل پس از بهینه‌سازی است. Pruna AI می‌گوید این ابزار مانند Hugging Face برای مدل‌های ترنسفورمر، استانداردی برای فشرده‌سازی ایجاد می‌کند.

۱۴۰۴/۱/۱ ۱۲:۳۵:۴۹
مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند

نوآم براون از محققان ارشد OpenAI معتقد است مدل‌های استدلالی هوش مصنوعی می‌توانستند ۲۰ سال زودتر بیایند اگر محققان مسیر درستی را انتخاب می‌کردند. او در کنفرانس GTC انویدیا توضیح داد که انسان‌ها قبل از تصمیم‌گیری زیاد فکر می‌کنند و این رویکرد در مدل o1 با استفاده از استنتاج زمان اجرا (Test-time inference) پیاده‌سازی شده است.

براون تأکید کرد که آموزش اولیه همچنان مهم است اما در کنار استنتاج زمان اجرا استفاده می‌شود. او همچنین گفت که دانشگاه‌ها با تمرکز بر طراحی مدل‌ها و معیارهای ارزیابی، علی‌رغم کمبود منابع محاسباتی، می‌توانند تأثیرگذار باشند.

۱۴۰۴/۱/۱ ۰۱:۱۳:۳۹

نمایش بیشتر