شرکت JetBrains مدل هوش مصنوعی Mellum را برای کدنویسی منتشر کرد
شرکت JetBrains، سازنده ابزارهای توسعه نرمافزار، مدل هوش مصنوعی Mellum را به صورت متنباز در پلتفرم Hugging Face منتشر کرد. این مدل با 4 میلیارد پارامتر و آموزش بر روی 4 تریلیون توکن، برای تکمیل قطعات کد طراحی شده است.
Mellum با استفاده از مجموعه دادههای مختلف از جمله کدهای مجوز باز GitHub و مقالات ویکیپدیا آموزش دیده و فرآیند آموزش آن حدود 20 روز با استفاده از 256 کارت گرافیکی Nvidia H200 انجام شده است.
شرکت تأکید کرده که این مدل نیاز به تنظیم دقیق دارد و نمونههای اولیه آن برای Python هنوز برای استفاده در محیطهای تولیدی آماده نیستند. همچنین هشدار داده شده که مدل ممکن است سوگیریهای موجود در مخازن کد عمومی را منعکس کند.
بررسیها نشان میدهد بیش از 50 درصد سازمانها با مسائل امنیتی در کدهای تولید شده توسط هوش مصنوعی مواجه میشوند. JetBrains این مدل را تنها آغاز یک مسیر جدید میداند و امیدوار است Mellum منجر به آزمایشها و همکاریهای معنادار شود. /



