افشای احتمال استفاده OpenAI از محتوای کپیرایت در آموزش مدلهای هوش مصنوعی
پژوهشی جدید توسط محققان دانشگاههای معتبر نشان میدهد که مدلهای هوش مصنوعی OpenAI احتمالاً از محتوای کپیرایت برای آموزش استفاده کردهاند.
این مطالعه روشی جدید برای شناسایی دادههای آموزشی ارائه داده که بر اساس کلمات غیرمعمول و با اهمیت در متون است.
محققان با بررسی مدلهای GPT-4 و GPT-3.5 دریافتند که این مدلها بخشهایی از کتابهای داستانی و مقالات روزنامه نیویورک تایمز را به طور کامل حفظ کردهاند.
این یافتهها میتواند ادعاهای حقوقی علیه OpenAI مبنی بر استفاده غیرمجاز از محتوای کپیرایت را تقویت کند.
محققان بر ضرورت شفافیت بیشتر در استفاده از دادههای آموزشی مدلهای هوش مصنوعی تأکید کردهاند. /



