افشای احتمال استفاده OpenAI از محتوای کپی‌رایت در آموزش مدل‌های هوش مصنوعی

۱۴۰۴/۱/۱۶ ۲۲:۳۹:۴۲

پژوهشی جدید توسط محققان دانشگاه‌های معتبر نشان می‌دهد که مدل‌های هوش مصنوعی OpenAI احتمالاً از محتوای کپی‌رایت برای آموزش استفاده کرده‌اند.
این مطالعه روشی جدید برای شناسایی داده‌های آموزشی ارائه داده که بر اساس کلمات غیرمعمول و با اهمیت در متون است.
محققان با بررسی مدل‌های GPT-4 و GPT-3.5 دریافتند که این مدل‌ها بخش‌هایی از کتاب‌های داستانی و مقالات روزنامه نیویورک تایمز را به طور کامل حفظ کرده‌اند.
این یافته‌ها می‌تواند ادعاهای حقوقی علیه OpenAI مبنی بر استفاده غیرمجاز از محتوای کپی‌رایت را تقویت کند.
محققان بر ضرورت شفافیت بیشتر در استفاده از داده‌های آموزشی مدل‌های هوش مصنوعی تأکید کرده‌اند. /

روش‌های شناسایی محتوای کپی‌رایت در مدل‌های هوش مصنوعی

هوش مصنوعیOpenAIکپی‌رایتفناوریمدل‌های زبانیهوش مصنوعی OpenAIکپی‌رایت مدل‌های AIآموزش مدل‌های زبانی

	OpenAI در تدارک انتشار مدل زبانی باز پس از سال‌ها
	چرا هوش مصنوعی به‌جای گفتن «نمی‌دانم» ترجیح می‌دهد حدس بزند؟
	توقف عرضه مدل GPT-4.5 توسط OpenAI در API
	طرح دعوای حق تألیف علیه OpenAI با احضار محقق ارشد
	دیزنی: گوگل حقوق کپی‌رایت ما را نقض کرده است
	افشای جزئیات استفاده مشکوک متا از آثار کپی‌رایت برای آموزش هوش مصنوعی
	عرضه مدل جدید GPT-4.1 بدون گزارش ایمنی ، نگرانی‌ها درباره شفافیت Open‌AI افزایش یافت
	OpenAI راهکار Flex processing را برای کاهش هزینه مدل‌های هوش مصنوعی معرفی کرد
	رونمایی OpenAI از مدل‌های هوش مصنوعی o3 و o4-mini با قابلیت‌های پیشرفته استدلال
	الزام شرکت OpenAI به احراز هویت سازمان‌ها برای دسترسی به مدل‌های پیشرفته هوش مصنوعی

افشای احتمال استفاده OpenAI از محتوای کپی‌رایت در آموزش مدل‌های هوش مصنوعی

ممکن است به این اخبار فناوری و تکنولوژی نیز علاقمند باشید