-
انتشار یکی از بزرگترین دیتاستهای قانونی هوش مصنوعی توسط EleutherAI با Common Pile
سازمان تحقیقاتی EleutherAI یکی از بزرگترین مجموعههای متنی دارای مجوز و منبعباز برای آموزش هوش مصنوعی را منتشر کرد. 📚
این دیتاست با نام Common Pile v0.1 در همکاری با استارتاپهایی مانند Hugging Face طی دو سال آماده شده و ۸ ترابایت حجم دارد. 💾
بر اساس آن، دو مدل جدید Comma v0.1-1T و Comma v0.1-2T توسعه یافتند که بهگفتهی EleutherAI با مدلهای دارای دادههای بدون مجوز رقابت میکنند. 🤖
در حالیکه بسیاری از شرکتهای هوش مصنوعی بهخاطر استفاده از دادههای دارای حقنشر تحت پیگردند، EleutherAI شفافیت را اصل خود میداند. ⚖️
این دیتاست با مشاوره حقوقی و با تکیه بر منابعی چون ۳۰۰ هزار کتاب دامنه عمومی تولید شده است. 📘
هدف این پروژه، اثبات امکان ساخت مدلهای قدرتمند بر پایه دادههای قانونی و منبعباز است. ✅
EleutherAI قول داده در آینده دیتاستهای شفافتری را با همکاری دانشگاهها و شرکتها منتشر کند. 🔄۱۴۰۴/۳/۱۸ ۱۷:۴۶:۲۶



