رونمایی از مدل هوش مصنوعی صوتی با قابلیت تولید صدای انسان
شرکت Sesame یک مدل هوش مصنوعی صوتی جدید با نام CSM-1B را معرفی کرده که زیرساخت اصلی دستیار صوتی Maya محسوب میشود.
این مدل با یک میلیارد پارامتر طراحی شده و تحت مجوز Apache 2.0 قابلیت استفاده تجاری دارد. مدل از تکنیک RVQ برای کدگذاری صوتی استفاده میکند که در فناوریهای صوتی هوش مصنوعی کاربرد دارد.
CSM-1B با استفاده از مدل Llama متعلق به Meta ساخته شده و قابلیت تولید انواع صداها را دارد. با این حال، شرکت Sesame تاکید کرده که این مدل هنوز روی یک صدای خاص تنظیم دقیق نشده است.
شرکت Sesame که توسط برندان ایریب، خالق Oculus تاسیس شده، علاوه بر فناوری دستیار صوتی، در حال توسعه عینک هوش مصنوعی است که قابلیت استفاده تمام روزه را دارد. /



