رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن
استارتاپ ElevenLabs که در زمینه تولید محتوای صوتی با هوش مصنوعی فعالیت دارد، اخیراً گام مهمی در عرصه فناوری برداشته است.
این شرکت اولین مدل مستقل تبدیل گفتار به متن خود را با نام Scribe معرفی کرده که از ویژگیهای منحصر به فردی برخوردار است.
مدل Scribe از پشتیبانی بیش از 99 زبان برخوردار بوده و در 25 زبان دارای دقت بالای 97 درصدی است. این زبانها شامل انگلیسی، فرانسوی، آلمانی، هندی و چندین زبان دیگر میشوند.
مدیرعامل شرکت معتقد است که علیرغم تصور عموم، سیستمهای تبدیل گفتار به متن برای بسیاری از زبانها هنوز کامل نیستند و آنها قصد دارند راهکاری بهتر ارائه دهند.
این مدل قابلیتهای پیشرفتهای مانند تشخیص گوینده، زمانبندی دقیق کلمات و برچسبگذاری رویدادهای صوتی دارد.
در حال حاضر Scribe فقط برای فایلهای صوتی از پیش ضبط شده کار میکند و نسخه آنی آن در آینده منتشر خواهد شد. /



