تبدیل پی‌دی‌اف به متن - صفحه 2 - اخبار فناوری - EcoFori

استارتاپ Stability AI یک مدل هوش مصنوعی جدید برای تبدیل تصاویر به ویدیوهای واقعی رونمایی کرد

استارتاپ Stability AI مدل هوش مصنوعی Stable Virtual Camera را معرفی کرد که قادر است تصاویر دوبعدی را به ویدیوهای با عمق و پرسپکتیو واقعی تبدیل کند. این مدل می‌تواند از یک یا چند تصویر، نماهای جدیدی با زوایای دوربین مختلف ایجاد کند و ویدیوهایی با مسیرهای متنوع دوربین تولید نماید. نسخه تحقیقاتی فعلی این مدل با محدودیت‌هایی در کیفیت تصاویر انسان و حیوانات همراه است.

۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۳۷
تنسنت با معرفی مدل‌های هوش مصنوعی جدید، قابلیت تبدیل متن و تصویر به محیط سه‌بعدی را ارائه داد

شرکت تنسنت (Tencent)، غول فناوری چینی، پنج مدل متن‌باز هوش مصنوعی را برای تولید تصاویر سه‌بعدی معرفی کرد. این مدل‌ها با فناوری Hunyuan3D-2.0 می‌توانند ظرف ۳۰ ثانیه تصاویر سه‌بعدی با کیفیت بالا تولید کنند. این اقدام در راستای رقابت شرکت‌های چینی با شرکت‌های آمریکایی در حوزه هوش مصنوعی تولیدی است.

۱۴۰۳/۱۲/۲۸ ۱۳:۵۹:۵۹
گوگل مدل جدید Gemini Embedding را برای توسعه‌دهندگان معرفی کرد

گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایش‌های عددی معرفی کرد.
این نمایش‌های عددی که نامیده می‌شوند، را در بر می‌گیرند. از مدل‌های در کاربردهای مختلفی مانند استفاده می‌شود، زیرا این مدل‌ها علاوه بر بهبود سرعت پردازش، می‌توانند هزینه‌ها را کاهش دهند
این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزه‌های مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماه‌های آینده است.

۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱
پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد

‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن

استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی می‌کند و در برخی زبان‌ها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیت‌هایی مانند تشخیص گوینده و زمان‌بندی کلمات را دارد.

۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹
راه‌اندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs

شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتاب‌های صوتی با فناوری هوش مصنوعی راه‌اندازی کرد. این پلتفرم به نویسندگان اجازه می‌دهد کتاب‌های صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.

۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰
عربستان سعودی با سرمایه‌گذاری ۵ میلیارد دلاری به دنبال تبدیل شدن به هاب دیجیتال و هوش مصنوعی

عربستان سعودی در راستای تحقق چشم‌انداز اقتصادی خود، قراردادی ۵ میلیارد دلاری با شرکت DataVolt برای احداث مرکز داده هوشمند در منطقه نئوم امضا کرد. این پروژه که در شهر شناور اکساگون در ساحل دریای سرخ اجرا خواهد شد، با هدف ایجاد زیرساخت‌های دیجیتال و هوش مصنوعی طراحی شده است. DataVolt یک شرکت توسعه‌دهنده مراکز داده پایدار است که بر استفاده از انرژی‌های سبز تمرکز دارد. این سرمایه‌گذاری بخشی از تلاش‌های عربستان برای تبدیل شدن به مرکز منطقه‌ای هوش مصنوعی محسوب می‌شود. با وجود ادعای پایداری و کارآمدی انرژی، پروژه نئوم با چالش‌های حقوق بشری متعددی از جمله مرگ کارگران مهاجر روبرو بوده است.

۱۴۰۳/۱۱/۲۴ ۲۲:۴۶:۵۵