-
استارتاپ Stability AI یک مدل هوش مصنوعی جدید برای تبدیل تصاویر به ویدیوهای واقعی رونمایی کرد
استارتاپ Stability AI مدل هوش مصنوعی Stable Virtual Camera را معرفی کرد که قادر است تصاویر دوبعدی را به ویدیوهای با عمق و پرسپکتیو واقعی تبدیل کند. این مدل میتواند از یک یا چند تصویر، نماهای جدیدی با زوایای دوربین مختلف ایجاد کند و ویدیوهایی با مسیرهای متنوع دوربین تولید نماید. نسخه تحقیقاتی فعلی این مدل با محدودیتهایی در کیفیت تصاویر انسان و حیوانات همراه است.
۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۳۷ -
تنسنت با معرفی مدلهای هوش مصنوعی جدید، قابلیت تبدیل متن و تصویر به محیط سهبعدی را ارائه داد
شرکت تنسنت (Tencent)، غول فناوری چینی، پنج مدل متنباز هوش مصنوعی را برای تولید تصاویر سهبعدی معرفی کرد. این مدلها با فناوری Hunyuan3D-2.0 میتوانند ظرف ۳۰ ثانیه تصاویر سهبعدی با کیفیت بالا تولید کنند. این اقدام در راستای رقابت شرکتهای چینی با شرکتهای آمریکایی در حوزه هوش مصنوعی تولیدی است.
۱۴۰۳/۱۲/۲۸ ۱۳:۵۹:۵۹ -
گوگل مدل جدید Gemini Embedding را برای توسعهدهندگان معرفی کرد
گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایشهای عددی معرفی کرد.
این نمایشهای عددی که نامیده میشوند، را در بر میگیرند. از مدلهای در کاربردهای مختلفی مانند استفاده میشود، زیرا این مدلها علاوه بر بهبود سرعت پردازش، میتوانند هزینهها را کاهش دهند
این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزههای مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماههای آینده است.۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱ -
پادکستسازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد
podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعهدهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینههای تولید و افزایش کیفیت تبدیل متن به صدا است.۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱ -
رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن
استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی میکند و در برخی زبانها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیتهایی مانند تشخیص گوینده و زمانبندی کلمات را دارد.
۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹ -
راهاندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs
شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتابهای صوتی با فناوری هوش مصنوعی راهاندازی کرد. این پلتفرم به نویسندگان اجازه میدهد کتابهای صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.
۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰ -
عربستان سعودی با سرمایهگذاری ۵ میلیارد دلاری به دنبال تبدیل شدن به هاب دیجیتال و هوش مصنوعی
عربستان سعودی در راستای تحقق چشمانداز اقتصادی خود، قراردادی ۵ میلیارد دلاری با شرکت DataVolt برای احداث مرکز داده هوشمند در منطقه نئوم امضا کرد. این پروژه که در شهر شناور اکساگون در ساحل دریای سرخ اجرا خواهد شد، با هدف ایجاد زیرساختهای دیجیتال و هوش مصنوعی طراحی شده است. DataVolt یک شرکت توسعهدهنده مراکز داده پایدار است که بر استفاده از انرژیهای سبز تمرکز دارد. این سرمایهگذاری بخشی از تلاشهای عربستان برای تبدیل شدن به مرکز منطقهای هوش مصنوعی محسوب میشود. با وجود ادعای پایداری و کارآمدی انرژی، پروژه نئوم با چالشهای حقوق بشری متعددی از جمله مرگ کارگران مهاجر روبرو بوده است.
۱۴۰۳/۱۱/۲۴ ۲۲:۴۶:۵۵



