هوش مصنوعی تبدیل صدا - اخبار فناوری - EcoFori

رونمایی ElevenLabs از مدل هوش مصنوعی Scribe برای تبدیل گفتار به متن

استارتاپ ElevenLabs که در زمینه تولید صدا با هوش مصنوعی فعال است، اولین مدل مستقل تبدیل گفتار به متن خود به نام Scribe را معرفی کرد. این مدل از بیش از 99 زبان پشتیبانی می‌کند و در برخی زبان‌ها دارای دقت بالای 97 درصدی است. قیمت این سرویس ساعتی 0.40 دلار بوده و قابلیت‌هایی مانند تشخیص گوینده و زمان‌بندی کلمات را دارد.

۱۴۰۳/۱۲/۸ ۲۲:۲۷:۵۹
هوش مصنوعی نظامی در کانون توجه نمایشگاه هوایی سنگاپور

چند شرکت آمریکایی سازنده پهپاد این هفته در نمایشگاه هوایی سنگاپور حاضر شدند تا فروش خود را فراتر از پنتاگون به کشورهای آسیایی گسترش دهند؛ کشورهایی که با توجه به تقویت نظامی چین، به‌دنبال گزینه‌های تازه دفاعی هستند. 🛩️
موفقیت پهپادها در جنگ اوکراین موج سرمایه‌گذاری در پهپاد و هوش مصنوعی نظامی را بالا برده و حالا این فناوری‌ها از حاشیه به مرکز نمایشگاه‌های هوایی آمده‌اند. 🤖
Shield AI اعلام کرد نرم‌افزار خودران «Hivemind» حتی با اختلال GPS و ارتباطات هم می‌تواند مأموریت‌های شناسایی انجام دهند. Anduril نیز با تمرکز بر بازار تایوان، ژاپن و کره‌جنوبی از فروش پهپاد پرسه‌زن خود به تایوان خبر داده و Red Cat هم اعلام کرد یک کشور نامشخص در آسیا-اقیانوسیه برای پهپاد «Black Widow» سفارش ثبت کرده است. 🌏

۱۴۰۴/۱۱/۱۸ ۰۵:۰۸:۲۶
اپلیکیشن های چت، کدنویسی، پشتیبانی مشتری؛ مثلث طلایی سرمایه‌گذاری در هوش مصنوعی

در رویداد TechCrunch Disrupt، چند سرمایه‌گذار مطرح گفتند تمرکز اصلی سرمایه‌گذاری جسورانه فعلاً روی هوش مصنوعی است و بازار با سرعتی بی‌سابقه شلوغ‌تر می‌شود. 🤖
نینا آچاژیان از Index گفت مهم‌ترین معیارشان تاب‌آوری بنیان‌گذار است، چون تغییرات سریع می‌تواند تصویر اشتباهی از موفقیت بسازد. او هشدار داد تقاضای شرکت‌های بزرگ برای تست هوش مصنوعی گاهی تطابق محصول با بازارِ کاذب ایجاد می‌کند؛ یعنی درآمد می‌آید اما مشتری بازگشت سرمایه واقعی ندارد، پس توان تغییر مسیر حیاتی است. 📈
پیتر دِنگ از Felicis افزود استارتاپ باید مزیت دفاعی، به‌خصوص در داده، بسازد چون مشتریان چند رقیب را هم‌زمان امتحان می‌کنند. جری چِن از Greylock هم گفت فعلاً سه حوزه بیشتر جواب داده: اپ‌های چت، ابزارهای کدنویسی و هوش مصنوعی در خدمات مشتری؛ و موج بعدی می‌تواند بازارگاه‌های AI، رباتیک و تحول در SaaS باشد. 🧠

۱۴۰۴/۱۰/۱ ۰۵:۰۰:۴۴
پروژه غول‌پیکر OpenAI سه برابر Stargate است؛ هدف: آینده‌ای بدون محدودیت!

پس از انتشار ChatGPT در سال ۲۰۲۲، مدیرعامل OpenAI، سم آلتمن اعلام کرد این فناوری آغازگر یک انقلاب بزرگ در جهان تکنولوژی است و می‌تواند شرکتش را به مهم‌ترین شرکت تاریخ سیلیکون‌ولی تبدیل کند. 💬🤖
او پس از توافق جدید با مایکروسافت برای جذب سرمایه بدون محدودیت، از برنامه‌ای عظیم برای ساخت زیرساخت‌های هوش مصنوعی به ارزش ۱.۴ تریلیون دلار خبر داد که هدف آن ایجاد ۳۰ گیگاوات ظرفیت محاسباتی است. ⚙️
آلتمن گفت می‌خواهد هر هفته یک گیگاوات توان جدید به سیستم اضافه کند. این طرح سه برابر بزرگ‌تر از پروژه Stargate است که با همکاری شرکت‌هایی مانند اوراکل، انویدیا و سافت‌بانک و با حمایت دولت آمریکا اجرا می‌شود. 🇺🇸💼
او وعده داده اجرای این پروژه صدها هزار شغل ایجاد کند و درآمد سالانه OpenAI را از حدود ۲۰ میلیارد دلار به صدها میلیارد افزایش دهد. 💰

۱۴۰۴/۸/۹ ۱۰:۳۹:۴۶
ایلان ماسک در آستانه تبدیل شدن به نخستین تریلیونر جهان!

ایلان ماسک، مدیرعامل تسلا، ممکن است پس از رأی سهام‌داران در ۶ نوامبر به نخستین تریلیونر جهان تبدیل شود. 💰
این رأی درباره بسته پرداختی یک تریلیون دلاری است که در صورت تصویب، سهم رأی ماسک از ۱۳.۵٪ به حدود ۲۵٪ افزایش می‌یابد. 📊
ماسک گفت هدفش پول نیست، بلکه نفوذ بیشتر برای پیشبرد پروژه ربات‌های Optimus است. 🤖 او منتقدان این طرح را «تروریست‌های شرکتی» خواند و وعده داد نسخه جدید ربات‌ها اوایل سال آینده معرفی شود؛ ربات‌هایی که به گفته او پنج برابر کارآمدتر از انسان‌اند. ⚙️
با کاهش سود تسلا به‌دلیل تعرفه‌های دولت ترامپ و حذف مشوق مالیاتی خودروهای برقی، شرکت تمرکز خود را بر هوش مصنوعی و رباتیک گذاشته است. 🚗💡
ماسک گفت تا پایان سال تاکسی‌های خودران تسلا بدون راننده ایمنی در آستین فعال می‌شوند و سپس در چند شهر دیگر آمریکا گسترش می‌یابند. 🚘 او تأکید کرد سیستم خودران تسلا از انسان ایمن‌تر است و حتی بهتر از انسان‌ها جای پارک را تشخیص می‌دهد. 🧠

۱۴۰۴/۸/۶ ۰۷:۳۰:۳۴
الکسا به دربان هوشمند تبدیل شد؛ خوش‌آمدگویی مخصوص هر مهمان

آمازون مجموعه‌ای از قابلیت‌های تازه هوش مصنوعی را برای «رینگ» معرفی کرد. رینگ برند امنیتی آمازون است که زنگ‌های تصویری (مثل آیفون تصویری هوشمند) و دوربین‌های امنیتی تولید می‌کند. این دستگاه‌ها به موبایل وصل می‌شوند و به کاربر امکان می‌دهند تصویر و صدای جلوی درب یا محیط خانه را ببینند و حتی با بازدیدکننده صحبت کنند. 🏠📱
مهم‌ترین قابلیت جدید «چهره‌های آشنا» است که اعضای خانواده و دوستان را تشخیص داده و در صورت حضور فرد ناشناس هشدار می‌دهد. 👤📷
«الکسا پلاس» نیز به‌عنوان منشی هوشمند عمل کرده و درباره بازدیدکنندگان و مرسوله‌ها توضیح می‌دهد. 🔔🤖
ویژگی «جستجوی گروهی» هم با همکاری همسایه‌ها به پیدا کردن حیوانات خانگی گمشده کمک می‌کند و ابتدا برای سگ‌ها فعال می‌شود. 🐶📡

۱۴۰۴/۷/۱۰ ۱۲:۱۸:۰۰
توافق OpenAI و مایکروسافت: راهی به سوی عمومی شدن

OpenAI با مایکروسافت به توافق اولیه رسیده تا بخش تجاری خود را به یک شرکت با منفعت عمومی تبدیل کند؛ اقدامی که در صورت تأیید قانونی، راه را برای جذب سرمایه بیشتر و ورود به بورس باز می‌کند. 🤝📈
در این ساختار، بخش غیرانتفاعی OpenAI کنترل شرکت را حفظ کرده و سهمی بیش از ۱۰۰ میلیارد دلار خواهد داشت. این تصمیم پس از ماه‌ها مذاکره با مایکروسافت و در حالی گرفته شد که ایلان ماسک نیز علیه OpenAI شکایت کرده است. ✅⚖️

۱۴۰۴/۶/۲۵ ۰۰:۰۲:۴۳
Cursor به دنبال تبدیل شدن به رقیب اصلی مایکروسافت

استارتاپ Cursor که ابزار هوش مصنوعی برای کمک به برنامه‌نویسان می‌سازد، به‌تازگی تعدادی از مهندسان شرکت Koala را جذب کرده؛ استارتاپی که فقط چند ماه پیش ۱۵ میلیون دلار سرمایه گرفته بود اما حالا قرار است تعطیل شود. Cursor با این اقدام قصد دارد خدماتش را برای شرکت‌های بزرگ گسترش دهد و با رقبای بزرگی مثل GitHub Copilot مایکروسافت رقابت کند. ✅👨‍💻
Cursor حالا با شرکت‌هایی مثل انویدیا، اوبر و ادوبی همکاری دارد و درآمد سالانه‌اش به ۵۰۰ میلیون دلار رسیده. این شرکت می‌خواهد ابزاری بسازد که در شرکت‌ها به‌طور گسترده استفاده شود، نه فقط توسط برنامه‌نویسان به‌صورت شخصی. ✅📊
در همین حال، شرکت‌های بزرگی مثل مایکروسافت، گوگل و Anthropic هم با سرعت در حال توسعه ابزارهای کدنویسی هوش مصنوعی هستند. این ابزارها به برنامه‌نویسان کمک می‌کنند سریع‌تر و بهتر کد بزنند، و حالا همه شرکت‌ها دنبال بهترین ابزار ممکن برای کارمندان خود هستند. رقابت سنگینی در جریان است و Cursor با جذب استعداد و توسعه سریع، تلاش می‌کند از رقبا عقب نماند. ✅🚀

۱۴۰۴/۴/۳۱ ۰۱:۰۷:۴۶
Nvidia در آستانه تبدیل شدن به باارزش‌ترین شرکت تاریخ

انویدیا با رسیدن به ارزش بازار ۳.۹۲ تریلیون دلار در آستانه تبدیل‌شدن به باارزش‌ترین شرکت تاریخ قرار گرفته و از رکورد قبلی اپل عبور کرده است. 📈
افزایش تقاضا برای تراشه‌های هوش مصنوعی از سوی غول‌هایی چون مایکروسافت و آمازون، موتور اصلی این رشد بوده است. 🧠
ارزش انویدیا اکنون از کل بورس بریتانیا و حتی بازارهای کانادا و مکزیک بیشتر است، در حالی‌که نسبت قیمت به درآمد آن همچنان نسبتاً پایین باقی مانده است. 💰
سهام شرکت پس از افت ناشی از تعرفه‌های ترامپ، بیش از ۶۸٪ رشد کرده و بازار روی توافق‌های تجاری آینده حساب باز کرده است. 📊

۱۴۰۴/۴/۱۵ ۲۱:۱۱:۱۳
NotebookLM گوگل حالا تصویری شد؛ تبدیل یادداشت‌ها به ویدیو با هوش مصنوعی!

گوگل در I/O 2025 از قابلیت‌های جدیدی برای ابزار هوش مصنوعی NotebookLM رونمایی کرد. 🧠📒 این ابزار که برای یادداشت‌برداری و تحقیق طراحی شده، حالا می‌تواند محتواهای پیچیده مثل یادداشت‌ها، PDFها و تصاویر را به ویدیوهای قابل‌فهم تبدیل کند. 🎥📝
قابلیت «Video Overviews» کمک می‌کند موضوعات سخت را به‌صورت تصویری بهتر درک کنید، در ادامه نسخه صوتی هم ارتقا یافته و حالا می‌توان طول فایل‌های صوتی را به دلخواه تنظیم کرد. 🎧🗣️
همچنین اپلیکیشن NotebookLM برای اندروید و iOS منتشر شده و قابلیت‌هایی مثل پخش در پس‌زمینه و حالت آفلاین را دارد.📱

۱۴۰۴/۳/۱ ۰۳:۱۲:۳۱
گوگل با "Simplify" متن‌های پیچیده را به زبان ساده‌تر تبدیل می‌کند

گوگل از قابلیت تازه‌ای به نام Simplify در اپلیکیشن iOS خود رونمایی کرد ✨ این ابزار با بهره‌گیری از هوش مصنوعی Gemini و تحقیقات Google Research طراحی شده تا متن‌های فنی و دشوار را بدون حذف جزئیات مهم، به زبانی ساده و قابل‌فهم بازنویسی کند 🧠
کاربران تنها با انتخاب متن در مرورگر گوگل و لمس آیکون “Simplify”، می‌توانند نسخه‌ای ساده‌تر از همان محتوا را ببینند 📲 این قابلیت به کاربران کمک می‌کند بدون ترک صفحه وب، درک بهتری از اطلاعات پیدا کنند و مطالب را راحت‌تر حفظ کنند 📚
این اقدام گوگل، گامی هوشمندانه برای حفظ کاربران در محیط خدمات خود و رقابت با ابزارهایی چون ChatGPT به شمار می‌رود ♟️ قابلیت Simplify از این هفته برای کاربران iOS فعال می‌شود 🚀

۱۴۰۴/۲/۱۷ ۲۱:۴۸:۴۸
گوگل قابلیت صوتی‌سازی سند با هوش مصنوعی را به ۷۶ زبان جدید گسترش داد

گوگل قابلیت «Audio Overviews» در NotebookLM را که پادکست‌هایی هوش مصنوعی‌محور از اسناد کاربران تولید می‌کند، به ۷۶ زبان جدید گسترش داده است. کاربران اکنون می‌توانند زبان تولید پادکست‌ها را خودشان انتخاب کنند، که امکان تولید محتوای چندزبانه یا مطالب آموزشی شخصی‌سازی‌شده را فراهم می‌کند. این ابزار برای مثال به دانش‌آموزان کمک می‌کند که خلاصه محتوای منابع مختلف را به زبان دلخواه خود گوش دهند. زبان‌های جدید شامل فارسی، عربی، فرانسوی، چینی، ترکی، اسپانیایی، و بسیاری دیگر می‌شود.

۱۴۰۴/۲/۱۱ ۰۹:۴۵:۱۴
اشتباه ساده‌ای که به یک اصطلاح علمی جعلی تبدیل شد و حالا هوش مصنوعی دست از سرش برنمی‌دارد

یک واژه علمی ساختگی به نام «میکروسکوپ الکترونی گیاهی» به‌طور اشتباهی وارد مقالات علمی شده و حالا به لطف هوش مصنوعی، در حال گسترش در دنیای علم است. این اصطلاح در واقع نتیجه‌ی یک خطای دیجیتالی در اسکن یک مقاله قدیمی از دهه ۱۹۵۰ است که دو کلمه‌ی بی‌ربط از دو ستون مختلف به اشتباه با هم ترکیب شده‌اند.
این خطا وارد دیتابیس‌های عظیم آموزش مدل‌های هوش مصنوعی شده و از آنجا در پاسخ‌ها و حتی مقالات منتشرشده ظاهر می‌شود.
در بررسی‌ها مشخص شد این اصطلاح ساختگی در مدل‌های جدیدی مثل GPT-4 و Claude 3.5 هم وجود دارد و به‌سختی می‌توان آن را از داده‌های آموزشی پاک کرد. این ماجرا نشان می‌دهد که اشتباهات کوچک می‌توانند به «فسیل‌های دیجیتالی» تبدیل شوند و برای همیشه در حافظه‌ی اینترنت و هوش مصنوعی باقی بمانند.

۱۴۰۴/۱/۳۰ ۰۴:۰۳:۵۴
رباتاکسی‌های Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند

پلیس لس‌آنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان می‌دهد که خودروهای بدون راننده به منبع جدیدی برای جمع‌آوری شواهد تصویری تبدیل شده‌اند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار می‌دهد.

۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰
استارتاپی که خانه‌ها را به نیروگاه تبدیل می‌کند

استارتاپ Base Power که کمتر از یک سال از شروع فعالیتش می‌گذرد، موفق شده ۲۰۰ میلیون دلار جذب سرمایه کند تا با گسترش سریع باتری‌های خانگی خود، یکی از بزرگ‌ترین ناوگان‌های باتری در تگزاس را راه‌اندازی کند. این باتری‌ها با ظرفیت بالا در خانه‌ها نصب می‌شوند. کاربران در ازای دریافت برق پشتیبان هنگام قطع برق، موظف‌اند سه سال برق را از این شرکت با تعرفه ثابت خریداری کرده و سالانه مبلغی بپردازند.
مدل درآمدی اصلی Base Power از طریق فروش برق ذخیره‌شده این باتری‌ها به شبکه برق است. با این روش، شرکت می‌تواند بدون نیاز به ساخت نیروگاه‌های بزرگ، تنها با نصب باتری در خانه‌ها، یک “نیروگاه مجازی” ایجاد کند. باتری‌های خانگی سریع‌تر و آسان‌تر از نیروگاه‌های بزرگ راه‌اندازی می‌شوند. بخشی از سرمایه جذب‌شده نیز صرف ساخت کارخانه تولید باتری در آمریکا خواهد شد.

۱۴۰۴/۱/۲۵ ۱۷:۱۷:۱۴
اعتراض جمعی از کارکنان سابق OpenAI به تبدیل آن به شرکت سودمحور

۱۲ نفر از کارکنان سابق OpenAI با حمایت یک استاد حقوق دانشگاه هاروارد، از شکایت ایلان ماسک علیه این شرکت حمایت کرده‌اند. آن‌ها می‌گویند تبدیل OpenAI از یک سازمان غیرانتفاعی به شرکت سودمحور، برخلاف مأموریت اولیه آن برای توسعه ایمن و عمومی هوش مصنوعی است.
شرکت OpenAI می‌گوید ساختار جدیدش مانند شرکت‌های رقیب (مثل Anthropic) خواهد بود و همچنان بخش غیرانتفاعی حفظ می‌شود. هم‌زمان، گروه‌های حقوقی و کارگری نیز خواستار توقف این تغییر شده‌اند.

۱۴۰۴/۱/۲۴ ۰۴:۴۲:۰۵
تبدیل نوارهای مغناطیسی به سیستم دیجیتال؛ هزینه یا صرفه‌جویی؟

وزارت بهبود کارایی دولت آمریکا (Doge) اعلام کرده ۱۴ هزار نوار مغناطیسی حاوی داده‌های آرشیوی را به نسخه دیجیتال تبدیل کرده است؛ اقدامی که به گفته‌ی مسئولان، سالانه یک میلیون دلار صرفه‌جویی به همراه دارد.
اما برخی کارشناسان هشدار داده‌اند که این تصمیم ممکن است هزینه‌های پنهانی به‌دنبال داشته باشد. نوارهای مغناطیسی، با وجود قدمتشان، همچنان یکی از امن‌ترین و ارزان‌ترین روش‌های ذخیره‌سازی طولانی‌مدت هستند. آن‌ها در برابر حملات سایبری مقاوم‌اند و برخلاف فضای ابری، در حالت عادی انرژی مصرف نمی‌کنند.

۱۴۰۴/۱/۲۱ ۱۵:۰۹:۳۹
استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
استارتاپ Stability AI یک مدل هوش مصنوعی جدید برای تبدیل تصاویر به ویدیوهای واقعی رونمایی کرد

استارتاپ Stability AI مدل هوش مصنوعی Stable Virtual Camera را معرفی کرد که قادر است تصاویر دوبعدی را به ویدیوهای با عمق و پرسپکتیو واقعی تبدیل کند. این مدل می‌تواند از یک یا چند تصویر، نماهای جدیدی با زوایای دوربین مختلف ایجاد کند و ویدیوهایی با مسیرهای متنوع دوربین تولید نماید. نسخه تحقیقاتی فعلی این مدل با محدودیت‌هایی در کیفیت تصاویر انسان و حیوانات همراه است.

۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۳۷
تنسنت با معرفی مدل‌های هوش مصنوعی جدید، قابلیت تبدیل متن و تصویر به محیط سه‌بعدی را ارائه داد

شرکت تنسنت (Tencent)، غول فناوری چینی، پنج مدل متن‌باز هوش مصنوعی را برای تولید تصاویر سه‌بعدی معرفی کرد. این مدل‌ها با فناوری Hunyuan3D-2.0 می‌توانند ظرف ۳۰ ثانیه تصاویر سه‌بعدی با کیفیت بالا تولید کنند. این اقدام در راستای رقابت شرکت‌های چینی با شرکت‌های آمریکایی در حوزه هوش مصنوعی تولیدی است.

۱۴۰۳/۱۲/۲۸ ۱۳:۵۹:۵۹
گوگل مدل جدید Gemini Embedding را برای توسعه‌دهندگان معرفی کرد

گوگل مدل جدید Gemini Embedding را به عنوان یک مدل آزمایشی برای تبدیل متن به نمایش‌های عددی معرفی کرد.
این نمایش‌های عددی که نامیده می‌شوند، را در بر می‌گیرند. از مدل‌های در کاربردهای مختلفی مانند استفاده می‌شود، زیرا این مدل‌ها علاوه بر بهبود سرعت پردازش، می‌توانند هزینه‌ها را کاهش دهند
این مدل که با هوش مصنوعی Gemini آموزش دیده، قابلیت پردازش بیش از ۱۰۰ زبان را دارد و در حوزه‌های مختلف مانند علوم، مالی و حقوقی کارایی بالایی دارد. گوگل این مدل را در مرحله آزمایشی عرضه کرده و در تلاش برای انتشار عمومی آن در ماه‌های آینده است.

۱۴۰۳/۱۲/۱۷ ۲۳:۴۹:۱۱
رونمایی Mistral از API جدید OCR برای پردازش اسناد پیچیده

شرکت Mistral یک API جدید OCR معرفی کرد که قادر به تبدیل اسناد پی‌دی‌اف به متن با قالب‌بندی مارک‌داون است. این API چندوجهی می‌تواند تصاویر و متون پیچیده را شناسایی کرده و در خروجی نهایی حفظ کند. Mistral مدعی است این سرویس از نمونه‌های مشابه گوگل، مایکروسافت و OpenAI بهتر عمل می‌کند و برای پردازش اسناد توسط مدل‌های زبانی بزرگ طراحی شده است.

۱۴۰۳/۱۲/۱۶ ۲۲:۲۹:۵۶
پادکست‌سازی با هوش مصنوعی؛ Podcastle مدل جدید متن به گفتار را معرفی کرد

‏podcastle یک پلتفرم پادکست، مدل هوش مصنوعی Asyncflow v1.0 را برای تبدیل متن به گفتار معرفی کرد. این استارتاپ بیش از ۴۵۰ صدای مصنوعی و قابلیت ادغام API برای توسعه‌دهندگان را ارائه می دهد. هدف اصلی این مدل، کاهش هزینه‌های تولید و افزایش کیفیت تبدیل متن به صدا است.

۱۴۰۳/۱۲/۱۵ ۰۱:۲۰:۵۱
راه‌اندازی پلتفرم انتشار کتاب صوتی با هوش مصنوعی توسط ElevenLabs

شرکت ElevenLabs، یک استارتاپ فعال در زمینه هوش مصنوعی صدا، اپلیکیشن خود را برای انتشار کتاب‌های صوتی با فناوری هوش مصنوعی راه‌اندازی کرد. این پلتفرم به نویسندگان اجازه می‌دهد کتاب‌های صوتی خود را منتشر کنند و در ازای هر ۱۱ دقیقه گوش داده شدن به کتاب صوتیشان، حدود ۱.۱۰ دلار درآمد کسب کنند.

۱۴۰۳/۱۲/۸ ۱۱:۱۳:۵۰
عربستان سعودی با سرمایه‌گذاری ۵ میلیارد دلاری به دنبال تبدیل شدن به هاب دیجیتال و هوش مصنوعی

عربستان سعودی در راستای تحقق چشم‌انداز اقتصادی خود، قراردادی ۵ میلیارد دلاری با شرکت DataVolt برای احداث مرکز داده هوشمند در منطقه نئوم امضا کرد. این پروژه که در شهر شناور اکساگون در ساحل دریای سرخ اجرا خواهد شد، با هدف ایجاد زیرساخت‌های دیجیتال و هوش مصنوعی طراحی شده است. DataVolt یک شرکت توسعه‌دهنده مراکز داده پایدار است که بر استفاده از انرژی‌های سبز تمرکز دارد. این سرمایه‌گذاری بخشی از تلاش‌های عربستان برای تبدیل شدن به مرکز منطقه‌ای هوش مصنوعی محسوب می‌شود. با وجود ادعای پایداری و کارآمدی انرژی، پروژه نئوم با چالش‌های حقوق بشری متعددی از جمله مرگ کارگران مهاجر روبرو بوده است.

۱۴۰۳/۱۱/۲۴ ۲۲:۴۶:۵۵
بازنشستگی GPT-4o در سایه ۸ شکایت حقوقی علیه OpenAI

OpenAI اعلام کرده مدل هوش مصنوعی GPT-4o تا ۱۳ فوریه بازنشسته می‌شود؛ مدلی که به‌دلیل پاسخ‌های بیش‌ازحد صمیمی و تأییدکننده شناخته می‌شد و برخی کاربران به آن وابستگی عاطفی پیدا کرده بودند. 💬
این تصمیم در حالی گرفته شده که OpenAI با هشت شکایت حقوقی روبه‌روست؛ شاکیان می‌گویند پاسخ‌های همدلانه این مدل در برخی موارد به بحران‌های روانی و حتی خودکشی انجامیده و کاربران آسیب‌پذیر را از خانواده و واقعیت دور کرده است. ⚖️
برخی کاربران به این تصمیم OpenAI اعتراض کرده اند و گفته اند دوستشان را از دست میدهند! اما کارشناسان هشدار می‌دهند چالش اصلی شرکت‌های هوش مصنوعی، ایجاد تعادل میان «همدل بودن» و «ایمن بودن» است. با اینکه فقط ۰.۱٪ کاربران از GPT-4o استفاده می‌کنند، این رقم حدود ۸۰۰ هزار نفر برآورد می‌شود و مدیرعامل OpenAI تأکید کرده رابطه عاطفی با چت‌بات‌ها دیگر موضوعی ساده نیست. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۳۴
کمبود شدید CPU در چین؛ اینتل و AMD زمان تحویل را ماه‌ها عقب انداختند

اینتل و AMD به مشتریان چینی خود درباره کمبود پردازنده‌های سروری هشدار داده‌اند و اینتل اعلام کرده زمان تحویل برخی سفارش‌ها تا شش ماه طول می‌کشد؛ موضوعی که باعث افزایش بیش از ۱۰ درصدی قیمت برخی محصولات سروری در چین شده است. 📈
افزایش سرمایه‌گذاری در زیرساخت‌های هوش مصنوعی، تقاضا برای پردازنده و حافظه را به‌شدت بالا برده و کمبودها را تشدید کرده است؛ در چین که بیش از ۲۰ درصد درآمد اینتل را تشکیل می‌دهد، پردازنده‌های نسل چهارم و پنجم Xeon با سهمیه عرضه می‌شوند و سفارش‌های معوقه افزایش یافته است. ⏳
AMD نیز از محدودیت عرضه خبر داده و تحویل برخی محصولاتش ۸ تا ۱۰ هفته زمان می‌برد؛ اینتل وعده بهبود وضعیت از سه‌ماهه دوم ۲۰۲۶ را داده و AMD هم می‌گوید با همکاری TSMC ظرفیت تولید را تقویت کرده است. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۲۳
تنش‌های ژئوپلیتیکی مانع توافق جهانی بر سر هوش مصنوعی نظامی شد

در نشست بین‌المللی «هوش مصنوعی مسئولانه در حوزه نظامی» (REAIM) در شهر آکورونیا اسپانیا، فقط ۳۵ کشور از مجموع ۸۵ کشور حاضر، بیانیه‌ای درباره نحوه استفاده از هوش مصنوعی در جنگ را امضا کردند؛ اما آمریکا و چین از پیوستن به آن خودداری کردند. 🌍
این بیانیه ۲۰ اصل کلی را مطرح می‌کند؛ از جمله تأکید بر اینکه تصمیم نهایی در استفاده از سلاح‌های مبتنی بر هوش مصنوعی باید با انسان باشد، زنجیره فرماندهی شفاف حفظ شود و ارزیابی ریسک و آزمایش‌های دقیق انجام گیرد. با اینکه سند الزام‌آور نیست، برخی کشورها به‌دلیل رقابت نظامی با چین و روسیه تمایلی به محدودسازی خود نداشتند. ⚖️
وزیر دفاع هلند گفت دولت‌ها در یک «دوراهی» قرار گرفته‌اند: از یک سو باید استفاده مسئولانه از AI را تضمین کنند و از سوی دیگر نمی‌خواهند در رقابت تسلیحاتی عقب بمانند. کانادا، آلمان، فرانسه، بریتانیا، هلند، کره‌جنوبی و اوکراین از امضاکنندگان این توافق بودند. 🤖

۱۴۰۴/۱۱/۲۴ ۱۶:۴۹:۱۹

نمایش بیشتر