ویرایش تصویر - صفحه 2 - اخبار فناوری - EcoFori

مدل تصویری Recraft از DALL-E و Midjourney پیشی گرفت!

استارتاپ نوپای Recraft که توانست در رقابتی جدی، مدل‌های تصویری بزرگی چون DALL-E و Midjourney را شکست دهد، حالا با جذب سرمایه ۳۰ میلیون دلاری در مسیر رشد پرشتابی قرار گرفته است.🚀
این شرکت با مدل red_panda، در تولید تصاویر دقیق برای برندها عملکردی بی‌نقص دارد؛ قابلیتی که آن را به رقیبی جدی برای ابزارهای طراحی مثل Canva بدل کرده است.🤖🏞️
Recraft که حالا به ۵ میلیون دلار درآمد و ۴ میلیون کاربر رسیده، توسط تنها مؤسس زن این حوزه هدایت می‌شود؛ کسی که از تجربه خود در گوگل، یاندکس و مایکروسافت آموخته.
موفقیت فقط با سخت‌کوشی حاصل نمی‌شود، بلکه نیازمند مهارت در بخش‌های کلیدی است. 🔥

۱۴۰۴/۲/۱۷ ۱۳:۲۸:۱۷
پینترست جستجوی تصویری خود را با هوش مصنوعی متحول کرد

🔍🖼️🤖 پینترست (Pinterest) ، شبکه اجتماعی تصویری ، با به‌روزرسانی بزرگ مبتنی بر هوش مصنوعی، تجربه جستجوی تصویری کاربران را متحول کرده است. اکنون کاربران می‌توانند بفهمند دقیقاً چه چیزی در یک تصویر برایشان جذاب است و به‌راحتی گزینه‌های مشابه با سبک، رنگ یا جنس دلخواه را بیابند. 💡👗 جستجوی تصویری با نگه‌داشتن روی پین‌ها فعال می‌شود و به بخش‌های بیشتری از اپلیکیشن گسترش یافته است. پینترست هم‌زمان در تلاش است تا تصاویر تولیدشده توسط AI را شفاف‌سازی کرده و کنترل بیشتری به کاربران بدهد تا از محتوای واقعی و الهام‌بخش بهره ببرند. ⚠️

۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۶
اسکایپ خاموش شد؛ پایان ۲۳ سال ارتباط جهانی

📴📞 مایکروسافت پس از ۲۳ سال به اسکایپ پایان داد.
از امروز، کاربران باید به سراغ Microsoft Teams یا جایگزین‌هایی مثل Zoom، Google Meet، Webex و Discord بروند. Teams با امکانات قوی‌تر مخصوص جلسات کاری، جایگزین رسمی اسکایپ است.
پایان اسکایپ، آغاز رقابت جدید بین برنامه‌های ویدیویی! 📡🧑‍💻🔁

۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۱
آموزش کاملاً قانونی؛ Freepik مدل هوش مصنوعی اخلاق‌محور F Lite را معرفی کرد

Freepik یک مدل هوش مصنوعی جدید با نام F Lite معرفی کرد که منحصراً با تصاویر دارای مجوز تجاری آموزش دیده است. این مدل که با همکاری استارتاپ Fal.ai توسعه یافته، حاوی 10 میلیارد پارامتر بوده و با استفاده از ۶۴ کارت گرافیک قدرتمند طی دو ماه ساخته شده و در دو نسخه استاندارد و بافت (Texture) طراحی شده است. هدف اصلی Freepik از این اقدام، ارائه یک مدل باز برای توسعه دهندگان است که بتوانند آن را بهبود بخشند.

۱۴۰۴/۲/۱۱ ۱۲:۲۸:۰۵
۱۴۰۴/۲/۱۰ ۱۸:۰۰:۰۴
معاوضه 2.5 میلیون عکس چهره بازداشت شدگان با نرم‌افزار تشخیص چهره

پلیس میلواکی در ایالت ویسکانسین آمریکا پیشنهاد داده که ۲.۵ میلیون عکس بازداشت‌شدگان را به یک شرکت خصوصی بدهد تا در ازای آن، دسترسی رایگان به نرم‌افزار تشخیص چهره برای شناسایی مظنونان دریافت کند. این طرح نگرانی‌های جدی درباره نقض حریم خصوصی و تبعیض نژادی ایجاد کرده، زیرا سابقه نشان داده این فناوری در تشخیص افراد رنگین‌پوست دچار خطای بالاست. همچنین در این معامله، رضایت افراد در نظر گرفته نشده و خطر سوءاستفاده از اطلاعات شخصی وجود دارد. فعالان حقوق بشر خواستار توقف این اقدام و تصویب قوانین سختگیرانه برای کنترل استفاده از فناوری‌های نظارتی شده‌اند.

۱۴۰۴/۲/۹ ۱۸:۴۷:۱۲
رونمایی موفق اینستاگرام Edits با استقبال گسترده کاربران

اپلیکیشن Edits متعلق به شرکت Meta با استقبال چشمگیری در بازار نرم‌افزارهای ویرایش ویدیو مواجه شده است. این اپلیکیشن در دو روز نخست، بیش از 702,900 بار در دستگاه‌های iOS دانلود شده که این رقم 37 برابر بیشتر از رقیب اصلی CapCut است. تا پایان هفته، تعداد دانلودها به 7.1 میلیون رسید و در ایالات متحده به تنهایی 381,000 بار دانلود شده است.

۱۴۰۴/۲/۷ ۱۸:۲۵:۱۳
رشد چشمگیر جست‌وجوی هوش مصنوعی در گوگل؛ موفقیتی برنامه‌ریزی‌شده

ویژگی «AI Overviews» گوگل حالا ماهانه ۱.۵ میلیارد کاربر در ۱۰۰ کشور دارد. این ابزار با خلاصه‌سازی توسط هوش مصنوعی، پاسخ‌هایی را بالای نتایج جست‌وجو نشان می‌دهد. گوگل آن را راهی برای افزایش درآمد می‌داند، اگرچه برخی ناشران از کاهش بازدید شکایت دارند.
هم‌زمان، گوگل ابزارهای جدیدی مثل «AI Mode» و «Circle to Search» را معرفی کرده که مورد استقبال قرار گرفته‌اند؛ دستگاه‌های دارای Circle to Search به ۲۵۰ میلیون رسیده و استفاده از آن ۴۰ درصد رشد داشته است.
جست‌وجو با Google Lens هم ۵ میلیارد بار بیشتر شده و خرید از طریق آن ۱۰ درصد افزایش یافته است. این رشد در حالی است که گوگل با پرونده‌های حقوقی درباره انحصار در جست‌وجو و تبلیغات مواجه شده است.

۱۴۰۴/۲/۶ ۱۹:۰۰:۲۱
ورود مدل‌های هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی

شرکت Adobe مدل‌های جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید می‌کند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدل‌های تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون می‌توانند با مدل‌هایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایده‌پردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.

۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶
راه‌اندازی API تولید تصویر OpenAI برای توسعه‌دهندگان

OpenAI قابلیت تولید تصویر هوش مصنوعی خود را در API جدید معرفی کرد که به توسعه‌دهندگان اجازه می‌دهد این فناوری را در برنامه‌های خود ادغام کنند. مدل gpt-image-1 می‌تواند تصاویر متنوع و با کیفیت را در سبک‌های مختلف ایجاد کند و از محدودیت‌های امنیتی برخوردار است. شرکت‌هایی مانند Adobe، Canva و Figma از این فناوری استفاده می‌کنند.

۱۴۰۴/۲/۴ ۲۲:۰۷:۵۱
هوش مصنوعی Grok قابلیت تشخیص تصاویر را به دست آورد

شرکت xAI قابلیت جدید Grok Vision را برای هوش مصنوعی Grok معرفی کرد که به کاربران اجازه می‌دهد با استفاده از دوربین تلفن همراه، اشیا، متون و محیط‌های اطراف خود را اسکن و درباره آنها سوال بپرسند. این قابلیت در حال حاضر برای کاربران iOS در دسترس است و به زودی برای اندروید نیز عرضه خواهد شد.

۱۴۰۴/۲/۴ ۰۳:۴۲:۵۹
متا اپلیکیشن Edits را برای ویرایش ویدیو راه‌اندازی کرد

شرکت متا اپلیکیشن Edits را به عنوان یک ابزار ویرایش ویدیو برای رقابت با CapCut معرفی کرد. این اپلیکیشن رایگان امکانات متنوعی مانند ایده‌پردازی، ویرایش، افکت‌گذاری و استفاده از هوش مصنوعی را برای تولیدکنندگان محتوا فراهم می‌کند. کاربران می‌توانند ویدیوهای خود را بدون واترمارک تولید و در پلتفرم‌های مختلف منتشر کنند.

۱۴۰۴/۲/۳ ۲۳:۵۵:۱۱
پلیس رباتیک در جشن سال نو تایلند؛ ناظر بی‌خواب با چشمان هوشمند

پلیس تایلند در جشن سال نو از یک ربات به نام «AI Police Cyborg 1.0» رونمایی کرد که با دوربین‌های ۳۶۰ درجه، تشخیص چهره، تحلیل رفتار، شناسایی اسلحه و دسترسی به تصاویر پهپادها و دوربین‌های مداربسته، طراحی شده تا امنیت مراسم‌ها را حفظ کند. این ربات می‌تواند چهره‌ها و رفتارهای مشکوک را تشخیص دهد و حتی آب‌پاش را از اسلحه واقعی تشخیص دهد.
این ربات به مرکز فرماندهی استان متصل است و هدف اصلی آن کمک به کنترل جمعیت در رویدادهای بزرگ اعلام شده. اما برخی نگران‌اند که از این فناوری برای کنترل فعالان سیاسی استفاده شود، به‌ویژه با توجه به سابقه پلیس تایلند در برخورد با معترضان.
هرچند قابلیت‌های پیشرفته‌ای برای این ربات تبلیغ شده، اما فعلاً حتی حرکتی از آن دیده نشده و مانند نمونه‌های مشابه در کشورهای دیگر، احتمال دارد کارایی زیادی نداشته باشد.

۱۴۰۴/۲/۲ ۲۱:۵۵:۵۷
نتفلیکس با درآمد بالاتر از انتظارات، چشم‌انداز مثبتی را ترسیم کرد

نتفلیکس (Netflix) سرویس پخش آنلاین محتوا در گزارش مالی سه‌ماهه اول سال، درآمدی بالاتر از پیش‌بینی‌های تحلیلگران کسب کرد. این شرکت با انتشار سریال‌های جدید و افزایش تعداد مشترکان، درآمد ۱۰.۵۴ میلیارد دلاری را محقق ساخت.

۱۴۰۴/۱/۳۰ ۰۴:۱۴:۰۰
رباتاکسی‌های Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند

پلیس لس‌آنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان می‌دهد که خودروهای بدون راننده به منبع جدیدی برای جمع‌آوری شواهد تصویری تبدیل شده‌اند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار می‌دهد.

۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد

گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران می‌توانند از طریق عکس‌هایی که می‌گیرند یا آپلود می‌کنند، سوالات پیچیده بپرسند.
این ویژگی که با کمک فناوری Google Lens کار می‌کند، می‌تواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفته‌اند.

به‌عنوان نمونه، اگر از کتابخانه‌تان عکس بگیرید و بپرسید: «اگه از این کتاب‌ها خوشم اومده، چه کتاب‌های مشابهی پیشنهاد می‌کنی؟» این سیستم کتاب‌ها را شناسایی می‌کند و پیشنهادهایی برایتان می‌آورد. همچنین می‌توانید سوال‌های بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»

این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویس‌هایی مثل ChatGPT Search و Perplexity محسوب می‌شود.

۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴
رونمایی Midjourney از مدل هوش مصنوعی جدید V7 با قابلیت‌های پیشرفته

میدجرنی، سرویس تولید تصویر هوش مصنوعی، مدل جدید V7 را معرفی کرد که با معماری متفاوت و قابلیت شخصی‌سازی، کیفیت تصاویر را به طور چشمگیری بهبود بخشیده است. این مدل در دو نسخه Turbo و Relax با سرعت بالاتر و قابلیت ایجاد تصاویر با جزئیات دقیق‌تر طراحی شده و در مرحله آلفا قرار دارد.

۱۴۰۴/۱/۱۶ ۰۹:۳۴:۴۹
Youtube Shorts با امکانات جدید به رقابت با تیک‌تاک می‌آید

Youtube Shorts با هدف رقابت با تیک‌تاک، امکانات جدیدی مانند ویرایشگر پیشرفته ویدیو، تولید استیکر هوش مصنوعی، همگام‌سازی محتوا با ریتم موسیقی و قالب‌های بهبود یافته را معرفی می‌کند. این قابلیت‌ها در آستانه احتمال ممنوعیت تیک‌تاک در آمریکا، فرصتی برای جذب تولیدکنندگان محتوا فراهم می‌کند.

۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۲
موفقیت چشمگیر قابلیت تولید تصویر OpenAI در ChatGPT

OpenAI با راه‌اندازی قابلیت تولید تصویر در ChatGPT، موفق به جذب 130 میلیون کاربر و تولید 700 میلیون تصویر در کمتر از یک هفته شده است. این قابلیت جدید که توانایی تولید تصاویر واقع‌گرایانه با سبک استودیو Ghibli را دارد، با استقبال بی‌سابقه‌ای مواجه شده اما زیرساخت‌های شرکت را تحت فشار قرار داده است.

۱۴۰۴/۱/۱۵ ۱۹:۰۴:۳۰
افزایش کاربران ChatGPT و چالش‌های ظرفیتی OpenAI

شرکت OpenAI با افزایش چشمگیر کاربران ChatGPT به ویژه در بخش تولید تصویر، با چالش‌های ظرفیتی مواجه شده است. سام آلتمن مدیرعامل شرکت اعلام کرد که در یک ساعت، یک میلیون کاربر جدید به پلتفرم اضافه شده و این موضوع منجر به تأخیر در انتشار محصولات و کندی سرویس خواهد شد.

۱۴۰۴/۱/۱۳ ۱۹:۴۶:۴۲
موج جهانی هوش مصنوعی با سبک انیمیشن استودیو Ghibli

پلتفرم هوش مصنوعی ChatGPT با ایجاد قابلیت تولید تصاویر با سبک انیمیشن استودیو Ghibli، رکورد جذب کاربر را شکست. این روند ویروسی باعث افزایش 11 درصدی دانلود اپلیکیشن و رسیدن کاربران فعال هفتگی به بیش از 150 میلیون نفر شد. با این حال، این موضوع سوالاتی درباره نقض احتمالی حقوق کپی رایت را نیز مطرح کرده است.

۱۴۰۴/۱/۱۳ ۱۷:۴۳:۰۲
هوش مصنوعی OpenAI تولید تصویر را برای همه کاربران آزاد کرد

OpenAI تولید تصویر با مدل GPT-4o را برای تمام کاربران رایگان کرد. این سرویس پیش از این فقط برای کاربران پولی در دسترس بود. مدیرعامل شرکت اعلام کرد که کاربران رایگان می‌توانند روزانه سه تصویر تولید کنند. استقبال گسترده از این سرویس باعث فشار بر سرورهای شرکت شده است.

۱۴۰۴/۱/۱۳ ۱۰:۲۴:۴۶
محدودیت در سرویس تولید تصویر OpenAI به دلیل ترافیک بالا

شرکت OpenAI با حجم بالای درخواست برای سرویس تولید تصویر Sora مواجه شده است. این شرکت به دلیل ترافیک سنگین، تولید تصویر را برای کاربران جدید موقتاً متوقف کرده و کارکنان آن در تلاش برای حفظ کیفیت سرویس هستند.

۱۴۰۴/۱/۱۲ ۲۰:۴۷:۳۴
هوش مصنوعی ChatGPT و تصویرسازی جنجالی از خودش

هوش مصنوعی ChatGPT در تصویرسازی از خودش، مردی سفیدپوست با موهای قهوه‌ای و عینک را به عنوان چهره پیش‌فرض ترسیم می‌کند. این موضوع نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی است که می‌تواند ناشی از تنوع محدود در منابع اطلاعاتی باشد. پژوهشگران معتقدند این رفتار می‌تواند نتیجه انتخاب عمدی، شوخی درونی شرکت یا ویژگی ذاتی داده‌های آموزشی باشد.

۱۴۰۴/۱/۱۲ ۱۸:۴۲:۱۵
تأثیر کیفیت صدا در قضاوت افراد در جلسات آنلاین

پژوهشی در دانشگاه ییل نشان می‌دهد کیفیت صدای افراد در تماس‌های تصویری، تأثیر مستقیمی بر قضاوت دیگران درباره آنها دارد. محققان دریافتند استفاده از میکروفون با کیفیت پایین می‌تواند شانس استخدام، برقراری ارتباط عاطفی و اعتبار فردی را کاهش دهد. این تأثیر صرف نظر از جنسیت و لهجه، در تمامی آزمایش‌ها مشهود بود.

۱۴۰۴/۱/۱۱ ۱۱:۰۴:۱۵
هوش مصنوعی OpenAI با قابلیت تولید تصاویر در سبک انیمیشن استودیو Ghibli جنجال برانگیز شد

قابلیت تولید تصویر جدیدی در ChatGPT به‌تازگی معرفی شده و کاربران با آن تصاویر زیادی در سبک استودیوی انیمیشن‌سازی Ghibli ایجاد کرده‌اند. این موضوع بحث‌های نقض کپی‌رایت را دوباره مطرح کرده است.
طبق نظر کارشناسان، سبک هنری به‌طور صریح تحت حفاظت کپی‌رایت نیست، اما اگر مدل‌های هوش مصنوعی برای تقلید از این سبک، روی آثار دارای حق نشر آموزش داده شده باشند، ممکن است نقض قانون محسوب شود.
چندین شرکت بزرگ، از جمله نیویورک تایمز، قبلاً از OpenAI و سایر شرکت‌های هوش مصنوعی به دلیل استفاده از محتوای دارای حق نشر بدون مجوز شکایت کرده‌اند. بااین‌حال، هنوز دادگاه‌ها در مورد قانونی بودن این روش تصمیم نگرفته‌اند.

۱۴۰۴/۱/۸ ۱۱:۲۹:۲۸
تأخیر در ارائه قابلیت‌های تولید تصویر ChatGPT برای کاربران رایگان

مدیرعامل OpenAI اعلام کرد که راه‌اندازی ویژگی‌های تولید تصویر ChatGPT برای کاربران رایگان به تعویق افتاده است. تقاضا برای این قابلیت بسیار بیشتر از پیش‌بینی شرکت بوده و در حال حاضر این امکان تنها برای کاربران اشتراک Pro، Plus و Teams در دسترس است.

۱۴۰۴/۱/۸ ۰۲:۳۲:۱۶
قابلیت جدید تولید تصویر در ChatGPT با مدل GPT-4o

شرکت OpenAI قابلیت جدید تولید و ویرایش تصاویر را برای ChatGPT معرفی کرد. این قابلیت جدید با مدل GPT-4o امکان ایجاد تصاویر دقیق‌تر و با جزئیات بیشتر را فراهم می‌کند و در حال حاضر برای کاربران اشتراک Pro در دسترس است و به زودی برای سایر کاربران منتشر خواهد شد.

۱۴۰۴/۱/۷ ۰۱:۱۴:۴۸

نمایش بیشتر