-
مدل تصویری Recraft از DALL-E و Midjourney پیشی گرفت!
استارتاپ نوپای Recraft که توانست در رقابتی جدی، مدلهای تصویری بزرگی چون DALL-E و Midjourney را شکست دهد، حالا با جذب سرمایه ۳۰ میلیون دلاری در مسیر رشد پرشتابی قرار گرفته است.🚀
این شرکت با مدل red_panda، در تولید تصاویر دقیق برای برندها عملکردی بینقص دارد؛ قابلیتی که آن را به رقیبی جدی برای ابزارهای طراحی مثل Canva بدل کرده است.🤖🏞️
Recraft که حالا به ۵ میلیون دلار درآمد و ۴ میلیون کاربر رسیده، توسط تنها مؤسس زن این حوزه هدایت میشود؛ کسی که از تجربه خود در گوگل، یاندکس و مایکروسافت آموخته.
موفقیت فقط با سختکوشی حاصل نمیشود، بلکه نیازمند مهارت در بخشهای کلیدی است. 🔥۱۴۰۴/۲/۱۷ ۱۳:۲۸:۱۷ -
پینترست جستجوی تصویری خود را با هوش مصنوعی متحول کرد
🔍🖼️🤖 پینترست (Pinterest) ، شبکه اجتماعی تصویری ، با بهروزرسانی بزرگ مبتنی بر هوش مصنوعی، تجربه جستجوی تصویری کاربران را متحول کرده است. اکنون کاربران میتوانند بفهمند دقیقاً چه چیزی در یک تصویر برایشان جذاب است و بهراحتی گزینههای مشابه با سبک، رنگ یا جنس دلخواه را بیابند. 💡👗 جستجوی تصویری با نگهداشتن روی پینها فعال میشود و به بخشهای بیشتری از اپلیکیشن گسترش یافته است. پینترست همزمان در تلاش است تا تصاویر تولیدشده توسط AI را شفافسازی کرده و کنترل بیشتری به کاربران بدهد تا از محتوای واقعی و الهامبخش بهره ببرند. ⚠️
۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۶ -
اسکایپ خاموش شد؛ پایان ۲۳ سال ارتباط جهانی
📴📞 مایکروسافت پس از ۲۳ سال به اسکایپ پایان داد.
از امروز، کاربران باید به سراغ Microsoft Teams یا جایگزینهایی مثل Zoom، Google Meet، Webex و Discord بروند. Teams با امکانات قویتر مخصوص جلسات کاری، جایگزین رسمی اسکایپ است.
پایان اسکایپ، آغاز رقابت جدید بین برنامههای ویدیویی! 📡🧑💻🔁۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۱ -
آموزش کاملاً قانونی؛ Freepik مدل هوش مصنوعی اخلاقمحور F Lite را معرفی کرد
Freepik یک مدل هوش مصنوعی جدید با نام F Lite معرفی کرد که منحصراً با تصاویر دارای مجوز تجاری آموزش دیده است. این مدل که با همکاری استارتاپ Fal.ai توسعه یافته، حاوی 10 میلیارد پارامتر بوده و با استفاده از ۶۴ کارت گرافیک قدرتمند طی دو ماه ساخته شده و در دو نسخه استاندارد و بافت (Texture) طراحی شده است. هدف اصلی Freepik از این اقدام، ارائه یک مدل باز برای توسعه دهندگان است که بتوانند آن را بهبود بخشند.
۱۴۰۴/۲/۱۱ ۱۲:۲۸:۰۵ -
-
معاوضه 2.5 میلیون عکس چهره بازداشت شدگان با نرمافزار تشخیص چهره
پلیس میلواکی در ایالت ویسکانسین آمریکا پیشنهاد داده که ۲.۵ میلیون عکس بازداشتشدگان را به یک شرکت خصوصی بدهد تا در ازای آن، دسترسی رایگان به نرمافزار تشخیص چهره برای شناسایی مظنونان دریافت کند. این طرح نگرانیهای جدی درباره نقض حریم خصوصی و تبعیض نژادی ایجاد کرده، زیرا سابقه نشان داده این فناوری در تشخیص افراد رنگینپوست دچار خطای بالاست. همچنین در این معامله، رضایت افراد در نظر گرفته نشده و خطر سوءاستفاده از اطلاعات شخصی وجود دارد. فعالان حقوق بشر خواستار توقف این اقدام و تصویب قوانین سختگیرانه برای کنترل استفاده از فناوریهای نظارتی شدهاند.
۱۴۰۴/۲/۹ ۱۸:۴۷:۱۲ -
رونمایی موفق اینستاگرام Edits با استقبال گسترده کاربران
اپلیکیشن Edits متعلق به شرکت Meta با استقبال چشمگیری در بازار نرمافزارهای ویرایش ویدیو مواجه شده است. این اپلیکیشن در دو روز نخست، بیش از 702,900 بار در دستگاههای iOS دانلود شده که این رقم 37 برابر بیشتر از رقیب اصلی CapCut است. تا پایان هفته، تعداد دانلودها به 7.1 میلیون رسید و در ایالات متحده به تنهایی 381,000 بار دانلود شده است.
۱۴۰۴/۲/۷ ۱۸:۲۵:۱۳ -
رشد چشمگیر جستوجوی هوش مصنوعی در گوگل؛ موفقیتی برنامهریزیشده
ویژگی «AI Overviews» گوگل حالا ماهانه ۱.۵ میلیارد کاربر در ۱۰۰ کشور دارد. این ابزار با خلاصهسازی توسط هوش مصنوعی، پاسخهایی را بالای نتایج جستوجو نشان میدهد. گوگل آن را راهی برای افزایش درآمد میداند، اگرچه برخی ناشران از کاهش بازدید شکایت دارند.
همزمان، گوگل ابزارهای جدیدی مثل «AI Mode» و «Circle to Search» را معرفی کرده که مورد استقبال قرار گرفتهاند؛ دستگاههای دارای Circle to Search به ۲۵۰ میلیون رسیده و استفاده از آن ۴۰ درصد رشد داشته است.
جستوجو با Google Lens هم ۵ میلیارد بار بیشتر شده و خرید از طریق آن ۱۰ درصد افزایش یافته است. این رشد در حالی است که گوگل با پروندههای حقوقی درباره انحصار در جستوجو و تبلیغات مواجه شده است.۱۴۰۴/۲/۶ ۱۹:۰۰:۲۱ -
ورود مدلهای هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی
شرکت Adobe مدلهای جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید میکند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدلهای تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون میتوانند با مدلهایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایدهپردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.
۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶ -
راهاندازی API تولید تصویر OpenAI برای توسعهدهندگان
OpenAI قابلیت تولید تصویر هوش مصنوعی خود را در API جدید معرفی کرد که به توسعهدهندگان اجازه میدهد این فناوری را در برنامههای خود ادغام کنند. مدل gpt-image-1 میتواند تصاویر متنوع و با کیفیت را در سبکهای مختلف ایجاد کند و از محدودیتهای امنیتی برخوردار است. شرکتهایی مانند Adobe، Canva و Figma از این فناوری استفاده میکنند.
۱۴۰۴/۲/۴ ۲۲:۰۷:۵۱ -
هوش مصنوعی Grok قابلیت تشخیص تصاویر را به دست آورد
شرکت xAI قابلیت جدید Grok Vision را برای هوش مصنوعی Grok معرفی کرد که به کاربران اجازه میدهد با استفاده از دوربین تلفن همراه، اشیا، متون و محیطهای اطراف خود را اسکن و درباره آنها سوال بپرسند. این قابلیت در حال حاضر برای کاربران iOS در دسترس است و به زودی برای اندروید نیز عرضه خواهد شد.
۱۴۰۴/۲/۴ ۰۳:۴۲:۵۹ -
متا اپلیکیشن Edits را برای ویرایش ویدیو راهاندازی کرد
شرکت متا اپلیکیشن Edits را به عنوان یک ابزار ویرایش ویدیو برای رقابت با CapCut معرفی کرد. این اپلیکیشن رایگان امکانات متنوعی مانند ایدهپردازی، ویرایش، افکتگذاری و استفاده از هوش مصنوعی را برای تولیدکنندگان محتوا فراهم میکند. کاربران میتوانند ویدیوهای خود را بدون واترمارک تولید و در پلتفرمهای مختلف منتشر کنند.
۱۴۰۴/۲/۳ ۲۳:۵۵:۱۱ -
پلیس رباتیک در جشن سال نو تایلند؛ ناظر بیخواب با چشمان هوشمند
پلیس تایلند در جشن سال نو از یک ربات به نام «AI Police Cyborg 1.0» رونمایی کرد که با دوربینهای ۳۶۰ درجه، تشخیص چهره، تحلیل رفتار، شناسایی اسلحه و دسترسی به تصاویر پهپادها و دوربینهای مداربسته، طراحی شده تا امنیت مراسمها را حفظ کند. این ربات میتواند چهرهها و رفتارهای مشکوک را تشخیص دهد و حتی آبپاش را از اسلحه واقعی تشخیص دهد.
این ربات به مرکز فرماندهی استان متصل است و هدف اصلی آن کمک به کنترل جمعیت در رویدادهای بزرگ اعلام شده. اما برخی نگراناند که از این فناوری برای کنترل فعالان سیاسی استفاده شود، بهویژه با توجه به سابقه پلیس تایلند در برخورد با معترضان.
هرچند قابلیتهای پیشرفتهای برای این ربات تبلیغ شده، اما فعلاً حتی حرکتی از آن دیده نشده و مانند نمونههای مشابه در کشورهای دیگر، احتمال دارد کارایی زیادی نداشته باشد.۱۴۰۴/۲/۲ ۲۱:۵۵:۵۷ -
نتفلیکس با درآمد بالاتر از انتظارات، چشمانداز مثبتی را ترسیم کرد
نتفلیکس (Netflix) سرویس پخش آنلاین محتوا در گزارش مالی سهماهه اول سال، درآمدی بالاتر از پیشبینیهای تحلیلگران کسب کرد. این شرکت با انتشار سریالهای جدید و افزایش تعداد مشترکان، درآمد ۱۰.۵۴ میلیارد دلاری را محقق ساخت.
۱۴۰۴/۱/۳۰ ۰۴:۱۴:۰۰ -
رباتاکسیهای Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند
پلیس لسآنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان میدهد که خودروهای بدون راننده به منبع جدیدی برای جمعآوری شواهد تصویری تبدیل شدهاند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار میدهد.
۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰ -
LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول میکند
لایو کیت (LiveKit) پلتفرمی متنباز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماسهای ۹۱۱ آمریکا استفاده میشود.
این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعهدهنده دارد و شرکتهایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده میکنند.
این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷ -
بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیتتر تا اسکن اسناد و خلاصه پیامهای صوتی
واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخشهای چت، تماس و کانالها اضافه کرده است. از این پس، در گروهها میتوان دید چه کسانی آنلاین هستند، نوتیفیکیشنها را فقط برای پیامهای مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگنمایی (زوم) انجام داد.
کاربران آیفون همچنین میتوانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
در تماسهای تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چتهای دو نفره، پاسخ به دعوتها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.
در بخش کانالها نیز، ادمینها میتوانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیامهای صوتی را برای دنبالکنندگان ارسال کنند.۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶ -
گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد
گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران میتوانند از طریق عکسهایی که میگیرند یا آپلود میکنند، سوالات پیچیده بپرسند.
این ویژگی که با کمک فناوری Google Lens کار میکند، میتواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفتهاند.
بهعنوان نمونه، اگر از کتابخانهتان عکس بگیرید و بپرسید: «اگه از این کتابها خوشم اومده، چه کتابهای مشابهی پیشنهاد میکنی؟» این سیستم کتابها را شناسایی میکند و پیشنهادهایی برایتان میآورد. همچنین میتوانید سوالهای بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»
این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویسهایی مثل ChatGPT Search و Perplexity محسوب میشود.۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴ -
رونمایی Midjourney از مدل هوش مصنوعی جدید V7 با قابلیتهای پیشرفته
میدجرنی، سرویس تولید تصویر هوش مصنوعی، مدل جدید V7 را معرفی کرد که با معماری متفاوت و قابلیت شخصیسازی، کیفیت تصاویر را به طور چشمگیری بهبود بخشیده است. این مدل در دو نسخه Turbo و Relax با سرعت بالاتر و قابلیت ایجاد تصاویر با جزئیات دقیقتر طراحی شده و در مرحله آلفا قرار دارد.
۱۴۰۴/۱/۱۶ ۰۹:۳۴:۴۹ -
Youtube Shorts با امکانات جدید به رقابت با تیکتاک میآید
Youtube Shorts با هدف رقابت با تیکتاک، امکانات جدیدی مانند ویرایشگر پیشرفته ویدیو، تولید استیکر هوش مصنوعی، همگامسازی محتوا با ریتم موسیقی و قالبهای بهبود یافته را معرفی میکند. این قابلیتها در آستانه احتمال ممنوعیت تیکتاک در آمریکا، فرصتی برای جذب تولیدکنندگان محتوا فراهم میکند.
۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۲ -
موفقیت چشمگیر قابلیت تولید تصویر OpenAI در ChatGPT
OpenAI با راهاندازی قابلیت تولید تصویر در ChatGPT، موفق به جذب 130 میلیون کاربر و تولید 700 میلیون تصویر در کمتر از یک هفته شده است. این قابلیت جدید که توانایی تولید تصاویر واقعگرایانه با سبک استودیو Ghibli را دارد، با استقبال بیسابقهای مواجه شده اما زیرساختهای شرکت را تحت فشار قرار داده است.
۱۴۰۴/۱/۱۵ ۱۹:۰۴:۳۰ -
افزایش کاربران ChatGPT و چالشهای ظرفیتی OpenAI
شرکت OpenAI با افزایش چشمگیر کاربران ChatGPT به ویژه در بخش تولید تصویر، با چالشهای ظرفیتی مواجه شده است. سام آلتمن مدیرعامل شرکت اعلام کرد که در یک ساعت، یک میلیون کاربر جدید به پلتفرم اضافه شده و این موضوع منجر به تأخیر در انتشار محصولات و کندی سرویس خواهد شد.
۱۴۰۴/۱/۱۳ ۱۹:۴۶:۴۲ -
موج جهانی هوش مصنوعی با سبک انیمیشن استودیو Ghibli
پلتفرم هوش مصنوعی ChatGPT با ایجاد قابلیت تولید تصاویر با سبک انیمیشن استودیو Ghibli، رکورد جذب کاربر را شکست. این روند ویروسی باعث افزایش 11 درصدی دانلود اپلیکیشن و رسیدن کاربران فعال هفتگی به بیش از 150 میلیون نفر شد. با این حال، این موضوع سوالاتی درباره نقض احتمالی حقوق کپی رایت را نیز مطرح کرده است.
۱۴۰۴/۱/۱۳ ۱۷:۴۳:۰۲ -
هوش مصنوعی OpenAI تولید تصویر را برای همه کاربران آزاد کرد
OpenAI تولید تصویر با مدل GPT-4o را برای تمام کاربران رایگان کرد. این سرویس پیش از این فقط برای کاربران پولی در دسترس بود. مدیرعامل شرکت اعلام کرد که کاربران رایگان میتوانند روزانه سه تصویر تولید کنند. استقبال گسترده از این سرویس باعث فشار بر سرورهای شرکت شده است.
۱۴۰۴/۱/۱۳ ۱۰:۲۴:۴۶ -
محدودیت در سرویس تولید تصویر OpenAI به دلیل ترافیک بالا
شرکت OpenAI با حجم بالای درخواست برای سرویس تولید تصویر Sora مواجه شده است. این شرکت به دلیل ترافیک سنگین، تولید تصویر را برای کاربران جدید موقتاً متوقف کرده و کارکنان آن در تلاش برای حفظ کیفیت سرویس هستند.
۱۴۰۴/۱/۱۲ ۲۰:۴۷:۳۴ -
هوش مصنوعی ChatGPT و تصویرسازی جنجالی از خودش
هوش مصنوعی ChatGPT در تصویرسازی از خودش، مردی سفیدپوست با موهای قهوهای و عینک را به عنوان چهره پیشفرض ترسیم میکند. این موضوع نشاندهنده سوگیریهای احتمالی در دادههای آموزشی است که میتواند ناشی از تنوع محدود در منابع اطلاعاتی باشد. پژوهشگران معتقدند این رفتار میتواند نتیجه انتخاب عمدی، شوخی درونی شرکت یا ویژگی ذاتی دادههای آموزشی باشد.
۱۴۰۴/۱/۱۲ ۱۸:۴۲:۱۵ -
تأثیر کیفیت صدا در قضاوت افراد در جلسات آنلاین
پژوهشی در دانشگاه ییل نشان میدهد کیفیت صدای افراد در تماسهای تصویری، تأثیر مستقیمی بر قضاوت دیگران درباره آنها دارد. محققان دریافتند استفاده از میکروفون با کیفیت پایین میتواند شانس استخدام، برقراری ارتباط عاطفی و اعتبار فردی را کاهش دهد. این تأثیر صرف نظر از جنسیت و لهجه، در تمامی آزمایشها مشهود بود.
۱۴۰۴/۱/۱۱ ۱۱:۰۴:۱۵ -
هوش مصنوعی OpenAI با قابلیت تولید تصاویر در سبک انیمیشن استودیو Ghibli جنجال برانگیز شد
قابلیت تولید تصویر جدیدی در ChatGPT بهتازگی معرفی شده و کاربران با آن تصاویر زیادی در سبک استودیوی انیمیشنسازی Ghibli ایجاد کردهاند. این موضوع بحثهای نقض کپیرایت را دوباره مطرح کرده است.
طبق نظر کارشناسان، سبک هنری بهطور صریح تحت حفاظت کپیرایت نیست، اما اگر مدلهای هوش مصنوعی برای تقلید از این سبک، روی آثار دارای حق نشر آموزش داده شده باشند، ممکن است نقض قانون محسوب شود.
چندین شرکت بزرگ، از جمله نیویورک تایمز، قبلاً از OpenAI و سایر شرکتهای هوش مصنوعی به دلیل استفاده از محتوای دارای حق نشر بدون مجوز شکایت کردهاند. بااینحال، هنوز دادگاهها در مورد قانونی بودن این روش تصمیم نگرفتهاند.۱۴۰۴/۱/۸ ۱۱:۲۹:۲۸ -
تأخیر در ارائه قابلیتهای تولید تصویر ChatGPT برای کاربران رایگان
مدیرعامل OpenAI اعلام کرد که راهاندازی ویژگیهای تولید تصویر ChatGPT برای کاربران رایگان به تعویق افتاده است. تقاضا برای این قابلیت بسیار بیشتر از پیشبینی شرکت بوده و در حال حاضر این امکان تنها برای کاربران اشتراک Pro، Plus و Teams در دسترس است.
۱۴۰۴/۱/۸ ۰۲:۳۲:۱۶ -
قابلیت جدید تولید تصویر در ChatGPT با مدل GPT-4o
شرکت OpenAI قابلیت جدید تولید و ویرایش تصاویر را برای ChatGPT معرفی کرد. این قابلیت جدید با مدل GPT-4o امکان ایجاد تصاویر دقیقتر و با جزئیات بیشتر را فراهم میکند و در حال حاضر برای کاربران اشتراک Pro در دسترس است و به زودی برای سایر کاربران منتشر خواهد شد.
۱۴۰۴/۱/۷ ۰۱:۱۴:۴۸



