• هوش مصنوعی Ask Photos گوگل در آلبوم شما؛ اما نه امروز!

    گوگل اعلام کرد عرضه عمومی قابلیت جدید «Ask Photos» در Google Photos حدود دو هفته به تأخیر افتاده است. طبق گفته مدیر محصول این بخش، دلیل این تأخیر نارضایتی از کیفیت، تأخیر پاسخ‌دهی و تجربه کاربری فعلی این ویژگی است. ⏳
    وی افزود نسخه بهبود‌یافته این ابزار که مبتنی بر مدل هوش مصنوعی Gemini است، طی دو هفته آینده منتشر خواهد شد تا مشکلات فعلی را برطرف کند. 🤖
    قابلیت Ask Photos امکان جست‌وجوی هوشمند میان عکس‌های کاربر را با دستورات زبان طبیعی فراهم می‌کند؛ برای مثال، می‌توان از آن خواست یک عکس خاطره‌انگیز از هر سفر به پارک ملی نمایش دهد. 🏞️
    گوگل این قابلیت را نخستین‌بار در کنفرانس توسعه‌دهندگان Google I/O معرفی کرده بود، اما هنوز پاسخی رسمی درباره زمان دقیق عرضه آن منتشر نکرده است. 📸

    ۱۴۰۴/۳/۲۰ ۱۷:۲۲:۲۷
  • ۱۰ سالگی Google Photos؛ تولدی با قابلیت‌های شگفت‌انگیز

    🎉 گوگل به مناسبت ۱۰ سالگی Google Photos، نسخه جدید ویرایشگر عکس را با ابزارهای هوش مصنوعی معرفی کرد. 📸🎂
    🤖 ابزار Reimagine امکان تغییر پس‌زمینه با متن را فراهم می‌کند و Auto Frame روش‌های قاب‌بندی هوشمند پیشنهاد می‌دهد. 🌤️🖼️
    🪄 قابلیت AI Enhance نیز ترکیبی از افکت‌های خودکار مثل حذف اشیاء و بهبود کیفیت را ارائه می‌دهد. ⚙️🧠
    📱 این بروزرسانی از ماه آینده برای اندروید عرضه می‌شود و iOS نیز به‌زودی در راه است. 📲📅

    ۱۴۰۴/۳/۹ ۰۱:۰۱:۵۶
  • استارتاپ Stability AI یک مدل هوش مصنوعی جدید برای تبدیل تصاویر به ویدیوهای واقعی رونمایی کرد

    استارتاپ Stability AI مدل هوش مصنوعی Stable Virtual Camera را معرفی کرد که قادر است تصاویر دوبعدی را به ویدیوهای با عمق و پرسپکتیو واقعی تبدیل کند. این مدل می‌تواند از یک یا چند تصویر، نماهای جدیدی با زوایای دوربین مختلف ایجاد کند و ویدیوهایی با مسیرهای متنوع دوربین تولید نماید. نسخه تحقیقاتی فعلی این مدل با محدودیت‌هایی در کیفیت تصاویر انسان و حیوانات همراه است.

    ۱۴۰۳/۱۲/۲۹ ۱۵:۰۵:۳۷
  • OpenAI: تقاضا انفجاری شده؛ ویژگی‌های جدید کند می‌آیند

    OpenAI مالک ChatGPT اعلام کرده با کمبود شدید توان پردازشی روبه‌روست و افزایش استفاده از ابزارهایی مثل تولید تصویر، فشار زیادی به سیستم‌هایش وارد کرده است. به‌گفته مدیران شرکت، همین موضوع باعث شده هم عرضه قابلیت‌های جدید کندتر شود و هم سرمایه‌گذاری روی پژوهش‌های آینده سخت‌تر شود. 🖥️
    گرگ براکمن، رئیس OpenAI، توضیح داده وقتی قابلیت تولید تصویر در ماه مارس بسیار محبوب شد، شرکت مجبور شد بخشی از توان پردازشی را از بخش تحقیق بردارد و صرف پاسخ‌گویی به کاربران کند؛ تصمیمی که او آن را فدا کردن آینده برای نیازهای امروز توصیف کرده است. 📈
    این صحبت‌ها در شرایطی مطرح می‌شود که برخی معتقدند OpenAI در رقابت هوش مصنوعی عقب افتاده است. پس از خبرساز شدن مدل Gemini 3 گوگل، سم آلتمن مدیر عامل OpenAI وضعیت «کد قرمز» اعلام کرد. OpenAI می‌گوید برای بازگشت به صدر رقابت، به توان پردازشی بسیار بیشتری نیاز دارد. ⚡

    ۱۴۰۴/۱۰/۶ ۰۳:۴۰:۴۶
  • رونمایی از Flux.1 Kontext؛ نسل جدید هوش مصنوعی برای ساخت و ویرایش عکس

    استارتاپ آلمانی Black Forest Labs مدل جدید هوش مصنوعی خود برای ساخت و ویرایش عکس به نام Flux.1 Kontext را معرفی کرد. 🤖
    این مدل می‌تواند با استفاده از متن و عکس، تصاویر واقعی و دقیق بسازد یا حتی عکس‌ها را ویرایش کند، مثلاً لباس را عوض کند یا نوشته‌ها را تغییر دهد. ✍️
    🚀 سرعت این مدل تا ۸ برابر بیشتر از مدل‌های مشابه است و کیفیت بالایی در ساخت تصویر و نوشته دارد. ⚡
    💰 گفته شده این شرکت در حال جذب ۱۰۰ میلیون دلار سرمایه با ارزش‌گذاری یک میلیارد دلاری است.

    ۱۴۰۴/۳/۱۳ ۰۰:۵۳:۳۲
  • جستجوی تصویری در یوتیوب با Google Lens

    🔍 یوتیوب اعلام کرده که به‌زودی ابزار Google Lens را به بخش Shorts اضافه می‌کند تا کاربران بتوانند آنچه را در ویدیو می‌بینند جستجو کنند. 📱🔎
    📍 مثلاً اگر در یک ویدیو مکان خاصی را ببینید، می‌توانید با استفاده از Lens آن را شناسایی کرده و درباره فرهنگ یا تاریخ آن بیشتر بدانید. 🌍📚
    🛠️ این قابلیت به کاربران اجازه می‌دهد با توقف ویدیو و انتخاب گزینه Lens، روی بخش موردنظر کلیک یا آن را علامت‌گذاری کنند تا نتایج جستجو به‌صورت تصویری نمایش داده شود. 🖼️🔧
    📢 این ابزار در هفته جاری به‌صورت آزمایشی در دسترس کاربران قرار می‌گیرد و گامی دیگر از یوتیوب برای رقابت با TikTok و Reels محسوب می‌شود. 🆚📊

    ۱۴۰۴/۳/۱۰ ۰۱:۱۱:۰۶
  • گوگل Beam: وقتی تماس تصویری شبیه به حضور واقعی می‌شود

    📹 گوگل در I/O 2025 نسخه تجاری و جمع‌وجور فناوری تماس ویدیویی سه‌بعدی خود با نام «Google Beam» را به نمایش گذاشت؛ نسخه‌ای پیشرفته از پروژه Starline که بدون نیاز به عینک، فرد مقابل را به‌صورت سه‌بعدی و واقعی روی نمایشگر نشان می‌دهد. 🧑‍💻👀
    در این فناوری، تصویر فرد با هوش مصنوعی از ویدیوهای دوبعدی بازسازی می‌شود و طوری نمایش داده می‌شود که انگار مقابل شما نشسته است! 🍏 حتی می‌توانید به‌طور طبیعی با او تماس چشمی برقرار کنید، لبخند بزنید یا حتی تلاش کنید چیزی را از او بگیرید. 🤝😄
    اما Beam هنوز کامل نیست؛ تصویر سه‌بعدی کمی لرزش دارد و فقط وقتی روبه‌روی نمایشگر باشید کیفیتش خوب است، اگر زاویه دید تغییر کند، تصویر تار و تیره می‌شود 📺⚠️ همچنین پشت تصویر فرد اصلاً وجود ندارد و فقط بخش جلویی و کناری او ثبت شده است. 👤
    در نور مناسب، تجربه خوب است ولی در محیط کم‌نور ممکن است کیفیت افت کند 🌗 همچنین در یکی از دموها سیستم هنگ کرد و تماس قطع شد. ❌
    در کل، فناوری Beam بسیار طبیعی و انسانی به‌نظر می‌رسد، اما هنوز جای کار دارد تا به تجربه‌ای بی‌نقص برسد. 🌟

    ۱۴۰۴/۳/۲ ۰۵:۴۱:۳۸
  • NotebookLM گوگل حالا تصویری شد؛ تبدیل یادداشت‌ها به ویدیو با هوش مصنوعی!

    گوگل در I/O 2025 از قابلیت‌های جدیدی برای ابزار هوش مصنوعی NotebookLM رونمایی کرد. 🧠📒 این ابزار که برای یادداشت‌برداری و تحقیق طراحی شده، حالا می‌تواند محتواهای پیچیده مثل یادداشت‌ها، PDFها و تصاویر را به ویدیوهای قابل‌فهم تبدیل کند. 🎥📝
    قابلیت «Video Overviews» کمک می‌کند موضوعات سخت را به‌صورت تصویری بهتر درک کنید، در ادامه نسخه صوتی هم ارتقا یافته و حالا می‌توان طول فایل‌های صوتی را به دلخواه تنظیم کرد. 🎧🗣️
    همچنین اپلیکیشن NotebookLM برای اندروید و iOS منتشر شده و قابلیت‌هایی مثل پخش در پس‌زمینه و حالت آفلاین را دارد.📱

    ۱۴۰۴/۳/۱ ۰۳:۱۲:۳۱
  • مدل تصویری Recraft از DALL-E و Midjourney پیشی گرفت!

    استارتاپ نوپای Recraft که توانست در رقابتی جدی، مدل‌های تصویری بزرگی چون DALL-E و Midjourney را شکست دهد، حالا با جذب سرمایه ۳۰ میلیون دلاری در مسیر رشد پرشتابی قرار گرفته است.🚀
    این شرکت با مدل red_panda، در تولید تصاویر دقیق برای برندها عملکردی بی‌نقص دارد؛ قابلیتی که آن را به رقیبی جدی برای ابزارهای طراحی مثل Canva بدل کرده است.🤖🏞️
    Recraft که حالا به ۵ میلیون دلار درآمد و ۴ میلیون کاربر رسیده، توسط تنها مؤسس زن این حوزه هدایت می‌شود؛ کسی که از تجربه خود در گوگل، یاندکس و مایکروسافت آموخته.
    موفقیت فقط با سخت‌کوشی حاصل نمی‌شود، بلکه نیازمند مهارت در بخش‌های کلیدی است. 🔥

    ۱۴۰۴/۲/۱۷ ۱۳:۲۸:۱۷
  • پینترست جستجوی تصویری خود را با هوش مصنوعی متحول کرد

    🔍🖼️🤖 پینترست (Pinterest) ، شبکه اجتماعی تصویری ، با به‌روزرسانی بزرگ مبتنی بر هوش مصنوعی، تجربه جستجوی تصویری کاربران را متحول کرده است. اکنون کاربران می‌توانند بفهمند دقیقاً چه چیزی در یک تصویر برایشان جذاب است و به‌راحتی گزینه‌های مشابه با سبک، رنگ یا جنس دلخواه را بیابند. 💡👗 جستجوی تصویری با نگه‌داشتن روی پین‌ها فعال می‌شود و به بخش‌های بیشتری از اپلیکیشن گسترش یافته است. پینترست هم‌زمان در تلاش است تا تصاویر تولیدشده توسط AI را شفاف‌سازی کرده و کنترل بیشتری به کاربران بدهد تا از محتوای واقعی و الهام‌بخش بهره ببرند. ⚠️

    ۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۶
  • اسکایپ خاموش شد؛ پایان ۲۳ سال ارتباط جهانی

    📴📞 مایکروسافت پس از ۲۳ سال به اسکایپ پایان داد.
    از امروز، کاربران باید به سراغ Microsoft Teams یا جایگزین‌هایی مثل Zoom، Google Meet، Webex و Discord بروند. Teams با امکانات قوی‌تر مخصوص جلسات کاری، جایگزین رسمی اسکایپ است.
    پایان اسکایپ، آغاز رقابت جدید بین برنامه‌های ویدیویی! 📡🧑‍💻🔁

    ۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۱
  • گوگل قابلیت جدید ویرایش تصویر را به ربات هوش مصنوعی Gemini اضافه کرد

    🚀 ربات Gemini گوگل، با یک قابلیت جدید و جذاب، دنیای ویرایش تصاویر را متحول کرد! 📸✨ حالا می‌توانید پس‌زمینه تصاویر را عوض کنید، چهره خود را با رنگ موهای جدید ببینید و حتی داستان‌های تصویری خلاقانه بسازید! 🖼️👩‍🎨 این فناوری فوق‌العاده، در بیش از ۴۵ زبان جهان در دسترس قرار می‌گیرد و برای جلوگیری از تصاویر جعلی (دیپ‌فیک)، همه عکس‌ها را با واترمارک نامرئی امن کرده است.🔐🌐

    ۱۴۰۴/۲/۱۲ ۰۸:۵۴:۰۰
  • آموزش کاملاً قانونی؛ Freepik مدل هوش مصنوعی اخلاق‌محور F Lite را معرفی کرد

    Freepik یک مدل هوش مصنوعی جدید با نام F Lite معرفی کرد که منحصراً با تصاویر دارای مجوز تجاری آموزش دیده است. این مدل که با همکاری استارتاپ Fal.ai توسعه یافته، حاوی 10 میلیارد پارامتر بوده و با استفاده از ۶۴ کارت گرافیک قدرتمند طی دو ماه ساخته شده و در دو نسخه استاندارد و بافت (Texture) طراحی شده است. هدف اصلی Freepik از این اقدام، ارائه یک مدل باز برای توسعه دهندگان است که بتوانند آن را بهبود بخشند.

    ۱۴۰۴/۲/۱۱ ۱۲:۲۸:۰۵
  • ۱۴۰۴/۲/۱۰ ۱۸:۰۰:۰۴
  • معاوضه 2.5 میلیون عکس چهره بازداشت شدگان با نرم‌افزار تشخیص چهره

    پلیس میلواکی در ایالت ویسکانسین آمریکا پیشنهاد داده که ۲.۵ میلیون عکس بازداشت‌شدگان را به یک شرکت خصوصی بدهد تا در ازای آن، دسترسی رایگان به نرم‌افزار تشخیص چهره برای شناسایی مظنونان دریافت کند. این طرح نگرانی‌های جدی درباره نقض حریم خصوصی و تبعیض نژادی ایجاد کرده، زیرا سابقه نشان داده این فناوری در تشخیص افراد رنگین‌پوست دچار خطای بالاست. همچنین در این معامله، رضایت افراد در نظر گرفته نشده و خطر سوءاستفاده از اطلاعات شخصی وجود دارد. فعالان حقوق بشر خواستار توقف این اقدام و تصویب قوانین سختگیرانه برای کنترل استفاده از فناوری‌های نظارتی شده‌اند.

    ۱۴۰۴/۲/۹ ۱۸:۴۷:۱۲
  • رشد چشمگیر جست‌وجوی هوش مصنوعی در گوگل؛ موفقیتی برنامه‌ریزی‌شده

    ویژگی «AI Overviews» گوگل حالا ماهانه ۱.۵ میلیارد کاربر در ۱۰۰ کشور دارد. این ابزار با خلاصه‌سازی توسط هوش مصنوعی، پاسخ‌هایی را بالای نتایج جست‌وجو نشان می‌دهد. گوگل آن را راهی برای افزایش درآمد می‌داند، اگرچه برخی ناشران از کاهش بازدید شکایت دارند.
    هم‌زمان، گوگل ابزارهای جدیدی مثل «AI Mode» و «Circle to Search» را معرفی کرده که مورد استقبال قرار گرفته‌اند؛ دستگاه‌های دارای Circle to Search به ۲۵۰ میلیون رسیده و استفاده از آن ۴۰ درصد رشد داشته است.
    جست‌وجو با Google Lens هم ۵ میلیارد بار بیشتر شده و خرید از طریق آن ۱۰ درصد افزایش یافته است. این رشد در حالی است که گوگل با پرونده‌های حقوقی درباره انحصار در جست‌وجو و تبلیغات مواجه شده است.

    ۱۴۰۴/۲/۶ ۱۹:۰۰:۲۱
  • ورود مدل‌های هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی

    شرکت Adobe مدل‌های جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید می‌کند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدل‌های تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون می‌توانند با مدل‌هایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایده‌پردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.

    ۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶
  • هوش مصنوعی Grok قابلیت تشخیص تصاویر را به دست آورد

    شرکت xAI قابلیت جدید Grok Vision را برای هوش مصنوعی Grok معرفی کرد که به کاربران اجازه می‌دهد با استفاده از دوربین تلفن همراه، اشیا، متون و محیط‌های اطراف خود را اسکن و درباره آنها سوال بپرسند. این قابلیت در حال حاضر برای کاربران iOS در دسترس است و به زودی برای اندروید نیز عرضه خواهد شد.

    ۱۴۰۴/۲/۴ ۰۳:۴۲:۵۹
  • پلیس رباتیک در جشن سال نو تایلند؛ ناظر بی‌خواب با چشمان هوشمند

    پلیس تایلند در جشن سال نو از یک ربات به نام «AI Police Cyborg 1.0» رونمایی کرد که با دوربین‌های ۳۶۰ درجه، تشخیص چهره، تحلیل رفتار، شناسایی اسلحه و دسترسی به تصاویر پهپادها و دوربین‌های مداربسته، طراحی شده تا امنیت مراسم‌ها را حفظ کند. این ربات می‌تواند چهره‌ها و رفتارهای مشکوک را تشخیص دهد و حتی آب‌پاش را از اسلحه واقعی تشخیص دهد.
    این ربات به مرکز فرماندهی استان متصل است و هدف اصلی آن کمک به کنترل جمعیت در رویدادهای بزرگ اعلام شده. اما برخی نگران‌اند که از این فناوری برای کنترل فعالان سیاسی استفاده شود، به‌ویژه با توجه به سابقه پلیس تایلند در برخورد با معترضان.
    هرچند قابلیت‌های پیشرفته‌ای برای این ربات تبلیغ شده، اما فعلاً حتی حرکتی از آن دیده نشده و مانند نمونه‌های مشابه در کشورهای دیگر، احتمال دارد کارایی زیادی نداشته باشد.

    ۱۴۰۴/۲/۲ ۲۱:۵۵:۵۷
  • رباتاکسی‌های Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند

    پلیس لس‌آنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان می‌دهد که خودروهای بدون راننده به منبع جدیدی برای جمع‌آوری شواهد تصویری تبدیل شده‌اند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار می‌دهد.

    ۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰
  • LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

    لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
    این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
    این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

    ۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
  • گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد

    گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران می‌توانند از طریق عکس‌هایی که می‌گیرند یا آپلود می‌کنند، سوالات پیچیده بپرسند.
    این ویژگی که با کمک فناوری Google Lens کار می‌کند، می‌تواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفته‌اند.

    به‌عنوان نمونه، اگر از کتابخانه‌تان عکس بگیرید و بپرسید: «اگه از این کتاب‌ها خوشم اومده، چه کتاب‌های مشابهی پیشنهاد می‌کنی؟» این سیستم کتاب‌ها را شناسایی می‌کند و پیشنهادهایی برایتان می‌آورد. همچنین می‌توانید سوال‌های بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»

    این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویس‌هایی مثل ChatGPT Search و Perplexity محسوب می‌شود.

    ۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴
  • موفقیت چشمگیر قابلیت تولید تصویر OpenAI در ChatGPT

    OpenAI با راه‌اندازی قابلیت تولید تصویر در ChatGPT، موفق به جذب 130 میلیون کاربر و تولید 700 میلیون تصویر در کمتر از یک هفته شده است. این قابلیت جدید که توانایی تولید تصاویر واقع‌گرایانه با سبک استودیو Ghibli را دارد، با استقبال بی‌سابقه‌ای مواجه شده اما زیرساخت‌های شرکت را تحت فشار قرار داده است.

    ۱۴۰۴/۱/۱۵ ۱۹:۰۴:۳۰
  • هوش مصنوعی ChatGPT و تصویرسازی جنجالی از خودش

    هوش مصنوعی ChatGPT در تصویرسازی از خودش، مردی سفیدپوست با موهای قهوه‌ای و عینک را به عنوان چهره پیش‌فرض ترسیم می‌کند. این موضوع نشان‌دهنده سوگیری‌های احتمالی در داده‌های آموزشی است که می‌تواند ناشی از تنوع محدود در منابع اطلاعاتی باشد. پژوهشگران معتقدند این رفتار می‌تواند نتیجه انتخاب عمدی، شوخی درونی شرکت یا ویژگی ذاتی داده‌های آموزشی باشد.

    ۱۴۰۴/۱/۱۲ ۱۸:۴۲:۱۵
  • قابلیت جدید تولید تصویر در ChatGPT با مدل GPT-4o

    شرکت OpenAI قابلیت جدید تولید و ویرایش تصاویر را برای ChatGPT معرفی کرد. این قابلیت جدید با مدل GPT-4o امکان ایجاد تصاویر دقیق‌تر و با جزئیات بیشتر را فراهم می‌کند و در حال حاضر برای کاربران اشتراک Pro در دسترس است و به زودی برای سایر کاربران منتشر خواهد شد.

    ۱۴۰۴/۱/۷ ۰۱:۱۴:۴۸
  • هوش مصنوعی محلی در جیب شما با اپلیکیشن HuggingSnap

    استارتاپ Hugging Face اپلیکیشن جدید HuggingSnap را برای iOS منتشر کرد که با استفاده از هوش مصنوعی محلی، قادر به توصیف محیط پیرامون دوربین آیفون بدون اتصال به اینترنت است. این اپلیکیشن با مدل بینایی smolvlm2، اشیا، متون و صحنه‌ها را در بصورت لحظه ای شناسایی می‌کند و برای کاربردهای مختلف مانند خرید، سفر و مطالعه مناسب است.

    ۱۴۰۳/۱۲/۲۹ ۲۰:۰۹:۱۸
  • تنسنت با معرفی مدل‌های هوش مصنوعی جدید، قابلیت تبدیل متن و تصویر به محیط سه‌بعدی را ارائه داد

    شرکت تنسنت (Tencent)، غول فناوری چینی، پنج مدل متن‌باز هوش مصنوعی را برای تولید تصاویر سه‌بعدی معرفی کرد. این مدل‌ها با فناوری Hunyuan3D-2.0 می‌توانند ظرف ۳۰ ثانیه تصاویر سه‌بعدی با کیفیت بالا تولید کنند. این اقدام در راستای رقابت شرکت‌های چینی با شرکت‌های آمریکایی در حوزه هوش مصنوعی تولیدی است.

    ۱۴۰۳/۱۲/۲۸ ۱۳:۵۹:۵۹
  • استارتاپ Bria؛ تولید تصاویر هوش مصنوعی با محتوای مجوزدار

    استارتاپ Bria یک راهکار نوین برای تولید تصاویر هوش مصنوعی ارائه می‌دهد که با خریداری تصاویر از شرکای مختلف مانند Getty Images، مدل‌های تولید محتوای خود را آموزش می‌دهد. این شرکت با هدف ایجاد یک اکوسیستم مالکیت معنوی، راهکاری برای تولید محتوای تصویری متنوع و قانونی ارائه می‌دهد و موفق شده ۴۰ میلیون دلار سرمایه جذب کند.

    ۱۴۰۳/۱۲/۲۳ ۱۴:۵۰:۳۴
  • هوش مصنوعی سونی در بازی‌ها؛ از NPC های مصنوعی تا بهبود کیفیت تصویر

    سونی در حال آزمایش کاربردهای هوش مصنوعی در صنعت بازی است. این شرکت از یک سو به دنبال بهبود کیفیت تصویر در PlayStation 5 Pro با فناوری AI Upscaling است و از سوی دیگر در حال توسعه شخصیت‌های بازی با هوش مصنوعی است. نمونه آزمایشی شخصیت Aloy با استفاده از مدل‌های مختلف هوش مصنوعی نشان می‌دهد که این فناوری هنوز در مراحل اولیه توسعه قرار دارد و با چالش‌های جدی مواجه است.

    ۱۴۰۳/۱۲/۲۲ ۰۰:۲۵:۰۰
  • گلیمر به دنبال پیشرفت در تصویربرداری پزشکی با هوش مصنوعی

    استارتاپ فرانسوی Gleamer با هدف توسعه تحلیل تصاویر پزشکی با هوش مصنوعی، دو شرکت Pixyl و Caerus Medical را خریداری کرد. این شرکت که از سال 2017 فعالیت می‌کند، راه‌حل‌های هوش مصنوعی برای رادیولوژیست‌ها ارائه می‌دهد و تاکنون 35 میلیون آزمایش را پردازش کرده است. هدف اصلی گلیمر بهبود دقت تشخیصی در تصویربرداری پزشکی با استفاده از مدل‌های هوش مصنوعی تخصصی است.

    ۱۴۰۳/۱۲/۲۱ ۱۱:۱۶:۵۴
نمایش بیشتر