• معاوضه 2.5 میلیون عکس چهره بازداشت شدگان با نرم‌افزار تشخیص چهره

    پلیس میلواکی در ایالت ویسکانسین آمریکا پیشنهاد داده که ۲.۵ میلیون عکس بازداشت‌شدگان را به یک شرکت خصوصی بدهد تا در ازای آن، دسترسی رایگان به نرم‌افزار تشخیص چهره برای شناسایی مظنونان دریافت کند. این طرح نگرانی‌های جدی درباره نقض حریم خصوصی و تبعیض نژادی ایجاد کرده، زیرا سابقه نشان داده این فناوری در تشخیص افراد رنگین‌پوست دچار خطای بالاست. همچنین در این معامله، رضایت افراد در نظر گرفته نشده و خطر سوءاستفاده از اطلاعات شخصی وجود دارد. فعالان حقوق بشر خواستار توقف این اقدام و تصویب قوانین سختگیرانه برای کنترل استفاده از فناوری‌های نظارتی شده‌اند.

    ۱۴۰۴/۲/۹ ۱۸:۴۷:۱۲
  • همکاری مایکروسافت و دولت بریتانیا برای مقابله با محتوای جعلی هوش مصنوعی

    بریتانیا اعلام کرده با همکاری مایکروسافت، دانشگاه‌ها و متخصصان، در حال طراحی یک چارچوب استاندارد برای شناسایی محتوای دیپ‌فیک (محتوای جعلی) در اینترنت است. هدف این طرح، ایجاد معیارهای مشخص برای ارزیابی ابزارهایی است که محتوای جعلی تولیدشده با هوش مصنوعی را تشخیص می‌دهند. 🏛️
    وزیر فناوری بریتانیا گفته دیپ‌فیک‌ها به ابزاری برای کلاهبرداری، سوءاستفاده جنسی و تضعیف اعتماد عمومی تبدیل شده‌اند. این چارچوب جدید قرار است توان فناوری‌ها را در شناسایی تهدیدهای واقعی مانند جعل هویت، تقلب و سوءاستفاده جنسی بررسی کند و به پلیس و دولت نشان دهد ضعف‌های موجود کجاست. 🛡️
    بر اساس آمار رسمی، تعداد دیپ‌فیک‌های منتشرشده از حدود ۵۰۰ هزار مورد در سال ۲۰۲۳ به حدود ۸ میلیون مورد در سال ۲۰۲۵ رسیده است. هم‌زمان، پس از انتشار گزارش‌هایی درباره تولید تصاویر جنسی بدون رضایت توسط چت‌بات Grok، نهادهای ناظر ارتباطات و حریم خصوصی بریتانیا تحقیقات جداگانه‌ای را آغاز کرده‌اند. ⚠️

    ۱۴۰۴/۱۱/۱۸ ۲۳:۰۱:۱۶
  • OpenAI: تقاضا انفجاری شده؛ ویژگی‌های جدید کند می‌آیند

    OpenAI مالک ChatGPT اعلام کرده با کمبود شدید توان پردازشی روبه‌روست و افزایش استفاده از ابزارهایی مثل تولید تصویر، فشار زیادی به سیستم‌هایش وارد کرده است. به‌گفته مدیران شرکت، همین موضوع باعث شده هم عرضه قابلیت‌های جدید کندتر شود و هم سرمایه‌گذاری روی پژوهش‌های آینده سخت‌تر شود. 🖥️
    گرگ براکمن، رئیس OpenAI، توضیح داده وقتی قابلیت تولید تصویر در ماه مارس بسیار محبوب شد، شرکت مجبور شد بخشی از توان پردازشی را از بخش تحقیق بردارد و صرف پاسخ‌گویی به کاربران کند؛ تصمیمی که او آن را فدا کردن آینده برای نیازهای امروز توصیف کرده است. 📈
    این صحبت‌ها در شرایطی مطرح می‌شود که برخی معتقدند OpenAI در رقابت هوش مصنوعی عقب افتاده است. پس از خبرساز شدن مدل Gemini 3 گوگل، سم آلتمن مدیر عامل OpenAI وضعیت «کد قرمز» اعلام کرد. OpenAI می‌گوید برای بازگشت به صدر رقابت، به توان پردازشی بسیار بیشتری نیاز دارد. ⚡

    ۱۴۰۴/۱۰/۶ ۰۳:۴۰:۴۶
  • هوش مصنوعی Ask Photos گوگل در آلبوم شما؛ اما نه امروز!

    گوگل اعلام کرد عرضه عمومی قابلیت جدید «Ask Photos» در Google Photos حدود دو هفته به تأخیر افتاده است. طبق گفته مدیر محصول این بخش، دلیل این تأخیر نارضایتی از کیفیت، تأخیر پاسخ‌دهی و تجربه کاربری فعلی این ویژگی است. ⏳
    وی افزود نسخه بهبود‌یافته این ابزار که مبتنی بر مدل هوش مصنوعی Gemini است، طی دو هفته آینده منتشر خواهد شد تا مشکلات فعلی را برطرف کند. 🤖
    قابلیت Ask Photos امکان جست‌وجوی هوشمند میان عکس‌های کاربر را با دستورات زبان طبیعی فراهم می‌کند؛ برای مثال، می‌توان از آن خواست یک عکس خاطره‌انگیز از هر سفر به پارک ملی نمایش دهد. 🏞️
    گوگل این قابلیت را نخستین‌بار در کنفرانس توسعه‌دهندگان Google I/O معرفی کرده بود، اما هنوز پاسخی رسمی درباره زمان دقیق عرضه آن منتشر نکرده است. 📸

    ۱۴۰۴/۳/۲۰ ۱۷:۲۲:۲۷
  • رونمایی از Flux.1 Kontext؛ نسل جدید هوش مصنوعی برای ساخت و ویرایش عکس

    استارتاپ آلمانی Black Forest Labs مدل جدید هوش مصنوعی خود برای ساخت و ویرایش عکس به نام Flux.1 Kontext را معرفی کرد. 🤖
    این مدل می‌تواند با استفاده از متن و عکس، تصاویر واقعی و دقیق بسازد یا حتی عکس‌ها را ویرایش کند، مثلاً لباس را عوض کند یا نوشته‌ها را تغییر دهد. ✍️
    🚀 سرعت این مدل تا ۸ برابر بیشتر از مدل‌های مشابه است و کیفیت بالایی در ساخت تصویر و نوشته دارد. ⚡
    💰 گفته شده این شرکت در حال جذب ۱۰۰ میلیون دلار سرمایه با ارزش‌گذاری یک میلیارد دلاری است.

    ۱۴۰۴/۳/۱۳ ۰۰:۵۳:۳۲
  • جستجوی تصویری در یوتیوب با Google Lens

    🔍 یوتیوب اعلام کرده که به‌زودی ابزار Google Lens را به بخش Shorts اضافه می‌کند تا کاربران بتوانند آنچه را در ویدیو می‌بینند جستجو کنند. 📱🔎
    📍 مثلاً اگر در یک ویدیو مکان خاصی را ببینید، می‌توانید با استفاده از Lens آن را شناسایی کرده و درباره فرهنگ یا تاریخ آن بیشتر بدانید. 🌍📚
    🛠️ این قابلیت به کاربران اجازه می‌دهد با توقف ویدیو و انتخاب گزینه Lens، روی بخش موردنظر کلیک یا آن را علامت‌گذاری کنند تا نتایج جستجو به‌صورت تصویری نمایش داده شود. 🖼️🔧
    📢 این ابزار در هفته جاری به‌صورت آزمایشی در دسترس کاربران قرار می‌گیرد و گامی دیگر از یوتیوب برای رقابت با TikTok و Reels محسوب می‌شود. 🆚📊

    ۱۴۰۴/۳/۱۰ ۰۱:۱۱:۰۶
  • ۱۰ سالگی Google Photos؛ تولدی با قابلیت‌های شگفت‌انگیز

    🎉 گوگل به مناسبت ۱۰ سالگی Google Photos، نسخه جدید ویرایشگر عکس را با ابزارهای هوش مصنوعی معرفی کرد. 📸🎂
    🤖 ابزار Reimagine امکان تغییر پس‌زمینه با متن را فراهم می‌کند و Auto Frame روش‌های قاب‌بندی هوشمند پیشنهاد می‌دهد. 🌤️🖼️
    🪄 قابلیت AI Enhance نیز ترکیبی از افکت‌های خودکار مثل حذف اشیاء و بهبود کیفیت را ارائه می‌دهد. ⚙️🧠
    📱 این بروزرسانی از ماه آینده برای اندروید عرضه می‌شود و iOS نیز به‌زودی در راه است. 📲📅

    ۱۴۰۴/۳/۹ ۰۱:۰۱:۵۶
  • گوگل Beam: وقتی تماس تصویری شبیه به حضور واقعی می‌شود

    📹 گوگل در I/O 2025 نسخه تجاری و جمع‌وجور فناوری تماس ویدیویی سه‌بعدی خود با نام «Google Beam» را به نمایش گذاشت؛ نسخه‌ای پیشرفته از پروژه Starline که بدون نیاز به عینک، فرد مقابل را به‌صورت سه‌بعدی و واقعی روی نمایشگر نشان می‌دهد. 🧑‍💻👀
    در این فناوری، تصویر فرد با هوش مصنوعی از ویدیوهای دوبعدی بازسازی می‌شود و طوری نمایش داده می‌شود که انگار مقابل شما نشسته است! 🍏 حتی می‌توانید به‌طور طبیعی با او تماس چشمی برقرار کنید، لبخند بزنید یا حتی تلاش کنید چیزی را از او بگیرید. 🤝😄
    اما Beam هنوز کامل نیست؛ تصویر سه‌بعدی کمی لرزش دارد و فقط وقتی روبه‌روی نمایشگر باشید کیفیتش خوب است، اگر زاویه دید تغییر کند، تصویر تار و تیره می‌شود 📺⚠️ همچنین پشت تصویر فرد اصلاً وجود ندارد و فقط بخش جلویی و کناری او ثبت شده است. 👤
    در نور مناسب، تجربه خوب است ولی در محیط کم‌نور ممکن است کیفیت افت کند 🌗 همچنین در یکی از دموها سیستم هنگ کرد و تماس قطع شد. ❌
    در کل، فناوری Beam بسیار طبیعی و انسانی به‌نظر می‌رسد، اما هنوز جای کار دارد تا به تجربه‌ای بی‌نقص برسد. 🌟

    ۱۴۰۴/۳/۲ ۰۵:۴۱:۳۸
  • NotebookLM گوگل حالا تصویری شد؛ تبدیل یادداشت‌ها به ویدیو با هوش مصنوعی!

    گوگل در I/O 2025 از قابلیت‌های جدیدی برای ابزار هوش مصنوعی NotebookLM رونمایی کرد. 🧠📒 این ابزار که برای یادداشت‌برداری و تحقیق طراحی شده، حالا می‌تواند محتواهای پیچیده مثل یادداشت‌ها، PDFها و تصاویر را به ویدیوهای قابل‌فهم تبدیل کند. 🎥📝
    قابلیت «Video Overviews» کمک می‌کند موضوعات سخت را به‌صورت تصویری بهتر درک کنید، در ادامه نسخه صوتی هم ارتقا یافته و حالا می‌توان طول فایل‌های صوتی را به دلخواه تنظیم کرد. 🎧🗣️
    همچنین اپلیکیشن NotebookLM برای اندروید و iOS منتشر شده و قابلیت‌هایی مثل پخش در پس‌زمینه و حالت آفلاین را دارد.📱

    ۱۴۰۴/۳/۱ ۰۳:۱۲:۳۱
  • SynthID Detector گوگل؛ پلیس هوش مصنوعی! شناسایی داده های AI

    🔍 گوگل در I/O 2025 از ابزار SynthID Detector رونمایی کرد؛ قابلیتی برای شناسایی تصاویر، ویدیوها، صداها و متن‌هایی که با هوش مصنوعی گوگل تولید شده‌اند. 🖼️🎙️📄
    کاربران می‌توانند فایل آپلود کنند و ببینند آیا تمام یا بخشی از آن با AI ساخته شده است 🤖📁 این ابزار با فناوری واترمارک SynthID کار می‌کند که تاکنون روی بیش از ۱۰ میلیارد محتوا استفاده شده 🌐✨
    با افزایش شدید محتوای جعلی و دیپ‌فیک، گوگل این ابزار را برای مقابله با سوءاستفاده از هوش مصنوعی معرفی کرده ⚠️🎭 البته فقط برای محتوای ساخته‌شده با محصولات گوگل قابل استفاده است. 🛠️

    ۱۴۰۴/۳/۱ ۰۲:۴۱:۳۳
  • عینک‌های هوشمند گوگل با پروژه Astra؛ شناسایی اشیا و راهنمایی هوشمند

    گوگل با تیزری کوتاه از عینک‌های هوشمند خود در رویداد I/O خبر داد! 👓این عینک‌ها با هوش مصنوعی Gemini و یکپارچگی با اندروید، رقیب مستقیم عینک‌های Ray-Ban متا خواهند بود.
    📸 عینک‌های گوگل می‌توانند اشیا را شناسایی کرده ، آنها را به خاطر بسپارند و راهنمایی ارائه دهند، مشابه پروژه Astra. 🚀👁️ متا نیز با پروژه Orion به‌دنبال عینک‌های واقعیت افزوده پیشرفته است.رقابت برای عینک‌های هوشمند داغ شده! 🚀

    ۱۴۰۴/۲/۲۸ ۱۵:۳۵:۵۴
  • مدل تصویری Recraft از DALL-E و Midjourney پیشی گرفت!

    استارتاپ نوپای Recraft که توانست در رقابتی جدی، مدل‌های تصویری بزرگی چون DALL-E و Midjourney را شکست دهد، حالا با جذب سرمایه ۳۰ میلیون دلاری در مسیر رشد پرشتابی قرار گرفته است.🚀
    این شرکت با مدل red_panda، در تولید تصاویر دقیق برای برندها عملکردی بی‌نقص دارد؛ قابلیتی که آن را به رقیبی جدی برای ابزارهای طراحی مثل Canva بدل کرده است.🤖🏞️
    Recraft که حالا به ۵ میلیون دلار درآمد و ۴ میلیون کاربر رسیده، توسط تنها مؤسس زن این حوزه هدایت می‌شود؛ کسی که از تجربه خود در گوگل، یاندکس و مایکروسافت آموخته.
    موفقیت فقط با سخت‌کوشی حاصل نمی‌شود، بلکه نیازمند مهارت در بخش‌های کلیدی است. 🔥

    ۱۴۰۴/۲/۱۷ ۱۳:۲۸:۱۷
  • پینترست جستجوی تصویری خود را با هوش مصنوعی متحول کرد

    🔍🖼️🤖 پینترست (Pinterest) ، شبکه اجتماعی تصویری ، با به‌روزرسانی بزرگ مبتنی بر هوش مصنوعی، تجربه جستجوی تصویری کاربران را متحول کرده است. اکنون کاربران می‌توانند بفهمند دقیقاً چه چیزی در یک تصویر برایشان جذاب است و به‌راحتی گزینه‌های مشابه با سبک، رنگ یا جنس دلخواه را بیابند. 💡👗 جستجوی تصویری با نگه‌داشتن روی پین‌ها فعال می‌شود و به بخش‌های بیشتری از اپلیکیشن گسترش یافته است. پینترست هم‌زمان در تلاش است تا تصاویر تولیدشده توسط AI را شفاف‌سازی کرده و کنترل بیشتری به کاربران بدهد تا از محتوای واقعی و الهام‌بخش بهره ببرند. ⚠️

    ۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۶
  • اسکایپ خاموش شد؛ پایان ۲۳ سال ارتباط جهانی

    📴📞 مایکروسافت پس از ۲۳ سال به اسکایپ پایان داد.
    از امروز، کاربران باید به سراغ Microsoft Teams یا جایگزین‌هایی مثل Zoom، Google Meet، Webex و Discord بروند. Teams با امکانات قوی‌تر مخصوص جلسات کاری، جایگزین رسمی اسکایپ است.
    پایان اسکایپ، آغاز رقابت جدید بین برنامه‌های ویدیویی! 📡🧑‍💻🔁

    ۱۴۰۴/۲/۱۶ ۱۹:۲۶:۵۱
  • گوگل قابلیت جدید ویرایش تصویر را به ربات هوش مصنوعی Gemini اضافه کرد

    🚀 ربات Gemini گوگل، با یک قابلیت جدید و جذاب، دنیای ویرایش تصاویر را متحول کرد! 📸✨ حالا می‌توانید پس‌زمینه تصاویر را عوض کنید، چهره خود را با رنگ موهای جدید ببینید و حتی داستان‌های تصویری خلاقانه بسازید! 🖼️👩‍🎨 این فناوری فوق‌العاده، در بیش از ۴۵ زبان جهان در دسترس قرار می‌گیرد و برای جلوگیری از تصاویر جعلی (دیپ‌فیک)، همه عکس‌ها را با واترمارک نامرئی امن کرده است.🔐🌐

    ۱۴۰۴/۲/۱۲ ۰۸:۵۴:۰۰
  • آموزش کاملاً قانونی؛ Freepik مدل هوش مصنوعی اخلاق‌محور F Lite را معرفی کرد

    Freepik یک مدل هوش مصنوعی جدید با نام F Lite معرفی کرد که منحصراً با تصاویر دارای مجوز تجاری آموزش دیده است. این مدل که با همکاری استارتاپ Fal.ai توسعه یافته، حاوی 10 میلیارد پارامتر بوده و با استفاده از ۶۴ کارت گرافیک قدرتمند طی دو ماه ساخته شده و در دو نسخه استاندارد و بافت (Texture) طراحی شده است. هدف اصلی Freepik از این اقدام، ارائه یک مدل باز برای توسعه دهندگان است که بتوانند آن را بهبود بخشند.

    ۱۴۰۴/۲/۱۱ ۱۲:۲۸:۰۵
  • ۱۴۰۴/۲/۱۰ ۱۸:۰۰:۰۴
  • موفقیت برنامه شناسایی استعدادهای علی پرتووی در سیلیکون ولی

    علی پرتووی، کارآفرین ایرانی-آمریکایی سیلیکون ولی ، با برنامه Neo که استعدادهای برتر را از دوران دانشجویی شناسایی و حمایت می‌کند، موفقیت بزرگی به دست آورده است. او با آزمون‌های فنی و حمایت‌های مالی، کارآفرینان آینده را پرورش می‌دهد. Neo با سرمایه‌گذاری در استارتاپ‌های بزرگی مثل Anysphere و Bluesky، اکنون یکی از موفق‌ترین صندوق‌های سرمایه‌گذاری در سیلیکون ولی شده است. پرتووی معتقد است توانایی فنی، ریسک‌پذیری، روحیه چالش‌پذیری و جذابیت فردی عوامل اصلی موفقیت هستند. این صندوق با جذب ۳۲۰ میلیون دلار سرمایه جدید، همچنان بر رویکرد گزینشی خود پافشاری می‌کند.

    ۱۴۰۴/۲/۹ ۱۰:۳۴:۰۶
  • رشد چشمگیر جست‌وجوی هوش مصنوعی در گوگل؛ موفقیتی برنامه‌ریزی‌شده

    ویژگی «AI Overviews» گوگل حالا ماهانه ۱.۵ میلیارد کاربر در ۱۰۰ کشور دارد. این ابزار با خلاصه‌سازی توسط هوش مصنوعی، پاسخ‌هایی را بالای نتایج جست‌وجو نشان می‌دهد. گوگل آن را راهی برای افزایش درآمد می‌داند، اگرچه برخی ناشران از کاهش بازدید شکایت دارند.
    هم‌زمان، گوگل ابزارهای جدیدی مثل «AI Mode» و «Circle to Search» را معرفی کرده که مورد استقبال قرار گرفته‌اند؛ دستگاه‌های دارای Circle to Search به ۲۵۰ میلیون رسیده و استفاده از آن ۴۰ درصد رشد داشته است.
    جست‌وجو با Google Lens هم ۵ میلیارد بار بیشتر شده و خرید از طریق آن ۱۰ درصد افزایش یافته است. این رشد در حالی است که گوگل با پرونده‌های حقوقی درباره انحصار در جست‌وجو و تبلیغات مواجه شده است.

    ۱۴۰۴/۲/۶ ۱۹:۰۰:۲۱
  • ورود مدل‌های هوش مصنوعی گوگل و OpenAI به اپلیکیشن Firefly ادوبی

    شرکت Adobe مدل‌های جدید هوش مصنوعی تولید تصویر و ویدئو Firefly را معرفی کرد. مدل Firefly 4 Ultra تصاویر با جزئیات بالا و کنترل کامل تولید می‌کند و نسخه وکتوری هم برای طراحی لوگو و آیکون عرضه شده است. نسخه وب جدید Firefly امکان استفاده از مدل‌های تصویری گوگل و OpenAI را نیز دارد ، یعنی کاربران اکنون می‌توانند با مدل‌هایی مانند GPT image، Imagen 3 و Veo 2، در کنار مدل اختصاصی Firefly، تصویر تولید کنند. همچنین ابزار جدید Firefly Boards برای ایده‌پردازی و APIهای متن به تصویر، ویدئو و آواتار نیز در دسترس هستند.

    ۱۴۰۴/۲/۵ ۱۳:۱۸:۴۶
  • هوش مصنوعی Grok قابلیت تشخیص تصاویر را به دست آورد

    شرکت xAI قابلیت جدید Grok Vision را برای هوش مصنوعی Grok معرفی کرد که به کاربران اجازه می‌دهد با استفاده از دوربین تلفن همراه، اشیا، متون و محیط‌های اطراف خود را اسکن و درباره آنها سوال بپرسند. این قابلیت در حال حاضر برای کاربران iOS در دسترس است و به زودی برای اندروید نیز عرضه خواهد شد.

    ۱۴۰۴/۲/۴ ۰۳:۴۲:۵۹
  • پلیس رباتیک در جشن سال نو تایلند؛ ناظر بی‌خواب با چشمان هوشمند

    پلیس تایلند در جشن سال نو از یک ربات به نام «AI Police Cyborg 1.0» رونمایی کرد که با دوربین‌های ۳۶۰ درجه، تشخیص چهره، تحلیل رفتار، شناسایی اسلحه و دسترسی به تصاویر پهپادها و دوربین‌های مداربسته، طراحی شده تا امنیت مراسم‌ها را حفظ کند. این ربات می‌تواند چهره‌ها و رفتارهای مشکوک را تشخیص دهد و حتی آب‌پاش را از اسلحه واقعی تشخیص دهد.
    این ربات به مرکز فرماندهی استان متصل است و هدف اصلی آن کمک به کنترل جمعیت در رویدادهای بزرگ اعلام شده. اما برخی نگران‌اند که از این فناوری برای کنترل فعالان سیاسی استفاده شود، به‌ویژه با توجه به سابقه پلیس تایلند در برخورد با معترضان.
    هرچند قابلیت‌های پیشرفته‌ای برای این ربات تبلیغ شده، اما فعلاً حتی حرکتی از آن دیده نشده و مانند نمونه‌های مشابه در کشورهای دیگر، احتمال دارد کارایی زیادی نداشته باشد.

    ۱۴۰۴/۲/۲ ۲۱:۵۵:۵۷
  • ۱۴۰۴/۲/۲ ۱۸:۰۸:۲۶
  • هوش مصنوعی ChatGPT قادر به شناسایی مکان از روی تصاویر

    مدل‌های جدید هوش مصنوعی OpenAI به نام‌های o3 و o4-mini قابلیت تحلیل تصاویر و شناسایی مکان را دارند. این فناوری می‌تواند با بررسی جزئیات تصاویر، محل دقیق عکس را تشخیص دهد که این موضوع نگرانی‌هایی درباره حریم خصوصی افراد ایجاد کرده است. کاربران در شبکه‌های اجتماعی با استفاده از این قابلیت، حتی از روی تصاویر مبهم می‌توانند مکان دقیق را شناسایی کنند.

    ۱۴۰۴/۱/۲۹ ۱۹:۵۸:۴۵
  • رباتاکسی‌های Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند

    پلیس لس‌آنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان می‌دهد که خودروهای بدون راننده به منبع جدیدی برای جمع‌آوری شواهد تصویری تبدیل شده‌اند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار می‌دهد.

    ۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰
  • LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

    لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
    این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
    این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

    ۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
  • گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد

    گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران می‌توانند از طریق عکس‌هایی که می‌گیرند یا آپلود می‌کنند، سوالات پیچیده بپرسند.
    این ویژگی که با کمک فناوری Google Lens کار می‌کند، می‌تواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفته‌اند.

    به‌عنوان نمونه، اگر از کتابخانه‌تان عکس بگیرید و بپرسید: «اگه از این کتاب‌ها خوشم اومده، چه کتاب‌های مشابهی پیشنهاد می‌کنی؟» این سیستم کتاب‌ها را شناسایی می‌کند و پیشنهادهایی برایتان می‌آورد. همچنین می‌توانید سوال‌های بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»

    این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویس‌هایی مثل ChatGPT Search و Perplexity محسوب می‌شود.

    ۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴
  • شناسایی ۱۶ سایت برای توسعه مراکز داده هوش مصنوعی در آمریکا

    دولت آمریکا قصد دارد ۱۶ منطقه از اراضی وزارت انرژی را برای ساخت مراکز داده و نیروگاه‌هایی که از رشد هوش مصنوعی پشتیبانی می‌کنند، آماده کند. این اقدام در پاسخ به افزایش تقاضای برق ناشی از پیشرفت هوش مصنوعی صورت می‌گیرد. برخی از این مناطق زیرساخت انرژی لازم را دارند و می‌توانند فرآیند صدور مجوز نیروگاه‌های جدید (از جمله راکتورهای هسته‌ای) را تسریع کنند. هدف این پروژه، ایجاد مشارکت میان دولت و بخش خصوصی برای راه‌اندازی این تأسیسات تا سال ۲۰۲۷ است.

    ۱۴۰۴/۱/۱۶ ۰۲:۰۹:۲۳
  • موفقیت چشمگیر قابلیت تولید تصویر OpenAI در ChatGPT

    OpenAI با راه‌اندازی قابلیت تولید تصویر در ChatGPT، موفق به جذب 130 میلیون کاربر و تولید 700 میلیون تصویر در کمتر از یک هفته شده است. این قابلیت جدید که توانایی تولید تصاویر واقع‌گرایانه با سبک استودیو Ghibli را دارد، با استقبال بی‌سابقه‌ای مواجه شده اما زیرساخت‌های شرکت را تحت فشار قرار داده است.

    ۱۴۰۴/۱/۱۵ ۱۹:۰۴:۳۰
  • TrueCaller به مرز ۴۵۰ میلیون کاربر جهانی رسید

    اپلیکیشن شناسایی تماس های ناشناس Truecaller اعلام کرد که تعداد کاربران فعال ماهانه‌اش از ۴۵۰ میلیون نفر عبور کرده است. این اپ در ۱۰ ماه گذشته ۵۰ میلیون کاربر جدید جذب کرده و علاوه بر هند، در بازارهایی مانند آمریکای لاتین، آفریقا و آمریکا رشد سریعی داشته است.
    با این حال، دولت هند در حال توسعه یک سیستم شناسایی تماس اختصاصی است که می‌تواند رقیب جدی Truecaller شود.
    این شرکت با افزودن ضبط تماس، رونوشت مکالمات و دستیار هوش مصنوعی در تلاش است تا خدمات خود را گسترش دهد.

    ۱۴۰۴/۱/۱۵ ۱۵:۳۷:۰۹
نمایش بیشتر