• رباتاکسی‌های Waymo به ابزار جدید پلیس برای تحقیقات تبدیل شدند

    پلیس لس‌آنجلس برای اولین بار از تصاویر ضبط شده توسط خودروهای خودران Waymo در تحقیقات جنایی استفاده کرده است. این اتفاق نشان می‌دهد که خودروهای بدون راننده به منبع جدیدی برای جمع‌آوری شواهد تصویری تبدیل شده‌اند. Waymo تأکید کرده که اطلاعات را تنها با حکم قانونی در اختیار پلیس قرار می‌دهد.

    ۱۴۰۴/۱/۲۹ ۱۷:۵۲:۵۰
  • LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

    لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
    این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
    این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

    ۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
  • گوگل امکان پرسیدن سوال از روی عکس را به موتور جستجوی خود اضافه کرد

    گوگل در نسخه آزمایشی موتور جستجوی جدید خود با نام AI Mode، قابلیتی را فعال کرده که کاربران می‌توانند از طریق عکس‌هایی که می‌گیرند یا آپلود می‌کنند، سوالات پیچیده بپرسند.
    این ویژگی که با کمک فناوری Google Lens کار می‌کند، می‌تواند کل محتوای تصویر را تحلیل کند؛ مثلاً تشخیص دهد چه اشیایی در تصویر هستند، چه رنگ و جنسی دارند، و چگونه کنار هم قرار گرفته‌اند.

    به‌عنوان نمونه، اگر از کتابخانه‌تان عکس بگیرید و بپرسید: «اگه از این کتاب‌ها خوشم اومده، چه کتاب‌های مشابهی پیشنهاد می‌کنی؟» این سیستم کتاب‌ها را شناسایی می‌کند و پیشنهادهایی برایتان می‌آورد. همچنین می‌توانید سوال‌های بعدی بپرسید، مثل اینکه «کدومشون حجم کمتری داره؟»

    این قابلیت اکنون در اختیار کاربران بیشتری قرار گرفته و رقیبی برای سرویس‌هایی مثل ChatGPT Search و Perplexity محسوب می‌شود.

    ۱۴۰۴/۱/۱۹ ۲۱:۴۸:۵۴
  • TrueCaller به مرز ۴۵۰ میلیون کاربر جهانی رسید

    اپلیکیشن شناسایی تماس های ناشناس Truecaller اعلام کرد که تعداد کاربران فعال ماهانه‌اش از ۴۵۰ میلیون نفر عبور کرده است. این اپ در ۱۰ ماه گذشته ۵۰ میلیون کاربر جدید جذب کرده و علاوه بر هند، در بازارهایی مانند آمریکای لاتین، آفریقا و آمریکا رشد سریعی داشته است.
    با این حال، دولت هند در حال توسعه یک سیستم شناسایی تماس اختصاصی است که می‌تواند رقیب جدی Truecaller شود.
    این شرکت با افزودن ضبط تماس، رونوشت مکالمات و دستیار هوش مصنوعی در تلاش است تا خدمات خود را گسترش دهد.

    ۱۴۰۴/۱/۱۵ ۱۵:۳۷:۰۹
  • تأثیر کیفیت صدا در قضاوت افراد در جلسات آنلاین

    پژوهشی در دانشگاه ییل نشان می‌دهد کیفیت صدای افراد در تماس‌های تصویری، تأثیر مستقیمی بر قضاوت دیگران درباره آنها دارد. محققان دریافتند استفاده از میکروفون با کیفیت پایین می‌تواند شانس استخدام، برقراری ارتباط عاطفی و اعتبار فردی را کاهش دهد. این تأثیر صرف نظر از جنسیت و لهجه، در تمامی آزمایش‌ها مشهود بود.

    ۱۴۰۴/۱/۱۱ ۱۱:۰۴:۱۵
  • تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

    استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

    ۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
  • کوپایلوت بازی مایکروسافت؛ دستیار هوش مصنوعی برای گیمرها

    مایکروسافت دستیار هوش مصنوعی «کوپایلوت برای بازی» را معرفی کرد که قابلیت راهنمایی بازیکنان در بازی‌های مختلف را دارد. این دستیار صوتی می‌تواند اطلاعات تخصصی بازی، توصیه‌های فنی و حتی مشاوره برای انتخاب شخصیت مناسب در بازی‌های آنلاین ارائه دهد. کوپایلوت همچنین قادر به نصب بازی، معرفی بازی‌های جدید و برقراری ارتباط با دوستان بازیکن است.

    ۱۴۰۳/۱۲/۲۳ ۱۹:۱۱:۳۰
  • استارتاپ Bria؛ تولید تصاویر هوش مصنوعی با محتوای مجوزدار

    استارتاپ Bria یک راهکار نوین برای تولید تصاویر هوش مصنوعی ارائه می‌دهد که با خریداری تصاویر از شرکای مختلف مانند Getty Images، مدل‌های تولید محتوای خود را آموزش می‌دهد. این شرکت با هدف ایجاد یک اکوسیستم مالکیت معنوی، راهکاری برای تولید محتوای تصویری متنوع و قانونی ارائه می‌دهد و موفق شده ۴۰ میلیون دلار سرمایه جذب کند.

    ۱۴۰۳/۱۲/۲۳ ۱۴:۵۰:۳۴
  • ادغام سورا در چت‌جی‌پی‌تی و توسعه قابلیت‌های تولید محتوای تصویری

    شرکت OpenAI قصد دارد ابزار تولید ویدیوی هوش مصنوعی سورا را به تدریج در اپلیکیشن چت‌جی‌پی‌تی ادغام کند. این شرکت همچنین برنامه‌هایی برای گسترش قابلیت‌های سورا در تولید تصاویر و ویدیوها دارد و احتمالاً این ویژگی جدید می‌تواند کاربران را به ارتقای اشتراک پریمیوم تشویق کند.

    ۱۴۰۳/۱۲/۱۱ ۰۱:۴۷:۴۸
  • یوتیوب با یک میلیارد بیننده ماهانه، پادکست را تسخیر کرد

    یوتیوب با عبور از مرز یک میلیارد بیننده ماهانه پادکست، سلطه خود را در عرصه محتوای صوتی-تصویری تثبیت کرد. این پلتفرم با تمرکز بر فرمت ویدیویی و تغییر در نحوه نمایش تبلیغات میان‌برنامه‌ای، رقبای اصلی خود مانند اسپاتیفای را تحت فشار قرار داده است.

    ۱۴۰۳/۱۲/۸ ۲۱:۰۳:۴۵
  • پایان خدمات Amazon Chime؛ جایگزینی برای جلسات آنلاین

    آمازون سرویس تماس و جلسات آنلاین Chime را از 20 فوریه 2026 تعطیل می‌کند. این پلتفرم که در سال 2017 برای کاربران کسب و کار راه‌اندازی شد، به دلیل عدم استقبال کافی، پذیرش جدید را متوقف کرده و مشتریان فعلی را به استفاده از سرویس‌های جایگزین مانند Zoom و Slack هدایت می‌کند. آمازون SDK این سرویس را همچنان پشتیبانی خواهد کرد.

    ۱۴۰۳/۱۲/۲ ۲۲:۴۹:۴۶
  • گوگل قابلیت جستجوی تصویری در iOS را با Google Lens گسترش می‌دهد

    گوگل قابلیتی جدید برای جستجوی تصویری در اپلیکیشن‌های Chrome و Google Search در iOS راه‌اندازی کرد. کاربران می‌توانند با استفاده از Google Lens، با حرکات مختلف مانند دایره کشیدن، برجسته کردن یا ضربه زدن، اشیاء روی صفحه نمایش را جستجو کنند. این ویژگی امکان جستجوی سریع تصاویر و اطلاعات بدون نیاز به گرفتن اسکرین‌شات را فراهم می‌کند.

    ۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۸
  • استارتاپ سانس با فناوری هوش مصنوعی، تبعیض لهجه در مراکز تماس را کاهش می‌دهد

    استارتاپ سانس با استفاده از هوش مصنوعی، نرم‌افزاری توسعه داده که قادر به تعدیل لهجه گویندگان در زمان واقعی است. این شرکت که در سال ۲۰۲۰ تأسیس شده، با هدف کاهش تبعیض لهجه‌ای در مراکز تماس فعالیت می‌کند. سانس با فناوری هوش مصنوعی خود توانسته درآمد سالانه ۲۱ میلیون دلاری کسب کند و اخیراً ۶۵ میلیون دلار سرمایه جذب کرده است.

    ۱۴۰۳/۱۲/۱ ۲۱:۱۱:۵۳
  • حذف اپلیکیشن‌های فاقد اطلاعات تماس در فروشگاه اپ استور اروپا

    اپل در اتحادیه اروپا، اپلیکیشن‌های توسعه‌دهندگانی که اطلاعات تماس خود شامل آدرس، شماره تلفن و ایمیل را ارائه نداده‌اند از فروشگاه اپ استور حذف کرده است. این اقدام در راستای اجرای قانون خدمات دیجیتال است که از توسعه‌دهندگان می‌خواهد وضعیت تجاری خود را مشخص کنند. توسعه‌دهندگان کوچک و مستقل برای حفظ حریم خصوصی، راهکارهایی مانند استفاده از دفاتر مجازی و شماره تلفن‌های اینترنتی را اتخاذ کرده‌اند.

    ۱۴۰۳/۱۲/۱ ۰۱:۲۰:۴۷
  • نتفلیکس به دنبال ورود به عرصه پادکست‌های تصویری

    نتفلیکس، غول پخش آنلاین محتوا، در حال بررسی ورود به حوزه پادکست‌های تصویری است. این شرکت که پیش از این نسبت به این فرمت تردید داشت، اکنون با نمایندگان استعدادها مذاکره می‌کند تا محتوای گفتگو محور جدیدی تولید کند. استراتژی جدید شامل همکاری با پادکسترهای مشهور برای تولید محتوای انحصاری و ارائه نسخه بدون تبلیغاتی پادکست‌ها برای مشترکان است. این حرکت در راستای رقابت با یوتیوب و اسپاتیفای و افزایش جذابیت پلتفرم برای مخاطبان است. نتفلیکس که پیش از این با تغییراتی مانند معرفی تبلیغات و محدود کردن اشتراک‌گذاری حساب، استراتژی خود را تغییر داده، اکنون به دنبال تنوع بخشیدن به محتوا و حفظ مخاطبان است.

    ۱۴۰۳/۱۱/۲۴ ۲۲:۳۶:۰۷