• نتفلیکس زیرنویس جدید خود را معرفی کرد

    نتفلیکس قابلیت جدیدی به زیرنویس‌های خود اضافه کرده که فقط دیالوگ‌ها را نشان می‌دهد و صداهایی مانند “در بسته شد” یا “تلفن زنگ زد” حذف شده‌اند. این ویژگی که با انتخاب گزینه “English” به‌جای “English (CC)” فعال می‌شود، برای کسانی طراحی شده که فقط می‌خواهند گفت‌وگوها را بخوانند و نیازی به اطلاعات صوتی دیگر ندارند. این نوع زیرنویس مکمل زیرنویس‌های کامل ویژه ناشنوایان است. نتفلیکس اعلام کرده تقریباً نیمی از زمان تماشای کاربران در آمریکا با زیرنویس همراه است. این قابلیت فعلاً برای فصل جدید سریال “You” فعال شده و به‌زودی در دیگر آثار اصلی نتفلیکس و به تمام زبان‌ها ارائه خواهد شد.

    ۱۴۰۴/۲/۶ ۰۸:۱۷:۵۵
  • هوش مصنوعی عینک‌های هوشمند متا به اروپا گسترش یافت

    متا اعلام کرد که دستیار هوش مصنوعی خود را روی عینک‌های هوشمند Ray-Ban در هفت کشور اروپایی دیگر فعال کرده است. کاربران در آلمان، اتریش، بلژیک، دانمارک، نروژ، سوئد و فنلاند اکنون می‌توانند با دستیار صوتی Meta AI صحبت کرده و پاسخ سوالات عمومی خود را دریافت کنند.
    این قابلیت ابتدا در آمریکا فعال شده بود، اما به‌دلیل قوانین سخت‌گیرانه اتحادیه اروپا در زمینه حفظ حریم خصوصی، ورود آن به اروپا با تأخیر مواجه شد.
    قابلیت‌های جدیدی نیز در راه است؛ از جمله ترجمه زنده و امکان پرسش از هوش مصنوعی درباره چیزهایی که کاربر با عینک می‌بیند. این ویژگی‌ها از هفته آینده در کشورهای اروپایی پشتیبانی‌شده فعال می‌شوند.
    هدف متا از این توسعه، جذب کاربران بیشتر و تقویت موقعیت خود در حوزه فناوری‌های پوشیدنی و هوش مصنوعی است.

    ۱۴۰۴/۲/۴ ۱۸:۲۹:۵۴
  • دانشجویان جوان، رقیبی برای هوش مصنوعی صوتی گوگل با نام Dia ساختند

    دو دانشجوی کره‌ای بدون تجربه زیاد در هوش مصنوعی، مدلی به نام “Dia” ساخته‌اند که می‌تواند صدای مصنوعی مانند پادکست تولید کند؛ عملکرد آن مشابه ابزار NotebookLM گوگل است، اما کنترل بیشتری به کاربر می‌دهد. این مدل رایگان است و در پلتفرم‌های Hugging Face و GitHub قابل دسترسی است. کاربران می‌توانند لحن صدا، مکث‌ها، سرفه و خنده را در گفت‌وگوها تنظیم کنند و حتی صدای واقعی افراد را شبیه‌سازی کنند. هرچند این ابزار محافظت زیادی در برابر سوءاستفاده ندارد و مشخص نیست از چه داده‌هایی برای آموزش آن استفاده شده، اما سازندگان آن قصد دارند پلتفرمی با قابلیت‌های اجتماعی و چندزبانه بسازند.

    ۱۴۰۴/۲/۳ ۲۱:۰۸:۴۱
  • تأمین سرمایه ۳.۶ میلیون دلاری Telli برای توسعه دستیارهای صوتی هوش مصنوعی

    استارتاپ آلمانی Telli با جذب ۳.۶ میلیون دلار سرمایه، قصد دارد دستیارهای صوتی هوش مصنوعی خود را توسعه دهد. این سیستم‌ها به کسب‌وکارها کمک می‌کنند تا تماس‌های مشتریان را خودکار مدیریت کنند و وظایف ساده‌ای مانند رزرو وقت و پیشنهاد محصول را انجام دهند. تماس‌های پیچیده به اپراتور انسانی واگذار می‌شود. این دستیارها با صدای بازیگران واقعی ساخته می‌شوند و تاکنون نزدیک به یک میلیون تماس را فقط با یک تیم شش‌نفره پردازش کرده‌اند. Telli رشد درآمدی بالای ۵۰ درصد در ماه داشته و مشتریانی از چند قاره جذب کرده است.

    ۱۴۰۴/۲/۱ ۲۰:۱۶:۵۸
  • ‏ نخستین نیمه‌ماراتن ربات‌های انسان‌نما در پکن؛ پیروزی آهسته با کمک انسان

    ‌ها

    در پکن برای اولین‌بار مسابقه نیمه‌ماراتن مخصوص ربات‌های انسان‌نما برگزار شد. در این رقابت که کنار هزاران دونده انسانی انجام شد، ۲۱ ربات شرکت کردند. ربات “Tiangong Ultra” با زمان ۲ ساعت و ۴۰ دقیقه برنده شد؛ البته با کمک انسانی که جلوتر از او می‌دوید و راه را نشان می‌داد. بیشتر ربات‌ها با کنترل از راه دور حرکت می‌کردند و تنها چهار ربات توانستند پیش از پایان محدودیت ۴ ساعته مسابقه را تمام کنند. برخی ربات‌ها دچار مشکل شدند؛ یکی دود کرد، یکی به حصار خورد و شکست. این مسابقه نشان داد ربات‌ها هنوز راه زیادی تا رسیدن به توانایی حرکتی انسان‌ها دارند.

    ۱۴۰۴/۱/۳۱ ۲۳:۵۵:۱۲
  • سرمایه‌گذاری Spotify برای گسترش کتاب‌های صوتی غیر انگلیسی

    اسپاتیفای برای افزایش تولید کتاب‌های صوتی به زبان‌های غیر انگلیسی، به‌ویژه فرانسوی و هلندی، بیش از یک میلیون دلار سرمایه‌گذاری می‌کند. این اقدام به‌دلیل کمبود کتاب‌های صوتی در این زبان‌ها و رقابت با پلتفرم‌هایی مثل Audible انجام می‌شود.
    در فرانسه تنها ۳٪ از کتاب‌ها به‌صورت صوتی در دسترس هستند و در هلند نیز این نسبت پایین است. اسپاتیفای می‌خواهد با کاهش هزینه تولید، از جمله استفاده از راویان انسانی و همچنین همکاری با شرکت ElevenLabs برای روایت صوتی با هوش مصنوعی، ناشران را به تولید بیشتر تشویق کند؛ هرچند این همکاری با واکنش‌هایی در صنعت نشر مواجه شده است.

    ۱۴۰۴/۱/۳۱ ۱۵:۵۷:۵۴
  • ویکی‌پدیا برای مقابله با ربات‌ها نسخه‌ای ویژه برای آموزش هوش مصنوعی منتشر کرد

    ‌‏
    ‏ویکی‌پدیا که با هجوم ربات‌ها برای استخراج داده جهت آموزش هوش مصنوعی مواجه شده، تصمیم گرفته نسخه‌ای ساده و استاندارد از محتوای خود را منتشر کند تا از فشار روی سایتش کم شود. این نسخه با همکاری پلتفرم “Kaggle” وابسته به گوگل ارائه می‌شود و شامل محتوای متنی ویکی‌پدیا به زبان‌های انگلیسی و فرانسوی است که بدون ارجاع و کدهای اضافی بوده و در قالب JSON ارائه می‌شود. هدف این اقدام، کاهش مصرف پهنای باند و هزینه‌های فنی ناشی از ترافیک غیرانسانی است که در سال گذشته ۵۰ درصد افزایش یافته. بنیاد ویکی‌مدیا گفته Kaggle بابت استفاده از این داده‌ها هزینه پرداخت کرده و شرکت‌ها باید قوانین منبع و مجوز را رعایت کنند.

    ۱۴۰۴/۱/۳۰ ۱۲:۲۰:۳۸
  • استارتاپ کره‌ای RLWRLD به‌دنبال ساخت مغز متفکر برای ربات‌ها

    استارتاپ کره‌ای RLWRLD با جذب ۱۴.۸ میلیون دلار قصد دارد مدل هوش مصنوعی پایه‌ای برای ربات‌ها بسازد؛ مدلی که با ترکیب فناوری زبانی و نرم‌افزارهای رباتیک، به ربات‌ها توانایی حرکت‌های دقیق و منطقی می‌دهد. این مدل می‌تواند کارهای پیچیده انسانی را شبیه‌سازی کند.
    این استارتاپ با همکاری شرکت‌هایی مانند LG و SK Telecom در حال آزمایش این فناوری در محیط‌های صنعتی است و به‌دنبال ساخت ربات‌هایی با دستان پنج‌انگشتی است که در کارخانه‌ها، فروشگاه‌ها و خانه‌ها کاربرد داشته باشند.

    ۱۴۰۴/۱/۲۷ ۱۰:۳۹:۴۲
  • هوش مصنوعی گوگل به رمزگشایی زبان دلفین‌ها کمک می‌کند

    گوگل مدل هوش مصنوعی جدیدی به نام DolphinGemma معرفی کرده که به رمزگشایی صدای دلفین‌ها کمک می‌کند. این مدل با داده‌های پروژه‌ای علمی روی دلفین‌های آتلانتیک آموزش دیده و حتی می‌تواند صداهایی شبیه دلفین‌ها تولید کند.
    محققان قصد دارند با استفاده از گوشی Pixel 9 گوگل، این مدل را برای شنیدن و پاسخ به صدای دلفین‌ها به کار بگیرند؛ کاری که قبلاً با Pixel 6 انجام می‌شد، اما حالا با قدرت بیشتر و عملکرد دقیق‌تر ادامه می‌یابد.

    ۱۴۰۴/۱/۲۶ ۲۱:۳۹:۴۵
  • هاگینگ فیس، استارتاپ رباتیک Pollen را خریداری کرد

    پلتفرم هوش مصنوعی Hugging Face، استارتاپ رباتیک Pollen Robotics فرانسه را خریداری کرد. این شرکت قصد دارد ربات انسان‌نمای Reachy 2 را به فروش رساند و کد آن را در اختیار توسعه‌دهندگان قرار دهد. Pollen Robotics که هدف آن تولید ربات‌های خانگی با قیمت مناسب است، پیش از این ۲.۵ میلیون یورو سرمایه جذب کرده بود.

    ۱۴۰۴/۱/۲۶ ۱۹:۲۵:۱۷
  • LiveKit استارتاپی که زیرساخت ارتباطات صوتی و تصویری را متحول می‌کند

    لایو کیت (LiveKit) پلتفرمی متن‌باز برای انتقال زنده صدا و تصویر بدون قطعی است که در محصولاتی مانند صدای ChatGPT و ۲۵٪ تماس‌های ۹۱۱ آمریکا استفاده می‌شود.
    این استارتاپ که از سال ۲۰۲۱ فعالیت خود را آغاز کرده، حالا بیش از ۵۰۰ مشتری و ۱۰۰ هزار توسعه‌دهنده دارد و شرکت‌هایی مثل اسپاتیفای، مایکروسافت و متا از آن استفاده می‌کنند.
    این پلتفرم با جذب ۴۵ میلیون دلار سرمایه جدید، قصد دارد زیرساخت ابری مخصوص ارتباطات مبتنی بر هوش مصنوعی بسازد و خدمات خود را توسعه دهد.

    ۱۴۰۴/۱/۲۶ ۱۱:۵۲:۲۷
  • نورو ۱۰۶ میلیون دلار سرمایه جذب کرد

    استارتاپ Nuro فعال در حوزه رانندگی خودکار با جذب ۱۰۶ میلیون دلار سرمایه، استراتژی خود را از تولید ربات‌های تحویل کالا به ارائه فناوری خودران به شرکت‌های خودروسازی و حمل و نقل تغییر داد. این سرمایه‌گذاری ارزش شرکت را به ۶ میلیارد دلار رساند.

    ۱۴۰۴/۱/۲۳ ۱۳:۱۵:۱۹
  • بروزرسانی جدید واتساپ؛ از تماس تصویری باکیفیت‌تر تا اسکن اسناد و خلاصه پیام‌های صوتی

    واتساپ در جدیدترین بروزرسانی خود چندین قابلیت جدید به بخش‌های چت، تماس و کانال‌ها اضافه کرده است. از این پس، در گروه‌ها می‌توان دید چه کسانی آنلاین هستند، نوتیفیکیشن‌ها را فقط برای پیام‌های مهم تنظیم کرد، و در تماس تصویری روی آیفون ، بزرگ‌نمایی (زوم) انجام داد.
    کاربران آیفون همچنین می‌توانند با استفاده از گزینه جدید، اسناد خود را اسکن و ارسال کنند.
    در تماس‌های تصویری، کیفیت افزایش یافته و قطع شدن یا فریز شدن تصویر کمتر خواهد شد. همچنین امکان ایجاد رویداد (event) در چت‌های دو نفره، پاسخ به دعوت‌ها با گزینه “شاید”، افزودن همراه و زمان پایان رویداد فراهم شده است.

    در بخش کانال‌ها نیز، ادمین‌ها می‌توانند ویدیوهای کوتاه ضبط و منتشر کنند، کد QR مخصوص بسازند، و خلاصه نوشتاری پیام‌های صوتی را برای دنبال‌کنندگان ارسال کنند.

    ۱۴۰۴/۱/۲۲ ۱۹:۰۶:۲۶
  • ربات‌های هوش مصنوعی برای کار خیر دست به کار شدند

    سازمانی غیرانتفاعی به نام Sage Future ، آزمایشی جالب راه‌اندازی کرده که در آن چهار مدل هوش مصنوعی (از OpenAI و Anthropic) در یک محیط مجازی تلاش کردند برای امور خیریه پول جمع کنند.
    این ربات‌ها با کمک انسان‌ها توانستند در حدود یک هفته ۲۵۷ دلار برای مؤسسه خیریه Helen Keller International جمع‌آوری کنند؛ نهادی که برای کودکان نیازمند مکمل ویتامین A فراهم می‌کند.
    مدیر پروژه معتقد است که این تنها آغاز راه است و در آینده‌ای نزدیک ربات‌های هوشمند می‌توانند نقش جدی‌تری در فعالیت‌های بشر‌دوستانه ایفا کنند.

    ۱۴۰۴/۱/۲۲ ۰۵:۲۸:۵۶
  • ورود آمازون به رقابت هوش صوتی با مدل جدید Nova Sonic

    آمازون از یک مدل هوش مصنوعی صوتی جدید به نام Nova Sonic رونمایی کرد؛ مدلی که می‌تواند صدا را بسیار طبیعی تولید و گفت‌وگوها را بهتر از قبل درک کند. این مدل، نسبت به دستیارهای صوتی قدیمی مانند الکسا و سیری، بسیار پیشرفته‌تر عمل می‌کند و حتی با مدل‌های پیشرفته‌ی شرکت‌هایی مثل OpenAI و گوگل رقابت می‌کند.
    این مدل به‌گونه‌ای طراحی شده که مکالمات را روان‌تر و با درک بهتری از صدا، حتی در محیط‌های پر سر و صدا یا هنگام لکنت، پردازش کند. آمازون می‌گوید این مدل تا ۸۰٪ ارزان‌تر از برخی رقباست و سرعت پاسخ‌دهی بالاتری هم دارد.

    ۱۴۰۴/۱/۲۰ ۱۷:۳۱:۵۱
  • استارتاپ Phonic؛ راهکار جدید برای بهبود کیفیت صدای مصنوعی هوش مصنوعی

    شرکت Phonic، که توسط دو فارغ‌التحصیل MIT تأسیس شده، در حال توسعه‌ی فناوری پیشرفته‌ای برای بهبود کیفیت و اطمینان‌پذیری صدای مصنوعی است. برخلاف سایر شرکت‌ها که مدل‌های مختلف را به هم متصل می‌کنند، Phonic مدل‌های خود را از صفر و به‌ صورت کامل و یکپارچه آموزش می‌دهد. این روش باعث کاهش تأخیر، افزایش دقت و کاهش هزینه‌های اجرا می‌شود.
    مدل‌های Phonic می‌توانند حتی در شرایطی که صداها نامفهوم، دارای لهجه‌های مختلف یا نویزدار هستند، عملکرد بهتری داشته باشند.

    ۱۴۰۴/۱/۱۶ ۰۱:۵۹:۰۰
  • اسپاتیفای از تبلیغات هوش مصنوعی و پلتفرم تبلیغاتی جدید رونمایی کرد

    اسپاتیفای در یک رویداد در نیویورک اعلام کرد که از تبلیغات مبتنی بر هوش مصنوعی استفاده خواهد کرد. این سیستم جدید به تبلیغ‌دهندگان امکان می‌دهد با استفاده از هوش مصنوعی، متن و صداگذاری تبلیغات صوتی خود را به‌صورت خودکار ایجاد کنند.
    همچنین، اسپاتیفای یک پلتفرم جدید به نام معرفی کرده که به تبلیغ‌کنندگان اجازه می‌دهد در لحظه و به‌صورت خودکار، تبلیغات خود را به کاربرانی که در اسپاتیفای فعال هستند نمایش دهند.

    ۱۴۰۴/۱/۱۵ ۲۳:۵۴:۲۹
  • ربات‌های هوش مصنوعی، بار اضافی روی ویکی‌مدیا ایجاد کرده‌اند

    حجم مصرف پهنای باند ویکی‌مدیا از ابتدای ۲۰۲۴ تا کنون ۵۰٪ افزایش یافته، اما دلیل آن افزایش بازدید کاربران عادی نیست، بلکه ربات‌های جمع‌آوری داده برای آموزش هوش مصنوعی هستند. این ربات‌ها حجم زیادی از تصاویر و فایل‌های چندرسانه‌ای را دانلود می‌کنند و هزینه‌های بالایی به ویکی‌مدیا تحمیل کرده‌اند.
    تیم فنی ویکی‌مدیا در تلاش است تا مانع این ربات‌ها شود، اما با چالشی بزرگ مواجه است. این مشکل، بخشی از یک روند رو به رشد است که می‌تواند اینترنت آزاد را تهدید کند.

    ۱۴۰۴/۱/۱۴ ۱۹:۱۹:۲۲
  • پایان نمایشگرهای لمسی در خودروها؟

    صفحات نمایش لمسی در خودروهای مدرن با وجود محبوبیت اولیه، با چالش‌های جدی مواجه شده‌اند. تنها 15 درصد رانندگان در سال ۲۰۲۴ خواستار نمایشگر تمام عرض هستند و برندهایی مانند فولکس واگن به دلیل انتقادات، به دکمه‌های فیزیکی بازمی‌گردند. دلایل عمده نارضایتی رانندگان شامل مشکلات ایمنی و فنی از جمله حواس‌پرتی راننده و نقص‌های نرم‌افزاری که عملکردهای حیاتی خودرو را مختل می‌کنند است. راهکارهای جدید مانند نمایشگرهای بالای شیشه جلو از جمله صفحه هدآپ و کنترل صوتی با هوش مصنوعی، آینده سیستم‌های خودرو را شکل می‌دهند.

    ۱۴۰۴/۱/۱۱ ۱۰:۵۴:۰۳
  • هدفون‌های Star Wars با افکت صوتی شخصیت‌های محبوب منتشر شد

    شرکت Audio-Technica هدفون‌های بی‌سیم ATH-CKS50TW2 را با طرح‌های اختصاصی شخصیت‌های محبوب جنگ ستارگان منتشر کرد. این هدفون‌ها با رنگ‌بندی و افکت صوتی شخصیت‌هایی مانند گروگو، دارث ویدر و R2-D2 طراحی شده‌اند و قیمت آنها 180 دلار است. هدفون‌ها قابلیت حذف نویز، شارژ بی‌سیم و عمر باتری 40 ساعته دارند.

    ۱۴۰۴/۱/۹ ۲۰:۳۷:۰۰
  • توقف پشتیبانی Google Assistant از Waze در iOS

    شرکت Waze که در زمینه ناوبری و نقشه فعالیت دارد، قابلیت Google Assistant را برای کاربران iOS به دلیل مشکلات مداوم متوقف کرد. این شرکت وعده داده است که در آینده راه حل تعاملی صوتی پیشرفته‌ای را جایگزین خواهد کرد و همزمان روی ویژگی گزارش‌دهی مکالمه‌ای مبتنی بر هوش مصنوعی کار می‌کند.

    ۱۴۰۴/۱/۷ ۱۹:۴۸:۰۶
  • تغییر لهجه با هوش مصنوعی در تماس‌های صوتی توسط Krisp

    استارتاپ Krisp با استفاده از هوش مصنوعی، قابلیت تغییر لهجه انگلیسی هندی به آمریکایی را در تماس‌های صوتی راه‌اندازی کرد. این فناوری با حفظ صدای اصلی گوینده، فقط واج‌ها را تغییر می‌دهد و مدعی است در آزمایشات، نرخ فروش را 26 درصد افزایش داده است.

    ۱۴۰۴/۱/۷ ۱۹:۴۸:۰۳
  • بهبود قابلیت گفتگوی صوتی ChatGPT با کاهش وقفه‌های مکالمه

    شرکت OpenAI نسخه جدیدی از قابلیت صوتی پیشرفته خود را منتشر کرد که به کاربران اجازه می‌دهد بدون قطع شدن مکالمه، مکث کنند. کاربران رایگان و اشتراک‌دهنده می‌توانند از این قابلیت جدید استفاده کنند که گفتگوی طبیعی‌تر و روان‌تری را فراهم می‌کند.

    ۱۴۰۴/۱/۶ ۱۰:۲۶:۱۸
  • OpenAI رونمایی از مدل‌های جدید هوش مصنوعی گفتار و رونویسی

    شرکت OpenAI مدل‌های جدید “gpt-4o-mini-tts” و “gpt-4o-transcribe” را معرفی کرد که دقت و کیفیت بالاتری دارند. مدل TTS صدایی طبیعی‌تر و قابل تنظیم ارائه می‌دهد، درحالی‌که مدل STT جایگزین Whisper شده و دقت بیشتری در تشخیص گفتار دارد. برخلاف Whisper، این مدل‌ها متن‌باز نخواهند بود.

    ۱۴۰۴/۱/۲ ۱۲:۲۲:۴۸
  • فناوری جدید صوتی با امواج فراصوت، صدا را به‌صورت خصوصی و بدون هدفون پخش می‌کند

    محققان فناوری جدیدی برای ایجاد “حباب‌های صوتی” خصوصی توسعه داده‌اند که امکان شنیدن صدا در یک نقطه خاص، بدون انتشار آن به محیط اطراف را فراهم می‌کند.
    این فناوری از پرتوهای فراصوتی خودخم‌شونده و آکوستیک غیرخطی استفاده می‌کند. دو پرتو فراصوت با فرکانس‌های متفاوت که به‌تنهایی ساکت هستند، در محل تلاقی خود یک موج صوتی قابل شنیدن ایجاد می‌کنند. این روش می‌تواند تجربه‌های صوتی شخصی‌سازی‌شده‌ای را بدون نیاز به هدفون فراهم کند.
    این تکنولوژی کاربردهایی مانند گوش دادن به موسیقی در خودرو بدون ایجاد مزاحمت یا ایجاد مناطق گفت‌وگوی خصوصی در دفاتر کاری یا محیط‌های نظامی را دارد.

    ۱۴۰۴/۱/۱ ۱۷:۵۳:۳۹
  • ربات‌های انسان‌نما در آستانه انقلاب صنعتی

    مدیرعامل انویدیا معتقد است ربات‌های انسان‌نما ظرف چند سال آینده در صنایع تولیدی به کار گرفته خواهند شد. جنسن هوانگ با معرفی ابزارهای نرم‌افزاری جدید، کاربرد این ربات‌ها را در محیط‌های کاری با محدودیت‌های مشخص امکان‌پذیر دانست و هزینه اجاره هر ربات را حدود ۱۰۰ هزار دلار عنوان کرد.

    ۱۴۰۳/۱۲/۲۹ ۱۴:۴۴:۰۴
  • انویدیا مدل هوش مصنوعی برای ربات‌های انسان‌نما معرفی کرد

    انویدیا مدل هوش مصنوعی Groot N1 را برای ربات‌های انسان‌نما معرفی کرد. این مدل با معماری دوگانه «تفکر سریع و کند» طراحی شده و قادر است محیط اطراف را درک کرده و اقدامات مناسب را برنامه‌ریزی کند. مدل متن‌باز Groot N1 برای کاربردهای مختلف صنعتی و عمومی طراحی شده و گامی مهم در توسعه رباتیک محسوب می‌شود.

    ۱۴۰۳/۱۲/۲۸ ۲۳:۴۲:۲۰
  • مرسدس بنز در پی استفاده از ربات‌های انسان‌نما در خط تولید

    مرسدس بنز در حال آزمایش ربات‌های انسان‌نمای شرکت Apptronik برای انجام وظایف تولیدی است. این شرکت آلمانی سرمایه‌گذاری میلیون‌ها یورویی در این استارتاپ تگزاسی انجام داده و هدف آن استفاده از ربات‌ها برای جابجایی قطعات و بازرسی کیفیت در خط تولید است. ربات‌های Apollo از طریق کنترل از راه دور با هدف انجام خودکار وظایف در آینده ، توسط انسان آموزش می‌بینند.

    ۱۴۰۳/۱۲/۲۸ ۲۰:۵۵:۱۲
  • تلاش Anthropic برای افزودن قابلیت گفتگوی صوتی به هوش مصنوعی Claude

    استارتاپ هوش مصنوعی Anthropic در حال توسعه قابلیت‌های صوتی برای دستیار هوش مصنوعی Claude است. مدیر ارشد محصول شرکت اعلام کرد که آنها در حال کار بر روی رابط کاربری طبیعی‌تر برای تعامل صوتی با هوش مصنوعی هستند و با شرکای مختلف از جمله Amazon گفتگو کرده‌اند.

    ۱۴۰۳/۱۲/۲۸ ۲۰:۵۴:۵۷
  • آمازون با تغییر سیاست حریم خصوصی، دسترسی به صدای کاربران الکسا را آزاد می‌کند

    آمازون سیاست جدیدی برای دستیار صوتی الکسا اتخاذ کرده که طبق آن از ۲۸ مارس، ضبط صدای کاربران به طور خودکار فعال خواهد شد. این تغییر برای توسعه قابلیت‌های هوش مصنوعی الکسا انجام می‌شود و کاربران دیگر نمی‌توانند جلوی ارسال صدای خود به فضای ابری آمازون را بگیرند. الکسا+ با قابلیت‌های جدید مانند سفارش مواد غذایی و تشخیص صدای کاربر همراه خواهد بود.

    ۱۴۰۳/۱۲/۲۷ ۱۹:۳۲:۴۶
نمایش بیشتر