ترکیب مدلهای هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی
گوگل در حال توسعه استراتژی جدیدی در زمینه هوش مصنوعی است که هدف آن ایجاد یک دستیار دیجیتالی جهانی با قابلیت درک چندرسانهای است.
دمیس هاسابیس، مدیرعامل DeepMind، تأکید کرده که مدل Gemini از ابتدا برای چندرسانهای بودن طراحی شده است. این رویکرد بخشی از چشمانداز گوگل برای ساخت یک دستیار هوش مصنوعی است که بتواند در دنیای واقعی به کاربران کمک کند.
صنعت هوش مصنوعی به سمت مدلهای "اُمنی" حرکت میکند که قادرند انواع مختلف رسانه را درک و ترکیب کنند. شرکتهای بزرگ فناوری مانند گوگل، OpenAI و آمازون در حال توسعه چنین مدلهایی هستند.
گوگل برای آموزش مدل Veo از ویدیوهای یوتیوب استفاده میکند تا درک مدل از فیزیک دنیای واقعی را بهبود بخشد. این اقدام با گسترش شرایط خدمات یوتیوب در سال گذشته همراه بوده است. /



