ترکیب مدل‌های هوش مصنوعی Gemini و Veo گوگل برای درک جهان فیزیکی

۱۴۰۴/۱/۲۳ ۰۲:۵۶:۲۲


گوگل در حال توسعه استراتژی جدیدی در زمینه هوش مصنوعی است که هدف آن ایجاد یک دستیار دیجیتالی جهانی با قابلیت درک چندرسانه‌ای است.
دمیس هاسابیس، مدیرعامل DeepMind، تأکید کرده که مدل Gemini از ابتدا برای چندرسانه‌ای بودن طراحی شده است. این رویکرد بخشی از چشم‌انداز گوگل برای ساخت یک دستیار هوش مصنوعی است که بتواند در دنیای واقعی به کاربران کمک کند.
صنعت هوش مصنوعی به سمت مدل‌های "اُمنی" حرکت می‌کند که قادرند انواع مختلف رسانه را درک و ترکیب کنند. شرکت‌های بزرگ فناوری مانند گوگل، OpenAI و آمازون در حال توسعه چنین مدل‌هایی هستند.
گوگل برای آموزش مدل Veo از ویدیوهای یوتیوب استفاده می‌کند تا درک مدل از فیزیک دنیای واقعی را بهبود بخشد. این اقدام با گسترش شرایط خدمات یوتیوب در سال گذشته همراه بوده است. /

© 2025 Copyright - All Rights Reserved By ecofori.ir