گوگل از VLOGGER رونمایی کرد؛ تبدیل عکس به ویدیو با هوش مصنوعی + ویدیو
محققان گوگل یک سیستم هوش مصنوعی جدید توسعه دادهاند که میتواند فقط از یک عکس، ویدیوهای واقعی از صحبتکردن و حرکت فرد حاضر در عکس ایجاد کند. این فناوری که VLOGGER نام دارد، از مدلهای پیشرفته یادگیری ماشینی برای ترکیب فیلمهای واقعبینانه استفاده میکند. درعینحال نگرانیهای درباره انتشار دیپفیکها و اطلاعات غلط با این فناوری بیشتر خواهد شد.
محققان گوگل در مقالهای به معرفی فناوری هوش مصنوعی VLOGGER پرداختهاند. این هوش مصنوعی میتواند با دریافت عکس یک شخص به همراه یک کلیپ صوتی از او، ویدیویی همراه با صدا از آن شخص تولید کند. در ویدیوهای این هوش مصنوعی، حالات صورت، حرکات سر و دست نیز لحاظ میشود. البته هنوز نقصها در این ویدیوها مشهود هستند، اما بهمرور میتوان آنها را برطرف کرد.
هوش مصنوعی VLOGGER گوگل
محققان گوگل، از نوعی مدل یادگیری ماشینی به نام «مدلهای انتشاری» (Diffusion Models) برای توسعه این هوش مصنوعی استفاده کردهاند. مدلهای انتشاری اخیراً عملکرد قابلتوجهی در تولید تصاویر بسیار واقعی از توضیحات متنی نشان دادهاند. با تعمیم این مدلها به حوزه ویدیو، محققان توانستند یک سیستم هوش مصنوعی ایجاد کنند که میتواند عکسها را به شیوهای واقعی زنده کند.
این هوش مصنوعی میتواند در حوزههای مختلف کاربردهای گوناگونی داشته باشد. برای مثال بازیگران میتوانند مدلهای سهبعدی دقیقی از خودشان تولید کنند تا در بخشی از یک فیلم بهکار برده شود. این فناوری همچنین میتواند برای ایجاد آواتارهای واقعی در هدستهای واقعیت مجازی و ویدیوگیمها کاربرد داشته باشد.
بااینحال، از این فناوری میتوان سوءاستفاده کرد. بهعنوان مثال میتوان از آن برای ایجاد دیپفیک استفاده کرد. همچنین چون این هوش مصنوعی تنها با یک عکس و فایل صوتی میتواند ویدیویی باورپذیر بسازد، مسلماً نگرانیهایی به دنبال خواهد داشت.