پلتفرم هوش مصنوعی جدید گوگل از تصاویر پس زمینه برای ایجاد ویدئوهایی با حداکثر طول 30 ثانیه استفاده می کند. این فناوری حتی با استفاده از عکس می تواند ویدیوهای کوتاه بسازد.با تکامل فناوری های مختلف، محققان همچنان به دنبال راه حل های جدید برای استفاده از قابلیت های مختلف هوش مصنوعی و یادگیری ماشین هستند. در اوایل این هفته، دانشمندان گوگل از ایجاد چارچوب جدیدی به نام Transframer خبر دادند که می تواند ویدیوهای کوتاهی را بر اساس ورودی های تصویر (حتی یک عکس) تولید کند. این فناوری جدید میتواند روزی راهحلهای رندر سنتی را تقویت کند و به توسعهدهندگان اجازه دهد تا محیطهای مجازی را بر اساس قابلیتهای یادگیری ماشین ایجاد کنند.
به گزارش TechSpot، نام پلتفرم جدید گوگل، i. ه. Transframer و به نوعی مفهوم آن به مدل مبتنی بر هوش مصنوعی به نام Transformer اشاره دارد که اولین بار در سال 2017 معرفی شد و در واقع معماری جدید شبکه عصبی با قابلیت تولید متن با مدل سازی و مقایسه کلمات دیگر در یک جمله می باشد. این مدل از آن زمان در چارچوب های یادگیری عمیق استاندارد مانند TensorFlow و PyTouch گنجانده شده است.
این سیستم فریم های تصویر اضافی را بر اساس داده ها و حاشیه نویسی ها و هر اطلاعات دیگری که از فریم های زمینه در دسترس است مدل می کند. چارچوب جدید گوگل با ارائه توانایی تولید ویدیوهای دقیق و معقول بر اساس مجموعه بسیار محدودی از داده ها، یک گام بزرگ رو به جلو در فناوری ویدیو نشان می دهد. Transframer همچنین نتایج بسیار امیدوارکنندهای را در معیارهای مربوط به ویدئو مانند تقسیمبندی معنایی و طبقهبندی تصویر و پیشبینیهای جریان نوری نشان داده است.
پیامدهای Transframer برای صنایع مبتنی بر ویدیو مانند توسعه بازی می تواند به طور بالقوه بسیار زیاد باشد. محیطهای توسعه بازی امروزی بر تکنیکهای رندر اصلی مانند سایهزنی، نقشهبرداری عمق، عمق میدان و ردیابی پرتو تکیه دارند. فناوری هایی مانند Transframer این توانایی را دارند که از هوش مصنوعی و یادگیری ماشین برای ایجاد محیط های مورد نظر بازی سازان به روشی کاملا جدید استفاده کنند و در زمان، منابع و تلاش های لازم برای ایجاد این محیط ها صرفه جویی کنند.