هوش مصنوعی جدید گوگل می تواند تنها با یک عکس ویدیوی کوتاه بسازد

پلتفرم هوش مصنوعی جدید گوگل از تصاویر پس زمینه برای ایجاد ویدئوهایی با حداکثر طول 30 ثانیه استفاده می کند. این فناوری حتی با استفاده از عکس می تواند ویدیوهای کوتاه بسازد.با تکامل فناوری های مختلف، محققان همچنان به دنبال راه حل های جدید برای استفاده از قابلیت های مختلف هوش مصنوعی و یادگیری ماشین هستند. در اوایل این هفته، دانشمندان گوگل از ایجاد چارچوب جدیدی به نام Transframer خبر دادند که می تواند ویدیوهای کوتاهی را بر اساس ورودی های تصویر (حتی یک عکس) تولید کند. این فناوری جدید می‌تواند روزی راه‌حل‌های رندر سنتی را تقویت کند و به توسعه‌دهندگان اجازه دهد تا محیط‌های مجازی را بر اساس قابلیت‌های یادگیری ماشین ایجاد کنند.

به گزارش TechSpot، نام پلتفرم جدید گوگل، i. ه. Transframer و به نوعی مفهوم آن به مدل مبتنی بر هوش مصنوعی به نام Transformer اشاره دارد که اولین بار در سال 2017 معرفی شد و در واقع معماری جدید شبکه عصبی با قابلیت تولید متن با مدل سازی و مقایسه کلمات دیگر در یک جمله می باشد. این مدل از آن زمان در چارچوب های یادگیری عمیق استاندارد مانند TensorFlow و PyTouch گنجانده شده است.

این سیستم فریم های تصویر اضافی را بر اساس داده ها و حاشیه نویسی ها و هر اطلاعات دیگری که از فریم های زمینه در دسترس است مدل می کند. چارچوب جدید گوگل با ارائه توانایی تولید ویدیوهای دقیق و معقول بر اساس مجموعه بسیار محدودی از داده ها، یک گام بزرگ رو به جلو در فناوری ویدیو نشان می دهد. Transframer همچنین نتایج بسیار امیدوارکننده‌ای را در معیارهای مربوط به ویدئو مانند تقسیم‌بندی معنایی و طبقه‌بندی تصویر و پیش‌بینی‌های جریان نوری نشان داده است.

پیامدهای Transframer برای صنایع مبتنی بر ویدیو مانند توسعه بازی می تواند به طور بالقوه بسیار زیاد باشد. محیط‌های توسعه بازی امروزی بر تکنیک‌های رندر اصلی مانند سایه‌زنی، نقشه‌برداری عمق، عمق میدان و ردیابی پرتو تکیه دارند. فناوری هایی مانند Transframer این توانایی را دارند که از هوش مصنوعی و یادگیری ماشین برای ایجاد محیط های مورد نظر بازی سازان به روشی کاملا جدید استفاده کنند و در زمان، منابع و تلاش های لازم برای ایجاد این محیط ها صرفه جویی کنند.

عرفان احمدپور ۰ لایک ۳۱ مرداد ۰۱