康奈尔大学人工智能研究人员提出了一种新的神经网络框架来解决视频配对问题
最流行的计算机应用程序是视频和图像编辑。 自从机器学习和深度学习出现以来,人们就通过神经网络架构深入研究了图像和视频编辑。 直到最近,大多数用于视频和图像编辑的深度学习 (DL) 模型都受到监督。 更具体地说,训练数据必须包括用于学习所需转换细节的输入数据和输出数据对。 最近,提出了只需要一张图像作为输入的端到端学习框架。
视频抠图是视频剪辑的重要组成部分。 “哑光”一词可以追溯到 19 世纪,当时在玻璃板上涂上哑光漆,并在拍摄过程中将其放在镜头前。 这造成了拍摄地点不存在环境的错觉。 今天数字图像的构成是相似的。 每个图像的前景和背景的强度使用复合公式进行着色。
这个过程非常强大,但也有局限性。 这个过程需要将图像清晰地分解为前景层、背景层,然后假设每一层都可以独立处理。 在某些情况下,层分解可能是一项艰巨的任务,例如视频抠图。
来源和详细信息:
https://www.marktechpost.com/2022/11/22/artificial-intelligence-ai-researchers-from-cornell-university-propose-a-novel-neural-network-framework-to-address-the-video-matting-problem/