多平面图像的单视图合成

single-view view synthesis with multiplane images
最近在视图合成方面的一系列工作使用深度学习来生成多平面图像——一种以相机为中心的分层 3d 表示——给定两个或多个已知视点的输入图像。我们将此表示应用于单视图视图合成,这是一个更具挑战性但可能具有更广泛应用的问题。我们的方法直接从单个图像输入中学习预测多平面图像,并且我们引入了用于监督的尺度不变视图合成,使我们能够在在线视频上进行训练。我们展示了这种方法适用于几个不同的数据集,它还生成了合理的深度图,并且它学会了在背景层中填充前景对象边缘后面的内容。
asset: autoregressive semantic scene editing with transformers athigh resolutions
我们提出了资产,一种神经架构,用于根据用户对其语义分割图的编辑自动修改输入的高分辨率图像。我们的架构基于具有新颖注意力机制的转换器。我们的关键思想是在高分辨率下稀疏变换器的注意力矩阵,由在较低图像分辨率下提取的密集注意力引导。虽然以前的注意力机制在处理高分辨率图像时计算成本太高,或者在阻碍远程交互的特定图像区域内受到过度限制,但我们新的注意力机制在计算上既高效又有效。我们的稀疏注意力机制能够捕捉远程交互和上下文,从而合成场景中有趣的现象,例如景观到水面上的反射或与景观的其余部分一致的论坛,这些是以前的卷积网络无法可靠生成的和变压器方法。我们提供定性和定量结果,以及用户研究,证明我们方法的有效性。
我们的代码和数据集可在我们的项目页面上找到:https://github.com/difanliu/asset


澳柯玛风冷无霜冷柜上市热销 引领冷柜行业进入无霜时代
电热水壶温控器的连接线路坏了怎么修
土壤水分测量系统的应用领域有哪些,它有什么特点
2018年金融区块链数字资产交易平台系统开发将迎国家化标准
充分利用人工智能,实现更为高效的下一代数据存储
多平面图像的单视图合成
分享电磁阀控制系统原理图
城市治安监控系统的结构组成及功能实现
2018款比亚迪元EV360新能源车电池与电驱系统拆解
Manz将激光应用于防水密封技术
智能电话机器人好不好?
基于磁阻传感器和RS485总线实现弹体滚转角测量系统的应用方案
2017年企业比特币使用情况及相关数据报告
华为达成与小米专利许可协议,科普:通信专利许可为啥这么难谈?
2011中国(肇庆)嵌入式技术创新应用大会
aigo国民好物固态硬盘P3000建功,让电脑全方位提速
高温线是一种什么线,高温线的种类有哪些
C++内存泄漏检测拾遗
三部委发布一系列鼓励消费政策 无线充电成重点
你必须要了解模拟系统中动态范围的解决方法