CVPRClonedPerson从单照片构建大规模真实穿搭虚

汽车报价
买车新车
博客专栏
专题精品
教育留学
高考读书
房产家居
彩票视频
直播黑猫
投资微博
城市上海
政务旅游

CVPRClonedPerson从单照片构建大规模真实穿搭虚

6月18日醉殇别投稿

　　机器之心专栏
　　作者：王雅楠、廖胜才
　　本文通过从单张照片克隆整套衣服穿搭到三维人物，构建了一个包含5621个三维人物模型的虚拟行人数据集ClonedPerson。这些虚拟人物在游戏环境里模拟真实监控渲染了多场景下的多摄像机视频。实验表明，该数据集在行人再辨识任务取得了良好的泛化性，并可应用于无监督域适应、无监督学习、人体关键点检测等多个相关任务。相关论文已被CVPR2022接收，数据和代码已开源。
　　论文地址：https：arxiv。orgpdf2204。02611。pdf项目地址：https：github。comYananWangcsClonedPerson
　　引言
　　大规模虚拟数据已经被证明能显著提升可泛化的行人再辨识能力。现有的虚拟行人数据库（例如RandPerson和UnrealPerson）的人物穿着与现实生活差距较大，且没有考虑服装搭配问题。
　　如下图1所示，（a）RandPerson的随机颜色和纹理组合生成虚拟人物的策略使其人物偏卡通化；（b）尽管UnrealPerson使用了真实衣服纹理来生成人物，但由于衣服纹理的尺寸问题，生成的虚拟人物和真实人物依然有较大的差异，且未考虑上下半身的协调穿搭。
　　图1。RandPerson，UnrealPerson和ClonedPerson的对比图
　　有鉴于此，本文提出一种自动从单角度人物照片中克隆整套衣服穿搭并产生三维人物模型的方案，并在游戏环境里模拟真实监控进行渲染，由此得到一个更真实的大规模虚拟行人数据集，并最终提升行人再辨识模型的泛化表现。
　　不同于已有的通过视频或多视角照片重建的方法，我们立足于克隆单张照片中的整套衣服生成虚拟人物。这样可以使用互联网上大量人物照片进行服装克隆，达到规模化的限制条件很低。
　　另外由于本文提出的方法将照片中人物的整套衣服克隆到虚拟人物身上，有效解决了现有虚拟数据库服装搭配与现实生活不匹配的问题。
　　具体而言，本文设计了衣服配准映射（registeredclothesmapping）和均匀布料扩展（homogeneousclothexpansion）两种方法来克隆衣服纹理。
　　其中，衣服配准映射主要针对目标UV纹理图衣服结构清晰的人物模型，根据正面人物照片和模型纹理图中衣服对应关键点的位置进行投影变换，从而保留衣服纹理的清晰度和纹理结构。均匀布料扩展主要针对人物背面（在正面照片中背面纹理不可见），通过找到并扩展衣服区域面积最大的同质纹理实现自动填充人物背面纹理。
　　除此之外，本文还提出一个相似性多样性人物扩展策略，通过聚类的方法使生成的虚拟人物既具有相似性，又具有多样性，从而形成最大效用的大规模虚拟行人数据集。该方法通过克隆同一聚类的人物照片生成相似人物，同时通过克隆不同聚类的人物照片生成多样性的人物。
　　最后，通过在Unity3D的场景下进行渲染得到一个包含自动标注的虚拟行人数据集，称为ClonedPerson。它包含5621个虚拟人物，6个场景，24个摄像机，168段密集行人的视频，887，766张切好的行人图片。图1c展示了部分虚拟行人图片。
　　论文通过实验证明了ClonedPerson虚拟数据集可以应用在多个任务中，如行人再辨识及其跨域泛化、无监督域适应、无监督学习、和人体关键点检测。其中，跨库泛化性测试显著超越三大主流行人再辨识数据集（CUHK03、Market1501和MSMT17）和当前流行的虚拟行人再辨识数据集（RandPerson和UnrealPerson）。
　　研究动机
　　数据匮乏一直制约着行人再辨识的发展，除了标注困难之外，近年来对监控视频数据的隐私敏感性的关注更是让这个问题雪上加霜，已经有一些公开数据集因此而下架了。与之相反，虚拟数据几乎无需标注且没有隐私敏感问题，且虚拟数据已经被证实能显著提升行人再辨识模型的泛化性能。
　　为此，研究人员提出了一些方法来生成大规模虚拟数据库，例如RandPerson和UnrealPerson。然而，这些数据库中的人物衣着纹理与真实人物有很大的区别，限制了虚拟数据库的提升效果。
　　图2。ClonedPerson和HPBTT生成人物的对比图
　　此外，研究人员采用不同的方法实现了将2D照片中的人映射到3D模型上，例如PIFu、HPBTT和Pix2Surf。然而，使用这些方法生成大规模虚拟数据库存在以下问题：PIFu由于训练数据需要3D形状标注，限制了其得到充分有效的训练；HPBTT通过神经网络模型生成的纹理相对模糊，衣服的纹理结构不够清晰（如图2c所示）；Pix2Surf则需要输入背景相对简单且拥有正背面纹理的衣服照片；HPBTT和Pix2Surf所采用的SMPL模型可能缺乏通用性，如图2c所示的裙子问题。
　　因此，为了解决上述问题，本文提出一种通过克隆单角度照片中的衣服生成大量三维人物模型的方案，并针对该方案设计了两种克隆方法。基于此方法可以将照片中的衣服纹理克隆到虚拟人物身上。
　　图2展示了此方法和HPBTT生成人物的对比图。考虑到生成数据的相似性和多样性，本文设计了一个相似性多样性人物扩展策略来扩展人物模型。最后得到了一个包含自动标注的虚拟行人数据集ClonedPerson。
　　该方法降低了对输入图片的要求（可以应用在互联网上获取的大量人物照片中），且设计的两种克隆方法能够得到清晰的正面纹理并自动补全背面纹理，因此可以不需要输入背面图片。
　　克隆方案
　　下图3展示了本文提出的克隆方案，包含以下步骤：首先在预处理阶段，使用行人检测、人物关键点检测、服装类型和服装关键点检测筛选图片；其次使用衣服配准映射和均匀布料扩展两种方法克隆衣服纹理并生成虚拟人物；最后将人物导入虚拟环境生成数据。
　　图3。ClonedPerson从单角度人物照片到虚拟数据的方案图
　　其中，预处理阶段的方法是为了提升生成人物的成功率。由于存在大量单角度的照片可以克隆，选择一些正面且衣服图案未被遮挡的照片来生成人物可以显著提高服装分类和服装关键点检测的成功率，而且由这些照片生成的虚拟人物更具有完整的衣服纹理和服饰搭配。
　　衣服配准映射
　　图4。MakeHuman中衣服模型的纹理图
　　本文采用了MakeHuman来制作三维人物。该软件的用户社区资源中包含多种衣服模型，其中大部分模型的UV纹理图具有清晰的纹理结构，如上图4b所示，称为规则纹理图。由此可以通过经由关键点配准的投影方法将真实照片中的图案投影到模型的UV纹理图上。
　　再如图4所示，目标模型纹理图中标注了一系列关键点位置（如4b红点所示），真实照片中衣服相应关键点位置可以通过训练检测器检测得到（如4a红点所示），再通过求解投影变换矩阵，便可以对照片中衣服区域的每个像素点计算出它在纹理图上的对应点，以此实现衣服配准映射。下图5的上部分展示了衣服配准映射的过程。
　　图5。衣服配准映射和均匀布料扩展示意图
　　均匀布料扩展
　　通过衣服配准映射可以将衣服正面纹理映射到规则纹理图的相应位置，但不能处理衣服模型的背面纹理和不规则纹理图（如图4c所示）。因此，本文提出了第二种方法均匀布料扩展来解决这个问题。
　　如上图5下半部分所示，首先通过一个训练好的行人再辨识模型对衣服图片抽取特征，然后在特征中遍历不同的矩形块。通过计算每个特征的均值方差，可以找到块内平均方差与矩形面积之比的最小矩形块，其对应区域为最优同质块。
　　对于规则模型，如图5所示，由于投影变换造成了图像尺寸变化，获得的同质块需要进行相应的尺度变换来保证纹理的一致性。对于不规则模型则保持同质块的原始尺寸。获得同质块后，使用图片翻转的策略扩展同质块来填充纹理图。
　　相似性多样性人物扩展策略
　　图6。相似性多样性人物扩展策略示意图
　　本文使用DeepFashion和DeepFashion2数据库生成虚拟人物。通过预处理阶段筛选后，仍然有数万张照片可以用来生成虚拟人物。考虑到生成的数据应该具备相似性和多样性，本文设计了一个相似性多样性人物扩展策略。
　　由于照片中存在同一人多角度的照片，首先需要去除这些相同衣服纹理不同角度的照片。因此本文对照片进行两次聚类：第一次去除重复图片，第二次选取具有相似性和多样性的照片。第一次聚类使非常相似（同一人的不同角度）的照片聚在一起，并抽取每类距离中心点最近的一张图片和聚类失败的图片混合后进行第二次聚类。
　　两次聚类后，如上图6所示，相似性多样性人物扩展策略通过采样克隆同一聚类内的人物照片生成相似人物，通过克隆不同聚类的人物照片生成多样性的人物。本文从聚类结果中的每一类抽取7张照片进行克隆（5张生成训练集，2张生成测试集），最终生成5621个虚拟人物。将这些虚拟人物渲染后得到数据集ClonedPerson。
　　下表1统计了ClonedPerson和其他虚拟行人数据集的一些特征。
　　表1。虚拟行人数据集统计表。Cam：摄像头数，Sur：模拟真实监控场景，Real：使用真实衣服纹理，Outfit：考虑服装搭配
　　实验结果
　　实验结果表明，ClonedPerson可以被应用在传统的单库行人再辨识（表3）、跨库可泛化的行人再辨识（表2、3、4）、无监督学习（表3）、无监督域适应（表3、4）和人体关键点检测（图7）中，且ClonedPerson训练出的模型在跨库测试中有良好的泛化性能。
　　表2。使用QAConv2。0在不同数据库上的跨库测试结果
　　表3。不同模型在ClonedPerson测试集的结果。绿色区域：跨库测试；灰色：库内测试；蓝色：UDA；粉色：无监督学习
　　表4。不同任务在不同数据库上的mAP结果。TransM：TransMatcher，RP：RandPerson，RP：RandPerson中的人物在ClonedPerson环境中渲染，UP：UnrealPerson，CP：ClonedPerson
　　从跨库测试（表2和表4）的结果可以看出，ClonedPerson数据库能很好地应用在可泛化的行人再辨识任务中。例如，表2表明，对比真实数据库，ClonedPerson上训练的模型泛化性能显著超过在真实数据库（CUHK03，Market1501和MSMT17）上训练的模型。
　　表4表明，对比已有的虚拟数据库，ClonedPerson训练的模型在CUHK03和Market1501上具有更好的泛化性能。UnrealPerson更真实的场景（采用虚幻引擎）和更多的摄像头数可能导致ClonedPerson在MSMT17上的泛化性能弱于UnrealPerson。但是，考虑到三个真实数据库的平均泛化性能，ClonedPerson则更胜一筹，证明了从照片中克隆衣服生成虚拟数据的有效性。
　　此外，本文还使用ClonedPerson作为测试集进行测试（表3）。实验结果表明，一方面，ClonedPerson可以支持多个行人再辨识任务；另一方面，在ClonedPerson上的测试结果（表3）显著低于在真实数据库上的测试结果（表2），表明ClonedPerson本身也是一个相当有挑战性的数据库。
　　ClonedPerson还可以用在无监督域适应（UDA）任务中。当ClonedPerson作为源数据集时（如表4所示），对比RandPerson和UnrealPerson，ClonedPerson具有更高的平均泛化性能。当ClonedPerson作为目标数据集时（如表2蓝色区域所示），由于多样化的摄像头和大量的相似人物，在ClonedPerson上的UDA性能还有很大的提升空间。
　　除此之外，ClonedPerson的关键点信息也可以用来训练人体关键点模型。图7展示了用ClonedPerson训练的人体关键点检测模型在真实数据集上的检测效果示例图。为了节省存储空间，ClonedPerson目前只记录了7个基本关键点，但数据渲染过程中可记录更多关键点的位置信息用于后续扩展。
　　图7。人体关键点检测结果
　　结论
　　本文提出了一种通过克隆单角度照片中的衣服生成大量三维人物模型的方案，并在该方案中设计了两种克隆方法和一种相似性多样性人物扩展策略，最终得到了一个包含自动标注的虚拟行人数据集ClonedPerson。本文通过实验证明在克隆照片生成的数据库上训练能提升行人再辨识模型的泛化能力和支持相关的多个任务。
　　本文所提方法的优势是能生成服装纹理清晰，并与照片中人物的衣服穿搭表观相似的虚拟人物。使用这些更真实的虚拟人物生成的虚拟数据具有更好的泛化性能。本文提出的方法由于只需要单一角度的人物照片，对输入图片的要求较小，因此可以采用大量互联网图片进行后续扩展。
　　此外，ClonedPerson公开了相应的图片和视频数据，未来可以探索更多的相关任务，如行人检测，行人跟踪，多摄像机行人跟踪等等。
　　作者简介
　　王雅楠，现任阿联酋起源人工智能研究院工程师。研究兴趣为行人分析。
　　廖胜才，阿联酋起源人工智能研究院（IIAI）主任研究员。IEEE高级会员。研究兴趣为行人和人脸分析。

投诉评论转载

忠于所爱，CBA总决赛开赛前，辽宁男篮海报受到央媒点赞北京时间4月20日，CBA总决赛即将拉开帷幕，开赛之前辽宁男篮的海报忠于所爱受到了央媒的点赞，海报中并没有宣战，而且一支手臂缠满了绷带，绷带上面写有受伤运动员的名字。这一……CVPRClonedPerson从单照片构建大规模真实穿搭虚机器之心专栏作者：王雅楠、廖胜才本文通过从单张照片克隆整套衣服穿搭到三维人物，构建了一个包含5621个三维人物模型的虚拟行人数据集ClonedPerson。这些虚拟……6对娱圈两岸婚姻各有各的相处模式，为何坚持不下去的是大S？前几天，大S与新老公具俊晔在米其林餐厅吃饭的背影，又一次引起轩然大波。尽管距离大S和汪小菲的上一段离婚大战已经过去了将近一年，但是围绕在她身边的关于婚姻的话题始终不断。……海莉比伯在纽约穿着碎花套裙外出，她看起来性感十足周二晚上，罗德创始人海莉比伯在纽约安曼豪华酒店现身，展示了她低调的魅力。这位IMG模特本月刚满26岁，她身穿米色碎花西装，搭配铅笔裙外出，她看起来美极了。海莉在晚上戴着太……界读丨华为商城再次悄咪咪上架P40ProPro，麒麟990有欧界报道：好消息：华为商城又偷偷上架了两款5G手机！坏消息：又一秒卖空，现在只能等到货通知！现在的华为商城像潘多拉宝盒，时不时的就悄悄上架几款5G手机，在很多消费者还不知……半价了！小米MIX45G仅需3998元文薛璐遥责编吕东兴总编唐迪手机是日常生活中必不可少的电子产品，一款赠送90天碎屏险晒单红包，性价比高的手机更加容易吸引购买者购买。今天要推荐的是小米官方标配12G256G……让英语学习变得轻松惬意，科大讯飞AI翻译笔P20究竟有多神奇近日，科大讯飞发布了新一代人工智能翻译笔讯飞AI翻译笔P20及P20plus。据悉，这是首个强打适龄同步学概念的翻译笔，能够针对不同学龄段定制优化，且集能查能译能学等多种功能于……专家提醒高血压患者最好少喝或不喝咖啡，还包括这些饮料咖啡，是现代人最常喝的饮品之一。随着工作压力、生活压力的增大，咖啡成为了人们提神、缓解焦虑的选择。咖啡因正是因为其自身可以提高人体灵敏度、注意力，促进新陈代谢，改善人体的……4名员工起家做到全球第一，日本企业扎根中国市场30年为何无人又这么一家日本企业，在中国市场上发展了30多年了，可是我们竟然这两年才知道它是谁。1973年，4位日本年轻小伙子挤在一间工作室，开了一家公司。虽然人单力薄，但他们却立志要……华为WATCHGTCyber可换壳智能潮表正式发布11月2日，华为如期召开了华为PocketS及全场景新品发布会，会上，除了新一代折叠屏手机华为PocketS，还带来了包括华为WATCHGTCyber智能手表在内的多款新品。……重新认识财富与幸福幸福篇第二部分幸福HAPPINESS人生的三大要素是财富、健康和幸福。我们依次追求财富、健康和幸福，但重要性顺序，则是反过来的。第二四章学习幸福幸福是一种技能……陈数的优雅气质太让人羡慕，40打扮高级大方，早秋照着她穿就行很多中年女人感叹，还是年轻的时候好，想怎么穿就怎么穿，在穿衣上一点都不用思前虑后，什么时髦就穿什么！但时尚穿衣，从来不受年龄的限制，年轻时展现时髦与洋气，中年时突出成熟气质，找……

<<<<<<－>>>>>>

中国高等教育学会副会长姜恩来推进高等教育数字化转型2021年红色旅游，以游在行动用这五种方法教育孩子，让孩子自己变得更加优秀 30岁感悟我进步最快的这5年，做对了这几件事认真分析曼联31阿森纳，曼联第一个进球分析买不到布洛芬，也可以找这两味中药退热，不伤脾胃，不伤正气！一个没什么用的dummy网卡撕破脸了！付豪母亲社媒炮轰杜锋，控诉2点耽误付豪致敬一代传奇教练波波维奇男女双全真的重要吗？换块电池近千元？苹果全系电池涨价，网友吐槽库克割韭菜马斯克不买了！440亿美元收购推特协议终止！欧美股市齐涨，大

韩大元：人民当家作主的根本保障我都交代了啊可怕的物理现象，能杀人于无形，三分之二的潜水员因此遭殃手汗多怎么治疗手汗症手术注意事项法律保护的利息范围是什么天际造句用天际造句大全关于昆虫的精彩作文厦门歌词厦门歌全文溥仪去世多年为何还能葬入皇陵星空美甲图片色彩斑斓的银河系美甲德莱塞《美国的悲剧》的主要内容是什么简介燃气空调参数有哪些，燃气空调的优势在哪呢？

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找江西南阳嘉兴昆明铜陵滨州广东西昌常德梅州兰州阳江运城金华广西萍乡大理重庆诸暨泉州安庆南充武汉辽宁