|
|
51CTO旗下网站
|
|
移动端

“一键脱衣”的DeepNude下架后,我在GitHub上找到它涉及的技术

前段时间,一名程序员开发出了一款名为 DeepNude 的应用软件。该APP的使用方法很简单,打开软件→转化→生成照片,从那个网上给出的生成结果来看,效果确实可以以假乱真。

作者:佚名来源:开源最前线|2019-07-10 10:55

【大咖·来了 第7期】10月24日晚8点观看《智能导购对话机器人实践》

开源最前线(ID:OpenSourceTop) 综合整理

综合自:https://github.com/yuanxiaosc/DeepNude-an-Image-to-Image-technology、程序猿等

前段时间,一名程序员开发出了一款名为 DeepNude 的应用软件。

该APP的使用方法很简单,打开软件→转化→生成照片,从那个网上给出的生成结果来看,效果确实可以以假乱真,如下:

目前,这个程序已经被下线,不过,猿妹在Github上找到一个关于DeepNude使用的图像生成和图像修复相关技术项目,该项目由yuanxiaosc创建

这个仓库包含DeepNude的pix2pixHD(由英伟达提出)算法,更重要的是DeepNude背后的通用的Image-to-Image理论与实践研究。

Image-to-Image Demo

这一部分提供一个试玩的 Image-to-Image Demo:黑白简笔画到色彩丰富的猫、鞋、手袋。DeepNude 软件主要使用了Image-to-Image技术,该技术理论上可以把你输入的图片转换成任何你想要的图片。

在左侧框中按照自己想象画一个简笔画的猫,再点击process按钮,就能输出一个模型生成的猫。

体验地址:https://affinelayer.com/pixsrv/

DeepNude的技术堆栈

  • Python + PyQt
  • pytorch
  • 深度计算机视觉

Image-to-Image Theoretical Research

这一部分阐述DeepNude相关的人工智能/深度学习理论(特别是计算机视觉)研究,

1. Pix2Pix

Pix2Pix是伯克利大学研究提出的使用条件对抗网络作为图像到图像转换问题的通用解决方案。(Github地址:https://github.com/phillipi/pix2pix)

2、Pix2PixHD

从语义图上获得高分辨率图片。语义图是一幅彩色图片,图上的不同色块代表不同种类物体,如行人、汽车、交通标志、建筑物等。Pix2PixHD将一张语义图作为输入,并由此生成了一张高分辨率的逼真的图像。之前的技术多数只能生成粗糙的低分辨率的图片,看起来也不真实。而这个研究却生成了2k乘1k分辨率的图像,已经很接近全高清的照片。(Github地址:https://github.com/NVIDIA/pix2pixHD)

3. CycleGAN

CycleGAN使用循环一致性损失函数来实现训练,而无需配对数据。换句话说,它可以从一个域转换到另一个域,而无需在源域和目标域之间进行一对一映射。这开启了执行许多有趣任务的可能性,例如照片增强,图像着色,样式传输等。您只需要源和目标数据集。

使用CycleGAN神经网络模型实现照片风格转换、照片效果增强、照片中风景季节变换、物体转换四大功能。

4. Image Inpainting 图像修复

在演示视频中,只需用工具将图像中不需要的内容简单涂抹掉,哪怕形状很不规则,NVIDIA的模型能够将图像“复原”,用非常逼真的画面填补被涂抹的空白。可谓是一键P图,而且“毫无ps痕迹”。该研究来自Nvidia的Guilin Liu等人的团队,他们发布了一种可以编辑图像或重建已损坏图像的深度学习方法,即使图像穿了个洞或丢失了像素。这是目前2018 state-of-the-art的方法。

事实上,可能不需要Image-to-Image。我们可以使用GAN直接从随机值生成图像或从文本生成图像:

1.Obj-GAN

微软人工智能研究院(Microsoft Research AI)开发的新AI技术Obj-GAN可以理解自然语言描述、绘制草图、合成图像,然后根据草图框架和文字提供的个别单词细化细节。换句话说,这个网络可以根据描述日常场景的文字描述生成同样场景的图像。

效果

模型

2.StoryGAN

微软新研究提出新型GAN——ObjGAN,可根据文字描述生成复杂场景。他们还提出另一个可以画故事的GAN——StoryGAN,输入一个故事的文本,即可输出连环画。

当前最优的文本到图像生成模型可以基于单句描述生成逼真的鸟类图像。然而,文本到图像生成器远远不止仅对一个句子生成单个图像。给定一个多句段落,生成一系列图像,每个图像对应一个句子,完整地可视化整个故事。

效果

现在用得多的Image-to-Image技术应该就是美颜APP了,所以我们为什么不开发一个更加智能的美颜相机呢

技术无罪,但也别娱乐至死,什么能做什么不能做要领的清,希望以上这些技术,大家都能把它们用到正道上。

【编辑推荐】

  1. Linus Torvalds 谈软件开发面临的硬件问题
  2. 印度第一颗CPU横空出世:软件开发已开动
  3. 开发者提高软件质量的六个步骤
  4. GitHub热榜第一,标星近万:这个用Python做交互式图形的项目火了
  5. 6月份Github上热门的Python开源项目
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

16招轻松掌握PPT技巧

16招轻松掌握PPT技巧

GET职场加薪技能
共16章 | 晒书包

347人订阅学习

20个局域网建设改造案例

20个局域网建设改造案例

网络搭建技巧
共20章 | 捷哥CCIE

704人订阅学习

WOT2019全球人工智能技术峰会

WOT2019全球人工智能技术峰会

通用技术、应用领域、企业赋能三大章节,13大技术专场,60+国内外一线人工智能精英大咖站台,分享人工智能的平台工具、算法模型、语音视觉等技术主题,助力人工智能落地。
共50章 | WOT峰会

0人订阅学习

读 书 +更多

精通SOA:基于服务总线的Struts+EJB+Web Service

Java的出现,实现了跨操作系统平台的程序开发,以Java为基础的J2EE技术已经成为因特网服务技术的主流。然而,以J2EE为基础的SOA架构技术必...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO播客