网站首页 > 技术文章 正文
哈喽,我是猫妹,咱们今天来看看Python图片风格迁移。
啥是风格迁移呢?
简单来说,图片风格迁移,就是指利用程序算法学习著名画作的风格,然后再把这种风格应用到另外一张图片上的技术。
举个例子,把猫妹在苏州古镇的一座小桥上拍下的一张照片,与爱德华蒙克的《呐喊》相融合,效果就像爱德华蒙克在我们的景色中运用了他高超的绘画技巧一样!
看了这个例子,你是不是有些心动了呢?
那就跟着猫妹一起来学一学吧!
基本原理
基本原理是这样的:
我们知道,卷积神经网络(CNN)具有很强的图像特征(feature/representation)提取能力,如上图所示。
对于内容图片,深层网络(d和e)提取的是高维特征,同时也丢弃了细节信息;浅层网络(a, b和c)提取的是低维特征,图片的细节大多都保留下来了。
对于风格图片,通过包含多层的特征相关性(Gram矩阵),可获得多尺度图像风格的重构,捕获其纹理信息。这样构建的网络可以忽略图像的具体细节,保留风格。
为了将内容图片和风格图片融合在一起(见下图),我们应该使风格化结果图(初始为一张白噪声图片)的特征同时与内容图片和风格图片的特征之间的距离最小化,最终获取我们所需的风格化结果图。
因此生成目标图片的损失函数可定义为:
其中α和β分别是内容图片和风格图片的特征所占的权重,通过最小化这个损失函数就可以获得我们想要的结果。
来看个动态示意图:
虽然上述方法可产生非常漂亮的风格迁移效果,但是速度很慢。
牛刀小试
猫妹下载了模型数据,参考了一些大牛的代码。
做了一些图片,一起欣赏下吧!
这是原图:
candy.t7风格迁移效果:
la_muse.t7风格迁移效果:
mosaic.t7风格迁移效果:
starry_night.t7 风格迁移效果:
the_scream.t7风格迁移效果:
udnie.t7风格迁移效果:
猫妹的测试代码如下:
import os
import sys
import cv2
abs_path=os.path.abspath('./')
styles_path=abs_path+'\styles'
input_path=abs_path+r'\input\1.png'
output_path=abs_path+r'\output\9.png'
#print(styles_path)
#print(input_path)
#print(output_path)
type_list = ['candy.t7',
'composition_vii.t7',
'feathers.t7',
'la_muse (1).t7',
'la_muse.t7',
'mosaic.t7',
'starry_night.t7',
'the_scream.t7',
'the_wave.t7',
'udnie.t7']
#读取模型
net = cv2.dnn.readNetFromTorch(styles_path+'\\'+type_list[9])
net.setPreferableBackend(cv2.dnn.DNN_BACKEND_OPENCV);#设置后端
# 读取图片
img = cv2.imread(input_path)
row,colum, _= img.shape
blob = cv2.dnn.blobFromImage(img, 1.0, (colum, row), (103.939, 116.779, 123.680), swapRB=False, crop=False)
# 进行计算
net.setInput(blob)
out = net.forward()
out = out.reshape(3, out.shape[2], out.shape[3])
out[0] += 103.939
out[1] += 116.779
out[2] += 123.68
out /= 255
out = out.transpose(1, 2, 0)
cv2.imwrite(output_path,out*255)
print('complete finish')
这个程序需要安装cv2库,需要用pip安装。
另外这里的模型文件(*.t7)也需要事先下载并保存起来,模型数据比较大,猫妹把它们整理好放到了学习群中了。
当然,还有很多种Python风格迁移,如素描、漫画、动漫、黑白画等,下次,猫妹就和大家一起学习吧!
人生苦短,我用Python!
咱们下次见!
对了,我是猫妹,欢迎评论哦!
猜你喜欢
- 2024-09-11 给3D Slicer添加Python第三方插件库
- 2024-09-11 使用Python创建自己的Instagram滤镜
- 2024-09-11 薅羊毛我愿称Python为最强,Python 自动化带你轻松赚钱
- 2024-09-11 史上最全的OpenCV入门教程!这篇够你学习半个月了!万字长文入门
- 2024-09-11 使用python实现简易的人脸检测(python人脸检测106关键点)
- 2024-09-11 机器视觉技术(一)边缘提取(机器视觉边缘检测)
- 2024-09-11 Python-OpenCV 16. 图像特征检测与描述算法
- 2024-09-11 Flask—远程查看行空板USB摄像头视频
- 2024-09-11 OpenCV+Python识别车牌和字符分割的实现
- 2024-09-11 在Fedora中安装OpenCV-Python | 二
- 08-03MySQL数据库的预处理详解
- 08-03《阿常·MySQL 70讲》全套教学视频
- 08-03隐式等待、显示等待和强制等待
- 08-03零基础C#上位机框架项目实例(完结篇)
- 08-03一文搞懂构建Web内容的技术
- 08-03西门子WINCC中的VBScript(VBS)常用于自动化脚本开发
- 08-03力控和sql2000之间的数据转储
- 08-03组态王|通过日历控件选择时间段查询历史报警
- 1521℃桌面软件开发新体验!用 Blazor Hybrid 打造简洁高效的视频处理工具
- 639℃Dify工具使用全场景:dify-sandbox沙盒的原理(源码篇·第2期)
- 527℃MySQL service启动脚本浅析(r12笔记第59天)
- 492℃服务器异常重启,导致mysql启动失败,问题解决过程记录
- 492℃启用MySQL查询缓存(mysql8.0查询缓存)
- 479℃「赵强老师」MySQL的闪回(赵强iso是哪个大学毕业的)
- 461℃mysql服务怎么启动和关闭?(mysql服务怎么启动和关闭)
- 459℃MySQL server PID file could not be found!失败
- 最近发表
- 标签列表
-
- cmd/c (90)
- c++中::是什么意思 (84)
- 标签用于 (71)
- 主键只能有一个吗 (77)
- c#console.writeline不显示 (95)
- pythoncase语句 (88)
- es6includes (74)
- sqlset (76)
- windowsscripthost (69)
- apt-getinstall-y (100)
- node_modules怎么生成 (87)
- chromepost (71)
- flexdirection (73)
- c++int转char (80)
- htmlbackground-image (68)
- static函数和普通函数 (76)
- el-date-picker开始日期早于结束日期 (70)
- asynccallback (71)
- localstorage.removeitem (74)
- vector线程安全吗 (70)
- java (73)
- js数组插入 (83)
- mac安装java (72)
- 查看mysql是否启动 (70)
- 无效的列索引 (74)