2022年 11月 9日

Python opencv之实现简单的图像处理

大家好,本文将会进行简单地介绍如何用开源且强大的第三方opencv库来实现对图片进行分割处理。

所需要安装的库有:

pip install opencv-python

pip install matplotlib

Python接口帮助文档网址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html


目录

图片分割处理篇

1.加载图片

2.对图片做灰度处理

3.对图片做二值化处理

3.1.自定义阈值

4.提取轮廓

5.对轮廓画矩形框

6.分割图片并保存

7.查看分割图片

8.完整代码


图片分割处理篇

本文所用到的图片素材:

首先,导入所用到的库:

  1. import cv2
  2. import os,shutil
  3. from matplotlib import pyplot as plt


1.加载图片

注意:这里在传入图像路径时,路径中不能包含有中文名,否则会报错!!!

  1. ###1,加载图片
  2. filepath = './testImage.png' ###图像路径,注意:这里的路径不能包含有中文名
  3. img = cv2.imread(filepath)
  4. cv2.imshow('Orignal img', img) ###显示图片
  5. cv2.waitKey(0) ###防止一闪而过,是一个键盘绑定函数(0表示按下任意键终止)


2.对图片做灰度处理

  1. ###2,将彩色图片变为灰色(进行灰度处理)
  2. img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
  3. cv2.imshow('img_gray', img_gray)
  4. cv2.waitKey(0)


3.对图片做二值化处理

thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255。

maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。

type:参数类型阈值类型( cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值) cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑) 等其它的类型…… )

  1. ###3,将图片做二值化处理
  2. '''
  3. thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255
  4. maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。
  5. type:参数类型阈值类型(
  6. cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值)
  7. cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑)
  8. 等其它的类型......
  9. '''
  10. ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
  11. cv2.imshow('img_inv', img_inv)
  12. cv2.waitKey(0)

3.1.自定义阈值

  1. ###阈值对比(全局阈值(v = 127),自适应平均阈值,自适应高斯阈值)
  2. def threshContrast():
  3. filepath = './testImage.png'
  4. img = cv2.imread(filepath)
  5. img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
  6. img_gray = cv2.medianBlur(img_gray, 5)
  7. ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
  8. th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
  9. th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
  10. title = ['原始图像(灰度)','全局阈值(v = 127)','自适应平均阈值','自适应高斯阈值']
  11. images = [img_gray, th1, th2, th3]
  12. for i in range(4):
  13. plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
  14. # plt.title(title[i]) ###plt绘图时不能使用中文
  15. plt.xticks([]), plt.yticks([])
  16. plt.show()

4.提取轮廓

img_inv是寻找轮廓的图像;

cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;

cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。

  1. ###4,提取轮廓
  2. '''
  3. https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
  4. img_inv是寻找轮廓的图像;
  5. cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;
  6. cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。
  7. '''
  8. contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
  9. print(f'检测出轮廓数量有:{len(contours)}个')
  10. print('返回值为各层轮廓的索引:\n', hierarchy)


5.对轮廓画矩形框

  1. ###5,找出每一个轮廓绘画出的矩形位置
  2. br = []
  3. cntid = 0
  4. for cnt in contours:
  5. '''cnt表示输入的轮廓值,x,y, w, h 分别表示外接矩形的x轴和y轴的坐标,以及矩形的w宽和h高,'''
  6. x, y, w, h = cv2.boundingRect(cnt)
  7. cntid += 1
  8. print(f'检测出第{cntid}个轮廓画出的矩形位置为:x={x},y={y},w={w},h={h}')
  9. br.append(cv2.boundingRect(cnt))
  10. '''img表示输入的需要画的图片(这里就是在原图上绘制轮廓),cnt表示输入的轮廓值,-1表示contours中轮廓的索引(这里绘制所有的轮廓),(0, 0, 255)表示rgb颜色——红色,2表示线条粗细'''
  11. cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
  12. cv2.imshow('cnt', img)
  13. cv2.waitKey(0)
  14. br.sort() ###将列表中的每一个元组里面的进行升序排序(这里其实想的是按照对应的x轴坐标进行升序)

对每个字符画轮廓的过程(顺序从右到左画,期间也有可能断续,如下图)。


6.分割图片并保存

  1. ​​###6,分割图片并保存(这里对前面处理过的二值化图片数据(img_inv)进行分割)
  2. if not os.path.exists('./imageSplit'):
  3. os.mkdir('./imageSplit')
  4. else:
  5. shutil.rmtree('./imageSplit')
  6. os.mkdir('./imageSplit')
  7. for x,y,w,h in br:
  8. # print(x,y,w,h)
  9. # split_image = img_inv[y:y + h, x:x + w]
  10. split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###这样分割感觉好看些
  11. cv2.imshow('split_image', split_image)
  12. cv2.waitKey(0)
  13. save_filepath = './imageSplit/'
  14. filename = f'{x}.jpg' ###这里由每张图片对应的x轴坐标命名
  15. cv2.imwrite(save_filepath + filename, split_image)
  16. print(f'\033[31m{filename}图片分割完毕!\033[0m')

这里是对前面处理过的二值化图片数据(img_inv)进行一个一个字符分割展示的过程。

这里是这行代码的意思,下面的图是手动绘制的,太丑了,哈哈哈!!!

# split_image = img_inv[y:y + h, x:x + w]


7.查看分割图片

最后,我们在pyplot上来查看我们分割图片后的效果,也就终于完成了。

  1. ###7,用pyplot来查看我们分割完成后的图片
  2. imagefile_list = os.listdir('./imageSplit')
  3. imagefile_list.sort(key=lambda x: int(x[:-4]))
  4. for i in range(len(imagefile_list)):
  5. img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
  6. plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
  7. plt.title(imagefile_list[i])
  8. plt.xticks([]), plt.yticks([])
  9. plt.show()


8.完整代码

  1. import cv2
  2. import os,shutil
  3. from matplotlib import pyplot as plt
  4. '''
  5. 这是使用文档网址:https://docs.opencv.org/4.5.2/index.html
  6. 这是提供的Python接口教程网址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
  7. '''
  8. def imageSplit():
  9. ###1,加载图片
  10. filepath = './testImage.png' ###图像路径,注意:这里的路径不能包含有中文名
  11. img = cv2.imread(filepath)
  12. cv2.imshow('Orignal img', img) ###显示图片
  13. cv2.waitKey(0) ###防止一闪而过,是一个键盘绑定函数(0表示按下任意键终止)
  14. ###2,将彩色图片变为灰色(进行灰度处理)
  15. img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
  16. cv2.imshow('img_gray', img_gray)
  17. cv2.waitKey(0)
  18. ###3,将图片做二值化处理
  19. '''
  20. thresh=220是自定义设定的阈值(通过分析print(img_gray)的图像数据大概得到的),像素值大于220被置成了0,小于220的被置成了255
  21. maxval=与 THRESH_BINARY 和 THRESH_BINARY_INV 阈值一起使用的最大值,可理解是填充色,范围为(0~255)。
  22. type:参数类型阈值类型(
  23. cv2.THRESH_BINARY 大于阈值的部分被置为255,小于部分被置为0(黑白二值)
  24. cv2.THRESH_BINARY_INV 大于阈值部分被置为0,小于部分被置为255(黑白二值反转——白黑)
  25. 等其它的类型......
  26. '''
  27. ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
  28. cv2.imshow('img_inv', img_inv)
  29. cv2.waitKey(0)
  30. ###4,提取轮廓
  31. '''
  32. https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
  33. img_inv是寻找轮廓的图像;
  34. cv2.RETR_EXTERNAL:表示只检索极端外部轮廓;
  35. cv2.CHAIN_APPROX_SIMPLE:压缩水平, 垂直和对角线方向的元素,只保留它们的端点坐标,例如,一个直立的矩形轮廓用 4 个点进行编码。
  36. '''
  37. contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
  38. print(f'检测出轮廓数量有:{len(contours)}个')
  39. print('返回值为各层轮廓的索引:\n', hierarchy)
  40. ###5,找出每一个轮廓绘画出的矩形位置
  41. br = []
  42. cntid = 0
  43. for cnt in contours:
  44. '''cnt表示输入的轮廓值,x,y, w, h 分别表示外接矩形的x轴和y轴的坐标,以及矩形的w宽和h高,'''
  45. x, y, w, h = cv2.boundingRect(cnt)
  46. cntid += 1
  47. print(f'检测出第{cntid}个轮廓画出的矩形位置为:x={x},y={y},w={w},h={h}')
  48. br.append(cv2.boundingRect(cnt))
  49. '''img表示输入的需要画的图片(这里就是在原图上绘制轮廓),cnt表示输入的轮廓值,-1表示contours中轮廓的索引(这里绘制所有的轮廓),(0, 0, 255)表示rgb颜色——红色,2表示线条粗细'''
  50. cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
  51. cv2.imshow('cnt', img)
  52. cv2.waitKey(0)
  53. br.sort() ###将列表中的每一个元组里面的进行升序排序(这里其实想的是按照对应的x轴坐标进行升序)
  54. ###6,分割图片并保存(这里对前面处理过的二值化图片数据(img_inv)进行分割)
  55. if not os.path.exists('./imageSplit'):
  56. os.mkdir('./imageSplit')
  57. else:
  58. shutil.rmtree('./imageSplit')
  59. os.mkdir('./imageSplit')
  60. for x,y,w,h in br:
  61. # print(x,y,w,h)
  62. # split_image = img_inv[y:y + h, x:x + w]
  63. split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###这样分割感觉好看些
  64. cv2.imshow('split_image', split_image)
  65. cv2.waitKey(0)
  66. save_filepath = './imageSplit/'
  67. filename = f'{x}.jpg' ###这里由每张图片对应的x轴坐标命名
  68. cv2.imwrite(save_filepath + filename, split_image)
  69. print(f'\033[31m{filename}图片分割完毕!\033[0m')
  70. cv2.destroyAllWindows() ###删除所有窗口
  71. ###7,用pyplot来查看我们分割完成后的图片
  72. imagefile_list = os.listdir('./imageSplit')
  73. imagefile_list.sort(key=lambda x: int(x[:-4]))
  74. for i in range(len(imagefile_list)):
  75. img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
  76. plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
  77. plt.title(imagefile_list[i])
  78. plt.xticks([]), plt.yticks([])
  79. plt.show()
  80. print('\nperfect!!!')
  81. ###阈值对比(全局阈值(v = 127),自适应平均阈值,自适应高斯阈值)
  82. def threshContrast():
  83. filepath = './testImage.png'
  84. img = cv2.imread(filepath)
  85. img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
  86. img_gray = cv2.medianBlur(img_gray, 5)
  87. ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
  88. th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
  89. th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
  90. title = ['原始图像(灰度)','全局阈值(v = 127)','自适应平均阈值','自适应高斯阈值']
  91. images = [img_gray, th1, th2, th3]
  92. for i in range(4):
  93. plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
  94. # plt.title(title[i]) ###plt绘图时不能使用中文
  95. plt.xticks([]), plt.yticks([])
  96. plt.show()
  97. if __name__ == '__main__':
  98. imageSplit()
  99. ###阈值对比
  100. # threshContrast()