python随机数据增强_Python - 语义分割数据增强实现-程序员宅基地

技术标签: python随机数据增强  

from __future__ import print_function

import cv2

import numpy as np

def resize(img, grt=None, mode=ModelPhase.TRAIN):

"""

改变图像及标签图像尺寸

AUG.AUG_METHOD为unpadding,所有模式均直接resize到AUG.FIX_RESIZE_SIZE的尺寸

AUG.AUG_METHOD为stepscaling, 按比例resize,训练时比例范围AUG.MIN_SCALE_FACTOR到AUG.MAX_SCALE_FACTOR,间隔为AUG.SCALE_STEP_SIZE,其他模式返回原图

AUG.AUG_METHOD为rangescaling,长边对齐,短边按比例变化,训练时长边对齐范围AUG.MIN_RESIZE_VALUE到AUG.MAX_RESIZE_VALUE,其他模式长边对齐AUG.INF_RESIZE_VALUE

Args:

img(numpy.ndarray): 输入图像

grt(numpy.ndarray): 标签图像,默认为None

mode(string): 模式, 默认训练模式,即ModelPhase.TRAIN

Returns:

resize后的图像和标签图

"""

if cfg.AUG.AUG_METHOD == 'unpadding':

target_size = cfg.AUG.FIX_RESIZE_SIZE

img = cv2.resize(img, target_size, interpolation=cv2.INTER_LINEAR)

if grt is not None:

grt = cv2.resize(grt, target_size, interpolation=cv2.INTER_NEAREST)

elif cfg.AUG.AUG_METHOD == 'stepscaling':

if mode == ModelPhase.TRAIN:

min_scale_factor = cfg.AUG.MIN_SCALE_FACTOR

max_scale_factor = cfg.AUG.MAX_SCALE_FACTOR

step_size = cfg.AUG.SCALE_STEP_SIZE

scale_factor = get_random_scale(min_scale_factor,

max_scale_factor,

step_size)

img, grt = randomly_scale_image_and_label(

img, grt, scale=scale_factor)

elif cfg.AUG.AUG_METHOD == 'rangescaling':

min_resize_value = cfg.AUG.MIN_RESIZE_VALUE

max_resize_value = cfg.AUG.MAX_RESIZE_VALUE

if mode == ModelPhase.TRAIN:

if min_resize_value == max_resize_value:

random_size = min_resize_value

else:

random_size = int(np.random.uniform(min_resize_value, max_resize_value) + 0.5)

else:

random_size = cfg.AUG.INF_RESIZE_VALUE

value = max(img.shape[0], img.shape[1])

scale = float(random_size) / float(value)

img = cv2.resize(img, (0, 0), fx=scale, fy=scale,

interpolation=cv2.INTER_LINEAR)

if grt is not None:

grt = cv2.resize(grt, (0, 0), fx=scale, fy=scale,

interpolation=cv2.INTER_NEAREST)

else:

raise Exception("Unexpect data augmention method: {}".format(

cfg.AUG.AUG_METHOD))

return img, grt

def get_random_scale(min_scale_factor, max_scale_factor, step_size):

"""

在一定范围内得到随机值,范围为min_scale_factor到max_scale_factor,间隔为step_size

Args:

min_scale_factor(float): 随机尺度下限,大于0

max_scale_factor(float): 随机尺度上限,不小于下限值

step_size(float): 尺度间隔,非负, 等于为0时直接返回min_scale_factor到max_scale_factor范围内任一值

Returns:

随机尺度值

"""

if min_scale_factor < 0 or min_scale_factor > max_scale_factor:

raise ValueError('Unexpected value of min_scale_factor.')

if min_scale_factor == max_scale_factor:

return min_scale_factor

if step_size == 0:

return np.random.uniform(min_scale_factor, max_scale_factor)

num_steps = int((max_scale_factor - min_scale_factor) / step_size + 1)

scale_factors = np.linspace(min_scale_factor, max_scale_factor, num_steps).tolist()

np.random.shuffle(scale_factors)

return scale_factors[0]

def randomly_scale_image_and_label(image, label=None, scale=1.0):

"""

按比例resize图像和标签图, 如果scale为1,返回原图

Args:

image(numpy.ndarray): 输入图像

label(numpy.ndarray): 标签图,默认None

sclae(float): 图片resize的比例,非负,默认1.0

Returns:

resize后的图像和标签图

"""

if scale == 1.0:

return image, label

height = image.shape[0]

width = image.shape[1]

new_height = int(height * scale + 0.5)

new_width = int(width * scale + 0.5)

new_image = cv2.resize(image, (new_width, new_height),

interpolation=cv2.INTER_LINEAR)

if label is not None:

height = label.shape[0]

width = label.shape[1]

new_height = int(height * scale + 0.5)

new_width = int(width * scale + 0.5)

new_label = cv2.resize(label, (new_width, new_height),

interpolation=cv2.INTER_NEAREST)

return new_image, new_label

def random_rotation(crop_img, crop_seg, rich_crop_max_rotation, mean_value):

"""

随机旋转图像和标签图

Args:

crop_img(numpy.ndarray): 输入图像

crop_seg(numpy.ndarray): 标签图

rich_crop_max_rotation(int):旋转最大角度,0-90

mean_value(list):均值, 对图片旋转产生的多余区域使用均值填充

Returns:

旋转后的图像和标签图

"""

ignore_index = cfg.DATASET.IGNORE_INDEX

if rich_crop_max_rotation > 0:

(h, w) = crop_img.shape[:2]

do_rotation = np.random.uniform(-rich_crop_max_rotation,

rich_crop_max_rotation)

pc = (w // 2, h // 2)

r = cv2.getRotationMatrix2D(pc, do_rotation, 1.0)

cos = np.abs(r[0, 0])

sin = np.abs(r[0, 1])

nw = int((h * sin) + (w * cos))

nh = int((h * cos) + (w * sin))

(cx, cy) = pc

r[0, 2] += (nw / 2) - cx

r[1, 2] += (nh / 2) - cy

dsize = (nw, nh)

crop_img = cv2.warpAffine(

crop_img,

r,

dsize=dsize,

flags=cv2.INTER_LINEAR,

borderMode=cv2.BORDER_CONSTANT,

borderValue=mean_value)

crop_seg = cv2.warpAffine(

crop_seg,

r,

dsize=dsize,

flags=cv2.INTER_NEAREST,

borderMode=cv2.BORDER_CONSTANT,

borderValue=(ignore_index, ignore_index, ignore_index))

return crop_img, crop_seg

def rand_scale_aspect(crop_img,

crop_seg,

rich_crop_min_scale=0,

rich_crop_aspect_ratio=0):

"""

从输入图像和标签图像中裁取随机宽高比的图像,并reszie回原始尺寸

Args:

crop_img(numpy.ndarray): 输入图像

crop_seg(numpy.ndarray): 标签图像

rich_crop_min_scale(float):裁取图像占原始图像的面积比,0-1,默认0返回原图

rich_crop_aspect_ratio(float): 裁取图像的宽高比范围,非负,默认0返回原图

Returns:

裁剪并resize回原始尺寸的图像和标签图像

"""

if rich_crop_min_scale == 0 or rich_crop_aspect_ratio == 0:

return crop_img, crop_seg

else:

img_height = crop_img.shape[0]

img_width = crop_img.shape[1]

for i in range(0, 10):

area = img_height * img_width

target_area = area * np.random.uniform(rich_crop_min_scale, 1.0)

aspectRatio = np.random.uniform(rich_crop_aspect_ratio,

1.0 / rich_crop_aspect_ratio)

dw = int(np.sqrt(target_area * 1.0 * aspectRatio))

dh = int(np.sqrt(target_area * 1.0 / aspectRatio))

if (np.random.randint(10) < 5):

tmp = dw

dw = dh

dh = tmp

if (dh < img_height and dw < img_width):

h1 = np.random.randint(0, img_height - dh)

w1 = np.random.randint(0, img_width - dw)

crop_img = crop_img[h1:(h1 + dh), w1:(w1 + dw), :]

crop_seg = crop_seg[h1:(h1 + dh), w1:(w1 + dw)]

crop_img = cv2.resize(

crop_img, (img_width, img_height),

interpolation=cv2.INTER_LINEAR)

crop_seg = cv2.resize(

crop_seg, (img_width, img_height),

interpolation=cv2.INTER_NEAREST)

break

return crop_img, crop_seg

def saturation_jitter(cv_img, jitter_range):

"""

调节图像饱和度

Args:

cv_img(numpy.ndarray): 输入图像

jitter_range(float): 调节程度,0-1

Returns:

饱和度调整后的图像

"""

greyMat = cv2.cvtColor(cv_img, cv2.COLOR_BGR2GRAY)

greyMat = greyMat[:, :, None] * np.ones(3, dtype=int)[None, None, :]

cv_img = cv_img.astype(np.float32)

cv_img = cv_img * (1 - jitter_range) + jitter_range * greyMat

cv_img = np.where(cv_img > 255, 255, cv_img)

cv_img = cv_img.astype(np.uint8)

return cv_img

def brightness_jitter(cv_img, jitter_range):

"""

调节图像亮度

Args:

cv_img(numpy.ndarray): 输入图像

jitter_range(float): 调节程度,0-1

Returns:

亮度调整后的图像

"""

cv_img = cv_img.astype(np.float32)

cv_img = cv_img * (1.0 - jitter_range)

cv_img = np.where(cv_img > 255, 255, cv_img)

cv_img = cv_img.astype(np.uint8)

return cv_img

def contrast_jitter(cv_img, jitter_range):

"""

调节图像对比度

Args:

cv_img(numpy.ndarray): 输入图像

jitter_range(float): 调节程度,0-1

Returns:

对比度调整后的图像

"""

greyMat = cv2.cvtColor(cv_img, cv2.COLOR_BGR2GRAY)

mean = np.mean(greyMat)

cv_img = cv_img.astype(np.float32)

cv_img = cv_img * (1 - jitter_range) + jitter_range * mean

cv_img = np.where(cv_img > 255, 255, cv_img)

cv_img = cv_img.astype(np.uint8)

return cv_img

def random_jitter(cv_img, saturation_range, brightness_range, contrast_range):

"""

图像亮度、饱和度、对比度调节,在调整范围内随机获得调节比例,并随机顺序叠加三种效果

Args:

cv_img(numpy.ndarray): 输入图像

saturation_range(float): 饱和对调节范围,0-1

brightness_range(float): 亮度调节范围,0-1

contrast_range(float): 对比度调节范围,0-1

Returns:

亮度、饱和度、对比度调整后图像

"""

saturation_ratio = np.random.uniform(-saturation_range, saturation_range)

brightness_ratio = np.random.uniform(-brightness_range, brightness_range)

contrast_ratio = np.random.uniform(-contrast_range, contrast_range)

order = [0, 1, 2]

np.random.shuffle(order)

for i in range(3):

if order[i] == 0:

cv_img = saturation_jitter(cv_img, saturation_ratio)

if order[i] == 1:

cv_img = brightness_jitter(cv_img, brightness_ratio)

if order[i] == 2:

cv_img = contrast_jitter(cv_img, contrast_ratio)

return cv_img

def hsv_color_jitter(crop_img,

brightness_jitter_ratio=0,

saturation_jitter_ratio=0,

contrast_jitter_ratio=0):

"""

图像亮度、饱和度、对比度调节

Args:

crop_img(numpy.ndarray): 输入图像

brightness_jitter_ratio(float): 亮度调节度最大值,1-0,默认0

saturation_jitter_ratio(float): 饱和度调节度最大值,1-0,默认0

contrast_jitter_ratio(float): 对比度调节度最大值,1-0,默认0

Returns:

亮度、饱和度、对比度调节后图像

"""

if brightness_jitter_ratio > 0 or \

saturation_jitter_ratio > 0 or \

contrast_jitter_ratio > 0:

crop_img = random_jitter(crop_img, saturation_jitter_ratio,

brightness_jitter_ratio, contrast_jitter_ratio)

return crop_img

def rand_crop(crop_img, crop_seg, mode=ModelPhase.TRAIN):

"""

随机裁剪图片和标签图, 若crop尺寸大于原始尺寸,分别使用DATASET.PADDING_VALUE值和DATASET.IGNORE_INDEX值填充再进行crop,

crop尺寸与原始尺寸一致,返回原图,crop尺寸小于原始尺寸直接crop

Args:

crop_img(numpy.ndarray): 输入图像

crop_seg(numpy.ndarray): 标签图

mode(string): 模式, 默认训练模式,验证或预测、可视化模式时crop尺寸需大于原始图片尺寸

Returns:

裁剪后的图片和标签图

"""

img_height = crop_img.shape[0]

img_width = crop_img.shape[1]

if ModelPhase.is_train(mode):

crop_width = cfg.TRAIN_CROP_SIZE[0]

crop_height = cfg.TRAIN_CROP_SIZE[1]

else:

crop_width = cfg.EVAL_CROP_SIZE[0]

crop_height = cfg.EVAL_CROP_SIZE[1]

if not ModelPhase.is_train(mode):

if (crop_height < img_height or crop_width < img_width):

raise Exception(

"Crop size({},{}) must large than img size({},{}) when in EvalPhase."

.format(crop_width, crop_height, img_width, img_height))

if img_height == crop_height and img_width == crop_width:

return crop_img, crop_seg

else:

pad_height = max(crop_height - img_height, 0)

pad_width = max(crop_width - img_width, 0)

if (pad_height > 0 or pad_width > 0):

crop_img = cv2.copyMakeBorder(

crop_img,

0,

pad_height,

0,

pad_width,

cv2.BORDER_CONSTANT,

value=cfg.DATASET.PADDING_VALUE)

if crop_seg is not None:

crop_seg = cv2.copyMakeBorder(

crop_seg,

0,

pad_height,

0,

pad_width,

cv2.BORDER_CONSTANT,

value=cfg.DATASET.IGNORE_INDEX)

img_height = crop_img.shape[0]

img_width = crop_img.shape[1]

if crop_height > 0 and crop_width > 0:

h_off = np.random.randint(img_height - crop_height + 1)

w_off = np.random.randint(img_width - crop_width + 1)

crop_img = crop_img[h_off:(crop_height + h_off), w_off:(

w_off + crop_width), :]

if crop_seg is not None:

crop_seg = crop_seg[h_off:(crop_height + h_off), w_off:(

w_off + crop_width)]

return crop_img, crop_seg

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_39682673/article/details/110906043

智能推荐

人脸识别(Face Recognition)入门_dlib.load_rgb_image(image_path) 路径-程序员宅基地

文章浏览阅读113次。人脸识别是一项重要的计算机视觉技术,它在各种应用场景中得到了广泛应用。本文介绍了人脸识别的入门知识和常用实现方法。通过人脸检测、人脸特征提取和人脸识别三个步骤,我们可以实现一个简单的人脸识别系统。这只是人脸识别领域的冰山一角,希望本文能够帮助读者入门人脸识别领域,并激发更多的兴趣与思考。示例代码:机票查询系统# 创建机票查询系统对象# 添加几条航班信息# 查询从北京到广州的航班# 打印查询结果这个示例代码展示了一个简单的机票查询系统。首先创建一个​​类作为机票查询系统的主要功能。它有一个​。_dlib.load_rgb_image(image_path) 路径

django启动服务器报错 ModuleNotFoundError: No module named 'django'-程序员宅基地

文章浏览阅读9.8k次,点赞2次,收藏18次。环境:python3.6+django2.2.1运行python manage.py runserver报错如下Traceback (most recent call last): File "manage.py", line 10, in main from django.core.management import execute_from_command_li..._modulenotfounderror: no module named 'django

黑马程序员Android 百分比布局库(percent-support-lib) 解析与扩展_黑马教育百分比布局素材包-程序员宅基地

文章浏览阅读415次。一、概述周末游戏打得过猛,于是周天熬夜码代码,周一早上浑浑噩噩的发现android-percent-support-lib-sample这个项目,Google终于开始支持百分比的方式布局了,瞬间脉动回来,啊咧咧。对于这种历史性的时刻,不出篇博客难以表达我内心的激动。还记得不久前,发了篇博客:Android 屏幕适配方案,这篇博客以Web页面设计引出一种适配方案,最终的目的就是可以通_黑马教育百分比布局素材包

LuatOS-SOC接口文档(air780E)-- ftp - ftp 客户端_luasocket ftp-程序员宅基地

文章浏览阅读604次。适配器序号, 只能是socket.ETH0, socket.STA, socket.AP,如果不填,会选择平台自带的方式,然后是最后一个注册的适配器。是否为ssl加密连接,默认不加密,true为无证书最简单的加密,table为有证书的加密。client_password 客户端私钥口令数据。client_cert 客户端ca证书数据。remote_name 服务器文件。remote_name 服务器文件。local_name 本地文件。local_name 本地文件。ip_addr 地址。_luasocket ftp

python自动化爬取淘宝商品数据导入execl表格_python爬淘宝数据表格-程序员宅基地

文章浏览阅读1.2k次,点赞3次,收藏7次。电商时代,淘宝、京东、天猫商品数据对店铺运营有极大的帮助,因此获取相应店铺商品的数据能够带来极大的价值,那么我们如何获取到相应的数据呢?_python爬淘宝数据表格

lamp环境搭建与phpwind,wordprss实现-程序员宅基地

文章浏览阅读80次。简单搭建LAMP(LinuxApacheMysqlPhp)1.安装httpd,yuminstallhttpd-y;2.安装mysql相关软件包;3.安装php相关软件包4.启动mysql,并为其设置管理密码5.编辑测试首页;6.测试结果如下:7.apache和php正常关联,不知能否正常连接数据..._lamp搭建wrod

随便推点

yolov8-pose,labelme关键点标注及格式转换_yolov8关键点标注-程序员宅基地

文章浏览阅读1.9k次,点赞14次,收藏21次。yolov8-pose,labelme关键点标注及格式转换。标签组成:类型,1个数据;目标框坐标,4个数据;关键点,n*3个数据(n为关键点个数,'3'为坐标及是否可见,点标签:0代表此点不在图像上,点标签:1 代表此点在图像上且在未遮挡处,点标签:2 代表此点在图像上但在遮挡处)_yolov8关键点标注

第十三课进阶面向对象(上)---狄泰学院-程序员宅基地

文章浏览阅读63次。第十三课 进阶面向对象(上)你考虑过吗?日常生活中,我们都习惯于对事物进行分类。那么,这种分类的思想是够可以引入程序设计中呢?是的1.面向对象基本概念面向对象的意义在于将日常生活中习惯的思维方式引入程序设计中将需求中的概念直观的映射到解决方案中以模块为中心构建可复用的软件系统提高软件产品的可维护性和可扩展性类和对象是面向对象中的两个基本概念类:指的是一类事物,是一个抽象的概念对象:指的是属于某个类的具体实体类是一种模型,这种模型可以创建出不同的对象实体对象实体是类模型的一个

编程语言排行榜-程序员宅基地

文章浏览阅读4.6k次,点赞3次,收藏24次。需要注意的是,编程语言的受欢迎程度是不断变化的,未来可能会有新的语言涌现并改变排行榜的格局。TypeScript:TypeScript是JavaScript的超集,添加了静态类型检查和面向对象编程的特性。C++:C++是一种通用的编程语言,它在系统开发、游戏开发、嵌入式系统等领域得到广泛应用。Go:Go是一种由Google开发的编程语言,它具有简单的语法和高效的并发性能。它的重点在于开发人员的幸福感和可读性。Java:Java是一种通用的高级编程语言,被广泛用于企业级应用的开发。_编程语言排行榜

知识付费系统正在升级,在线教育网站平台系统源码如何开发?-程序员宅基地

文章浏览阅读300次,点赞6次,收藏8次。所以,不是有源码大家就可以自己操作的,因为这些源码都是没有经过调整的,所以,漏洞会非常大,如果不是相关专业的,自己随意去搭建,那搞不好就容易出现各种事故,而且安全性也不高,网站也容易被攻击,所以,是非常不牢靠的。在线教育网站平台系统源码想获得开发,其实,最关键是需要懂得技术,如果不懂,那要么就找团队来帮忙,要么就找服务商这边来搭建,当然,招聘团队花的钱也不少,所以,最好的方式还是选择服务商更为合适。帮助课程变现,学员粉的沉淀。对于不懂技术的老师来说,建议选择第三方平台帮忙,比如就是不错的平台。

多标签、类别不均衡分类问题_binary 交叉熵 多标签不均衡-程序员宅基地

文章浏览阅读5.8k次,点赞11次,收藏45次。最近老是遇到多标签分类问题????,加之自己对loss的理解还是不够到位整理以下链接以作学习参考使用:多标签分类:定义、思想和算法主要是将多标签分类的定义,思考和一些解决办法。????multilabel_categorical_crossentropy????损失函数主要是介绍了两个损失函数的区别:????categorical_crossentropy????????binary_crossentropy????二分类、多分类与多标签问题的区别及对应损失函数的选择这篇主要分析了so_binary 交叉熵 多标签不均衡

企业邮箱邮件误删除了怎么恢复?_公司邮箱误删邮件怎么恢复-程序员宅基地

文章浏览阅读662次。生活中,在浏览出游新拍的照片,一不小心按了删除按钮,导致心爱的照片被删除,无法找回,邮箱作为重要的办公软件同样存在该问题,将重要的工作资料删除,以至于无法找回。随着邮箱技术的越来越成熟,找回删除的邮件不再是难题,TOM企业邮箱针对此情况,特意研发出邮件误删恢复功能,下面我们细聊如何使用邮件删除恢复功能。高端商务邮箱对于每个人来说删除动作都是非常危险的,一旦启动操作就是不可逆的行为,所以说数据恢复在此刻显得尤为重要。邮件删除怎么恢复,删除的邮件可以恢复吗?现在明确告述大家可以的。邮件误删了怎么恢复?_公司邮箱误删邮件怎么恢复

推荐文章

热门文章

相关标签