cv/pirm.py

# -*- coding: UTF-8 -*-
import os

import cv2
import numpy as np
import struct
import matplotlib.pyplot as plt
import mindspore
import mindspore.dataset as ds

import mindspore.dataset.vision.c_transforms as cvision
import mindspore.dataset.transforms.c_transforms as ctrans
import mindspore.common.dtype as mstype
import glob
import cv2
import gzip
import shutil

# 数据集下载链接
resources1 = r'https://pirm.github.io/'

# 数据集内的所有文件
resources2 = [
    "PIRM_Self-Val_set",
    "PIRM_Test_set",
    "PIRM_Val_set", ]


class PIRM:
    def __init__(self, root, is_training=True, scale=2, name="Self-Val"):
        """
        :param root:
        :param is_training:
        :param scale:
        """

        self.root = root
        self.is_training = is_training  # True表示训练集，False表示测试集
        self.scale = scale
        self.name = name
        self.is_training = is_training

        # 检查数据集是否完整
        self.check_exist()

        self.data = []
        self.label = []

        if self.is_training:
            self.data = self.read_image()
            self.label = self.read_label()
        else:
            self.data = self.read_image()

    def __getitem__(self, item):
        if self.is_training:
            data = cv2.imread(self.data[item])
            label = cv2.imread(self.label[item])

            return data, label
        else:
            data = cv2.imread(self.data[item])

            return data

    def __len__(self):
        return len(self.data)

    def read_image(self):
        filename = f"PIRM_{self.name}_set"
        content = sorted(glob.glob(os.path.join(root, filename, "LR") + r'\*.png'))
        return content

    def read_label(self):
        filename = f"PIRM_{self.name}_set"
        content = sorted(glob.glob(os.path.join(root, filename, "HR") + r'\*.png'))
        return content

    def check_exist(self):
        """检查数据集文件是否完整"""
        for x in resources2:
            temp_path = os.path.join(self.root, x)
            if not os.path.exists(temp_path):
                print(f"文件{temp_path}有缺失, 请去{resources1}下载数据集并且解压好")
                raise RuntimeError()
        print("数据集完整！")


if __name__ == '__main__':
    """ 用法示例 """

    # 填写数据集的上级目录
    root = r'E:\MindsporeVision\dataset\PIRM'

    # 实例化，注意图片为HWC、BGR格式，所以训练时候要转化为CHW、RGB格式
    dataset = PIRM(root, is_training=True, scale=2, name="Self-Val")

    # 设置一些参数，如shuffle、num_parallel_workers等等
    dataset = ds.GeneratorDataset(dataset,
                                  column_names=["image", "label"],
                                  num_parallel_workers=1,
                                  num_samples=None,
                                  shuffle=False)

    # 做一些数据增强，如果不需要增强可以把这段代码注释掉
    # 首先把数据集设置为uint8，因为map只支持uint8
    dataset = dataset.map(operations=ctrans.TypeCast(mstype.uint8), input_columns="image")
    dataset = dataset.map(operations=ctrans.TypeCast(mstype.uint8), input_columns="label")

    # # 此处填写所需要的数据增强算子
    # transform = [cvision.Resize(448),
    #              cvision.RandomCrop(448)]
    # dataset = dataset.map(operations=transform, input_columns="image")
    # dataset = dataset.map(operations=transform, input_columns="label")

    # 显示5张图片
    for index, data in enumerate(dataset.create_dict_iterator(output_numpy=True)):
        if index >= 5:
            break
        print(data["image"].shape, data["label"].shape)
        plt.subplot(2, 5, index + 1)
        plt.imshow(data["image"].squeeze())
        plt.title("data")

        plt.subplot(2, 5, index + 1 + 5)
        plt.imshow(data["label"].squeeze())
        plt.title("label")
    plt.show()