大佬教程收集整理的这篇文章主要介绍了1、DL_paddle深度学习,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
在实际的场景中,更多需要使用你已有的相关数据来定义数据集。你可以使用飞桨提供的paddle.io.Dataset
基类,来快速实现自定义数据集。
import paddle
from paddle.io import Dataset
BATCH_SIZE = 64
BATCH_NUM = 20
IMAGE_SIZE = (28, 28)
CLASS_NUM = 10
class MyDataset(Dataset):
"""
步骤一:继承paddle.io.Dataset类
"""
def __init__(self, num_samples):
"""
步骤二:实现构造函数,定义数据集大小
"""
super(MyDataset, self).__init__()
self.num_samples = num_samples
def __getitem__(self, indeX):
"""
步骤三:实现__getitem__方法,定义指定index时如何获取数据,并返回单条数据(训练数据,对应的标签)
"""
data = paddle.uniform(IMAGE_SIZE, dtype='float32')
label = paddle.randint(0, CLASS_NUM-1, dtype='int64')
return data, label
def __len__(self):
"""
步骤四:实现__len__方法,返回数据集总数目
"""
return self.num_samples
# 测试定义的数据集
custom_dataset = MyDataset(BATCH_SIZE * BATCH_NUM)
print('=============custom dataset=============')
for data, label in custom_dataset:
print(data.shape, label.shapE)
break
飞桨推荐使用paddle.io.DataLoader
完成数据的加载。简单的示例如下:
Train_loader = paddle.io.DataLoader(custom_dataset, batch_size=BATCH_SIZE, shuffle=TruE)
# 如果要加载内置数据集,将 custom_dataset 换为 Train_dataset 即可
for batch_id, data in enumerate(Train_loader()):
x_data = data[0]
y_data = data[1]
print(x_data.shapE)
print(y_data.shapE)
break
参考链接:数据集定义与加载-使用文档-PaddlePaddle深度学习平台
以上是大佬教程为你收集整理的1、DL_paddle深度学习全部内容,希望文章能够帮你解决1、DL_paddle深度学习所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。