动手学深度学习PyTorch版---day01

阅读量：

Day01

1.线性回归

方法1---手动实现

方法2---pytorch实现

2.Softmax

1.相关概念

2.交叉熵损失函数

3.从零实现softmax回归

4.pytorch实现softmax回归

3.多层感知机

Day01

线性回归，softmax回归与分类模型，多层感知机

参考：https://tangshusen.me/Dive-into-DL-PyTorch/#/

《动手学深度学习》结伴而行学生的学习手册 https://shimo.im/docs/pdr3wkyHKrxJYdyT/read

1.线性回归

方法1---手动实现

复制代码

 import torch

    
 #import IPython import display
    
 from matplotlib import pyplot as plt
    
 import numpy as np
    
 import random
    
  
    
 num_inputs = 2
    
 num_examples = 1000
    
  
    
 true_w = [2, -3,4]
    
 true_b = 4.2
    
  
    
 features = torch.randn(num_examples,num_inputs,
    
                    dtype=torch.float32) #标准正态分布
    
 labels = true_w[0]*features[:,0]+true_w[1]*features[:,1]+true_b
    
 labels += torch.tensor(np.random.normal(0, 0.01, size=labels.size()),
    
                   dtype=torch.float32)
    
 # plt.figure()
    
 # #画散点图
    
 # plt.scatter(features[:,1].numpy(),labels.numpy(),1)
    
 # plt.show()
    
  
    
 #读取数据
    
 def data_iter(batch_size,features,labels):
    
     num_examples = len(features)
    
     indices = list(range(num_examples))
    
     random.shuffle(indices)
    
     for i in range(0, num_examples, batch_size):
    
     j = torch.LongTensor(indices[i:min(i+batch_size, num_examples)])
    
     yield features.index_select(0, j), labels.index_select(0, j)
    
  
    
 batch_size = 10
    
 for X,y in data_iter(batch_size, features, labels):
    
     print(X,'\n', y)
    
     break
    
  
    
 # 初始化模型参数
    
 w = torch.tensor(np.random.normal(0,0.01,(num_inputs,1)),dtype=torch.float32)
    
 b = torch.zeros(1,dtype=torch.float32)
    
  
    
 w.requires_grad_(requires_grad=True)
    
 b.requires_grad_(requires_grad=True)
    
  
    
 #定义模型
    
 def linreg(X, w, b):
    
     return torch.mm(X,w)+b
    
  
    
 #定义损失函数
    
 def squared_loss(y_hat, y):
    
     return (y_hat-y.view(y_hat.size()))**2/2
    
  
    
 #定义优化函数
    
 def sgd(params, lr, batch_size):
    
     for param in params:
    
     param.data -= lr*param.grad/batch_size   #注意 .data
    
  
    
 #train
    
 lr = 0.03
    
 num_epoches = 5
    
  
    
 net = linreg
    
 loss = squared_loss
    
  
    
 for epoch in range(num_epoches):
    
     for X,y in data_iter(batch_size, features, labels):
    
     l = loss(net(X,w,b),y).sum()
    
     l.backward()
    
     sgd([w,b],lr,batch_size)
    
     w.grad.data.zero_()
    
     b.grad.data.zero_()
    
     train_l = loss(net(features, w, b),labels)
    
     print('epoch %d, loss %f' % (epoch+1, train_l.mean().item()))
    
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/pf4oiK7jmbLrxsyOzRMJXCIkTDBU.png)

方法2---pytorch实现

复制代码

 import torch

    
 from torch import nn
    
 from torch.nn import init
    
 import torch.optim as optim
    
 import numpy as np
    
 import torch.utils.data as Data
    
  
    
 #生成数据
    
 num_inputs = 2
    
 num_examples = 1000
    
  
    
 true_w = [2,-3.4]
    
 true_b = 4.2
    
  
    
 features = torch.tensor(np.random.normal(0,1,(num_examples,num_inputs)),dtype=torch.float)
    
 labels = true_w[0]*features[:,0]+true_w[1]*features[:,1]+true_b
    
 labels += torch.tensor(np.random.normal(0,0.01,size=labels.size()),dtype=torch.float)
    
  
    
 #读取数据集
    
 batch_size=10
    
 #combine features and labels of dataset
    
 dataset = Data.TensorDataset(features, labels)
    
 #put dataset into DataLoader
    
 data_iter = Data.DataLoader(
    
     dataset=dataset,    #torch TensorDataset format
    
     batch_size=batch_size,
    
     shuffle=True,
    
     num_workers=0, #read data in multithreading
    
 )
    
 # for X,y in data_iter:
    
 #     print(X,'\n',y)
    
 #     break
    
  
    
  
    
 #定义模型
    
 class LinearNet(nn.Module):
    
     def __init__(self, n_feature):
    
     super(LinearNet, self).__init__()
    
     self.linear = nn.Linear(n_feature,1)
    
  
    
     def forward(self,x):
    
     y = self.linear(x)
    
     return y
    
  
    
     # 定义权值初始化
    
     def initialize_weights(self):
    
     for m in self.modules():
    
         if isinstance(m, nn.Linear):
    
             torch.nn.init.normal_(m.weight.data, 0, 0.01)
    
             m.bias.data.zero_()
    
  
    
 net = LinearNet(num_inputs)     #num_inputs传参n_feature
    
 net.initialize_weights()
    
 # print(net)
    
  
    
 #loss
    
 loss=nn.MSELoss()
    
  
    
 #定义优化函数
    
 optimizer = optim.SGD(net.parameters(),lr=0.03)
    
 #print(optimizer)
    
  
    
 #training
    
 num_epoches=3
    
 for epoch in range(1,num_epoches+1):
    
     for X,y in data_iter:
    
     output = net(X)
    
     l = loss(output,y.view(-1,1))
    
     optimizer.zero_grad()  #reset gradient
    
     l.backward()
    
     optimizer.step()
    
     print('epoch %d,loss %f' % (epoch, l.item()))
    
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/f5EIR2XbVv4AqdLe6GJPWUngO1zm.png)

2.Softmax

1.相关概念

softmax回归的输出层也是一个全连接层。

softmax运算符，将输出值变换成值为正且和为1的概率分布
解决问题

softmax回归对样本i分类的矢量计算表达式为

2.交叉熵损失函数

3.从零实现softmax回归

复制代码

 import torch

    
 import numpy as np
    
  
    
 num_inputs = 784
    
 num_outputs = 10
    
  
    
 W = torch.tensor(np.random.normal(0, 0.01, (num_inputs, num_outputs)), dtype=torch.float)
    
 b = torch.zeros(num_outputs, dtype=torch.float)
    
 W.requires_grad_(requires_grad=True)
    
 b.requires_grad_(requires_grad=True)
    
  
    
 def softmax(X):
    
     X_exp = X.exp()
    
     partition = X_exp.sum(dim=1, keepdim=True)
    
     # print("X size is ", X_exp.size())
    
     # print("partition size is ", partition, partition.size())
    
     return X_exp / partition  # 这里应用了广播机制
    
 X = torch.rand((2, 5))
    
 X_prob = softmax(X)
    
 print(X_prob, '\n', X_prob.sum(dim=1))
    
  
    
 #softmax回归模型
    
 def net(X):
    
     return softmax(torch.mm(X.view((-1, num_inputs)), W) + b)
    
  
    
 #定义损失函数
    
 y_hat = torch.tensor([[0.1, 0.3, 0.6], [0.3, 0.2, 0.5]])
    
 y = torch.LongTensor([0, 2])
    
 y_hat.gather(1, y.view(-1, 1))
    
  
    
 def cross_entropy(y_hat, y):
    
     return - torch.log(y_hat.gather(1, y.view(-1, 1)))
    
  
    
 #定义准确率
    
 def evaluate_accuracy(data_iter, net):
    
     acc_sum, n = 0.0, 0
    
     for X, y in data_iter:
    
     acc_sum += (net(X).argmax(dim=1) == y).float().sum().item()
    
     n += y.shape[0]
    
     return acc_sum /n
    
  
    
 def accuracy(y_hat, y):
    
     return (y_hat.argmax(dim=1) == y).float().mean().item()
    
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/y9bf7cW4Js1Td0DFaKC8rVwHkv5t.png)

4.pytorch实现softmax回归

复制代码

 import torch

    
 from torch import nn
    
 from torch.nn import init
    
 import numpy as np
    
  
    
 num_inputs = 784
    
 num_outputs = 10
    
  
    
 class LinearNet(nn.Module):
    
     def __init__(self, num_inputs, num_outputs):
    
     super(LinearNet, self).__init__()
    
     self.linear = nn.Linear(num_inputs, num_outputs)
    
  
    
     def forward(self, x):  # x 的形状: (batch, 1, 28, 28)
    
     y = self.linear(x.view(x.shape[0], -1))
    
     return y
    
  
    
  
    
 # net = LinearNet(num_inputs, num_outputs)
    
  
    
 class FlattenLayer(nn.Module):
    
     def __init__(self):
    
     super(FlattenLayer, self).__init__()
    
  
    
     def forward(self, x):  # x 的形状: (batch, *, *, ...)
    
     return x.view(x.shape[0], -1)
    
  
    
  
    
 from collections import OrderedDict
    
  
    
 net = nn.Sequential(
    
     # FlattenLayer(),
    
     # LinearNet(num_inputs, num_outputs)
    
     OrderedDict([
    
     ('flatten', FlattenLayer()),
    
     ('linear', nn.Linear(num_inputs, num_outputs))])  # 或者写成我们自己定义的 LinearNet(num_inputs, num_outputs) 也可以
    
 )
    
  
    
 #初始化
    
 init.normal_(net.linear.weight, mean=0, std=0.01)
    
 init.constant_(net.linear.bias, val=0)
    
  
    
 #loss
    
 loss = nn.CrossEntropyLoss()
    
  
    
 #优化函数
    
 optimizer = torch.optim.SGD(net.parameters(), lr=0.1)
    
    
    
    
    python
    
    
![](https://ad.itadn.com/c/weblog/blog-img/images/2025-08-19/jkqQCJ0fSDtcXWnG71lmZypKde8V.png)

3.多层感知机

1.sigmoid

全部评论 (0)

还没有任何评论哟~

动手学深度学习PyTorch版---day01

目录 Day01 1.线性回归方法1手动实现方法2pytorch实现 2.Softmax 1.相关概念 2.交叉熵损失函数 3.从零实现softmax回归 4.pytorch实现softmax回归...

《动手学深度学习》(PyTorch版)

《动手学深度学习》PyTorch版前言简介面向人群食用方法方法一方法二方法三目录原书地址引用阅读指南前言读书啦！！！本项目将《动手学深度学习》原书中MXNet代码实现改为P...

动手学深度学习-pytorch版

Task01 线性回归线性回归的基本要素：模型、数据集、损失函数和优化函数 Softmax与分类模型多层感知机 Task02 文本预处理文本是一类序列数据，一篇文章可以看作是字符或单词的序列，本...

[动手学深度学习pytorch版]

2.2.1读取数据集代码讲解的补充：os.makedirsos.path.join'..','data',existok=True os.makedirs:使用os库里的makedirs函数作用：...

动手学深度学习PyTorch版

概率用于处理日期和时间 %pipinstallpytz 包含了许多用于数学、科学和工程的函数 %pipinstallscipy 在Jupyter笔记本中嵌入绘图 %matplotlibinline ...

动手学深度学习PyTorch版

基本的数据操作 importtorch 创建一个行向量，默认为从0开始的12个整数 n维数组也称为张量 x=torch.arange12 x python 张量的形状 x.shape 张量的大小,张量...

《动手学深度学习》PyTorch版 Task03

一、过拟合、欠拟合及其解决方案知识点笔记笔记：模型选择、过拟合和欠拟合：训练误差和泛化误差：训练误差：模型在训练数据集上表现出的误差，泛化误差：模型在任意一个测试数据样本上表现出的误差的期望...

动手学深度学习PyTorch版---lastDay_2

目录 lastDay 1.数据增强 2.模型微调 3.目标检测 3.1锚框 3.2IoU 3.3标注训练集的锚框 3.4输出预测边界框非极大值抑制（nonmaximumsuppression，NM...

《动手学深度学习PyTorch版》4

机器翻译及相关技术 1、机器翻译和数据集机器翻译（MT）：将一段文本从一种语言自动翻译为另一种语言，用神经网络解决这个问题通常称为神经机器翻译（NMT）。主要特征：输出是单词序列而不是单个单词。输...

动手学深度学习PyTorch版-Transformer

Transformer importos importmath importnumpyasnp importtorch importtorch.nnasnn importtorch.nn.functi...

是否确定退出登录?

动手学深度学习PyTorch版---day01

Day01

1.线性回归

方法1---手动实现

方法2---pytorch实现

2.Softmax

1.相关概念

2.交叉熵损失函数

3.从零实现softmax回归

4.pytorch实现softmax回归

3.多层感知机

全部评论 (0)

相关文章推荐

动手学深度学习PyTorch版---day01

《动手学深度学习》(PyTorch版)

动手学深度学习-pytorch版

[动手学深度学习pytorch版]

动手学深度学习PyTorch版

动手学深度学习PyTorch版

《动手学深度学习》PyTorch版 Task03

动手学深度学习PyTorch版---lastDay_2

《动手学深度学习PyTorch版》4

动手学深度学习PyTorch版-Transformer