斯坦福cs231n课程记录——assignment1 Two-layer neural network

阅读量：

一、两层神经网络原理

通过搭建两层神经网络对图片进行分类。

二、某些API解释

三、实现

1.定义一个类：

复制代码

 class TwoLayerNet(object):

    
  
    
     def __init__(self, input_size, hidden_size, output_size, std=1e-4):
    
     
    
     self.params = {}
    
     self.params['W1'] = std * np.random.randn(input_size, hidden_size)
    
     self.params['b1'] = np.zeros(hidden_size)
    
     self.params['W2'] = std * np.random.randn(hidden_size, output_size)
    
     self.params['b2'] = np.zeros(output_size)

2.定义损失函数

复制代码

 def loss(self, X, y=None, reg=0.0):

    
     
    
     # Unpack variables from the params dictionary
    
     W1, b1 = self.params['W1'], self.params['b1']
    
     W2, b2 = self.params['W2'], self.params['b2']
    
     N, D = X.shape
    
  
    
     # Compute the forward pass
    
     scores = None
    
    
    
     s1 = np.dot(X, W1) + b1  # (N, H)
    
     s1_act = (s1 > 0) * s1
    
     scores = np.dot(s1_act, W2) + b2  # (N, C)
    
       
    
  
    
     # If the targets are not given then jump out, we're done
    
     if y is None:
    
         return scores
    
  
    
     # Compute the loss
    
     loss = None
    
       
    
     scores -= np.max(scores, axis=1, keepdims=True)  # 数值稳定性
    
     scores = np.exp(scores)
    
     scores /= np.sum(scores, axis=1, keepdims=True)  # softmax
    
     loss = -np.log(scores[np.arange(N), y]).sum()
    
     loss /= X.shape[0]
    
     loss += reg * np.sum(W1**2)
    
     loss += reg * np.sum(W2**2)
    
    
    
     # Backward pass: compute gradients
    
     grads = {}
    
    
    
     ds2 = np.copy(scores)  # 计算ds
    
     ds2[np.arange(X.shape[0]), y] -= 1
    
     ds2 = ds2 / X.shape[0]
    
     grads['W2'] = np.dot(s1_act.T, ds2) + 2 * reg * W2
    
     grads['b2'] = np.sum(ds2, axis=0)
    
  
    
     ds1 = np.dot(ds2, W2.T)
    
     ds1 = (s1 > 0) * ds1
    
     grads['W1'] = np.dot(X.T, ds1) + 2 * reg * W1
    
     grads['b1'] = np.sum(ds1, axis=0)
    
     
    
     return loss, grads

3.训练网络

复制代码

     def train(self, X, y, X_val, y_val,

    
           learning_rate=1e-3, learning_rate_decay=0.95,
    
           reg=5e-6, num_iters=100,
    
           batch_size=200, verbose=False):
    
     
    
     num_train = X.shape[0]
    
     iterations_per_epoch = max(num_train / batch_size, 1)
    
  
    
     # Use SGD to optimize the parameters in self.model
    
     loss_history = []
    
     train_acc_history = []
    
     val_acc_history = []
    
  
    
     for it in range(num_iters):
    
         X_batch = None
    
         y_batch = None
    
  
    
         idx = np.random.choice(range(num_train), batch_size)
    
         X_batch = X[idx]
    
         y_batch = y[idx]
    
     
    
  
    
         # Compute loss and gradients using the current minibatch
    
         loss, grads = self.loss(X_batch, y=y_batch, reg=reg)
    
         loss_history.append(loss)
    
  
    
         
    
         for p in ['W1', 'W2', 'b1', 'b2']:
    
             self.params[p] -= learning_rate * grads[p]
    
        
    
         if verbose and it % 100 == 0:
    
             print('iteration %d / %d: loss %f' % (it, num_iters, loss))
    
  
    
         # Every epoch, check train and val accuracy and decay learning rate.
    
         if it % iterations_per_epoch == 0:
    
             # Check accuracy
    
             train_acc = (self.predict(X_batch) == y_batch).mean()
    
             val_acc = (self.predict(X_val) == y_val).mean()
    
             train_acc_history.append(train_acc)
    
             val_acc_history.append(val_acc)
    
  
    
             # Decay learning rate
    
             learning_rate *= learning_rate_decay
    
  
    
     return {
    
         'loss_history': loss_history,
    
         'train_acc_history': train_acc_history,
    
         'val_acc_history': val_acc_history,
    
     }

4.预测

复制代码

 def predict(self, X):

    
  
    
     y_pred = None
    
  
    
     scores = self.loss(X)
    
     y_pred = np.argmax(scores, axis=1)
    
  
    
     return y_pred

5.CIFAR-10分类结果

四、作业问题记录

Inline Question

Now that you have trained a Neural Network classifier, you may find that your testing accuracy is much lower than the training accuracy. In what ways can we decrease this gap? Select all that apply.

Train on a larger dataset.
Add more hidden units.
Increase the regularization strength.
None of the above.

Your answer : 1 和 3

Your explanation: 增大数据和增加正则化强度都能够提高泛化能力，但是增加隐藏节点会使得model更加的过拟合

全部评论 (0)

还没有任何评论哟~

斯坦福cs231n课程记录——assignment1 Two-layer neural network

目录 twolayerneuralnetwork原理某些API解释 twolayerneuralnetwork实现作业问题记录 twolayerneuralnetwork优化 twolayerne...

CS231n-assignment1-two-Layer Neural Network

In[1]: importnumpyasnp importmatplotlib.pyplotasplt fromcs231n.classifiers.neuralnetimportTwoLayerNe...

斯坦福cs231n课程记录——assignment1 SVM

目录 SVM原理某些API解释 SVM实现作业问题记录 SVM优化 SVM运用参考文献一、SVM原理线性SVM分类是给每一个样本一个分数，其正确的分数应该比错误的分数大。

斯坦福cs231n课程记录——assignment1 KNN

目录 KNN原理某些API解释 KNN实现作业问题记录行业运用算法改进参考文献一、KNN原理 KNN是一种投票机制，依赖少数服从多数的原则，根据最近样本的标签进行分类的方法，属于局部近似。

[CS231n@Stanford] Assignment1-Q4 (python) Two layer neural network实现

neuralnet.py importnumpyasnp importmatplotlib.pyplotasplt classTwoLayerNetobject: Atwolayerfullycon...

CS231n课程作业(一) Two-layer Neural Network

神经网络的过程主要就是forwardpropagation和backwardpropagation。 forwardpropagationtoevaluatescorefunction&lossfun...

cs231n assignment1 two-layer-net

twolayernet 首先完成神经网络对scores和损失函数的计算，其中激活函数使用RELU函数，即max0,x函数。 neuralnet.py的loss函数 STARTOFYOURCODEDON...

斯坦福cs231n课程记录——assignment2 FullyConnectedNets

目录作业目的网络层实现优化方法实现作业问题记录参考文献一、作业目的之前做了一个Twolayerneuralnetwork的作业，但是其损失函数和反向传播都是在一个函数中实现的，并没有实现...

斯坦福cs231n课程记录——assignment2 Dropout

目录 Dropout原理 Dropout实现 Dropout运用作业问题参考文献一、Dropout原理作用：regularizeneuralnetworksbyrandomlysettings...

斯坦福cs231n课程记录——assignment2 BatchNormalization

目录 BatchNormalization原理 BatchNormalization实现 BatchNormalization运用 LayerNormalization 参考文献一、BatchNor...

是否确定退出登录?

斯坦福cs231n课程记录——assignment1 Two-layer neural network

目录

一、两层神经网络原理

二、某些API解释

三、实现

四、作业问题记录

全部评论 (0)

相关文章推荐

斯坦福cs231n课程记录——assignment1 Two-layer neural network

CS231n-assignment1-two-Layer Neural Network

斯坦福cs231n课程记录——assignment1 SVM

斯坦福cs231n课程记录——assignment1 KNN

[CS231n@Stanford] Assignment1-Q4 (python) Two layer neural network实现

CS231n课程作业(一) Two-layer Neural Network

cs231n assignment1 two-layer-net

斯坦福cs231n课程记录——assignment2 FullyConnectedNets

斯坦福cs231n课程记录——assignment2 Dropout

斯坦福cs231n课程记录——assignment2 BatchNormalization