测试了一下keras和mxnet的速度

阅读量：

这两个都很好用啊，适合我这样的入门小白

win10 64 cuda8.0 cudnn5.1 gtx1060

cnn mnist

复制代码

 import numpy

    
 import os
    
 import urllib
    
 import gzip
    
 import struct
    
 def read_data(label_name, image_name):
    
     s=os.getenv('DATA')
    
     with gzip.open(os.getenv('DATA')+'\ MNIST\ '+label_name) as flbl:
    
     magic, num = struct.unpack(">II", flbl.read(8))
    
     label = numpy.fromstring(flbl.read(), dtype=numpy.int8)
    
     with gzip.open(os.getenv('DATA')+'\ MNIST\ '+image_name, 'rb') as fimg:
    
     magic, num, rows, cols = struct.unpack(">IIII", fimg.read(16))
    
     image = numpy.fromstring(fimg.read(), dtype=numpy.uint8).reshape(len(label), rows, cols)
    
     return (label, image)
    
 (train_lbl, train_img) = read_data('train-labels-idx1-ubyte.gz', 'train-images-idx3-ubyte.gz')
    
 (val_lbl, val_img) = read_data('t10k-labels-idx1-ubyte.gz','t10k-images-idx3-ubyte.gz')
    
 def to4d(img):
    
     return img.reshape(img.shape[0], 1, 28, 28).astype(numpy.float32)/255
    
 def repack_data(d):
    
     t = numpy.zeros((d.size, 10))
    
     for i in range(d.size):
    
     t[i][d[i]] = 1
    
     return t
    
 train_img=to4d(train_img)
    
 val_img=to4d(val_img)
    
 batch_size = 100
    
 num_epoch =5
    
 #backend='mxnet'
    
 backend='keras'
    
 if backend=='keras':
    
     from keras.models import *
    
     from keras.layers import *
    
     from keras.optimizers import *
    
     model = Sequential()
    
     model.add(Convolution2D(64, 5, 5, input_shape=(1,28,28), init='uniform', activation='relu'))
    
     model.add(MaxPooling2D())
    
     model.add(Convolution2D(128, 5, 5, init='uniform', activation='relu'))
    
     model.add(MaxPooling2D())
    
     model.add(Flatten())
    
     model.add(Dense(1024, init='uniform', activation='relu'))
    
     model.add(Dense(1024, init='uniform', activation='relu'))
    
     model.add(Dense(10, init='uniform', activation='softmax'))
    
     model.summary()
    
     model.compile(loss='categorical_crossentropy', optimizer=adadelta(), metrics=['accuracy'])
    
     model.fit(train_img,repack_data(train_lbl),batch_size=batch_size,nb_epoch=num_epoch,validation_data=(val_img,repack_data(val_lbl)))
    
 else:
    
     import mxnet
    
     train_iter = mxnet.io.NDArrayIter(train_img, train_lbl, batch_size, shuffle=True)
    
     val_iter = mxnet.io.NDArrayIter(val_img, val_lbl, batch_size)
    
     data = mxnet.symbol.Variable('data')
    
     conv1 = mxnet.sym.Convolution(data=data, kernel=(5, 5), num_filter=64)
    
     relu1 = mxnet.sym.Activation(data=conv1, act_type="relu")
    
     pool1 = mxnet.sym.Pooling(data=relu1, pool_type="max", kernel=(2, 2), stride=(2, 2))
    
     conv2 = mxnet.sym.Convolution(data=pool1, kernel=(5, 5), num_filter=128)
    
     relu2 = mxnet.sym.Activation(data=conv2, act_type="relu")
    
     pool2 = mxnet.sym.Pooling(data=relu2, pool_type="max", kernel=(2, 2), stride=(2, 2))
    
     flatten = mxnet.sym.Flatten(data=pool2)
    
     fc1 = mxnet.symbol.FullyConnected(data=flatten, num_hidden=1024)
    
     relu3 = mxnet.sym.Activation(data=fc1, act_type="relu")
    
     fc2 = mxnet.symbol.FullyConnected(data=relu3, num_hidden=1024)
    
     relu4 = mxnet.sym.Activation(data=fc2, act_type="relu")
    
     fc3 = mxnet.sym.FullyConnected(data=relu4, num_hidden=10)
    
     net = mxnet.sym.SoftmaxOutput(data=fc3, name='softmax')
    
     mxnet.viz.plot_network(symbol=net, shape= {"data" : (batch_size, 1, 28, 28)}).render('mxnet')
    
     model = mxnet.model.FeedForward(
    
     ctx=mxnet.gpu(0),  # use GPU 0 for training, others are same as before
    
     symbol=net,
    
     num_epoch=num_epoch,
    
     learning_rate=0.1,
    
     optimizer='AdaDelta',
    
     initializer=mxnet.initializer.Uniform())
    
     import logging
    
     logging.getLogger().setLevel(logging.DEBUG)
    
     model.fit(
    
     X=train_iter,
    
     eval_data=val_iter,
    
     batch_end_callback=mxnet.callback.Speedometer(batch_size, 200)
    
     )

Layer (type) Output Shape Param # Connected to

convolution2d_1 (Convolution2D) (None, 64, 24, 24) 1664 convolution2d_input_1[0][0]

maxpooling2d_1 (MaxPooling2D) (None, 64, 12, 12) 0 convolution2d_1[0][0]

convolution2d_2 (Convolution2D) (None, 128, 8, 8) 204928 maxpooling2d_1[0][0]

maxpooling2d_2 (MaxPooling2D) (None, 128, 4, 4) 0 convolution2d_2[0][0]

flatten_1 (Flatten) (None, 2048) 0 maxpooling2d_2[0][0]

dense_1 (Dense) (None, 1024) 2098176 flatten_1[0][0]

dense_2 (Dense) (None, 1024) 1049600 dense_1[0][0]

dense_3 (Dense) (None, 10) 10250 dense_2[0][0]

Total params: 3364618

keras+theano

采用了6万组样本进行训练，并在1万组样本上进行验证

mxnet

INFO:root:During the training process, GPU(0) was utilized effectively.
INFO:root:During epoch 0, batch 200 completed with a processing speed of 2960.54 samples per second and achieved a training accuracy of 84.56%.
INFO:root:During epoch 1, batch processing began at 2878.78 samples per second, resulting in a higher training accuracy of approximately 97.51%.
INFO:root:During epoch 1, validation accuracy reached an impressive level of about 98.67%.
INFO:root:Different epochs exhibited varying performance metrics throughout the training cycles.

我对keras的速度表示认可，并且觉得它运行得相当流畅。基本上来说，在同类硬件中已经达到了预期的性能水平。此外，在GPU使用方面也相当稳定大都处于满负荷状态

但是theano后端的编译速度好慢好慢好慢！

MXNet运行缓慢。MXNet耗时三倍。运行官方示例时发现其速度较GTX 980低一半，请确认配置是否存在问题。

不过我发现mxnet训练的时候cpu一直是100，可能是这个原因。。。。

悲伤的故事

全部评论 (0)

还没有任何评论哟~

测试了一下keras和mxnet的速度

这两个都很好用啊，适合我这样的入门小白 win1064cuda8.0cudnn5.1gtx1060 cnnmnist importnumpy importos importurllib importg...

简单测试了一下Lua的速度

很简单,循环做加法100w次,机器N73 //代码如下 CountTimeAndDumpToDialog constchartimeTest= a=0/r/n fori=1,1000000doa=a+...

今天闲来无事测了一下cout.put和putchar的速度。

环境——编译器：MSVC；标准：C++14；模式：Release 测试代码：今天闲来无事测了一下cout.put和putchar的速度。环境——编译器：MSVC；标准：C++14；模式：Relea...

Flutter测试（一）： Widget 测试了解一下

平时我们在写代码的时候，或多或少都会写一些测试来测试一下我们的逻辑是否正确，那在Flutter当中，测试也被分为三种： 1.单元测试2.Widget测试3.集成测试在Flutter当中，最重要的就...

mxnet CrossEntropy 测试

fromfutureimportabsoluteimport fromfutureimportdivision fromfutureimportprintfunction importos impor...

linux测试硬盘速度命令,Linux下的硬盘读写速度测试

读取速度可以使用以下命令:hdparmt设备名称/dev/sda1 写入速度命令:时间ddif=/dev/zeroof=/tmp/test.datbs=1Gcount=1 测试磁盘的读写IO速度有时...

TensorFlow和Caffe、MXNet、Keras等其他深度学习框架的对比

Google近日发布了TensorFlow1.0候选版，这第一个稳定版将是深度学习框架发展中的里程碑的一步。自TensorFlow于2015年底正式开源，距今已有一年多，这期间TensorFlow不断...

安装mxnet 镜像_【mxnet速成】mxnet图像分类从模型自定义到测试

这一次我们讲讲mxnet，相关的代码、数据都在我们Git上，希望大家Follow一下这个Git项目，后面会持续更新不同框架下的任务。 https://github.com/longpeng2008/L...

SVM和LR速度测试

样本1 html X,Y=sklds.makeclassificationnsamples=200,nfeatures=50,nclasses=2 Xtrain,Xtest,ytrain,ytest=...

单元测试（一）：快速了解单元测试

单元测试 Why What 常用单元测试框以及常用用法 junit Mockito PowerMock 实操采坑不间断更新记录（1RestTemplate:预定义的返回值无法传递 Why 单元测试帮我...

是否确定退出登录?

测试了一下keras和mxnet的速度

Layer (type) Output Shape Param # Connected to

dense_3 (Dense) (None, 10) 10250 dense_2[0][0]

全部评论 (0)

相关文章推荐

测试了一下keras和mxnet的速度

简单测试了一下Lua的速度

今天闲来无事测了一下cout.put和putchar的速度。

Flutter测试（一）： Widget 测试了解一下

mxnet CrossEntropy 测试

linux测试硬盘速度命令,Linux下的硬盘读写速度测试

TensorFlow和Caffe、MXNet、Keras等其他深度学习框架的对比

安装mxnet 镜像_【mxnet速成】mxnet图像分类从模型自定义到测试

SVM和LR速度测试

单元测试（一）：快速了解单元测试