[TensorRT Sample Code] How to Save Engine and Load Engine from file

阅读量：

In the TensorRT Sample "TensorRT-7.0.0.11/samples/trtexec/trtexec.cpp"

1 Save Engine to file

复制代码

 bool saveEngine(const ICudaEngine& engine, const std::string& fileName, std::ostream& err)

    
 {
    
     std::ofstream engineFile(fileName, std::ios::binary);
    
     if (!engineFile)
    
     {
    
         err << "Cannot open engine file: " << fileName << std::endl;
    
         return false;
    
     }
    
  
    
     TrtUniquePtr<IHostMemory> serializedEngine{engine.serialize()};
    
     if (serializedEngine == nullptr)
    
     {
    
         err << "Engine serialization failed" << std::endl;
    
         return false;
    
     }
    
  
    
     engineFile.write(static_cast<char*>(serializedEngine->data()), serializedEngine->size());
    
     return !engineFile.fail();
    
 }

2 Load Engine from file

复制代码

 TrtUniquePtr<nvinfer1::ICudaEngine> getEngine(const ModelOptions& model, const BuildOptions& build, const SystemOptions& sys, std::ostream& err)

    
 {
    
     TrtUniquePtr<nvinfer1::ICudaEngine> engine;
    
     if (build.load)
    
     {
    
     engine.reset(loadEngine(build.engine, sys.DLACore, err));//.trt file
    
     }
    
     else
    
     {
    
     engine.reset(modelToEngine(model, build, sys, err));//other file such as .onnx
    
     }
    
     if (!engine)
    
     {
    
     err << "Engine creation failed" << std::endl;
    
     return nullptr;
    
     }
    
     if (build.save && !saveEngine(*engine, build.engine, err))
    
     {
    
     err << "Saving engine to file failed" << std::endl;
    
     return nullptr;
    
     }
    
     return engine;
    
 }

2.1 Load Engine from .trt file

复制代码

 ICudaEngine* loadEngine(const std::string& engine, int DLACore, std::ostream& err)

    
 {
    
     std::ifstream engineFile(engine, std::ios::binary);
    
     if (!engineFile)
    
     {
    
     err << "Error opening engine file: " << engine << std::endl;
    
     return nullptr;
    
     }
    
  
    
     engineFile.seekg(0, engineFile.end);
    
     long int fsize = engineFile.tellg();
    
     engineFile.seekg(0, engineFile.beg);
    
  
    
     std::vector<char> engineData(fsize);
    
     engineFile.read(engineData.data(), fsize);
    
     if (!engineFile)
    
     {
    
     err << "Error loading engine file: " << engine << std::endl;
    
     return nullptr;
    
     }
    
  
    
     TrtUniquePtr<IRuntime> runtime{createInferRuntime(gLogger.getTRTLogger())};
    
     if (DLACore != -1)
    
     {
    
     runtime->setDLACore(DLACore);
    
     }
    
  
    
     return runtime->deserializeCudaEngine(engineData.data(), fsize, nullptr);
    
 }

2.1 Load Engine from model file (caffe,onnx)

复制代码

 ICudaEngine* modelToEngine(

    
     const ModelOptions& model, const BuildOptions& build, const SystemOptions& sys, std::ostream& err)
    
 {
    
     TrtUniquePtr<IBuilder> builder{createInferBuilder(gLogger.getTRTLogger())};
    
     if (builder == nullptr)
    
     {
    
     err << "Builder creation failed" << std::endl;
    
     return nullptr;
    
     }
    
     const bool isOnnxModel = model.baseModel.format == ModelFormat::kONNX;
    
     auto batchFlag = (build.maxBatch && !isOnnxModel) ? 0U : 1U
    
     << static_cast<uint32_t>(nvinfer1::NetworkDefinitionCreationFlag::kEXPLICIT_BATCH);
    
     TrtUniquePtr<INetworkDefinition> network{builder->createNetworkV2(batchFlag)};
    
     if (!network)
    
     {
    
     err << "Network creation failed" << std::endl;
    
     return nullptr;
    
     }
    
     Parser parser = modelToNetwork(model, *network, err);
    
     if (!parser)
    
     {
    
     err << "Parsing model failed" << std::endl;
    
     return nullptr;
    
     }
    
  
    
     return networkToEngine(build, sys, *builder, *network, err);
    
 }

复制代码

 Parser modelToNetwork(const ModelOptions& model, nvinfer1::INetworkDefinition& network, std::ostream& err)

    
 {
    
     Parser parser;
    
     const std::string& modelName = model.baseModel.model;
    
     switch (model.baseModel.format)
    
     {
    
     case ModelFormat::kCAFFE:
    
     {
    
     using namespace nvcaffeparser1;
    
     parser.caffeParser.reset(createCaffeParser());
    
     CaffeBufferShutter bufferShutter;
    
     const auto blobNameToTensor = parser.caffeParser->parse(
    
         model.prototxt.c_str(), modelName.empty() ? nullptr : modelName.c_str(), network, DataType::kFLOAT);
    
     if (!blobNameToTensor)
    
     {
    
         err << "Failed to parse caffe model or prototxt, tensors blob not found" << std::endl;
    
         parser.caffeParser.reset();
    
         break;
    
     }
    
  
    
     for (const auto& s : model.outputs)
    
     {
    
         if (blobNameToTensor->find(s.c_str()) == nullptr)
    
         {
    
             err << "Could not find output blob " << s << std::endl;
    
             parser.caffeParser.reset();
    
             break;
    
         }
    
         network.markOutput(*blobNameToTensor->find(s.c_str()));
    
     }
    
     break;
    
     }
    
     ...
    
 }

复制代码

 ICudaEngine* networkToEngine(const BuildOptions& build, const SystemOptions& sys, IBuilder& builder,

    
     INetworkDefinition& network, std::ostream& err)
    
 {
    
     TrtUniquePtr<IBuilderConfig> config{builder.createBuilderConfig()};
    
  
    
     IOptimizationProfile* profile{nullptr};
    
     if (build.maxBatch)
    
     {
    
     builder.setMaxBatchSize(build.maxBatch);
    
     }
    
     ...
    
     bool hasDynamicShapes{false};
    
     for (unsigned int i = 0, n = network.getNbInputs(); i < n; i++)
    
     {
    
     // Set formats and data types of inputs
    
     auto input = network.getInput(i);
    
     if (!build.inputFormats.empty())
    
     {
    
         input->setType(build.inputFormats[i].first);
    
         input->setAllowedFormats(build.inputFormats[i].second);
    
     }
    
     else
    
     {
    
         switch (input->getType())
    
         {
    
         case DataType::kINT32:
    
         case DataType::kBOOL:
    
             // Leave these as is.
    
             break;
    
         case DataType::kFLOAT:
    
         case DataType::kINT8:
    
         case DataType::kHALF:
    
             // User did not specify a floating-point format.  Default to kFLOAT.
    
             input->setType(DataType::kFLOAT);
    
             break;
    
         }
    
         input->setAllowedFormats(1U << static_cast<int>(TensorFormat::kLINEAR));
    
     }
    
  
    
     ...
    
  
    
     for (unsigned int i = 0, n = network.getNbOutputs(); i < n; i++)
    
     {
    
     // Set formats and data types of outputs
    
     auto output = network.getOutput(i);
    
     if (!build.outputFormats.empty())
    
     {
    
         output->setType(build.outputFormats[i].first);
    
         output->setAllowedFormats(build.outputFormats[i].second);
    
     }
    
     else
    
     {
    
         output->setAllowedFormats(1U << static_cast<int>(TensorFormat::kLINEAR));
    
     }
    
     }
    
  
    
     config->setMaxWorkspaceSize(static_cast<size_t>(build.workspace) << 20);
    
  
    
     if (build.fp16)
    
     {
    
     config->setFlag(BuilderFlag::kFP16);
    
     }
    
  
    
     if (build.int8)
    
     {
    
     config->setFlag(BuilderFlag::kINT8);
    
     }
    
  
    
     auto isInt8 = [](const IOFormat& format) { return format.first == DataType::kINT8; };
    
     auto int8IO = std::count_if(build.inputFormats.begin(), build.inputFormats.end(), isInt8)
    
     + std::count_if(build.outputFormats.begin(), build.outputFormats.end(), isInt8);
    
  
    
     if ((build.int8 && build.calibration.empty()) || int8IO)
    
     {
    
     // Explicitly set int8 scales if no calibrator is provided and if I/O tensors use int8,
    
     // because auto calibration does not support this case.
    
     setTensorScales(network);
    
     }
    
     else if (build.int8)
    
     {
    
     config->setInt8Calibrator(new RndInt8Calibrator(1, build.calibration, network, err));
    
     }
    
  
    
     if (build.safe)
    
     {
    
     config->setEngineCapability(sys.DLACore != -1 ? EngineCapability::kSAFE_DLA : EngineCapability::kSAFE_GPU);
    
     }
    
  
    
     if (sys.DLACore != -1)
    
     {
    
     ...
    
         config->setDefaultDeviceType(DeviceType::kDLA);
    
         config->setDLACore(sys.DLACore);
    
         config->setFlag(BuilderFlag::kSTRICT_TYPES);
    
  
    
         if (sys.fallback)
    
         {
    
             config->setFlag(BuilderFlag::kGPU_FALLBACK);
    
         }
    
         if (!build.int8)
    
         {
    
             config->setFlag(BuilderFlag::kFP16);
    
         }
    
     ...
    
     }
    
  
    
     return builder.buildEngineWithConfig(network, *config);
    
 }

全部评论 (0)

还没有任何评论哟~

[TensorRT Sample Code] How to Save Engine and Load Engine from file

IntheTensorRTSampleTensorRT7.0.0.11/samples/trtexec/trtexec.cpp 1SaveEnginetofile boolsaveEnginecons...

Save and load data from CSV to Eigen data

include<iostream include<eigen3/Eigen/Dense include<fstream include<vector usingnamespaceEigen; usin...

Cadence: How to save voltage and current signals through a file?

Presimulationsettingfile: 保存电感电容instance的结点电流：电感和电容的结点是按数字1/2等标记的，即使电感端口名字叫PLUS，也不能使用L1:PLUS；instan...

How to Save for Your Career And Family

作者：禅与计算机程序设计艺术 1.简介 2020年伊始，新冠病毒疫情席卷全球，全球金融、房地产、运输、教育、医疗等行业陷入瘫痪。很多人为了生计、养老、收入，不得不考虑如何快速转移到其他领域。在这个关键...

How to programmatically Download a file from Google Drive, using Javascript and HTML?

题意：如何使用JavaScript和HTML以编程方式从GoogleDrive下载文件？问题背景： Goal:目标 1. InmyChromeBrowser,openthisPublicGoogle...

TensorRT创建Engine并推理engine

NVIDIATensorRT是一个高性能的深度学习推理库，专为部署神经网络模型而设计。TensorRT通过优化和高效的内存管理来提高模型的推理速度，从而提高整体应用程序的性能。

Error code: 0x80004005 The Microsoft Access database engine cannot open or write to the file ''

前两天做了一个SSIS的Package，用来循环Excel然后倒入到数据库。在开发环境可以正常工作，但是真正部署到SQLAgent后发现Job一直失败。打开JobHistory看到下面的错误： De...

如何从EXCEL文件加载Hierarchy到BW (How to Load Hierarchy From Flat File)

BW7.0中提供从文件导入Hierarchy的功能,其具体操作步骤如下： 1、创建InfoObject 首先创建需要的infoObject,ZORG,,选择InfoArea,点击右键CreateInf...

How to connect to WIFI from a browser with Javascript and PHP?

题意：如何通过浏览器使用JavaScript和PHP连接到WIFI？问题背景： IworkingoncreatingaLinuxDigitalsignageBox,whichmyclientsca...

How to use AWS IoT rule engine locally at AWS IoT greengrass?

题意：如何在AWSIoTGreengrass中本地使用AWSIoT规则引擎？问题背景： 1. IsthereawaytouseAWSIoTruleenginelocallyatAWSIoTgreen...

是否确定退出登录?

[TensorRT Sample Code] How to Save Engine and Load Engine from file

全部评论 (0)

相关文章推荐

[TensorRT Sample Code] How to Save Engine and Load Engine from file

Save and load data from CSV to Eigen data

Cadence: How to save voltage and current signals through a file?

How to Save for Your Career And Family

How to programmatically Download a file from Google Drive, using Javascript and HTML?

TensorRT创建Engine并推理engine

Error code: 0x80004005 The Microsoft Access database engine cannot open or write to the file ''

如何从EXCEL文件加载Hierarchy到BW (How to Load Hierarchy From Flat File)

How to connect to WIFI from a browser with Javascript and PHP?

How to use AWS IoT rule engine locally at AWS IoT greengrass?