Advertisement

统计数据集标签的数量(xml标签文件)

阅读量:

数据集划分的txt文件

一般在 ImageSets 目录下

在这里插入图片描述
在这里插入图片描述

xml标签文件

在这里插入图片描述

xml文件内容

在这里插入图片描述

完整代码

复制代码
    import xml.etree.ElementTree as ET #导入xml模块
    import pickle
    import os
    import glob
    from os import listdir, getcwd
    from os.path import join
    
    test_dir='E:/tx/tx200929-30-data/20m/20m-cut/ImageSets/test.txt'
    train_dir='E:/tx/tx200929-30-data/20m/20m-cut/ImageSets/train.txt'
    trainval_dir='E:/tx/tx200929-30-data/20m/20m-cut/ImageSets/trainval.txt'
    
    xml_dir='E:/tx/tx200929-30-data/20m/20m-cut/Test_annotations/'#保存xml文件的路径
    
    xml_index = open(test_dir).readlines()
    print(len(xml_index))#计算测试集的xml文件的数量
    
    nums=0
    k=0
    for i in range(len(xml_index)):
    index=xml_index[i].strip('\n')#截取xml文件名
    #print(xml_dir+index+'.xml')
    xml_file=open(xml_dir+index+'.xml')
    xml=ET.parse(xml_file)
    
    for name in xml.iter('object'):
        nums=nums+1
        if name.find("name").text=='1': #按标注的标签名进行统计           
            k=k+1          
            xml_file.close()           
                
    print("标签为1的个数:",k)       
    print("\n总标签数目:",nums)
    
    
    
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
      
    
    代码解读

全部评论 (0)

还没有任何评论哟~