Python生物信息学数据管理——第7、8章课后习题

阅读量：

#新手参考

复制代码

    #添加一列平均消光值
    table = [
    ['protein', 'ext1', 'ext2', 'ext3'],
    [0.16, 0.038, 0.044, 0.040],
    [0.33, 0.089, 0.095, 0.091],
    [0.66, 0.184, 0.191, 0.191],
    [1.00, 0.280, 0.292, 0.283],
    [1.32, 0.365, 0.367, 0.365],
    [1.66, 0.441, 0.443, 0.444]
    ]
    title=table[0]
    table = table[1:]
    title.append('average_ext')
    protein, ext1, ext2, ext3 = zip(*table)
    average_ext=[round(sum(tup)/3,2)  for tup in zip(ext1,ext2,ext3)]
    q=tuple(average_ext)
    opq=zip(protein,ext1,ext2,ext3,q)
    table=[]
    table.append(title)
    for line in opq:
    table.append(list(line))
    for line in table:
    for item in line:
        print(item,end='\t')
    print('')

7.2将7.2.2的示例代码中出现的表转化为一个嵌套字典的列表

复制代码

    table = [
    ['protein', 'ext1', 'ext2', 'ext3'],
    [0.16, 0.038, 0.044, 0.040],
    [0.33, 0.089, 0.095, 0.091],
    [0.66, 0.184, 0.191, 0.191],
    [1.00, 0.280, 0.292, 0.283],
    [1.32, 0.365, 0.367, 0.365],
    [1.66, 0.441, 0.443, 0.444]
    ]
    ls=[]
    key=table[0]
    for row in table[1:]:
    entry={key[0]:row[0],key[1]:row[1],key[2]:row[2],key[3]:row[3]}
    ls.append(entry)
    print(ls)

7.3从文本文件读取矩阵

复制代码

    table = []
    for line in open('similarity.txt'):
    table.append(line.strip().split('\t'))
    table[0].insert(0,'')
    for line in table:
    for item in line:
        print(item,end='\t')
    print('')

7.4RNA序列的相似性

复制代码

    table = []
    for line in open('similarity.txt'):
    table.append(line.strip().split('\t'))
    table[0].insert(0,'')
    seq1='AGCAUCUA'
    seq2='ACCGUUCU'
    similarity=0
    for base1,base2 in zip(seq1,seq2):
    num1= 'AGCU'.find(base1)
    num2= 'AGCU'.find(base2)
    similarity += eval(table[num1+1][num2+1])
    print(similarity)

7.5选择性打印表的列和行

复制代码

    table = [
    ['protein', 'ext1', 'ext2', 'ext3'],
    [0.16, 0.038, 0.044, 0.040],
    [0.33, 0.089, 0.095, 0.091],
    [0.66, 0.184, 0.191, 0.191],
    [1.00, 0.280, 0.292, 0.283],
    [1.32, 0.365, 0.367, 0.365],
    [1.66, 0.441, 0.443, 0.444]
    ]
    ls=[]
    key=table[0]
    for row in table[1:]:
    entry={key[0]:row[0],key[1]:row[1],key[2]:row[2],key[3]:row[3]}
    ls.append(entry)
       
    #对嵌套列表进行处理
    print(table[1])
    for line in table:
    print(line[0],end=',')
    print('\n')
    #对嵌套字典进行处理
    print(ls[1])
    for line in ls:
    print(line['protein'],end=',')

8.1按第二列对表排序

复制代码

    table = [
    ['protein', 'ext1', 'ext2', 'ext3'],
    [0.16, 0.038, 0.044, 0.040],
    [0.66, 0.184, 0.191, 0.191],
    [0.33, 0.089, 0.095, 0.091],
    [1.32, 0.365, 0.367, 0.365],
    [1.00, 0.280, 0.292, 0.283],
    [1.66, 0.441, 0.443, 0.444]
    ]
    table1=table[1:]
    table_sorted=sorted(table1,key=lambda x:x[1])
    fo=open('table_sorted','w')
    fo.write(','.join(table[0])+'\n')
    for line in table_sorted[0:2]:
    line=[str(x) for x in line]
    fo.write(','.join(line)+'\n')
    fo.close()

8.2按序列长度排序

复制代码

    fo=open('SwissProt.fasta','r')
    fi=open('result.fasta','w')
    seq=''
    ls=[]
    for line in fo:
    if line[0]=='>' and seq=='':
        header=line
    elif line[0]!='>':
        seq+=line.strip()
    else:
        ls.append([header,seq,len(seq)])
        seq=''
        header = line
    ls.append([header,seq,len(seq)])
    ls=sorted(ls,key=lambda x:x[2])
    for item in ls:
    fi.write(item[0])
    for i in range(len(item[1])//60):
        fi.write(item[1][60*(i+1)-60:60*(i+1)]+'\n')
    fi.write(item[1][60*(i+1):]+'\n')
    fi.close()
    fo.close()

8.3Excel文件中的排序

复制代码

    from operator import itemgetter
    fo=open('PDB.txt','r')
    fi=open('PDB_sorted.txt','w')
    ls=[]
    for line in fo:
    line=line.replace('"','')
    ls0=line.strip().split(',')
    ls.append(ls0)
    ls_1=ls[0]
    ls_2=ls[1:]
    for line in ls_2:
    line[-1]=eval(line[-1])
    line[-2] = eval(line[-2])
    ls_sorted=sorted(ls_2,key=itemgetter(4,3,2,1,0))
    fi.write(','.join(ls_1)+'\n')
    for line in ls_sorted:
    line=[str(x) for x in line]
    fi.write(','.join(line)+'\n')
    fo.close()
    fi.close()

8.4按字母顺序对FASTA序列记录排序

复制代码

    fo=open('SwissProt.fasta','r')
    fi=open('result.fasta','w')
    seq=''
    ls=[]
    for line in fo:
    if line[0]=='>' and seq=='':
        header=line
        AC=line.split('|')[1]
    elif line[0]!='>':
        seq+=line
    else:
        ls.append([AC,header,seq])
        seq=''
        header = line
        AC = line.split('|')[1]
    ls.append([AC,header,seq])
    ls=sorted(ls,key=lambda x:x[0])
    for item in ls:
    fi.write(item[1])
    fi.write(item[2])
    fi.close()
    fo.close()

8.5按升序根据e-value对BLAST输出排序

复制代码

    from operator import itemgetter
    input_file = open("BlastOut.csv")
    output_file = open("BlastOutSorted.csv", "w")
    table = []
    for line in input_file:
    col = line.split(',')
    col[-2] = float(col[-2])
    table.append(col)
    table_sorted = sorted(table, key=itemgetter(-2))
    for row in table_sorted:
    row = [str(x) for x in row]
    output_file.write("\t".join(row) + '\n')
    input_file.close()
    output_file.close()

全部评论 (0)

还没有任何评论哟~

Python生物信息学数据管理——第7、8章课后习题

初学小白，仅供参考 7.1在7.2.2的示例代码中出现的表里添加一行平均浓度或消光值并打印添加一列平均消光值 table=[ ['protein','ext1','ext2','ext3'], [0...

Python生物信息学数据管理——第3、4章课后习题

初学小白，仅供参考 3.1读取和写入文件 fo=open'neurondata.txt','r' fi=open'neurondata副本.txt','w' txt=fo.read fi.writet...

Python生物信息学数据管理——第11、12章课后习题

初学小白，仅供参考 11.1/2/3创建一个类，从类中创建对象，让类可以打印 classChannel: definitself,name,code,phi,psi: self.code=code s...

Python生物信息学数据管理——第5、6章课后习题

初学小白，仅供参考 5.1一个简单的字典 dict0='UAA':'Stop','UAG':'Stop','UGA':'Stop','AUG':'Start','GGG':'Glycin' 5.2对起...

Python生物信息学数据管理——第9、10章课后习题

1检测二硫键模式 importre fo=open'genome.fasta','r' 把多序列文件整成字典格式，并使序列连贯起来 txt=fo.readlines flag=True seq='' ...

Python生物信息学数据管理——第1、2章课后习题

初学小白，仅供参考 1.1计算所有三种组织中的ΔG值 importmath defdetlaGATP,ADP,Pi: R=0.00831 T=298 deltaG0=30.5 returndeltaG...

[《python生物信息学数据管理》解读——第一章 python shell

1.1本章知识点如何把pyhton操作系统外壳（shell）用作科学计算器如何计算ATP水解的△G 如何计算两点间的距离如何创建自己的python模块 1.2案例：计算ATP水解的△G ATP→...

python生物信息学数据管理第20章_Python生物信息学数据管理生命科学与信息技术丛书pdf,9787121303821...

编辑推荐适读人群：本书除可以作为高等院校生物信息、生物系的高年级学生和研究生的编程教材之外，对于从其他学科如数学、物理、计算机等转到生物信息领域工作的广大科研人员和高校学生也可起到参考作用。生命科...

生物信息学python脚本_Python生物信息学数据管理

内容简介本书实例意在解决生物学问题，通过编程技法”的形式，涵盖尽可能多的组织、分析、表现结果的策略。在每章结尾都会有为生物研究者设计的编程题目，适合教学和自学。

管理信息系统第七版第11章课后习题

1.请为DSS做简要的特征描述。 DSS是以信息技术为手段，应用决策科学及有关学科的理论与方法，以人机交互方式辅助决策者解决半结构化和非结构化的决策问题的信息系统。 2.请简述DSS中人机对话子系统的...

是否确定退出登录?

Python生物信息学数据管理——第7、8章课后习题

全部评论 (0)

相关文章推荐

Python生物信息学数据管理——第7、8章课后习题

Python生物信息学数据管理——第3、4章课后习题

Python生物信息学数据管理——第11、12章课后习题

Python生物信息学数据管理——第5、6章课后习题

Python生物信息学数据管理——第9、10章课后习题

Python生物信息学数据管理——第1、2章课后习题

[《python生物信息学数据管理》解读——第一章 python shell

python生物信息学数据管理第20章_Python生物信息学数据管理 生命科学与信息技术丛书pdf,9787121303821...

生物信息学python脚本_Python生物信息学数据管理

管理信息系统 第七版 第11章 课后习题

python生物信息学数据管理第20章_Python生物信息学数据管理生命科学与信息技术丛书pdf,9787121303821...

管理信息系统第七版第11章课后习题