Advertisement

TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance

阅读量:

文章目录

  • 前言

  • 一、摘要(abstract)

  • 二、引言(Introduction)

    • 1.引入库
    • 2.读入数据
  • 总结


前言

TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance是2021年5月发表在ACL上的文章。改文章主要介绍针对基于金融领域表格(Tabular)和文本(Textual)混合(Hybrid)(即结构化和非结构化混合数据)的数据进行问题回复的研究。
文章获取链接: 论文下载链接.


一、摘要(abstract)

在论文摘要中,作者介绍了现有的研究,忽视了混合数据的问题回答(QA)。
本文的创新工作,1、从实际财务报告中抽取样本,构建一个包含表格和文本的大型QA数据集,命名为 TAT-QA。2、为了对表格数值进行推理,本文提出了一个新的模型TAGOP。
数据集获取链接: TAT-QA下载链接.

二、引言(Introduction)

1.引入库

代码如下(示例):

复制代码
    import numpy as np
    import pandas as pd
    import matplotlib.pyplot as plt
    import seaborn as sns
    import warnings
    warnings.filterwarnings('ignore')
    import  ssl
    ssl._create_default_https_context = ssl._create_unverified_context
    
    
      
      
      
      
      
      
      
      
    
    AI写代码

2.读入数据

代码如下(示例):

复制代码
    data = pd.read_csv(
    'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
    print(data.head())
    
    
      
      
      
    
    AI写代码

该处使用的url网络请求的数据。


总结

提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。

全部评论 (0)

还没有任何评论哟~