TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance
发布时间
阅读量:
阅读量
文章目录
-
前言
-
一、摘要(abstract)
-
二、引言(Introduction)
-
- 1.引入库
- 2.读入数据
-
总结
前言
TAT-QA: A Question Answering Benchmark on a Hybrid of Tabular and Textual Content in Finance是2021年5月发表在ACL上的文章。改文章主要介绍针对基于金融领域表格(Tabular)和文本(Textual)混合(Hybrid)(即结构化和非结构化混合数据)的数据进行问题回复的研究。
文章获取链接: 论文下载链接.
一、摘要(abstract)
在论文摘要中,作者介绍了现有的研究,忽视了混合数据的问题回答(QA)。
本文的创新工作,1、从实际财务报告中抽取样本,构建一个包含表格和文本的大型QA数据集,命名为 TAT-QA。2、为了对表格数值进行推理,本文提出了一个新的模型TAGOP。
数据集获取链接: TAT-QA下载链接.
二、引言(Introduction)
1.引入库
代码如下(示例):
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import ssl
ssl._create_default_https_context = ssl._create_unverified_context
AI写代码
2.读入数据
代码如下(示例):
data = pd.read_csv(
'https://labfile.oss.aliyuncs.com/courses/1283/adult.data.csv')
print(data.head())
AI写代码
该处使用的url网络请求的数据。
总结
提示:这里对文章进行总结:
例如:以上就是今天要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。
全部评论 (0)
还没有任何评论哟~
