Advertisement

python遍历文件夹下所有excel文件_读取某文件夹下所有excel文件 python

阅读量:

import os

import pandas as pd

from sklearn import linear_model

path = r'D:\新数据\每日收益率'

filenames = os.listdir(path)

for filename in filenames:

print(filename)

for i in filenames:

excel_path = 'D:\新数据\每日收益率\ ' + i

f = open(excel_path,'rb')

通过使用pandas库中的read_excel函数实现对该特定Excel文件的导入

data['time'] = data.index

data = data.reset_index(drop = True)

data1 = data.iloc[0:110,]#估计窗口的真实收益率

data2 = data.iloc[110:,]#事件窗口的真实收益率

feature = data.columns.tolist()

feature.remove('time')

feature.remove('000300')#沪深300指数

dfR = pd.DataFrame(data2['time'])

dfAR = pd.DataFrame(data2['time'])

for m in feature:

regr=linear_model.LinearRegression()

regr.fit(data1['000300'].values.reshape(-1, 1),data1[m].values.reshape(-1, 1))

y_pred1 = regr.predict(data2['000300'].values.reshape(-1, 1))#事件窗口的预期收益率

AR = data2[m].values.reshape(-1, 1) - y_pred1 # 使用 reshape 方法将 data2[m] 的值重塑为 (-1, 1) 维数组与 y_pred1 的差值即为真实收益率减去预期收益率的结果即为该事件窗口期间的超额收益

dfR[m] = y_pred1#预期收益率

dfAR[m] = AR #超额收益率

save_path1 = 'D:\新数据\日预期收益率\ ' + i

save_path2 = 'D:\新数据\日超额收益率\ ' + i

dfR.to_excel(save_path1,index=False)

dfAR.to_excel(save_path2,index=False)

如何用VBA代码依次打开文件夹下的Excel文件

Public Function Check() As Variant On Error Goto erlb Dim StrDir As String Define string variable StrDir and assign its value to T...

[R语言]读取文件夹下所有子文件夹中的excel文件,并根据分类合并。

使用PHP提取网页源代码,并将其导出为TXT文本;解析XLS文档;获取包含在该目录中的所有文件名

全部评论 (0)

还没有任何评论哟~