科学网

 找回密码
  注册

tag 标签: 数据预处理

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

python学习——根据矩阵文件构造网络文件
LImetrics 2019-2-20 22:13
【python学习——根据矩阵文件构造网络文件】 源代码以及测试数据文件 convert_matrix_to_list.py test_matrix.xlsx 初始矩阵文件 经处理后的文件 1.导入相应的库以及读取数据 importpandasaspd importnumpyasnp data=pd.read_excel(C:/Users/test_matrix.xlsx,index_col=国家/地区) data.head() 2.构造第一列数据,即边列表的起始边 #x= #y= ]*2foriinrange(len(x))] #t= #t #data.shape 计算列数 #data.shape 计算行数,也可用len(data),更快 index_list=data.index.tolist() combine_list= ]*data.shape foriinrange(len(index_list))] #将多个了列表进行合并 start_list= 3.构造第二列数据,即边列表的终止边 # columns_list=data.columns.tolist() end_list=columns_list*data.shape 4.构造第三列数据,即边的权重 data_values_list=np.reshape(data.values,data.shape *data.shape ) 5.将列表转化为数据框 edge_list={'start_list':start_list, 'end_list':end_list, 'values_list':data_values_list} #data_new=pd.DataFrame(edge_list,index=start_list)重新设置索引 data_new=pd.DataFrame(edge_list) data_new.head() 6.根据相应的条件进行数据的筛选 #多条件筛选数据 #df.loc ==some_value)df .isin(some_values)] selected_data=data_new.loc =5]#筛选出阈值大于等于5的边。 selected_data.head() #data_new.to_excel(new_data.xlsx) 7.将处理好的数据导出到excel中 selected_data.to_excel(selected_data.xlsx)
个人分类: python学习|5904 次阅读|0 个评论
python 27 中利用pandas处理数据
wuxiaolananhui 2018-9-28 09:45
在第一次读取xls数据时老是出现错误,ImportError: Install xlrd >= 0.9.0 for Excel support,需要另外安装xlrd pip install xlrd, 然后调用就df = pd.read_excel(\'log.xls.xls\')OK了
2886 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-29 19:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部