inforworld分享 http://blog.sciencenet.cn/u/rbwxy197301 教学和科研过程中的心得。

博文

一个数据处理程序

已有 6063 次阅读 2013-4-29 10:27 |个人分类:信息资源建设|系统分类:科研笔记|关键词:学者| 数据处理程序

  在做教育部项目的过程中,委托安徽财经大学盛鹏飞同学编制了一个小程序。这个小程序的功能是可以把从CNKI等数据库中获取的数据进行自动处理,如生成一个共词矩阵。有几位同行曾向我索要这个程序,与盛鹏飞同学沟通之后,他同意把程序公开,与大家分享。

   下面将本程序使用的环境及使用方法简要说明,与大家分享。希望大家使用时能够注明,本程序由安徽财经大学盛鹏飞同学开发。如果大家对这个程序有什么问题,我会和盛鹏飞同学沟通,然后改进程序。

   一、程序的使用环境:

   (1)python2.7。高版本的python本程序不能正常运行。

   (2)建议office2007以上。office2003及以下版本,只能处理的256个节点。

   二、程序功能

   本程序可以将原始数据直接处理为UCINET等程序需要的矩阵。下面原始数据中的A、B、C等可以是关键词,中间用分号(半角)隔开。生成的共现矩阵直接是一个excel文档。excel文档当中的数据直接可以复制到UCNIET的表中,然后可以利用它进行定量分析,或是绘制出共现网络图。


*原始数据如下:

A;B;C;D

B;C;D

A;C;D

B;C;E

A;D;E

*共现矩阵如下:

 A C B E D

A 3 2 1 1 3

C 2 4 3 1 3

B 1 3 3 1 2

E 1 1 1 2 1

D 3 3 2 1 4


   三、程序的使用

   (1)用word打开附件中的org文档,然后把从CNKI等获取的数据简单处理(关键词之间用分号隔开)后,保存即可。要处理新的数据时,直接在文档中把原来的数据替换就可以。

   (2)打开python2.7,然后运行程序MyIndex.new。程序运行结束之后,会自动将处理结果保存在org.output文档中。

   (3)用EXCEL打开org.output,就可以看到一个共现矩阵数据。

   (4)用UCINET等工具对共现矩阵数据进行进一步的处理分析。


MyIndex.new.py

org

org.output


    欢迎大家在使用过程中提出宝贵意见,我们将尽力对其进行完善。



https://m.sciencenet.cn/blog-113146-685032.html

上一篇:数据存储单位
下一篇:Fatality Analysis Reporting System (FARS)

8 武夷山 姜春林 章成志 刘宇 李小涛 支丽平 李立 rosejump

该博文允许注册用户评论 请点击登录 评论 (7 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-16 14:55

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部