伊振中分享 http://blog.sciencenet.cn/u/yizhenzhong 关注复杂网络理论在管理经济系统中的应用。山东的同行与我联系!

博文

省级区域知识元超网络的建模步骤

已有 2824 次阅读 2010-5-7 10:03 |个人分类:研究笔记|系统分类:科研笔记|关键词:学者

用了两天的时间研读完了于洋的博士论文《组织知识管理中的知识超网络研究》,再结合我对区域高层次科教人才网络建设及政策选择的一些思考,有点想法,记录下来。我想,我这样的记录对于一些像我这样的新手来讲还是很有帮助的。这篇博文主要谈如何完成第一步:网络建模。

1 于洋的论文中提出了一套完整的针对一般组织如何完成知识元网络及包括人员、知识物质载体在内的知识超网络的网络建模步骤和方法,但对于省域这样规模的知识网络建模由于数据量太大,无法按照于洋的思路顺利完成网络建模。经过思考,我想按照以下的思路和步骤完成区域知识网络的网络建模。

a 超网络的选择:对于一个小型的组织来讲,可能会关心知识的具体物质载体或者发布形式,特别是在具体的知识管理过程中,但对于省级区域甚至国家层面的知识网络建模来讲,这样的物质载体形式可能显得不那么重要。因此,在省域知识超网络的建模过程中可以把物质载体这个元素去掉,只建立知识元网络,对应的人才网络和以上两种网络结合的知识超网络就能够满足分析要求了。这样一来,将大大减少数据的数量。

b知识元的选择:在于洋的文章中,对于知识元进行了比较详细的分析,甚至又把比知识元更微观的知识核层次也进行了讨论。对于知识元本身是使用了文本挖掘的技术进行相应的挖掘和分词处理。这在小的样本空间内或许是可以完成的,但在省级区域的知识元网络分析中,数据量就实在是太庞大了,那很可能是一个天文数量级的。为了减少数据量,可以直接把文章的关键词进行相应的规整,把关键词作为知识元就可以了。就算是这样,数据量也会是非常庞大的,因为关键词虽人员数量的增长集合式增长。为了解决这个问题,需要进行下一步。

c省域高端科教人才的网络建模:按照文献统计学里面的洛特卡定律,科技生产力的分布也就是人员与发表文章的数量之间的关系符合幂率分布,也就是说很少的人发表的文章数量占据了全部人员发表文章数量的绝大多数,这在复杂网络看来就是符合无标度特征。因此,如果能够完成区域高端科教人才的网络建模,就能找出其中存在的节点度比较高的节点。把这些高度值节点的论文关键词可以作为一个省级区域知识元网络的节点。这样就可以把很多在领域中没有影响力或者处于从属低位的科研人员,或者干脆说,包括跟风研究和抄袭等在内的低质量文章或者作者剔除出知识元网络之外。(省级区域高端科教人才的科研成果可以粗略分为两个部分:一是发表的文章,二是专利。这两方面的数据都有可靠的数据来源,都有公开的数据库)

d知识元网络建模:在c步骤的基础上,找出对于一个省域能够产生影响的科研人员节点(估计像山东省这样的区域,保留这样的节点1000个左右甚至更少就能说明问题,因为研究对象是高端人才,是可以产生以点带面影响的科研岗位或者领域),从数据库中收集这些人员的知识元(文章和专利的关键词)就可以完成区域知识存量的网络建模工作。还要说明的是,在每个人员的文章或者专利中也不见得就是所有出现的关键词都可以算是他的知识元,思路还是和对人才节点的去除一样,针对每一个人员可以依据一定的技术手段去除影响力低的关键词,找出他们在学术或科研上有影响力的关键关键词。这样也可以删除掉很大一部分不必要的数据。

e建立知识元(关键词)与科研人员之间的超网络:有了c和d,这个超网络的建立就容易了。以后的分析步骤及内容有时间再写。

f 建模软件的选择:在于洋的论文中可以很明显的看到,数据量相对较小,就算是这样,也已经基本超出ucinet的数据处理能力了。因此,选取合适的建模软件就非常重要了。在我有限的知识里,matlab,igraph都可以成为选择。昨天看到的关于idl的介绍能否成为网络建模软件的选择之一,还需要探讨。

2 其他的一些问题,包括分析内容如专有知识和共有知识的计算和衡量、知识的深度和广度的计算和衡量,相似性算法等有时间再写吧。

 



https://m.sciencenet.cn/blog-440200-320913.html

上一篇:大连理工大学系统工程研究所
下一篇:省级区域人才网络的分析内容、过程及结果述评

1 haotao

发表评论 评论 (3 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 11:33

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部