很多医学文献计量分析采用PUBMED/MEDLINE数据库中的医学主题词(MESH)作为分析依据,根据主题词的词频来确定研究热点和趋势分析等。有几个问题应该注意,在分析和讨论中最好予以说明。
1 主题词是人工受控语言,词量的控制有一定人为性。
2 数据库的主题标引深度是预先人为确定的,MEDLINE数据库的标引深度为平均每篇文献12个主题词。
3 文献标引有漏标引和误标引的问题,组配标引也有漏组配和误组配的问题,特别是文献中的重要主题概念被漏标引或误标引。MEDLINE数据库一直是由标引员人工标引的,虽然标引质量很好,但也有一定的标引误差存在。
4 标引的一致性问题,MEDLINE数据库的主题标引一致性,主题词标引一致性为62%;主题词与副主题词组配标引的一致性为48%。
5 从科研结束----论文发表----数据库收录到主题标引需要1-2年时间,因此主题词分析不能准确反映研究热点或动态趋势。
最好采用自然语言(关键词,文本词)进行文献计量分析,或主题词与关键词分别比较分析,看看分析结果有多大差别。
https://m.sciencenet.cn/blog-280034-576671.html
上一篇:
SCI 数据库文献计量分析的局限性下一篇:
女性乳腺癌与上夜班关系密切