科学网

 找回密码
  注册

tag 标签: 数据导入

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

EndNote:(四)EndNote数据导入之其他文献导入方法
yutingtuzi2008 2015-12-30 09:17
EndNote在线库检索导入 纸质期刊、书籍导入 PDF导入
个人分类: 工具应用|5609 次阅读|0 个评论
EndNote:(三)EndNote数据导入之中文期刊数据库
yutingtuzi2008 2015-12-30 08:45
一、CNKI数据库 二、维普数据库 三、万方数据库 四、Google Scholar
个人分类: 工具应用|2906 次阅读|0 个评论
[转载]数据导入/导出的通用方法
cs2bioinfor 2011-10-31 14:08
有 人对数据的导入 / 导出产生疑问,比如 SPSS 怎样导进 LISREL ,或是 SAS 怎样导进 Stata ,或是 Excel 怎样导进 R ,等等。其实一般情况下这种问题并不是什么大问题,我们总是被软件蒙蔽,猜不透数据文件背后究竟是什么,或者根本没有想过文件里面究竟是什么。我对计算机文件的机制了解并不多,我只知道两种基本的格式: ASCII 格式(或纯文本格式)以及二进制格式。后者是经过某种规则编码了的,所以用纯文本编辑器打开一般看不到内容,而前者就简单多了,用任何纯文本编辑器(如记事本)都可以打开看。 纯 文本格式是几乎任何软件都支持读写的,因此它可以成为软件之间互相 “ 沟通 ” 的桥梁。比如 Excel 可以另存为 CSV 文件,然后由 R 用 read.csv() 读进来或者由 SPSS 的 Read Text Data 导进去,等等。所以一般情况下通过纯文本文件行事就足够了。 统 计数据的形式一般都是二维表格,行为观测,列为变量;纯文本数据中当然要想办法将行列用一定的标志区分开来。对于行,当然就是换行符(例如回车),这没什么好说的,用编辑器打开看到就是一行一行的;对于列,则稍有不同,这就涉及到分隔符( separator / delimiter )的问题了,它们的作用就像是 Excel 或者其它表格软件中的网格线一样,将一列一列分隔开来,每一列对应一个变量,分隔符可以是任何字符,但常见的一般是逗号( , )或者制表符( \t , Tab )。所谓 CSV 文件,也就是以逗号为分隔符的纯文本文件,我们可以将 Excel 数据存为 CSV 格式,然后用记事本打开看看就明白了。 Windows 下 CSV 文件( *.csv )的图标一般是 Excel 的图标,其实这是很具有误导性的, CSV 与 Excel 毫无关系,只是纯文本文件的一种而已。 这 是关于数据的很基础的知识,但我发现很多人并不明白。怪哉。纯文本文件之外的统计数据我通常推荐采用专门的数据库作为存储工具(尤其是支持 SQL 的数据库),而不是 Excel 或 SPSS 等软件,用数据库捣腾数据一方面比那些看起来易用的 Excel 或 SPSS 更高效,另一方面也比较安全。
个人分类: 生物信息学|3852 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 10:07

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部