科学网 › 标签 › 数据

标签: 数据

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

信息的定义: accsys 2009-11-15 09:04; 如今，信息这个词用得非常之广。什么是信息？上世纪80年代，我在讲课中就给出过：信息是事物的表现或描述。后来，我将这个定义写入我撰写的书中，长时间来倒也未听到有人反对。其实，我很想找人讨论，利用博客既方便，又快捷，何乐而不为？事物是指世间的万事万物，表现或描述是事物存在的基本特征，信息体现了事物之间的相互作用。因为信息是表现或描述，故而，信息可以存储、复制、传播、由简单到复杂地综合、从复杂到简单地分析，这些是信息的属性。人为地进行信息属性方面的工作，就称为信息处理。信息搜集和查询是信息处理的大众化说法而已。数据是待处理的信息。信息的度量必须根据其具有的基本属性来进行。信息概念起源于通信学问题，从人类通信的角度来看，同一个消息，对受信者有知晓程度之分，故香浓前辈将信息量定义为未知程度的量度。显然，这种度量信息的方法，并没有一把统一的尺子，具有不客观性。计算机的出现，使信息的度量有了客观的，统一的尺子。由于在计算机领域中，用二进制数可以表示一切信息，因而，信息量的大小就可以用二进制数表示的位长来量度。这种量度不会因人而异，不必再通过通信的方式才能度量，所以客观实在，目前被人们普遍接受了。信息有许多属性，按着某一种属性都可以产生一种度量方法，就如同物体一样，你可以按照它的质量来量度它，也可以按照它的体积来量度。究竟我们要采用何种方式度量信息，这跟对信息的需求有关。在计算机科学中，以bit作为信息量的基本单位，统一量度大有好处。 2009-11-15; 个人分类: 随笔|4395 次阅读|2 个评论

测光-作光变曲线图总结: dabing 2009-11-7 22:48; 根据已知的数据画光变曲线的总结第一阶段： 1、把相应要用到的五个数据源（expt、flist、res.dat、utime、coord.dat）整理出来； 2、修改coord.dat。根据XX网络已知星的参数，选取与目标星参数比较接近的星作比较星，删除coord.dat文件前面的信息，将比较星提前(可选9颗提前)。 3、修改expt。根据程序中读取的数值，需更改格式如（EXPTIME = 20.000000这之间的空格应与程序的读出位置一致） 4、修改res.dat。根据程序中读取的数值，需更改格式。如（QXAnd_B_0000.fit 284.282 186.516 14.493 0.009）第二阶段： 1、建立相应的数据存放文件，将an文件下的（sofe pag）中的fortran程序拷入其中； 2、得出的五个数据源拷入刚建立的目录中； 3、修改程序，编译读出数据（主要用到fmtlst.f 和 getlcc.f，要会读其中的变量，学会改数据）。 4、编译plot.f。应与pgplot建立起相应的环境变量操作如下： sudo gfortran -o plot plot.f -L/usr/local/pgplot -L/usr/local/X11R6/lib -lpgplot -lX11 ；编译plot.f文件，使其与pgplot和X11R6建立关联 6、运行下列程序画出光变曲线: export PGPLOT_DIR=/usr/local/pgplot ；导出的目录 export PGPLOT_DEV=/Xserve ；显示的设备 ./plot ；在运行另一文件夹中编译好的plot文件 7、根据画出的光变曲线图选取较好的比较星作光变曲线图。此时会产生一个tmp临时文件，用于后面kw程序执行。 8、执行 ./kw 程序，取出minimum times。会让输入文件 (tmp),然后有问是否擦除bad point，(一般选NO)，用鼠标选取最小值的范围，会等到某一范围内的极小值。依次对第一天的数据这样做，将得到的极小值放入一个mini的文件中。 9、编译epoch，运行 ./epo 程序，会让输入数据文件(将mini输入)，还会输入周期p，T0。最后产生一个tmp临时文件。 10、编译oc1.f，将tmp和oc拷入pgplot目录下，运行oc会得到EPOCH－L(o-c)图。 2009-11-24于河北兴隆; 个人分类: IRAF测光|6095 次阅读|0 个评论

不理想的数据可以剔除吗？: wangdh 2009-10-4 00:04; 不理想的数据可以剔除吗？（王德华）一天与学生讨论关于一个实验的数据分析和统计问题。学生说，在根据（某参数）测定的数据做的散点图中，有一个数据点出奇得高，结果导致统计分析时没有检测到差异显著性。如果删除这个数据，差异显著性就检测到了 ( 就是说概率值 P0.05) 。学生问能否删掉这个明显高的数据，并且说他已经计算了这个数据，高出平均值 (Mean) 的 2 倍的标准差 (SD) 。我的意见：要删除数据，一定要有充足的理由。下面几种情况是可以删除的： 1 ）如果确定是由于动物本身的问题（如健康等原因）造成的数据偏离，是可以删除的，但是所有关于这个动物的其他参数也都要一起删除，实际上等于我们减少了一个样本。 2 ）如果确定是实验记录等方面出现的错误，如平均值为 50 克的一只老鼠的重量被记录成 250 克。对于不明原因的“歧异”数据，要特别关注这类“异常”数据，关注和分析高或低的原因是什么，是什么因素造成的，不能随意删除，不能没有根据地删除或丢弃。在我们的实验中，尽管这个歧异数据不能代表整个样本量的变化趋势，但也许会有其他什么含义。学生又说，（这只动物）除了这一个参数异常外，其他参数在正常范围内，能否保留其他参数，而只删除这一个参数，由于是在很不理想。我的意见：我们要清楚什么样的数据是数据理想？科学的严格性，不允许我们按照自己的意愿随意挑选数据。科学要的就是客观，数据展现的就是这种客观存在。万万不可根据统计分析结果的差异性是否显著来会过头来挑选数据。为什么差异显著的数据就是理想的数据？达到差异显著的结果就是好结果吗？一般说来，数据在统计分析前，需要先检测数据的分布特征（如正态分布），然后根据实验设计的特点选定合适的分析方法，最后检测的结果是什么就是什么。如果规定概率值 p0.05 为差异显著性，那么 P= 0.049 ，结论就是：差异就显著；如果 P = 0.051 ，结论就是：差异就不显著。数学的含义就是这样。实际上，生物学实验中数据偏离平均值较大的现象时常产生，就是所谓的“歧异值”。关于歧异值的处理，具体起来，生物统计学著作上有相关介绍，有点复杂；是保留还是删除，有时候会很伤脑筋。如果确定是记录或实验或动物等等客观原因造成的，是可以删除的。如果没有充分的理由，应该保留这个数据。当然最好的方法就是重复一下实验，加大样本量，这样就可以很明确确定了。生物医学研究是要高度重视的，涉及到药物、病理、药理等等人命关天，不可大意。科研的一般原则要遵守：尊重事实，尊重数据。要获得准确的数据，获得真实的数据，正确运用数据，正确解释数据。数据是为结论服务的，结论是以数据为基础的。万不可（不允许）为了（某个）结论而决定数据的取舍。要是根据自己的意愿进行数据修改，更是不允许的了，那就属于学术不端了。随意编造数据更是不能容忍的。如果按照自己的意愿进行数据改变，就不是科学研究了，那完全是数字游戏了，是对科学的玷污。毫无疑问属于坚决打击的学术不端行为了。恰巧前几天有外宾来访，在研究组学术讨论会（ Seminar ）上，聊到这个问题。外宾的意见与我的意见是完全一致的。他还补充到：如果选择了一种数据的取舍原则，那么这个实验室或这个学者的以后的所有数据都要采取一致的处理方式，也许会终生是这个原则。不能同样的数据，（由于不同的目的）这次就删除，下次就保留。这也是不允许的。（提醒研究生：尊重事实，尊重数据，是基本原则。要删除数据时，一定要有充分的理由。） (2009.9.25 日草稿， 2009.10.3 完善 ); 个人分类: 生态学科研入门|26907 次阅读|14 个评论

遥感试验：设计原则: lix 2009-9-30 10:02; 实验与建模必须一起作, 可以说是我们团队的特色。1986年我回国后, 在《林业遥感》上读到禹秉熙老师的文章, 强调了波谱测量的必要性。但最后他说, 森林、树木结构太复杂，多变, 建模是不可能的, 只能不断测, 测, 测。我是搞森林反射建模的, 也就写了一篇短文, 强调波谱测量与建模必须在一起做, 每测一次, 都要试图理解或解释为什么测到这样的结果。日积月累, 有了能用的模型, 测量数据也就有了外延能力, 有了生命。禹老师接受了我的意见, 开始合作，后来张仁华老师也参加。那时经费很少，两个面上基金（3+8）一共才11万, 小打小闹。但是效果不错。打下了后来的基础。 1990年在美国开了一个学术交流会, 总结FIFE, 推动BOREAS. (这是两次大型的多国合作实验)。会上各国科学家达成共识, FIFE 的教训是建模与测量分离; BOREAS 应在这方面大力加强合作。可惜各国科学家的共识未能成为各国官员的共识, BOREAS的进步是非常有限的, 仅仅多了一些模型验证。各国官员其实也不是不知道，但他们的责任是分钱。实验花钱多，所以测量就主导，最后就只搞现有模型的验证，基本上没有已有模型的新进展。反而是我们咬定青山不放松, 从禹老师、张老师和我小打小闹的合作开始, 在基金委和科技部长期接续的支持下,我们的团队始终保持着建模与实验的密切合作, 以建模为主导，坚持测量必须心中有模型（验证和可能的改进），同时坚持依靠实验数据简化模型或建立新模型。这样才能稳步前进，形成基础数据和研究成果长期的积累。与国家大型对地观测计划密切配合，开展包括观测、建模、反演和验证的综合实验（1）在实验设计时充分考虑建模、反演、验证及示范应用等多方面的研究需求。（2）星－机－地同步的遥感综合试验。（3）主被动数据同步获取，为主被动协同研究提供数据支持。（4）兼顾了空间尺度和时间尺度效应研究的需求，可以支持生态环境参数的四维同化。（摘编自为王锦地等《地物波谱知识库》写的序）; 个人分类: 课件科普|7876 次阅读|5 个评论

科学研究中数据与理论何者为重？: wangdh 2009-9-28 19:44; 科学研究中的数据与理论：数据和理论相信哪一个？ ( 王德华 ) 博友李老师在我的博文：如果你不喜欢数据，不能算是热爱科学后面评论道：“ 还需要好的思想和方法，单凭数据和数据的统计是不够的。数据最终还需要理论来解释和包容。” 李老师说得正是。我们申请基金项目和研究生们开题的时候，恐怕最艰难的就是提出和选择（好的）科学问题了，也就是我们常说的 ” Idea ” ，就是李老师说的“思想”了。我们阅读文献，分析文献；观察自然，分析现象，就是为了发现好的“想法”，提出好的“想法”。有了（好的）想法，再选择合适的研究方法（仪器设备），按照实验设计进行，就可以收集数据了。有个好想法是很宝贵幸运的，经常也是很受折磨的。爱因斯坦也说过：提出一个问题比解决一个问题要重要得多。科学不允许蛮干，不需要埋头苦干，需要的是巧干和巧干加苦干。具体到生物学研究，达尔文曾告诫我们：要让理论来指导你的观察；所有的观察结果必须是支持或反对某种观点，否则你的观察将毫无用处。这是非常重要的。在实验前，需要有充分的理论准备。如果对本学科、本领域的发展不熟悉，对相关的理论和概念的来龙去脉没有很好地了解，也很难找到合适的理论和重要的理论。理论指导实践，应该作为研究的第一原则。没有合适的理论，最好不要开始数据收集。毫无目的的苦干，是很大的浪费。但是，我们也必须清楚，科学发展到今天，学说和理论不知有多少，要想在短时期内掌握清楚，谈何容易。那么是不是就不能开始工作了？凡事都不要绝对化和教条化。每个研究组都已经有一定的积累，有导师，有师兄弟姐妹，所以要知道哪个是重要的，哪个是新的，应该不是困难的事情。当然，不交流，你不会达到这个目的的。关于生物学理论和数据的关系，著名生态学家 R. MacArthur 说过：不要相信没有数据支持的理论。任何理论都有局限性，有实验数据的局限性和仪器设备的局限性，以及历史发展的局限性。所以，我们在选择和运用相关理论时，要清楚这一点。与之对应，著名动物行为学家 J. Wolff 也说过一句很有哲理的话：不要相信没有理论指导的数据。这句话的含义，与达尔文的那句话的含义是一致的。收集任何数据，都要有理论的指导。也就是说，任何数据都是为理论（假说）服务的。没有空想的理论，也没有随意的数据。理解和牢记数据与理论的辩证关系，对于开展和提高生物学研究的水平是很重要的，尤其对于初学者。（提醒研究生：思想、想法、主意，即 Idea ，也是有产权的，不能随便窃取盗用，反之亦然。该协商协商，该合作合作，该通报通报。）（王德华 2009.9.28 ）; 个人分类: 生态学科研入门|9893 次阅读|16 个评论

如果你不喜欢数据，不能算是热爱科学: wangdh 2009-9-26 00:12; 如果你不喜欢数据，不能算是热爱科学（王德华）我说的是实验科学，需要收集数据的科学。可是细想一下，自然科学中，有哪个学科不需要数据？作为生物学来说，拿数据说话更是硬道理。作为生物学实验研究，（当今）一般是在周密思考的假说 ( Hypothesis ) 驱动下，通过严格的实验设计，进行严格地数据收集过程，然后进行相关统计分析，得出相应的结论。根据假说提出的预测 ( Prediction ) ，作为收集数据的研究者一般是很清楚“理想”的数据应该是什么样子的，在头脑里是有数的，知道自己期盼什么样的数据。所以研究者们一般都会特别关注实验结果的变化趋势。在每天结束数据收集后，都会焦急地等待分析结果，急切想看新的数据的趋势，渴望看新测定（收集）的数据是否符合自己的预测，也喜欢将收集的数据的平均数 ( Mean ) 计算出来，喜欢将新的数据标记在趋势（或散点）图上。看着每天（次）的数据变化，心里充满了期待，逐渐就有了成就感，有了对下一个（次）数据的期望。这种经历和这种心情，相信许多过来人都深有体会的。看到数据的那种喜悦，也不是任何人都能体验到的。但总是有些研究者（研究生）不是很及时地处理数据，有时候还会拖得时间很久。有些研究者（研究生）喜欢集中处理数据。可是如果不及时处理数据，等以后处理发现数据存在问题时（不整齐性是很经常出现的，尤其是对于野生动物的数据），有时候补救已经来不及了，即使补救也会给自己造成很大的被动。在与研究生一起分析数据时，经常是有很多的数据，变化趋势很好（或符合预测），但总是有些遗憾，如标准差过大，样本数不足，等等因素导致差异显著性没有检测到。有时候很容易导致统计学上的 I 型错误或 II 型错误（简单说就是，本来自然界中存在的事实，由于我们实验方面的问题，而没有检测到这种存在；或者本来自然界中不存在的事实，由于我们实验的问题，而检测到了这种存在），造成了分析数据时的很多烦恼的事情。每个人有每个人的工作习惯，不能强求都一个模式。但对于未知的东西，人们如果真心喜欢，总是渴望尽快知道答案，就是有强烈探索的欲望，浓厚的好奇心。对一个问题（现象）没有好奇心，没有发现的欲望，没有想知道答案的渴望，那么在进行这些枯燥艰苦的实验时，一定是有些功利性的。经常看到实验结束了，（原始）数据记录本随便放置；更有甚者，丢失找不到了。也有些记录很不规范，甚至随便找个什么地方（纸张）记录，或者对于记录本上记录的内容，潦草马虎，有时候自己都分辨不清 … … 这些都不是合格的研究者的表现。研究生培训的就是严格的学风，严谨的为学态度，严肃科学，热爱科学。不喜欢数据的（实验科学）学者，不应该算是优秀的学者。不喜欢数据的（实验科学）研究生，也不会是优秀的研究生。（提醒研究生：要及时处理数据，熟悉数据，分析数据。）（王德华 2009.9.25 ）; 个人分类: 生态学科研入门|11511 次阅读|15 个评论

数据之美--转帖量子日记2009-9-3: caojun 2009-9-3 14:15; 一张图抵一万句话。数据是抽象的，尤其是海量数据，人的大脑很难直接对大量数据进行分析并获得印象，然而从另一个角度看，数据也可以异常美丽，人们设计了很多工具，让枯燥的数据图形化，它们以令人难以置信的方式让我们看到了数据美丽的一面。图1-3摘自 Webdesignerdepot ，更多的例子请见原文。数据的图形化在高能物理里广泛使用，以至于我们把它当成最自然的选择。许多研究生学的第一件事就是如何用ROOT（以前是PAW）来画图。在数据分析中尽管总是采用严格的统计方法，对可疑事例进行肉眼扫描仍然是必不可少的。图4是一个超级神岗事例，看上去非常漂亮，而且非常有趣，因为它像一个我们一直在寻找的质子衰变事例。用一张精心构思的图来表达物理分析结果，复杂的数据关系可以得到直观的体现。这种例子在高能物理中不可胜数。例如Sudbury Neutrino Observatory (SNO)太阳中微子实验的结果见图5。也许这个结果用数据来表达并不困难，但远远没有这张图令人印象深刻。它浓缩了上百名科学家10年的努力。每当我们看到这张图时，只要一眼，我们就知道这是SNO。无论结果是相对简单，还是显得杂乱无章，总是值得你花很多的时间去构思一张图，它应当漂亮、直观、包括尽可能多的内容和数据关系。图 1 ，用 Narratives 2.0 软件分析的贝多芬第五交响曲。不同的声轨被分割成单个的通道，然后用扇形结果显示出来。图 2 ， Schemaball 软件制作的 SQL 数据库结构图，基于表之间的外键，显示表间的关联。图 3 ， Internet 是如何组织的。可以看到， Internet 的核心是大约 80 个主要节点，不过即使这些核心节点出现故障，其余的 70% 的节点也会以点对点模式继续保持 Internet 运转。图4 ， Super Kamiokande 的事例。看上去像一个质子衰变事例，下方的切伦科夫环可能是正电子，上面可能是 pi0 衰变到两个伽马形成的两个环。图5 ， SNO 的硼-8太阳中微子实验结果，表示了通过三种过程测到的电子中微子流强与缪+陶两种中微子流强的关系。; 个人分类: 物理八卦|4563 次阅读|0 个评论

书已出版]ChemOffice 2008实用教程——化学结构绘图分子模拟数据整合: wangkj80 2009-9-2 07:58; 书名： ChemOffice 2008实用教程化学结构绘图分子模拟数据整合出版社：化学工业出版社编者：曾炜孙延辉李红霞出版日期： 2009年8月主要内容：好的东西应该得到更广泛的传播，ChemOffice就是这样一款好的化学化工软件，它的功能模块使您的科研更加方便。通过ChemDraw，您可以快速、精确地绘制各期刊、杂志指定格式的分子结构；通过Chem3D，您可以得到漂亮的三维模拟结构，并可进行分子力学及量子力学计算；通过ChemFinder，您可以充分利用本机及网络资源，查询现有化学信息及建立个性化的数据库。本书主要介绍利用ChemOffice 2008进行化学结构绘图、分子模拟以及化学信息搜寻整合等方面的内容。其中，详细介绍了绘制化学结构式、反应式、反应流程图，绘制化学结构式的3D图形，进行半经验计算以及预测分子轨道的形状、查询现有的化学信息、建立本地化学查询数据库等多方面的内容。各部分内容的介绍既有软件的应用与操作方法和技巧，又融入了ChemOffice基础知识和要点，还通过大量实例具体说明操作与绘图过程，语言通俗易懂、实例丰富、图文并茂，方便用户学习。本书可作为化学化工专业人员学习ChemOffice 2008入门与提高的书籍，也可作为大专院校应用化学、材料学、生物医药等专业教师及学生、科研部门的化学工作者、各单位化学技术人员及化学界其他相关人士学习ChemOffice 2008的教材或教学参考书。化学工业出版社网购地址: http://shop.cip.com.cn//product/20090901/164769787122064097.html 卓越网书籍购买网址: http://www.amazon.cn/mn/searchAp ... Go.x=13Go.y=11 附件介绍：附件中的PPT为本书中主要内容介绍，欲了解详细内容，请关注化学工业出版社新书动向。 ChemOffice2008英文版下载地址： http://www.fixdown.com/china/Education/8336.htm 纳米盘下载： http://www.namipan.com/d/ChemOff ... 7da35c754a01023b507 破解包： http://www.namipan.com/d/742ade7 ... b079a4ac08e61670500 注：本文引自小木虫网 http://emuch.net/bbs/viewthread.php?tid=1469713fpage=1 ppt; 个人分类: 未分类|5687 次阅读|0 个评论

获取文章中的面状图中的数据: zjwang 2009-5-12 00:33; 如果图是一个面的话，如图2。则不仅要得到某个点的坐标值，还需要得到其像素值，对应右边图例可以得到真实值。同样我们使用GIS工具ArcGIS也很容易做到这一点。方法：尽量放大PDF，截下要获取数据的图，只需要除去坐标轴和图例的数据块的图。打开ArcGIS，加载此图。这回不用校正。代替为之的是，在VBA中使用栅格数据的接口读取此图中的像素值P(L*W)和图像的长L与宽W。根据右边的图例，得到每一个像素对应的实际值V。由坐标轴确定一个像素对应的波段和高度角，以及左下角的坐标，即原点。这样任意像素的坐标就知道了。由3和4中分别确定的像素实际值和坐标，可以得到一系列（X,Y,V），即我们想要的不同波段不同天顶角对应的值。发表时注明数据来源（按李老师修改）。同样注意：如果坐标是对数的话，得到的是形如10EY.X的坐标，而不是X*10EY的形式。; 个人分类: 学习笔记|5747 次阅读|1 个评论

获取文章中的线状图中的数据: 热度 1 zjwang 2009-5-12 00:24; 如果文章中直接提供了数据的话，一般在表中，条件好的话可以直接用PDF选择工具把数据选择粘贴到文本编辑工具中。如果不支持文本选择，就麻烦了，可能得自己敲。但是，还有一种比这两种情况更麻烦的是文章是以图的形式给出数据的。如图1所示为OClO在204K时在波长240~480nm之间的吸收截面，想要把这些数据弄下来使用，使用GIS工具ArcGIS可以方便精确地获取数据。主要使用其几何校正和编辑功能。方法：尽量放大PDF，截下要获取数据的图打开ArcGIS，加载此图对此图进行几何校正，控制点多了，就是X轴和Y轴上的这些点，其图上坐标即为实际坐标。校正完，则此图坐标系就成为按图中坐标轴表示的坐标系了，鼠标所到之处都是以此坐标系表示的坐标了新建一线图层，设置空间参考为此图的空间参考；然后，就描此图中的的线吧。尽量放大一些，数据分辨率才高。这需要时间比较长。描完后，保存。即会生成一个要素。然后，利用VBA，获取此要素中所有点的坐标。主要接口：IMxDocument, IMap, ILayer, IFeatureLayer, IFeatureClass, IFeature, IPointColletion, IPoint。这样就得到了X与Y的一系列值，即是我们要的数据。发表时注明数据来源（按李老师修改）。注意：如果是对数坐标的话，如果用形如X*10EY表示（0.1*10E22,0.2*10E22...0.9*10E22），坐标是不均匀的，所以校正后可以得到的数据是形如10EY.X表示(10E22.1,10E22.2...10E22.9) 的。; 个人分类: 学习笔记|7332 次阅读|4 个评论

徒弟与学生: dongping2009 2009-4-8 22:08; 今天早晨起来，感觉就不太好，过后发生的一系列事情，似乎也验证了我这感觉。两件事情，一件是关于徒弟的，一件则是关于学生的。先说一说，与徒弟及学生没啥关系的事情：起来一通漱洗之后，出门去赶那到学校的班车，走到半路上，发现不对劲，原来是屁股坐的地方，裤子被磨出了一个不大不小的破洞，想起是昨晚没太注意，以致找出了一条旧裤子来的缘故，好在破洞的位置不太显眼，里面还有两层防火墙，加上上面的外套垂下来，勉强也可遮住，为了赶上早上的班车，便也不管不顾，没有换裤子便直接去了学校。一进办公室，照例打开电脑，先处理来往信件，该回信的回信。然后便是赶写一份杂志文章审稿的评论，除了先前断断续续地看了几次，比较完整的时间我已经花了有两个晚上，于是再次草草地浏览了一遍这篇文章的全文，开始动笔写了起来。其间又陆陆续续地，有一些同事与学生进来，包括5、6个打进来的电话，加上本人还穿插瞄了几眼科学网上的众位弟兄姐妹，但好歹总算将该文章的评论写完。于是心中渐渐高兴了起来，一看时间，刚刚好上午11点整。于是，想起曾经在不同场合，答应过发明狂杨秀海先生，要对他的本能态方法泼些冷水，正好有些时间，那就开始写吧。这样，先按照我本人的习惯，打开科学网，进入发表文章的界面，眼睛盯住屏幕，停个3、5分钟的样子，然后开始如飞地敲击键盘，所谓敲击如泉涌。只不长的30分钟左右，洋洋洒洒，一篇大约2000多个字符的长文，劝告发发如何教育我徒弟样样行的长文，宣告完成。于是，点击提交文章。接下来的事情，现在想来都实在太过悲惨，看看我对发发的两次留言吧：评论人：dongping2009 标题：小发发的一天都做了什么？　评论内容：发发，郁闷，刚刚花了我近40分钟时间，码好了一篇劝告发发的长文，大约2500字。没有想到啊，上网发表的时候，发现断网了，等到我好不容易整好网络后，又发现那2500字不见了，而且怎么也找不回来了。博主回复：那真是不幸呀，哈哈，我是说您呀，师兄。对发发来说就大幸了，又不用听师兄的唠叨了，是不是？不过人有时候还是真的贱，听不到别人唠叨，又会孤单得想发疯。没办法啦，师兄，只有再写一遍了。。。。提醒：下次不要直接在博客上编辑，在WORD上编好了再COPY过去，这样就不会有这种不幸的事发生了。评论人：dongping2009 标题：买东西与偷东西　评论内容：越想越郁闷，我学生进实验室，我对他们进行教育的重要一条便是，做好备份，包括数据与程序的备份。反而我这个老师自己，犯了如此莫名其妙的错误，真是不应该！但我一定要劝告发发的，这一次重写的话，要写3000字以上，也为自己再买个教训。博主回复：有感东平师兄的真诚，就算您写三万，发发也认真读完，认真学习，深刻检讨！噢，发发又在下围棋了，不是深刻检讨，是认真思考。哈哈。师兄请！下午继续发生的一件事情，则与我们学院的一个学生有关，先是我们学院负责学生工作的W老师，简要告诉了我关于这位学生，昨天至今天中午的一些比较反常的情况，于是接下来，W老师在与我们学校的研究生处，及这位学生的培养单位等，一通电话联系之后，我们两位简单进行了分工，W老师去忙她的那部分，我则揪心地坐在办公室里，似乎什么也不能够做，就那么无助地等候培养单位有关老师的过来。好在最后，基于该学生的现有情况，实际我们得到的结果，相对来说对我们大家都算比较良好，也没有白花我们这一干众人，几乎整个下午的着急与劳累。但这样一耽误，我便没有赶上学校按时下班开出的那趟班车，及我到家的时候，老人们都已经开始吃晚饭了。唉，今天过的，对徒弟没有及时尽到责任，对学生则感到责任日益重大。; 个人分类: 教学科研|5549 次阅读|6 个评论

小数点不能乱用: entomology 2009-4-6 10:09; 科学研究中不注意经常会出现一些关于小数点的技术性问题：比如，有1次我投稿，有审稿人就指出大象的坐标位置怎么能精确到cm，还询问我是量那个脚（呵呵），原来我小数点后面保留了2位。今天QQ上讨论的时候，有人也指出某地每年固定的二氧化碳是12345678.09吨（虚数），我就觉得万吨就可以，甚至3位有效数字就可以，没必要准确到几斤几两。这类准确实际上更不准确。（by 戴小华 2009.4.6）; 个人分类: 扯闲皮儿 Babble Chat|3249 次阅读|1 个评论

如何彻底防止硬盘泄密？: chrujun 2009-3-31 21:43; 在现有技术条件下，对硬盘重新分区、重新格式化、甚至把硬盘砸坏，都无法有效删除硬盘数据，防止硬盘泄密。这里根据硬盘是否正常工作，提供两种彻底删除硬盘数据，无论如何也无法恢复硬盘数据的方法。一、硬盘正常工作情况在硬盘正常工作情况下，可以采用数据覆盖法。有效的方法是对整个硬盘进行数据填充。首先在整个硬盘上写入十六进制数0，然后在整个硬盘上写入十六进制FF。有个软件叫WINHEX，里面有对整个物理硬盘填充数据功能。先填充0，再填充FF。软件完成任务时间与硬盘容量和速度有关，典型时间为几小时至几十小时。经过上述处理后，美国CIA也没有办法恢复数据。二、硬盘损坏情况当硬盘不工作后，如果里面有保密数据，千万不能直接把硬盘扔掉。世界上有很多机构可以把硬盘磁片上的数据恢复，保密信息在这些机构手段下会一览无余。有效的方法是把硬盘打开，把里面的磁片取出来，用火烧掉。或是把里面的磁片取出来放在一个安全的地方。; 个人分类: 科研心得|11756 次阅读|0 个评论

实验方法的精确性问题: cutefay 2009-3-29 23:39; 前一段时间在实验室里做蛋白质含量检测实验凯氏定氮，用的是传统的凯氏定氮仪，最后我和实验室另一同学发现：传统凯氏定氮的误差还是很大的，实验的精确性挺差的。传统的凯氏定氮是蛋白质经过浓硫酸消化之后，用定氮仪把释放出来的氨气收集到硼酸里，再通过标准盐酸滴定，来计算含氮量。这个过程中，误差最大的是来源于标准盐酸滴定的过程，因为滴定终点的判断是根据指示剂变色来判断的，要滴回到粉红色。而就这个粉红色每个人肉眼感受是不一样的。我和实验室同学那天都在做凯氏定氮，后来我们发现我们对粉红色的定义大不相同，结果，对一蛋白质含量约10-20%的样品，我们俩测定的误差可以达到20%，20%的误差是相当大的。后来，我们俩一起做了一个小的验证实验，来验证到底谁对粉红色的定义更准确，于是我们就用pH试纸来测那粉红色的液体的pH，结果发现：即使用pH范围很窄的试纸，也无法准确知道这溶液的准确一点儿的pH，例如，我们觉得两种溶液的pH试纸显示的颜色差不多，而实际上这两种溶液的pH能够相差0.5-1.0之间，这个误差也太大了点。后来，我们就用pH计来精确测定pH，pH计可以得到很精确的pH。通过pH计我们发现，原来我们俩的滴定终点判断都不算准确，真正的滴定终点差不多刚好是我们俩中间的那个时候。也就是说，我们俩计算的误差刚好是约等于正负10%。于是，我们得出结论：做传统凯氏定氮实验的滴定的时候，滴定终点最好是用pH计来判断，通过肉眼分辨颜色，无论是溶液指示剂法还是pH试纸法，都是误差相当大的。而现在很先进的微量自动凯氏定氮仪，里面应该有pH计的准确判断滴定终点的功能，用那定氮仪做实验就要准确多了。所以工欲善其事，必先利其器，这器的作用还是挺大的，尤其是在科研领域。通过我以前做过的实验发现，还有很多传统的检测方法误差也很大。例如那些比色法测定物质的含量，稀释不同的倍数测定之后计算出来的结果误差也是很大的，而如果能够用其他的办法代替，就能精确很多。以前做还原糖的测定实验用DNS检测法，误差较大，后来实验室有了高效液相色谱，用高效液相色谱来检测，就精确多了。另外，蛋白质检测也有几种不同的办法，几种不同的办法之间测定的数据结果也是有比较大的误差的。因此，不要迷信经典实验方法，也不要太迷信自己的实验数据，用另外一种方法检测，说不定实验数据又不相同。只有几种不同办法比较，才能够知道精确性究竟如何。另外，传统的办法不一定准确还有一个表现：例如，凯氏定氮是通过测定含氮量来计算蛋白质含量，而如果样品中有无机氮，也会被算在内，造成结果不准。三聚氰胺被添加到牛奶里，就是个最好的例子，凯氏定氮是检测不出来三聚氰胺的。; 个人分类: 科研*创新|7152 次阅读|9 个评论

检测的数据是否能改: jxz1963 2008-12-17 20:24; 前段时间，有位几年不见了的朋友来找我，我问何事，朋友倒也十分爽快，说是在我认识的单位里做了一次产品检测，数据出来了，有一些问题，怕在质检部门过不了关，想请我出面给相关领导打个招呼，能否把化验的结果给修改一下，把报告重新给出一下。我一听是这种事情，首先声明：第一我没有这个能力；第二我认识的单位领导不一定会给我这个面子，万一出了事情是要担责任的；第三检测人员也不一定干这种事情。出于好心，我劝这位朋友还是想办法在工艺或设备方面想想办法，而不要把心思放在修改检测报告上。朋友听了我的话，显然是有些不太高兴，最终还是说了一句：我们多出些钱，或者给相关人员一些好处费你说行不！我告诉了朋友：这种事情你最好不要给我说，小心事情没有办成误了你的事情！我还告诉朋友：你如果这次真的办成了，下次你的产品即就是合格了，也没有人会相信的，最起码我是不会相信你们的产品是合格的了。朋友听了我的话，没有再去找相关人员修改产品检测报告中的数据，只是苦苦地笑了一下，说回去不好给老板交差。我告诉朋友，这次检测数据要是改了，给老板交差了，以后出现了消费方面的纠纷，你将如何给消费者交差呢？到时候老板也不会轻饶了你呀！朋友挥着手走远了，我的心里象有一块石头压着似的，修改数据，谁会想出这种损招呢！但愿这种事情不要出在任何检测单位，也不要出在所有产品上，特别是人们吃的东西，检测数据可是要准确无误的呀！; 个人分类: 我的观点|4095 次阅读|1 个评论

速度非均匀的海平面上升和地壳均衡运动: 杨学祥 2008-11-26 07:04; 20 世纪最重要的科学成就之一，就是证实了米兰克维奇的天文冰期理论。对两极冰芯、岩洞石笋、中国黄土的放射性元素测年数据表明，全球气候变化有显著的 2 、 4 、 10 万年的地球轨道周期，即与第四纪大冰期中的亚冰期周期一一对应，证实了地球轨道对地球气候的决定性影响。最近，这一理论又被新的证据所证明。太阳辐射是气候形成的最主要因素。气候的变迁与到达地表的太阳辐射能的变化关系十分密切。引起太阳辐射能变化的条件是多方面的。（1）地球轨道偏心率变化：地球轨道运动是椭圆的，在行星摄动下，轨道偏心率在0.0005 - 0.0607之间变化，周期约为 9.5万年。地球轨道偏心率变化，使地球接收太阳辐射的日照量变化，最大是士l％左右。当地球轨道偏心率大时，一年中在近日点附近接收的辐射量增加，北方的冬季变暖。在第四纪以后，冰期都是出现在地球轨道偏心率最小的时期；间冰期出现在偏心率最大的时期。（2）黄赤交角变化：地球自转轴的倾角变化引起的黄赤交角在22度～20度 30 变化，变化的周期约为4.1万年。由于地球上南、北回归线和南北极圈的位置是由黄赤交角决定的，因而会影响到高纬地区的日照量改变。黄赤交角减小时，中、高纬度地区，尤其是高纬地区接收到辐射量会明显减少；黄赤交角增加时，纬度越高，接收辐射量增加越多。黄赤交角达到最大值时，在极地全年接收到的太阳辐射量可增加4.02%。（3）近日点的进动：由于行星摄动，地球轨道的近日点有进动，平均周期约为2.17万年。现在北半球的冬季位于近日点附近，再过12750年，近日点将位于目前的远日点附近，北半球的冬季将位于远日点。这会引起南北两半球在不同季节日照量的变化，影响到全球气温的很大变化。目前，地球过近日点的时间是每年的 1月3日或4日，过远日点的时间为每年的 7月2日或3日。近日点进动的方向和地球公转方向一致。 100 -200 米厚的海水层在冰期和间冰期交替变化中不断地从两极冰盖和赤道海水中转换迁移，将引起地壳的巨大形变，破坏了原来的地壳均衡，引发冰川地壳均衡和水均衡运动（就像轮船装载和卸载会引起吃水线变化一样）。最后一次冰期的结束，导致海平面上升了 130 米，如果两极冰盖全部融化，海平面至少会继续上升 60 米。这意味着，大洋地壳因负载增加，要均衡下降 20 米，两极地壳因冰盖消失而卸载，要依据原冰盖的厚度，上升其 1/3 的数量（岩石和海水密度比为 3 ： 1 ）。根据地质学的地壳均衡理论（单位均衡面上的物质柱体质量相等），大陆冰盖融化，负载减少，大陆地壳要均衡上升；海平面上升，负载增大，海洋地壳要均衡下降。最末一次冰川后期，全球平均海平面上升了 130 米，洋壳均衡下降了 43 米（地壳与水的密度比大约为 3 ： 1 ）。斯堪的纳维亚半岛在末次冰期中冰盖厚度为 2000 米，冰盖融化后，已上升了 500 米，还将继续上升 200 米。科学家称其为冰期地壳均衡理论的大自然实验室。所以，斯堪的纳维亚半岛并没有因为海平面上升而被淹没。对于没有冰盖的大陆，海平面的实际上升仅 87 米，减少了三分之一。洋壳下降挤压下方岩浆流向大陆地壳底部，使沿海大陆均衡上升。由于地球表面是球面，洋壳下降，球面半径缩小，洋壳将插入到大陆地壳之下，使大陆边缘受到挤压和抬升。　　联合国政府间气候变化专门委员会（ＩＰＣＣ） 2007 年 2 月 2 日在法国首都巴黎发表一份评估报告摘要指出，全球气候变暖有超过 90% 的可能由人类活动导致。报告说，全球变暖将持续数百年，海平面将持续上升。ＩＰＣＣ由联合国环境规划署和世界气象组织于 1988 年创建，汇集来自 130 多个国家的 2500 多名专家。从 1 月 29 日起，ＩＰＣＣ第一工作组 500 多名专家以及政府和地区代表在巴黎联合国教科文组织总部举行会议，讨论全球变暖问题的第四份评估报告。这份长 21 页的报告说，过去 50 年全球平均气温上升极可能与人类使用石油等化石燃料产生的温室气体增加有关，报告说，极可能意味着可能超过 90% 。ＩＰＣＣ最新报告预测，到 2100 年，全球平均气温将上升 1 ． 8 至 4 摄氏度，海平面升高 18 至 59 厘米。在 2001 年发表的评估报告中，ＩＰＣＣ曾预测到 2100 年，全球平均气温将升高 1 ． 4 至 5 ． 8 摄氏度，海平面将升高 9 至 88 厘米。按ＩＰＣＣ最新报告预测，到 2100 年海平面升高 18 至 59 厘米。由地壳均衡运动，大洋地壳将均衡下降 6 至 19 厘米。由此引发剧烈的地震火山活动。 Wu 和 Peltier （ 1983 ）估计北半球劳仑泰德冰盖和斯堪的纳维亚的冰盖于 18000 年前开始融化，快速融化始于 1350 年前到 7000 年前， 7000-5000 年前间的冰融量减少。 Jaritz 和 Ruder （ 1977 ）绘出莫桑比克全新世海面变化曲线， 10000-8000 年前期间海面以每百年 2.65 米的速率快速上升， 8000-6000 年前期间海面上升速率明显减慢，将为每百年 0.47 米。 6000 年前海面达到最高点，高出现代海面 2.5 米。此后海面缓慢下降至现代海面位置。中国沿海全新世海面变化可分为 6000 年前的急剧上升、 6000-5000 年前期间的最高海面和 5000 年来相对稳定成微微下降等 3 个阶段；同时，海面是波动的，具有 8500-7800 年前期间、 7300-6700 年前期间、 6000-5000 年前期间、 4600-4000 年前期间、 3800-3100 年前期间、以及 2500-1500 年前期间 6 次波峰，其中后 4 次波峰为高于现今海面的高海面时期。我国全新世珊瑚礁发育，可分为 8500-7800 年前、 7300-6700 年前、 6300-4800 年前、 4500-4000 年前、 3800-3100 年前、 2800-1400 年前以及小于 1000 年前 7 个时期，我国全新世珊瑚礁发育和海面变化以及地壳运动的有关。 6 次海面波峰对应 6 次我国全新世珊瑚礁发育，与联合国政府间气候变化专门委员会（ＩＰＣＣ）报告的结论正好相反。 10000-8000 年前期间海面以每百年 2.65 米的速率快速上升， 8000-6000 年前期间海面上升速率明显减慢，为每百年 0.47 米。 6000 年前海面达到最高点，高出现代海面 2.5 米。此后海面缓慢下降至现代海面位置。 6000 年以来海平面不升反降，平均每百年下降 0.04 米，说明 6000 年以来不是地壳均衡剧烈活动时期。海平面变化是波动的，具有 8500-7800 年前期间、 7300-6700 年前期间、 6000-5000 年前期间、 4600-4000 年前期间、 3800-3100 年前期间、以及 2500-1500 年前期间 6 次波峰，其中后 4 次波峰为高于现今海面的高海面时期。 15-17 世纪小冰期时期海平面是下降的。马宗晋院士指出，从 15 至 17 世纪的 200 余年内，世界上强震很多，其它自然灾害也很集中，这也正是太阳黑子蒙德极小值期。与之对应的中国华北第六地震活动期，延续了 200 多年，其间发生了 4 次 8 级地震， 7 次 7 级地震，其后的平静期延续了 85 年，未发生任何大于 6 级的地震。这表明，在暖期高峰和冷期低谷，海平面剧烈升降，地壳均衡活动强烈，地震活动频繁。气候冷暖变化、海平面升降与地震活动密切相关。 19 世纪气候变暖以来，海平面上升速度为平均每百年 0.10 -0.15 米。即 10000-8000 年前期间海面上升速度是其近 26 倍，因此 10000-8000 年前期间地壳均衡的强度也应该是目前的 26 倍。这样，在 10000-8000 年前期间，目前的 1000 年间隔的强震将缩短为 50 年间隔，百年间隔的地震将缩短为 4 年间隔。 6000 年前海面达到最高点，高出现代海面 2.5 米。 10000-6000 年前期间应该是地球的强震集中爆发时期。成都理工大学教授朱介寿对《第一财经日报》表示，专家们搜集、分析了从公元前 26 年至今长达 2034 年的龙门山地震史料，发现 8 级及以上地震仅此一次， 7~7.8 级的地震共 19 次，差不多 100 年一个 7 级地震。这些数据也表明，两千年以来，龙门山地震带的地震活动并不强烈，全球地震活动强烈时期应该在 10000-6000 年前期间海平面快速上升时期，而这时期是没有文字资料可查阅的。从公元前 26 年至今长达 2034 年的龙门山地震史料上没有的 8 级地震，不能说明 10000-6000 年前期间海平面快速上升时期也没有，更不能说明 8 级地震在 10000-6000 年前期间海平面快速上升时期也是千年一遇。海平面变化资料表明，全球地震活动强烈时期应该在 10000-6000 年前期间海平面快速上升时期。仅当我们能用证实海平面变化的方法，同样证实 10000-6000 年前期间 8 级以上地震的大致分布，我们才能确定龙门山地震带的地震活动规律。用 2000 年的资料证实 1000 年一遇地震的观点，这只能是推测，应该有更多的周期数据。世界上有仪器准确记录的地震资料仅有百年的历史。地球在整个地质时期都经受过地震，文字记载可追溯到过去的几千年。在中国，学者们曾从很早以前的历代王朝文献、文学作品及其他来源得到地震证据。最早的可追溯到公元前 1831 年的山东省地震，该记载仅提到泰山震，但从公元前 780 年起中国北部的地震记载就已经相当完整了。这些历史记载如此之详细，以致现代研究者根据它们可了解当时破坏的分布情况，从而得出地震的大小。从数据对比中可以看到，越是早期的地震，数据就越少，漏记和数据遗失的情况在所难免，特别是无人居住边远地区的地震。更早的地震记录就无据可查。 8000-6000 年前期间海面上升速率明显减慢，将为每百年 0.47 米。按ＩＰＣＣ最新报告预测，到 2100 年海平面升高 18 至 59 厘米。两者的变化速度非常接近，用 8000-6000 年前期间的地震数据才能真实反映未来的地震变化趋势。以目前地震研究的水平和资料，准确的估计难以给出可信的证据。气候剧变海平面升降地壳运动火山地震活动生物大规模灭绝。这就是地球气候变化史、构造演变史和生物进化史，尽管时间循序千差万别。读懂这个历史，对当前防灾减灾很有意义。气候变化已经无法用历史记录来推测，难道地震还会按照历史记录来发生吗？即使不考虑人为的全球变暖，海平面上升的自然速率表明， 19 世纪气候变暖以来，海平面上升速度为平均每百年 0.10 -0.15 米。即 10000-8000 年前期间海面上升速度是其近 26 倍，因此 10000-8000 年前期间地壳均衡的强度也应该是目前的 26 倍。这样，在 10000-8000 年前期间，目前的 1000 年间隔的强震将缩短为 50 年间隔，百年间隔的地震将缩短为 4 年间隔。 10000-6000 年前期间应该是地球的强震集中爆发时期。揭示 10000-6000 年前期间地球强震集中爆发的全貌将为我们预测未来地震勾画出大致的可信蓝图。参考文献 1．杨学祥 . 构造运动中的天文因素两极冰盖融化的威胁 . 发表于 2008-10-13 6:41:51 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=42439 2．金煜。科学家研究称冰川万年后冰冻地球 ( 图 ) 。 2008 年 11 月 23 日 09:49 新京报。 http://tech.sina.com.cn/d/2008-11-23/09492597279.shtml 3．杨学祥 , 陈殿友 . 重力均衡与质量均衡 . 长春科技大学学报 . 1995, 25(1):87-92. 4．杨学祥。地壳均衡与水平运动。世界地质。 1988 ， 7 （ 1 ）： 43-48 5．杨学祥 . 地壳形变与海平面变化 . 地壳形变与地震 . 1994, 14(4):29-37. 6．杨学祥 , 陈殿友 . 地球差异旋转动力学 , 长春：吉林大学出版社 , 1998 7．杨学祥 . 地壳均衡与海平面变化 . 地球科学进展 . 1992, 7(5): 22-29. 8．杨学祥。对全球海面变化均衡模式的改进。地质科学。 1992 ，（ 4 ）： 204-408 9．刘浩，王宇。联合国最新报告：人类活动引起全球变暖。 2007 年 02 月 03 日 08:41 来源：中国证券网 . 上海证券报 http://it.sohu.com/20070203/n248019491.shtml 10．赵希涛，杨达源。全球海面变化。科学出版社， 1992 。 118 ， 108 ， 74 。 11．马宗晋 , 杜品仁 . 1995, 现今地壳运动问题 . 北京 : 地质出版社 , 10, 99-102. 12．漆小均。成都市防震减灾局：汶川 8 级强震将千年不复发。 2008 年 11 月 25 日 01:48 第一财经日报。 http://news.sina.com.cn/c/2008-11-25/014816715788.shtml 13．杨学祥 . 不能按常规来思考：全球变暖与冰河世纪 . 发表于 2008-11-25 16:28:20 科学网。 http://www.sciencenet.cn/blog/user_content.aspx?id=48323; 个人分类: 全球变化|3425 次阅读|3 个评论

谁在为政府提供数据库服务: moxj 2008-10-27 19:15; (图片来源 http://bbs.jxcn.cn/dispbbs.asp?boardID=21ID=229031 ) 首先了解下数据库是什么．数据库这个词出现的时间大概也不算太长．提到它也许会有很多种解释．但主要的意思一般指为了满足对应用户的需要，按照一定数据模型在计算机系统中组织、存储和使用且互相联系的数据集合。围绕这种服务而形成的数据库系统当然不止包括这个数据库，而且还要有相应的管理系统，管理人员（和题目中的谁有点关系了）和他们的用户及应用程序．　　关于题目中的谁，因为后面限制它的是强大的政府，所以我不可能像题目那么大一样也把它说的很全，只提一点自己的感受．至于后面的数据库因为在这方面我还是个盲，所以只是不恰当的借用．现在回到题目上面那幅图，一般人看到它首先要问的是如此多的收费站，那些做运输的人是怎么生存的．我的爸爸像我这么大已经开始在山西跑运输且那时经常一个月呆在车上不回家，也许我对这样的问题有一点发言的权利，但我不会和你讨论这个问题，至于我们国家那些改革开放后从事类似职业的但不属于工人阶级的，依然是农民的，在社会发展中没有经受起冲击但不会像工人兄弟一样有任何保障人的现状问题，我没有做相关的调查，没有确凿的数据，更不会和你聊这样一个没有意义的问题．所以不管你看到这幅图后在网上搜索到了什么信息，我借它讲的还是其中的这些收费站和类似的东西它们能给政府提供什么样信息数据的问题．首先举一个例子．如果你在一条河上筑了坝，那么它不仅是能为你发电或做别的，更重要的是它如果能给你提供这天河的流量及变化，那将是你科学利用和管理这条河的最宝贵资源．难道这些收费站没有这样的作用吗？老爸可能要扇我耳光了，说到这些用沉默来表示我的坚持．可能你在同时关注到了除了收费站，山西还有无数的煤检站．不用多讲，这些煤检站也像你建的坝一样有类似的作用．大概又一个耳光了．不敢再提这些了，说说那些为了产量而让大家心惊胆颤的煤矿吧．矿难我们就不用在这里讨论了．煤矿上报了那么多的产量，在我刚提到的煤检那里一定有对应的记录了把，我这里只是提下简单的算术好让大家听我说话有点逻辑．如果这些有必然的对应关系，那即使是收费站的流量，绿色通道的排出量．．．．．．都是可以进一步解析找到他们的相关性的．也许数学很好的你不屑考虑如此简单的问题，但答案如果不能像你想的那样闭合有怎么样呢？其实这种答案一般是有出入的，不然我们还要政府做什么呢？更不要你这样的学者．如果你还去检查你的算法和步骤那我非常支持．但如果有人建议你去看看是不是有人私下操作让数据有了漏洞，那将不再和你探讨这个问题，因为这涉及到有腐败问题在里面．相关的东西我一点都不知道．但如果你想知道鱼在哪里好让政府找到撒网的地方，我不会反对你．如果从几个收费站和煤检那里就能让你嗅到鱼的味道，估计海关那边腥味更重．最近金融海啸吹的有点猛烈，从水坝里你计算出了水的流量，公路关卡那里你知道了车的流量，煤检和煤矿一样的地方你明白了物资的状况．难道从银行这样更加干净和统计手段先进且各项管理严格的地方你就不能了解到钱的流动状况吗？任它金融海啸多大，量身定做，给它个马甲穿上，能有多大个折腾劲呢？丰富和便捷的信息确实给我们带来了很大的好处．然而信息的不对称也给我们带来了不少的伤害．追逐民主的人们，你们有足够的理由问责政府，但我们作为一个公民在考问国家为我们做了什么的时候，为什么不先问下我们为国家做了些什么呢？信息的不对称确实伤害到了一些弱势群体．那作为普通建设者的你给强大提供了确实有效的信息了吗？现在政府的被动创租又该去问责谁呢？（博主今日言论：如果社会发展对某种知识有了需求，那么即使最艰深的理论和方程都将变的显而易见．写给当前那些拿到一些数据，得到一点结果，不为人民着想，挑衅政府对策的经济现象分析专家门）; 个人分类: 观察思考|2840 次阅读|1 个评论

信息要从知识和数据的夹缝中跳出来: nipy 2008-7-18 15:55; 信息要从知识和数据的夹缝中跳出来就信息与数据、知识关系与刘锋老师商权刘锋老师在他的博文什么是数据、信息、知识和智慧给出了一个典型的知识阶层图，把信息夹在知识与数据之间，并在文中给出了数据、信息、知识的明确定义，我把这些定义扼要归纳为：数据是对客观事物属性的抽象表示，信息是有价值的数据，知识是更有价值的信息。这一观点与我们还经常看到的一种提法：从数据中提取信息，从信息中挖掘知识也是基本上一致的。刘锋老师上述关于信息与数据、知识关系的认识和观点，确实是一种比较经典或传统的观点，为许多科技工作者，特别是从事知识工程方面工作的人接受和认可。既然如此，为什么还需要把信息与数据、知识关系的问题重新提出来讨论呢？我想，关键在于：随着科学技术，特别是信息技术的发展推动着社会信息化的迅猛发展，信息的意义、信息的应用已有很大发展，以致信息概念也已极大拓展，还把信息塞在知识与数据之间的狭小空间实在有点太委屈它了，它要跳出这个夹缝，大喊大叫、大展身手。对此，我们试做如下分析：（ 1 ）信息概念在认知领域的拓展。人的大脑具有信息处理能力，人对客观事物的认知过程是一个以大脑为核心的认知信息系统的系统行为。如果承认这一点，那么由认知信息系统在人脑中产生的对客观事物的认识，以及由此产生的思想、知识都应属于信息的范畴，而从人大脑输出的知识，可能以语言、文字、图像或二进制编码数据的形态表示，它们也都应属于信息的范畴，我们把它们统称为基于认识的知识信息，由此可见，传统的知识（包括一般知识和科学知识）和数据（包括狭义的数字数据和广义的二进制编码数据）都应属于信息范畴，都是基于认识的对客观事物属性的反映或抽象表示。（ 2 ）信息概念在信息技术领域的拓展。我们曾指出，信息技术是对人自然信息功能扩展和加强的技术，包括遥感、遥测等信息检采集技术，无线通信、光纤通信等信息传输技术、计算机等信息处理技术、光盘、磁盘等信息存储技术、遥控、自动控制等信息控制技术以及综合信息采集、存储、传输、处理和控制利用的计算机网络都得到了迅猛发展。我们还曾指出，整个科学技术的发展是从信息技术开始和推动的。如果承认这一点，那么我们可以看到，在信息技术所涉及的信息概念中是包含知识、数据、语言、文字、图像等各种信息形态的非常广泛的概念。例如：遥感、遥测等信息的采集技术把客观事物属性信息转换为数据（可能是数字编码形式或图像形式），信息采集技术产生的数据，自然仍然属于信息范畴。在各种通信系统中传输的信息，可能是采集到的各种数据，也可能是传递某种消息的话音，也可能是广播的视频图像，也可能是远程教学讲授的某种科学知识，都是信息的传输。再看进行信息处理的计算机，无论是数值计算、数据处理、知识挖掘处理等等也都是信息的处理。（ 3 ）信息概念在信息社会领域的拓展。人们把信息资源、物质资源、能源资源并列为推动人类社会发展的三大重要战略性资源。信息资源并已成为推动社会信息化的重要因素。如果承认这一点，我们可以看到，这里的信息资源显然包括人类社会长期积累并可为人类社会共享的知识和数据。这些知识和数据除了传统的存储在各种纸质、文献资料中以外，在现代信息化社会中更多地被存储在互联网的各种数据库和知识库中，它们通过互联的计算机网络可以在全人类社会中对信息资源进行更高效的积累、交流和利用。因此，计算机网络已成为信息社会的重要支柱。信息资源通过知识产生科学技术还可直接形成社会生产力并进一步推动社会信息化发展，科学技术已被称为第一生产力。实际上也是知识信息的潜在作用。（ 4 ）信息概念在本体层次自然世界中的拓展。当我们承认人的认知系统是一个信息系统时，实际上已承认了客观自然世界中也存在信息，认知过程正是把自然界中的属性信息转换为人脑中的知识信息。生物进化中遗传信息的发现，以及鸟语花香的存在，都说明人类社会以前和人类社会以外有信息客观存在。如果承认这一点，就不应把信息概念局限于认识层次，更不应把信息放在知识和数据之间的狭小空间。信息在认识层次的概念无法普适于本体层次。我们用被反映的物质属性作为信息的本质概念，它是建立在事物之间普遍存在相互作用和相互联系的基础之上的，是与物同在的。因此，这一信息概念，既适应本体层次，也适应认识层次。这样，信息才可能在包括客观自然世界、主观认识世界、人造科技世界的整个世界中大展身手了。根据以上分析，对于信息、知识和数据的关系，我们试用下图来表示。信息概念有关分析请参看关于信息定义与本原质概念讨论的我见。欢迎讨论！欢迎交流！; 个人分类: 信息本质探索|3411 次阅读|0 个评论

科研数据的清洁度: jlpemail 2008-6-6 16:42; 在论文中采用的数据，应该是来源清楚；记录宜真实、准确、细致和及时的。真实、准确、细致和及时这八个字，我大学时代就熟知了。因为测绘行业，尤其是大地测量专业，经常从事的就是野外数据采集。这八个字是牢记在心的。记录的手簿，即使出现合理的修正也是有章可循的，比如铅笔记录的数据，假如错误了，需要整齐地以直线划去，并且在上方填写正确的数据。数据记录表格有限，不可能出现多次重新记录的。出现了，到一定程度就需要重新采集数据了。数据的记录绝对是要清洁明白的。不允许胡乱涂改的。工程技术上对于数据的看重，与科研相比，或许有甚而无不足。那些数据，是很快就要经受工程的考验的。曾经有人，因为虚构数据，和实地严重不符合，被处以刑法的。科研中的数据，也应该是清洁的。采集数据的实验室工作人员以及使用数据的研究分析人员，需要保持数据的清洁。模糊的数据怎么可能可靠。在阅读影响巨大的巴而的摩事件相关材料时，我记住了 Imanishi-Kari 的一句话我不是一个爱清洁的人。 O'Toole 应该属于喜欢数据清洁的人。撇开她们的个人恩怨不谈，单是就科研数据的真实和可靠性而言， O'Toole 是值得夸赞的，虽然她当时不过是个博士后，不具备 Imanishi-Kari 甚至 Baltimore 的学术地位，但这一点的确值得肯定。 Imanishi-Kari 的一个明显问题就是数据比较乱。韩国的黄禹锡或者其他学者准学者,数据造假,就和数据不清洁性质不同了。经过加工的数据可以趋近于研究者预期的方向，制造假数据自然更可以使数据和结论一致了。因为先有结论，后有数据。; 个人分类: 科学书场|4560 次阅读|0 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 数据

相关帖子

相关日志

关闭安全验证