科学网

 找回密码
  注册
科学网 标签 关键词 相关日志

tag 标签: 关键词

相关日志

[转载]导师快退休了,导师给我们的忠告
热度 2 zkm08 2011-10-25 18:59
导师快退休了,导师给我们的忠告 已有 866 次阅读 2011-10-24 15:37 | 系统分类: 生活其它 | 关键词:修炼 经典语录 研究生 忠告 导师 我的研究生导师今年65岁了,我们很多同门师兄师姐师弟师妹聚在一起为导师庆贺生日,那一天,我们都很感动,导师很快要从学校办退休手续了,我们很伤感。导师先后在企业、政府、高校工作过,经历丰富、阅人无数,整理了75句经典语录,让我们细细体会,以免除烦扰、平复心情。 ×××××××××××××××××××××××××××××××××××××××××××××××××××× 1、心外无物,闲看庭前花开花落;去留无意,漫随天外云卷云舒。 2、静以修身,俭以养德,非淡泊无以明志,非宁静无以致远。 3、古之立大事者,不惟有超世之才,亦必有坚韧不拔之志。 4、小人以己之过为人之过,每怨天而尤人;君子以人之过为己之过,每反躬而责己。 5、千里之行,始于足下。改变将来,从现在开始。改变现在,就是改变未来。   6、没有烦恼不要惹烦恼,有了则尽量解决它。   7、忏悔心、谦卑心很重要,不过对自己的爱心更重要。 8、最好的改变方式,是我们跟内在力量沟通,然后它会改变我们。    9、如果认为自己很弱小,我们就成为弱小;如果认为自己很伟大,我们就变成伟大。    10、修改自己就是修改世界,天生我材必有用,自己是整个宇宙中很重要的一个程序。要相信自己的潜力。    11、找到自己内在的爱力之后,才能真正地爱人。    12、爱什么人,照顾他、保护他、给他自在,才是真正高雅的爱。    13、不能贪求任何东西,一旦喜欢就执著在那里,应该心无挂碍。    14、最怕的东西,最应该去突破。    15、道不是知识能够分析的,它是内边的悟解。    16、自卑心最伤害自己,是最大的障碍。    17、内心如果平静,外在就不会有风波。    18、随时保持警觉心,做事要独立,合乎逻辑,合乎自己良心。    19、一旦开悟,任何事都变得简单,我们自然想的快,做得快,适当时机会做正确反应,这就是成功要诀。    20、为了批评世界及指正他人,我们生活才过得繁忙障碍,才会筋疲力尽。     21、对人诚信是保护自己尊严、良知的最好方法。    22、选择勇敢,做一个轰轰烈烈的英雄,不能低下高贵的头,甘心投降在小小的障碍里。    23、爱心、谦卑心是我们沟通别人的最佳利器,它会让我们天下无敌,用爱可以感动一切、打赢一切。    24、要感谢痛苦与挫折,它是我们的功课,我们要从中训练,然后突破,这样才能真正解脱。    25、放下自己的小我,自然变得伟大。    26、心要跟小孩一样,很单纯、很简单,才能很快进步。要简单,但不要简陋。    27、把学习的功课变成刑罚,我们才感到痛苦,不妨愉快地接受,笑着去应对它——那它就只是我们的功课。学好就行了。    28、单纯的生活是随遇而安,有什么享受什么。笑着接受一切。    29、祸中之福如同玫瑰带刺,我们不能一直在乎刺,应该看花。一切痛苦不是来自外在的情况,而是源自我们的态度。    30、学习主动的精神,决定出手的最佳时机,要果断,用自己已被开发的智慧。     31、真正的爱是别人感觉不到我们的存在,不占用他的空间,不绑他,越靠近我们越舒服。    32、当我们把关爱、仁慈、宽容和体谅扩及别人时,我们就创造了天堂。    33、挑战越大,我们灵性的领悟和成长也越大。    34、最大的浪费是我们不认识自己的智慧,不明白自己拥有全宇宙的力量。    35、解脱自己执著的概念、黑暗的思想和绑住的感情,才叫现世解脱。不要以为天上云间有个地方可去——那样跑到哪里都没用。 36、当我们往内静观时,会发现什么都没有,没有身体,没有物质,只有真实的能量存在,那就是我们的源头。只要我们不把自己当成这个肉体,就可以明白我们的来处,真实的能量才是万物的源头。    37、我们要净化自己的意念、言语、和行动。    38、用自己的判断和智慧去认识较高等的世界,你就会越来越熟悉高等的生活、高等的想法和高等的力量,你会一天比一天伟大,任何心中所想,内在力量都会帮你达成。    39、不要让世俗问题和个人习惯阻碍自己回归真我。每当你无条件地爱别人,扩展自己爱的品质,那就是你的真我在扩展。每次这样做,你都在开阔自己的世界,开阔自己的真我,你会变得越来越伟大。    40、当陶醉在爱里,我们就会变得象诗人、音乐家一样,像在天上飘,走路不用脚;用灵魂呼吸,不是用心智;用心灵思考,不是用头脑;用爱的语言交流,不用开口说话。    41、修改自己就是修改世界,每个人都变改,世界自然会变改。    42、我们付出爱心,就会感到满足,而不是等待别人的爱。   43、我们不是这个身体,不是自己这个人,而是智慧和爱力,是极为神圣的品质。    44、真正的快乐不是来自世俗的崇高地位、书本知识或财产多少,真正的快乐只有从开悟中获得。    45、这个世界只是一个客栈,一夜短暂的梦乡。    46、我们应该发展任何方面的才能,应该将事业照顾好,同时内边具有智慧和圣洁。只有这样我们才能真正完成人生的目的——了悟自我并且美化世界,不管此生有多短暂。    47、如果我们静心,唤醒内在的意识,我们会知道自己的伟大,知道自己和宇宙源头有沟通,而且是其中一分子,我们和整个宇宙是一体的,因此我们会更有耐心、更坚强、更有智慧,可以做更多神奇的事。    48、开悟之后,我们不再渴望任何东西,因为我们拥有了整个宇宙。虽然我们仍然工作,仍然赚钱养家,不过那是为了与世人分享,为了尽自己的责任。我们不求回报,不计较成败得失,只是尽力完成自己的事业。    49、无欲不是厌恶生活中的事情,我们尽力做好每件事,但是不执着,即使结果不如所料,我们也不在乎,那就是无欲的境界。 50、真正的智慧不是预知未来,而是知道现在,享受现在的一切,不必担心现在和将来。    51、我们什么都怀疑,就是不怀疑自己的无知与无明,麻烦就在这里。    52、所有的痛苦,一切外在的不幸,都是幻想,都只是一场梦、一场戏,根本没什么好担心的。    53、智慧的种子在我们内边,认识它,我们会比历史上任何一位英雄都无所畏惧;不认识它,每件事都会令我们不安,即使拥有全世界也不会快乐。贪婪和欲望因此造成,因为我们从来没有真正快乐过。    54、开悟是我们与生俱有的权利,一切痛苦源于我们拒绝接受这一宝物。    55、真正的快乐惟有从自我了悟中获得,我们笑是真心的笑,哭是由衷感动,我们所有的情绪都变得和谐、自然而完美。那些造成疾病还有精神混乱的负担、压力,都会从身心里边解除。    56、开悟之后,我们才能洞悉事物的真相,才能深入地看透一切,真正了解快乐,即使生活中还会遭遇许多困难和逆境,但我们内边不会动摇。    57、我们拥有自由意志,拥有各种资源,可以自由掌握方向盘,把我们生命导向正确的方向。    58、我们不需要为寻找天国而逃避世俗生活,而是要把天国带进我们的生活中。要找到真正的快乐与成功的方法,只有往内边寻找更高层次的意识,收集更好资料,并加以运用在日常生活中。    59、在这无常的世上唯一可获得真正快乐的方法,就是籍由开悟来改善身心的平衡。    60、用坚强的意志,维持好习惯,与高尚的人在一起,可以改掉很多坏习惯。     61、处在思想控制一切的世界中,这些先入为主的概念、偏见及所收集的资料控制了一切,使我们忘记了本性,忘记了自己不是那个先入为主的概念。我们不应忘记自己的判断力,必须找出自己本有的智慧。    62、开悟不是将情绪消灭,而是知道如何运用情绪。    63、任何不好的习惯都要尽量改掉;任何对自己有益,更理想、更高雅的事,都尽量做好。靠自己的才能、自己的时间、自己的诚心和努力来达成,不要过于依赖外在,自己却忘记成长。    64、不执着的意思是我们可以控制自己感情,欣赏自己的喜怒哀乐,但不会被它冲昏头,使自己顺其自然。    65、我们应该放下对金钱与权力的执著,而不是其本身。    66、心放松,精神不这么争名夺利,我们的聪明才智会自然跑出来,我们越轻松工作越好。    67、这个宇宙没什么真的好,没什么真的坏,就是一种循环,让大家玩一玩,然后,时间到了回去休息。    68、言论自由不是你想说什么就说什么,而是你是否知道你在说什么;思想自由不是你爱想什么就想什么,而是你是否知道你的思想是自由的、正确的;行动自由不是为所欲为,而是你知道自己在做什么。    69、命运在自己手中,你可以创造自己的命运,只要下定决心。    70、世界上一切都是荣耀与辉煌,都是福赐与快乐。    71、一旦开悟,爱力会经由你流到你的朋友、爱人、任何你想到或关心的人那里去。    72、应该找回我们的权力,我们的荣耀,我们所该拥有的一切,因为我们本来拥有整个世界。    73、我们必须先得到内在和平,才能将和平带入世界。    74、有时环境有一些被压迫的情况,那时要我们学习无畏的精神和勇敢的功课,惟有乐观地看事情,运用肯定的爱力,才能胜过否定的力量。    75、试着做个个性坚强的人,只要相信是好的,就坚持下去,不要让别人动摇我们。既然这世界罕有好的典范,就让我们成为好的典范吧! 转载自 http://blog.sciencenet.cn/home.php?mod=spaceuid=565089do=blogid=500473
2979 次阅读|3 个评论
[转载]灵魂 一夜 走 多远?
dongzg101 2011-10-24 04:53
灵魂一夜走多远? 已有 105 次阅读 2011-10-23 08:57 | 系统分类: 人文社科 | 关键词:多 我是相信还存在四维空间的,也就是相信还存在另一个和我们同时使用我们所感知的物理空间的另一个空间存在。 我是相信灵魂的存在的,奶奶去世时哥哥比电报早一小时知道,姥爷去世时我在千里外的北京也是一夜之间知道的。 后来我科学推算了一下,灵魂的速度?好像没有我们想象的那么快。大概也就是十几公里每小时吧。好像不太快。 中国的速度早已超越了这个速度,小车80-120公里/小时,高铁200-300公里/小时。 结果,很多人在忙碌中,不小心把灵魂落下了。
1035 次阅读|0 个评论
[转载]一个为科研团队量身定做的服务平台
dongzg101 2011-10-24 04:24
一个为科研团队量身定做的服务平台 已有 53 次阅读 2011-10-23 19:46 | 系统分类: 科研笔记 | 关键词:科研在线 量身定做 科研团队 科研在线 ( http://www.escience.cn/ ) 是为科研人员提供基于云存储的知识分享与协作的平台。它具有以下的一些功能特征, 如果您有自己的团队(课题组、兴趣小组等),会比较适合您。注册后,记得一定要创建自己的团队,才能看到如下功能! 专属的团队与个人空间 自由创建专属于您的个人空间或者团队空间,多团队支持,可满足不同组织需要,并可定制团队名称,邀请并管理团队成员,确定的信息流通范围,保证数据流向的确定性与隐私性。 强大的知识管理能力 可以轻松上传本地文件,甚至直接在云端创建内容,创建集合并组织管理云端知识,对知识的访问权限进行完全控制,确定的人看到确定的知识。支持对云端知识的搜索以及多维度的检索,方便知识的查找。云端知识版本管理以及访问统计 ,并且提供多种人性化的小工具方便知识的收集、整理、阅读 。 社会化的沟通与协作 社会化的知识协作,可以邀请同事加入自己的团队,向同事推荐、分享云端的知识,就某一知识发表观点,展开讨论。也可以关注同事动态,甚至可以与同事共同编辑修改同一知识。 轻松分享,永久保存 轻松进行团队空间或个人空间内的文件分享( http://www.escience.cn/system/shareFile ),并且能实现文件的多次分享,复制与保存文件到自己的个人空间。云端存储,永久保存,支持10G空间的免费存储。 个人与团队通讯录 管理自己的朋友或者同事通讯方式,并通过社会化的方式与您的朋友或同事进行方便的沟通与协作。 周到的消息提醒 无论是团队空间还是个人空间,所有发生的事都给予周到的记录与提醒,自动推送到您的邮箱、微博等,不怕错过任何关心的事情 移动终端支持 可通过智能手机随时随地访问云端内容,支持Android等智能手机的访问 安全的数据保护 云端内容加密存储。 支持云端知识的导出 科研在线支持云端知识的导出,可将云端知识导出成zip包或者epub电子书格式,保存在个人电脑、iPad、iPhone、Android等设备上进行离线保存与阅读。
1188 次阅读|0 个评论
[转载]涛哥当年说的“绕口令”
dongzg101 2011-10-24 04:16
涛哥当年说的“绕口令” 已有 124 次阅读 2011-10-23 17:15 | 个人分类: 博客新闻 | 系统分类: 博客新闻 | 关键词:胡锦涛 日本青年 1984年 围脖上看到一段涛哥年轻时的一段讲话,有点像绕口令 上世纪80年代初,是中日两国关系最好的时期。1983年11月,时任中共中央总书记胡耀邦在东京的NHK大礼堂对日本青年发表演讲,正式提出中国将邀请3000名日本青年到中国参观访问。 1984年9月,3000日本青年开始访华。在当时中国还不富裕的条件下,3000名日本青年访问的全部费用都有中方承担。 中国当时有几十万人直接参与了3000日本青年访华的各种联欢活动,这次中日两国青年大规模联欢的总负责人就是时任团中央书记处书记的胡锦涛。 下面的视频就是在一次联欢会上,胡锦涛发表了简短而又热情洋溢的讲话。当年的涛哥年轻帅气。如今涛声依旧,涛哥见老。明年十八大召开,真是江山代有才人出,各领风骚十几年。 http://bbs.sciencenet.cn/home.php?mod=spaceuid=40615do=blogid=500120
1251 次阅读|0 个评论
[转载]如何帮助患癌的亲人稳定情绪、确立信心
热度 1 dongzg101 2011-10-24 04:13
如何帮助患癌的亲人稳定情绪、确立信心 已有 38 次阅读 2011-10-21 10:52 | 系统分类: 博客新闻 | 关键词:癌症 心身 心理 信心 灵枢 中医 如何帮助患癌的亲人稳定情绪、确立信心 人为什么会生癌?或者是生活方式不合理,或者是情绪不好,或者是心理长期失衡。所以,要帮他仔细分析。找到一个事物发生的根本原因后,再告诉他为什么会这样,然后,再指点他怎么做才会更好,全面细致地帮助他解决一些问题,包括疼痛、情绪低落等症状。 告诉他,两类癌症患者通常活得很好 经验告诉我们,癌症治疗的第一步,首先是帮患者一把,从认知上、心理上、情感上,帮助患者。下面,我会为大家提供一些具体的方法。 我们注意到癌症康复最好的有两类人:一类是特别糊涂或大智若愚的人。 我特别喜欢治疗农村的老大妈、老大爷,也许他们的病常常比较重(因为病情轻一般不会来上海)。但是给他调整、治疗后,病情都会较为稳定。因为你这位上海大医生告诉他:“没什么问题,你是炎症(或其他什么病),回去好好吃药,就会没事的。”他通常会信以为真,高高兴兴地回去了,几年以后,都还活得好好的。 其实,那种自己心里很清楚,天天提心吊胆、时时紧张,吃睡都成问题,嘴里还说不怕的患者,根本没法从容理性地治疗。 处于中间一段的患者,天天都处于惶恐不安的状态。他为什么惶恐不安呢?因为他恐惧,因为他害怕。那么,医生怎么去帮助他呢?用专业说法来说,就是要帮助癌症患者解开心里的死结。这些问题不解决,就算积极进行治疗,效果都会大受影响。 因此,对肿瘤患者和对一般疾病患者的治疗完全不一样。第一步是要帮助肿瘤患者稳定情绪、确立信心。要明确地告诉他:癌症是一类慢性病,生了癌需要积极理性地治疗。 美国乳腺癌患者绝大多数可以长期活着, 90% 以上可以活 5 年以上。肝癌患者中国长时间活着的也有很多。比如一位海门的患者,患肝癌已经活了 19 年了,中间还有过复发。还有,我治疗的胰腺癌患者最长活了 20 多年了,现在 82 岁了。 所以,癌症患者生了癌以后,只要积极治疗、理性对待,就可以走出阴影,就可以像那些得了癌症仍长期生存的人一样,活得很好、活得很长。 《走出冬季》一书中,记载了许多真名真姓的癌症案例。 案例之一: 我叫李清溪 , 洛阳人,现年 60 岁。 2006 年元月 10 日检查身体时发现左肺上叶上面有一个 4.9 × 5.9 厘米的肿块,被确诊为左肺鳞状细胞癌 , 当时真如五雷轰顶 , 天旋地转 , 头脑一片空白。心想完了,常言说“十个癌九个埋,剩下一个不是癌”。这玩意儿咋整啊?元月 17 号进行手术左肺全切,意想不到的是手术时喉返神经被切除 1Cm 。说话已发不出声音。主刀医师说我康复后说话也不会再恢复到从前的声音了。 由于种种原因,返回家后情况非常不好,出现了手术并发症。胸闷,咳嗽,咳不出来,咽不下去,那叫一个粘啊,连团圆饭都不能吃。没有办法,吃了不少中药,野生灵芝水也喝了,均不能解决问题。给医院打电话,让过几天回洛阳复查。眼看我一天天的消瘦,家人万分着急,那个春节都不知道怎么过的,谁叫咱得的是癌症呢?谁还能有办法呢? 这期间,我儿子买了本书叫《肺癌》,我是无意中看到的。这本书里说鳞癌对化疗药物不敏感,也就是说不起作用。化了也白化?于是我推迟了化疗时间。这时,我的一个朋友拿着一份《洛阳晚报》对我说:“上海中医药大学教授、博士生导师何裕民 2006 年 4 月 9 号到洛阳来讲座,专门搞肿瘤方面的治疗与预防。”当时,我是抱着试一试的态度去听讲座的,真是不听不知道,一听真奇妙,讲的道理即深奥又通俗易懂。当即我就掉下了眼泪。 听何教授这么一说,我还真有了生存的希望了。因那时我的身体很弱,家不住洛阳,还要赶着回去,大伙让我提前看。当时不能说话,没法语言交流,病情及治疗过程只能靠手写。何教授问术后放化疗没有,我写没有,“没放化疗,就对了。”何教授诊断后对我说:“放化疗对你的癌症不敏感,这种情况下还做放化疗,不仅意义不大,而且还会进一步摧垮免疫系统,恶化体内微环境,给肿瘤复发转移创造条件。”接着给我开了 21 付中药方,还有中医药片剂。他说你先吃着好吗?有什么问题与我联系,随即给我写了他助手的联系电话。我先拿了中药,配着成药吃,这才叫不吃不知道,一吃真奇妙,简直是妙不可言。我吃了三天的药,气管特舒服、特清楚,像含了块薄荷冰糖似的。 第 9 天,奇迹出现了,那天是星期天,我往家里打电话,我爱人接电话。 “你是谁呀?” “你连我的声音都听不出来吗?”我听后已止不住泪流满面。待听出是我的声音后,她大喊:“孩子们快来呀,你爸会打电话啦!”只听电话那头孩子们大喊:“爸爸!爸爸!”孩子们高兴地嗷嗷叫。 我爱人抱着电话,说:“老李呀,你知道这些日子你有病,有多少人为你流泪吗?我为什么在你面前没有掉过泪呢?这种病最怕生气,不能有心理压力,需要有一个好的心情。老李呀,你能理解吗?”说着说着,已是泣不成声了。 我急着说:“理解,太理解了,你别哭了。”我知道很多看我的人,在我面前都忍不住哭了出来,“你看我吃何教授的药这不是好了吗?” 她说:“我哭什么呀,我这是高兴。” 内蒙古一朋友接到我的电话,都愣住了,没想到我这么快就能说话了,还和以前一模一样。 在西医完全束手无策的时候,中医给了我生存的希望,活着,真好。 我想告诉大家:得了癌症别害怕! 案例之二: 我叫李橙香,南通人,退休工程师, 2003 年( 73 岁时)对我来说,是人生道路上面临生死抉择关键的一年。这一年 3 月 15 日,被确诊为前列腺癌。这突如其来的恶讯,真是晴天霹雳。 尽管治疗了,我的病情还在一天天地急剧变化,右肺骨头疼痛,折磨得我难以忍受,脸色焦黄,人逐渐消瘦,身体极度虚弱。 4 月 1 日出院时,证实癌细胞已扩散到胸椎、腰椎、盆腔多处部位。病情已属晚期,生命危在旦夕,也无特效的西医药治疗。 4 月 29 日,我被迫再次住院。在再次住院期间,与我同住院的病友,磷肥厂驾驶员张 xx 、退休职工冯 xx 等和我病情相似的人朝夕相处。他们由于选择化疗放疗,相继去世。我心里很不是滋味,他们的悲剧一直在我脑海中浮现。 当我在茫茫雾海之中时,得知南通市癌友康复协会可帮助癌友走出阴影。于是,我找到了徐会长、黄郑周同志。他们热情地接待了我,帮助我、指导我正确地对待疾病、正确对待自己,并给我讲癌症不等于死亡的道理和许多癌症康复者的故事,要我树立战胜癌症的决心和信心,千万别被癌症吓倒,并给了我一些何裕民教授的资料。这些,使我茅塞顿开、如获至宝,使我看到了光明,看到了生命的希望。 因此,我与家人商量后,于 7 月 23 日,冒着高温,专车去上海请著名肿瘤专家、博士生导师何裕民教授亲自诊断。那天等候就诊的患者很多,排着队,依次轮号围圆桌而坐。当一位患者就诊结束,大家就顺时针移动一个座位。何教授坐在最右边,左边有两个助手协助工作。轮到我时,心情既紧张又焦虑。只见何教授拿起我的病历、 ECT 及其他片子仔细察看。把脉、望舌苔、询问病史,不放过一点疑点,那严谨认真以及和蔼可亲的态度,使我轻松了许多。 从那天起,我按照何教授开的汤药和制剂按时按量服用。两个星期后,奇迹出现了,骨头疼痛有所减轻、睡眠好转。 8 月 26 日,又去上海请何教授复诊。之后,经过三个月的治疗,脸色红润,精神大有好转。后经骨像扫描,病灶基本消失, PSA 正常。 如今,我仍在服何教授开的中药,已经整整 7 年了,康复效果很好。 告诉他癌症只是慢性病,与其他癌症患者结成对子,一帮一 癌症当然要理性对待,不是措施越多越好。至于老年人,我们不一定要和他实话实说,也可以瞒着他。 首先,告诉他癌症只是慢性病,然后告诉他生了癌,我们可以好好地应对。还可以找一些生了癌的,病情与他差不多的、已经康复得很好的,和他结成对子。让他们互相学习、互相鼓励,这些都是很好的措施,还要经常帮助他分析,及时解开他心里的疙瘩。 我们有个患者——王先生,在事业鼎盛时期生了肺癌。他的老师是上海人,先于他患了前列腺癌,现在我们这里治疗,情况相当不错。 这个患者生病之初特别悲观。他的老师就劝导他到上海待一段时间,并介绍了一些和他一样的肺癌患者,他们这些人天天在一起聊天、玩、练郭林功、吃中药。因为他本身经历非常丰富,有各种各样的故事,他愿意和大家分享,很多人也愿意和他聊,所以他的生活开始充实起来。原来那种失落、挫折、失望、心灰意冷一扫而光。 现在他已经基本恢复正常了,变成了一个热心的采风者,到处去旅游,然后写文章。所以说,处于困境当中的人,可以找些志同道合的、和你一样同病相怜的人,通过相互激励的方式,走出阴影走向康复。 张某 59 岁那年被诊断为胃癌。下面就是他在《走出冬季》一书中的自述: 我偶尔看了何裕民教授的资料,何教授提出:癌症是一种慢性病,“肿瘤的治疗模式要从战争模式向和平模式转变;肿瘤治疗的原则是科学、综合、合理;治疗的“十二字方针”是“调整为先、零毒为佳、护胃为要”。这些,我是非常接受和认可的,何教授对肿瘤的这些理解不是高深的理论,而是比较通俗的、平易近人的理念,光读他的这些文章,心里就敞亮多了。 我感到癌症并不像以前想像的那样可怕,可以从各个方面来解决这个问题。 手术后两个多月我找到了何教授(此后,我一直在接受他的治疗,现在活得很好)。最大的收获是心理上的调整和医疗上的直接得益。 我先做了 3 次化疗,反应很大,但西医还建议我做第 4 次化疗,我跟何教授商量,何教授认为根据我的情况,加强中医调理,第 4 次化疗可以不做。 没有来看中医之前,血常规检查的各项指标上窜下跳,没有几项是正常的。 但中医治疗以后,各项指标如肝功能、血常规、癌胚抗原指标全部正常了,这让我非常信服,也坚定了继续治疗的信心。 现在,何教授让我一周只需要吃三四天的药。他说因为我已经康复 6 年多了。现在只是调整、巩固,你想,这对我来说,是多大的喜讯啊! 最初,何教授还介绍了一些康复了的患者与我交朋友。我印象最深的是朱春女士。她虽然比我小几岁,但当时她的胃癌已康复 8 年了(现在应该 15 年了吧?)。而且,她开刀时是明确有转移的,与她的交往,对于我当时能够走出癌症恐惧阴影,意义重大。 帮他分析原因,指点迷津 人之所以生癌,是有原因的。尽管这个原因一时间不一定说得很清楚,每个人的情况又不完全一样。但是多多少少,我们还是可以帮助他分析。为什么要帮助他分析?因为癌症是内乱,人为什么会生癌?如果原因不明,导致内乱的相关因素就难以消除。就算暂时控制了指标或肿块,内乱的祸根仍然存在。过了一段时间,往往内乱还会再发生,也就是癌症会转移复发。 所以先要告诉患者:癌症只是慢性病。对策很多,很多对策能够较好地解决问题。但要理性地、合理地、巧妙地选择与应对。 其次,要帮患者分析:你为什么会生癌?可能是生活方式不注意,可能是个性过于认真,可能是长期过于压抑自我。总之,要帮他仔细分析。用中医经典《灵枢》中的话来说,就是先“告之以其败”,就是告诉你为什么会这样。然后,“语之以其善”,就是指点他怎么走才会更好些。再次,“开之以其所苦,导之以其所便”,积极帮助他解决一些痛苦的症状等问题。 所以,对于刚刚获悉自己病情的癌症患者,尤其是心里忐忑不安、高度恐惧者,要结合其性格特点,帮他进行分析。
1397 次阅读|2 个评论
[转载]Wordsmith Tools简介(转)
zhanghongwei11 2011-10-23 21:33
源自 http://hi.baidu.com/seanxpq/blog/item/5d1f3b8081eb24ac0cf4d2fd.html/cmtid/a24db214e2920017972b4390 I. WordSmith Tools 简介: WordSmith Tools 是一个在Window下运行的用来观测文字在文本中的表现的功能强大的综合软件包。它共包含 Concord (语境共现检索工具)、WordList (词频列表检索工具)、KeyWords(关键词检索工具)、Splitter(文本分割工具)、Text Converter (文本替换工具)、Viewer(文本浏览工具)等六个程序,其中前面三个程序是主要的文本检索工具,后面三个程序属于辅助性工具。这六个程序的各项设置由一个叫WordSmith Tools Controller(文字匠工具控制器)的程序来控制。 II.各个工具的操作和主要功能介绍: 1.Concord 1)基本操作过程:  在WordSmith Tools Controller窗口中选择Tools选项。当该选项打开,你就会看到Concord。单击它,Concord的窗口将打开。  按下 按钮,将出现一个对话框,选择将进行语境共现检索的文本文件。  确定一个检索词或短语。  如果要改变设置,按Horizons etc按钮,对缺省的设置值进行修改。  按 Start Concordance 按钮,检索开始。窗口上出现检索进行的状态条。检索结束,结果显示在Concord 的窗口。  如果要保留语境共现检索的结果,按 按钮存盘。 2)主要的功能:  语境共现(Concordance):  语境共现(Concordance)的窗口显示: 语境共现(Concordance)的窗口包括六个纵列,例如: A. N 列:显示检索项的数目。 B. Concordance 列:显示语境共现检索的结果。 C. Set 列:在这一列,用户可以使用任何字母对条目进行分类。例如,如果你想对检索词的动词和名词用法进行归类,你可以键入字母V或N。要清除键入的字母,按0(零)。 D. Tag 列:显示最接近的标记符号。 E. Word No. 列:显示检索词在文本中的位置。例如,上面例子中条目1 的检索词good 是文本的2,265个单词。 F. File 列:显示源文本的文件名。 G. % 列:以百分比的形式显示检索词在文本中的位置。  要想得到有关语境共现检索的结果的更多的信息,按下面的按钮:  按 按钮 ,可增加语境共现检索的结果每行的显示量,按 按钮 ,可减少语境共现检索的结果每行的显示量。  按( )按钮,可启动文本浏览工具(Viewer),对源文本进行查看。  按 按钮,可查看检索词在规定的语境范围内的搭配词的情况。例如,下图是在上例中检索词good在左右各五个词的语境范围内的搭配词的情况。从图中可以知道,搭配词very共出现29次,其中在good的左边26次,右边3次,而在左边的26次中有23次是作为左边的第一个单词出现。  按( )按钮,可打开检索词分布图窗口。检索词分布图窗口显示的内容如下: File 源文本文件名 Words 源文本文件中单词的数目 Hits 找到的检索词的数目 per 1,000 每千字检索词的数目 Plot 检索词分布图显示检索词在文本中出现的位置  按 按钮,Concord将检索语境共现检索的结果中的句子,找出重复出现的字串(word clusters)。字串的大小的推荐值一般为2—4个字,最低出现率为3个。例如:  按( )按钮,打开用词类型(Patterns)窗口,显示临近检索词的单词的统计资料。这些单词按出现频率的高低从高到低排列。例如:  取消检索词 按空格键或选择窗口View选项中的Blanked out, 语境共现检索的结果中的检索词将被一行星号代替。要恢复检索词,重复一次前面的操作。  对语境共现检索的结果重新排序  语境共现检索进行时,检索的结果是以语境在文本中的出现顺序排列的。当语境共现检索一完成,它就会以当时的缺省设置进行重新排序。如果不想重新排序,将缺省值设定在File, File 位置。语境共现检索的结果重新排序有以下几种方式: A. 根据检索词的左或右的某个位置的单词进行排序。 B. 根据检索词本身进行排序。 C. 如果有语境词,可根据语境词进行排序。 D. 根据最近的标码符号进行排序。 E. 根据与最近的标码符号的距离进行排序。 F. 根据用户自己的分类进行排序。 G. 根据在文本中的出现顺序排序。  语境共现检索结果的重新排序,可以根据三重标准同时进行。这三重标准分别在Main Sort, then by, finally by 三个对话框中设定。另外,重新排序时,可以设置区分或不区分大小写,按升序还是降序排列,既可以将所有的检索项重新排序,也可以设定将一定范围内的检索项重新排序。  保存和打印语境共现检索结果 可以将语境共现检索的结果保存为文本文件或是可以在Concord再打开的文件。按下F3 或选择File 的Print选项,将打印语境共现检索的结果。 3)参数设置:  检索词(search word): A. 检索词可以是一个单词,一个短语或是一个包含许多检索词的文本文件。 B. 按照缺省设置,Concord进行的是不区分大小写的整词检索。格式如下: 检索词 结果 book Book or book or BoOk book book, books, booking, booked *book textbook (but not textbooks) bo* in book in, books in, booking in (but not book into) book * hotel book a hotel, book the hotel, book my hotel bo* in* book in, books in, booking in, book into book? book, books, book; book. book^ book, books b^^k book, back, bank, etc. ==book== book (but not BOOK or Book) book/paperback book or paperback 符号 意义 例子 * 代表多个任意字符 book* ? 代表单个任意字符(包括标点符号) Engl??? ^ 代表单个任意字母 Fr^nc^ == 区分大小写 ==French== ==Fr*== :\ 表示一个可包含多达500 个检索词的文本文件 (参看帮助中的 file-based search words) c:\text\frd.txt / 分隔多个检索词。你可以选择多达15个检索词,但字符的总数不能超过80。 may/can/will 如果要使用 *, ? , == , ^ , :\ or / 作为检索词中的一个字符,要将这些符号放到双引号内,例如: "*" Why"?" and"/"or ":\"  语境词(context word): A. 为了限制语境共现的检索,可以指定一个语境词在检索词的规定的语境范围内出现或不出现。 B. 语境词的输入格式与检索词的相同,只有一个不同的符号~ 。~表示该词在规定的语境范围内不出现。例如: 当search word是book 而 context word是 hotel* 时, Concord将只会找到hotel or hotels 出现在其语境范围内的book 。 当search word是book 而 context word是 ~paper* 时, Concord将只会找到paper or papers 不出现在其语境范围内的book 。  语境范围(horizons): 语境范围设置限定在语境共现中检索词的左右两边各可以出现多少个单词。最高值是 左右两边各可出现25个单词。  检索项的数目(entries wanted): 语境共现中检索项的数目的最大值可达16,368 行。 但用户可以在 Controller 的Adjust Settings | Concord选项中对检索项的数目自行定义,还可以设定Concord 对检索项进行随机抽取。  搭配词(collocate): 搭配词的最短长度为一个字母,最低出现频率为一次。但是在语境共现中出现一两次的搭配词是不能说明什么问题的。用户可以在 Controller 的Adjust Settings | Concord选项中对搭配词的最短长度和最低出现频率自行定义。 2.Wordlist 1) 基本操作过程:  在WordSmith Tools Controller窗口中选择Tools选项。当该选项打开,你就会看到WordList。单击它,WordList的窗口将打开。  按下 按钮,将出现一个对话框,选择一个或多个文本文件。  按 Make a word list now 按钮,检索开始。窗口上出现检索进行的状态条。检索结束,WordList出现三个窗口显示检索结果。这三个窗口分别显示以字母为序的词频列表,以频率为序的词频列表以及综合统计数据。  如果要保留词频列表的结果,按 按钮存盘。 2) 主要的功能:  创建词频列表(word lists):  词频列表(word lists)的窗口显示:  以字母为序的词频列表的窗口(部分)显示如下:  以频率为序的词频列表的窗口(部分)显示如下:  综合统计数据的窗口(部分)显示如下:  创建单词索引列表(index lists): 单词索引列表的作用是记录所有单词在文本中的位置,以便了解每个词在文本的那一部分出现。另一作用是加快对列表中单词的检索处理,例如,如果选择列表中一个或多个单词,按下 按钮,就会得到快速的语境共现检索的结果。另外,在单词索引列表中,还可以计算单词与那些词搭配以及与搭配词的相关值( “Mutual Information” scores)  建立单词索引列表  打开 Controller, 选择Adjust Settings | Indexing 选项,进行以下的设置: A. 确定单词索引列表的路径和文件名。 B. 激活Actitated对话框。 C. 激活File order too对话框(非必选)。 D. 选择出现多少次的高频词要被删除。 E. 按OK按钮。  打开WordList, 选择菜单Index的New Index 选项, 指定要进行操作的文本文件,再选择Index的New Index 选项。检索结束,将在指定的路径生成三个扩展名分别是*.wdx, *.xfo, 和*.xal的文件。  浏览建立的单词索引列表: 打开WordList, 选择菜单Index的 Alphabetical List 选项或File Order List 选项。选定要打开的单词索引列表文件,就可以浏览建立的单词索引列表。例如:  计算相关值(mutual information): A. 要计算相关值,单词索引列表必须是在激活了 “File Order too” 复选框的情况下建立的。 B. 选择菜单Index的 Alphabetical List 选项,打开建立的单词索引列表。 C. 按 按钮,选择要计算相关值的词条,然后按 按钮。如果没有选择任何词条,按 按钮将计算单词索引列表的所有词条的相关值。例如,在上图中,词条answer在文本的最常见的搭词是know,它们的相关值4.48。  词频列表的批处理 用户可以一次选择多个文本进行词频列表的创建。例如,选择10个文本同时进行词频列表,既可以得出一个基于10个文本的大的词频列表,也可以得出十个分别基于10个文本的的词频列表。  字串的词频列表: 词频列表不必一定以单词为单位,也可以以2-8个单词的字串为单位创建词频列表。选择WordList 主菜单的 Settings | Min. Max. Frequencies 选项,激活复选框,选择字串的大小,就可以进行字串的词频列表。  对词频列表的编辑:  合并词条到同一词类(Lemmatisation): 例如,你可以将属于不同类型(type)的词条want; wants; wanting; wanted 合并到同一词类(lemma) want中。  手动合并: A. 使用 F5 选定要合并的词条, 第一个被选定的词条将成为词类(lemma)的名称(head)。 B. 使用 F4 可将所有选定的词条合并。  基于文件的合并: 建立一个将属于同一词类的不同类型(type)的词分组归类的文本文件(例如,be-was, is ,were, am, are go-goes, going, went, gone)。按 按钮,WordList将根据文本文件的分类为标准对当前词频列表的所有词条进行词类(lemma)合并。  词类(lemma)合并结束后,按 按钮,将显示重新计算的综合数据。  词频列表的排序:  按 按纽或F6,可对词频列表重新排序。  选择正确的语言:许多语言有自己特殊的字母排列顺序,所以在排序或重新排序之前,应检查是否在语言选项选择了正确的语言。另外,在缺省值中,某些语言中的带重读符号的字母与不带重读符号的同一字母是同等对待的。  按单词结尾排序:选择反向排序选项(Reverse Sort), 可以按单词的结尾的字母顺序排序。这样,就能将以某种后缀结尾的单词,例如,-ing 形式结尾的单词列在一起。  比较两个词频列表: 选择WordList中 Comparison菜单下的 Compare 2 Wordlists 选项,选中两个要进行对比的词频列表,就可以对两个词频列表进行比较。这一功能可以帮助进行文体方面的比较。例如,比较一篇文章的不同译本中对某个词的不同翻译。  简单一致性分析:Consistency Analysis (simple) 这一功能可以对超过五十个词频列表一次性进行比较分析,然后生成一个基于所有文本的词频列表。这一功能可以帮助找出哪些词是在大量的某一特定类型的文本中一贯出现的。  详细一致性分析:Consistency Analysis (Detailed) 这一功能与简单一致性分析的功能完全一样,只是提供的分析更为详细,而且进行分析的词频列表不能超过五十个。这一功能可以帮助进行文体方面的比较。 3.KeyWords 1)主要功能:  KeyWords 主要作用是确定某个文本的关键词是什么以及它们在文本中的位置。要实现着这一目的,必须先用WordList 工具建立两个单词列表。这两个单词列表中,一个是根据要考察的文本建立的,而另一个作为参照的单词列表,必须是根据较大型的由同类文本组成的语料库建立的。大的单词列表将为比较提供背景数据。  文本中的关键词(key words),是指在两个单词列表的比较中得出的那些在所考察文本中出现频率突出的词。得出的关键词以它们在文本中的出现频率的突出程度由高到低排列。  KeyWords 的潜在用途包括:语言教学,文体研究,文本内容分析,文本归档等。 2)KeyWords 的参数设置 在Controller中的Adjust Settings/KeyWords 选项下,可以对以下的参数进行设置: a. 最大的P值。 b. 关键词列表的最大数目。(缺省值是500) c. 关键词在所考察文本中的最低出现频率。(缺省值是3次) 3) 基本操作过程:  在WordSmith Tools Controller窗口中选择Tools选项。当该选项打开,你就会看到KeyWords。单击它,KeyWords的窗口将打开。  按下 按钮,将出现一个对话框,在对话框选择一个要进行研究的单词列表和一个作为参照的单词列表。  按 OK 按钮,检索开始。窗口上出现检索进行的状态条。检索结束,KeyWords出现一个窗口显示关键词列表。  如果要保留关键词列表的结果,按 按钮存盘。  关键词列表的显示窗口包括以下内容(见下图): a. 每个关键词。 b. 关键词在所考察的文本中的出现频率。 c. 要考察的文本的文件名及百分比。 d. 关键词在参照文本中的出现频率。 e. 参照文本的文件名及百分比。 f. 关键词的关键值。 g. p 值。 4)对关键词列表的结果的编辑:  按窗口中的 按纽,将会显示关键词在文本中的分布图。  每按一次 按纽,关键词列表的结果将会按照下面的顺序循环排序:以关键值为序,以字母为序,以在考察文本中的关键词的频率为序,以在参照文本中的关键词的频率为序。 III.三个辅助工具主要功能简绍: 4.Splitter(文本分割工具) Splitter的用途是为了文本分析的目的将大的文件分割成小的文本。它通过在大的文本中插入某个符号,例如 /Text, Splitter将自动识别这些符号,将大的文本分割成若干个小文本。 5.Text Converter (文本替换工具) Text Converter这一程序的主要功能有: A. 编辑文本,对文本进行重命名,改变文件的属性,将文件移动到新的路径。 B. 在文本中执行搜索和替换功能。它一次可以搜索多达16,368个文本文件,并可以同时进行500个条目的替换。 6.Viewer(文本浏览工具) Viewer的主要作用是帮助使用者浏览源文本文件。在使用三个文本检索工具的时候,只要按浏览工具按纽 ,就可启动Viewer。
7550 次阅读|0 个评论
[转载]IEEE 的Latex模版中Journal与Conference的区别
augustwang 2011-10-23 00:18
IEEE 的Latex模版中Journal与Conference的区别 关键词 : Latex ieee journal transaction conference IEEE提供的Latex模版包括了一个IEEETran.cls文件。对于journal和conference的投稿,都使用的是同一个cls文件,只是在documentclass语句后加一个可选项 或者 来予以区分。 在 默认情况下,conference中是不显示关键字(即Index Terms)的,即使在源文件中的abstract之后加了\begin{keywords}......\end{keywords}也不行。这是因为 默认情况下模版对journal和conference是进行不同处理的。除了关键字之外,还有其他一些区别,比如页码、编号等等。 有些变 态的会议会有一些变态的要求,比如要求按照IEEE的标准文档进行排版,但是又需要显示出关键字,并且还没有给出可用的Latex模版,只给出word的 模版。这种情况下如何利用标准的IEEE模版在conference中显示出Index Terms呢? 解决的方法是在usepackage之后,begin{document}之前,加上一条语句 \IEEEoverridecommandlockouts ,这样就能使得在conference中也能像journal中那样显示出Index Terms 等内容。
8944 次阅读|0 个评论
拉尼娜事件发生警报可以解除
热度 1 杨学祥 2011-10-18 03:20
拉尼娜事件发生警报可以解除
2011年10月17日,赤道中太平洋变暖明显,拉尼娜发生的警报可以解除。事实证明,9月过后,拉尼娜事件形成的可能性不大。 2011年10月17日赤道太平洋海温异常 附件: noaa预期拉尼娜:将在2011年10月至2012年1月间加强? 已有 227 次阅读 2011-10-13 09:21 |个人分类:科技点评|系统分类:观点评述|关键词:拉尼娜 海温异常 noaa预期拉尼娜:将在2011年10月至2012年1月间加强? 杨学祥 根据noaa海温研究数据,今年为拉尼娜年,从去年9月到今年4月均有较为明显的拉尼娜气象。根据最新的noaa数据,海洋气温已进入新一轮的拉尼娜状态,预期将在2011年10月至2012年1月间加强,后期将影响南美大豆种植生长,有可能对美豆价格形成潜在支撑。 7月30日-11月6日为地球自转减慢时期,有利于拉尼娜的形成。9月23日秋分是形成拉尼娜的高潮时期,9月过后,拉尼娜形成的可能性不大。 两种预期需要时间检验。 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=496243 趋势分析结果不同:拉尼娜天气很可能在第四季度返回? 已有 238 次阅读 2011-10-11 03:40 | 个人分类: 科技点评 | 系统分类: 观点评述 | 关键词:拉尼娜 地球自转 趋势分析结果不同:拉尼娜天气很可能在第四季度返回? 杨学祥 Somar气象学者CassiaBeu称,“拉尼娜天气很可能在第四季度返回,意味着南部谷物种植带天气将较为干旱,中西部地区则较为潮湿。” 2011年10月10日赤道太平洋海温异常再次表明,赤道东太平洋正在变暖,形成拉尼娜事件可能性不大。 2011年10月10日赤道太平洋海温异常 巴西主要大豆种植带预计迎来大范围降雨 http://www.sina.com.cn 2011年10月10日 13:01 世华财讯    气象预报机构Somar称,巴西南部大豆主产区周末预计迎来大雨天气,且重要的中西部地区下周晚些时候将出现大范围降雨。   综合媒体10月7日消息,当地气象预报机构Somar周五称,巴西南部大豆主产区周末预计迎来大雨天气,且重要的中西部地区下周晚些时候将出现大范围降雨。   尽管缺少大范围降雨,中西部各州的播种工作已经开始。巴西最大的大豆生产州--马托格罗索州局部地区具有充足的降水,种植户已开始播种。   预计于10月14-17日迎来的普遍降雨可能会加快未来几日马托格罗索和亚斯州的播种。   农户的大豆播种工作于9月末开始在中西部展开,并且持续到12月,在南部结束。   在南部主产州,第二大大豆产区帕拉那州和第三大产区南里奥格兰德州未来五日预计迎来大雨天气。帕拉纳州播种进度加快,逾5%的预计播种面积已经于本周初完成。   帕拉纳州未来5日预计出现113毫米(4.3英寸)降水。Somar数据显示,南里奥格兰德预计周末有78毫米降水,该州通常直到11月才开始播种。Somar称,未来几周,如果有降雨出现,土壤水分将有助于种子发芽,且缩短干旱期。   未来几日,局部阵雨将会给马托格罗索州带来15-17毫米降水。该州的西部地区播种进展一直迅速,因该地区获得较多的常规降雨。Somar称,预计下周早期该州南部大豆产区降水增加。   第四大大豆产区亚斯州(Goias)周末和下周初将迎来阵雨。   Somar在10日预报中称,10月14-17日,马托格罗索和亚斯州将恢复更多大范围降雨,因冷锋继续提前进入巴西。   Somar气象学者CassiaBeu称,“拉尼娜天气很可能在第四季度返回,意味着南部谷物种植带天气将较为干旱,中西部地区则较为潮湿。”   巴西国家商品供应公司(Conab)周四在首次谷物产量预估中称,若出现与拉尼娜相关的干旱天气威胁南部谷物种植带,巴西明年大豆产量或将遭受十年来最大降幅。   然而,去年大豆丰收也是受到拉尼娜天气的影响,其延误了春季降水。但单产仍达到了纪录高位,因中西部和南部降雨量接近理想水平。   今年降水好于去年。   (王德军 编辑) http://finance.sina.com.cn/money/future/20111010/130110591871.shtml 拉尼娜进展:发展成拉尼娜事件的可能性降低 已有 196 次阅读 2011-10-4 04:11 | 个人分类: 科技点评 | 系统分类: 观点评述 | 关键词:地球自转 拉尼娜 厄尔尼诺 推荐到群组 点评:9月过后,形成拉尼娜事件的可能性明显降低。 2011年10月3日赤道中东太平洋海温变化 2011年10月3日赤道中东太平洋海温变化 拉尼娜进展:发展成拉尼娜事件的可能有多大? 2011-10-1 03:45 赤道中东太平洋再次进入拉尼娜状态 应加强防御秋台影响 来源:中国气象报社 发布时间: 2011年09月30日 14:11:00 http://www.cma.gov.cn/qxxw/xw/201109/t20110930_105081.html 拉尼娜进展低于预期 赤道中太平洋冷暖交替 2011-9-30 06:15 | 个人分类: 科技点评 | 系统分类: 观点评述 | 关键词:拉尼娜 厄尔尼诺 地球自转 拉尼娜进展低于预期 赤道中太平洋冷暖交替 杨学祥 每年4月9日-7月28日(110天)及11月18日-1月23日(66天)为地球自转加速阶段,有利于厄尔尼诺事件的形成,季节性的厄尔尼诺现象就发生在每年12月25日圣诞节附近;1月25日-4月7日(72天)及7月30日-11月6日(109天)为地球自转减速阶段,有利于拉尼娜事件的形成。 赤道中太平洋变冷出现反复,拉尼娜形成不能确定。 2011年9月19日(下)、26日(中)和29日(上)赤道太平洋海温异常对比(蓝色表示变冷,黄色表示变暖)。 7月30日-11月6日为地球自转减慢时期,有利于拉尼娜的形成。9月23日秋分是形成拉尼娜的高潮时期,9月过后,拉尼娜形成的可能性不大。 http://miit.ccidnet.com/art/32559/20110929/2875553_1.html 拉尼娜发展出现反复 2011-9-27 04:33 赤道中太平洋变冷出现反复,拉尼娜形成不能确定。 2011年9月19日和26日赤道太平洋海温异常对比(蓝色表示变冷,黄色表示变暖)。 7月30日-11月6日为地球自转减慢时期,有利于拉尼娜的形成。9月23日秋分是形成拉尼娜的高潮时期,9月过后,拉尼娜形成的可能性不大。 http://blog.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=489788 http://blog.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=490787 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=491934    2007年9月20日的拉尼娜事件 http://blog.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=493049 http://bbs.sciencenet.cn/home.php?mod=spaceuid=2277do=blogid=495416
个人分类: 科技点评|3756 次阅读|0 个评论
[转载]不识“庐山”真面目,可喜,可叹!
wyc 2011-10-14 17:31
日游大连 已有 129 次阅读 2011-10-5 23:55 | 系统分类: 图片百科 | 关键词:大连 我虽身居大连近60年,还得感谢李丕鹏老师让我更了解了大连之美。?
个人分类: 未分类|1604 次阅读|0 个评论
[转载]疯狂高利贷会否导致“中国式的次贷危机” 【转载】
dongzg101 2011-10-11 05:06
疯狂高利贷会否导致“中国式的次贷危机”【转载】 已有 23 次阅读 2011-10-11 02:40 | 系统分类: 科研笔记 | 关键词:次贷危机 高利贷 http://finance.ifeng.com/news/industry/20110927/4689455.shtml 钱从银行流入民间借贷,资金链条越拉越长,而借钱的企业无法偿还,最终会对银行产生冲击,牵连的经济体越来越多,从而发生所谓“中国式的次贷危机” 这是个民间借贷几近“疯狂”的年代。 乌云笼罩的一个上午,几名彪形大汉撞入行长办公室,把郑林(化名)请到外头“谈心”。这位上海某股份制银行支行长返回时,已经落得一身残废。根据郑林的说法,某钢贸企业欲从银行贷款,但一直未获批。郑林把钢贸老板介绍给民间高利贷公司,并从中收取高额好处费。郑林声称,他建议钢贸老板先从银行外的渠道获取资金,待银行贷款下放后再还给高利贷公司。此后,因为种种原因,银行不再做钢贸企业贷款,钢贸老板被高利贷几近逼疯,遂雇人行凶。 这还不是最糟糕的。事实上, 一些高利贷的钱是从银行流出 ,借钱的企业无法偿还,最终会对银行产生冲击,牵连的经济体也会越来越多。 老板出逃“成风” 欠下高利贷而雇凶伤人只是少数,这几个月来,更多的是不少欠债老板忽然“出走”。6月,温州一家电器合金实业公司股东之一因涉及约千万民间借贷“出走”,乐清某电子公司老板叶某因无力偿还7000万元巨债“出走”;7月,温州龙湾巨邦鞋业老板因涉及约1亿元担保资金“出走”;8月,温州鹿城区某鞋材企业停工,传老板因欠巨款“出走”,温州部落之神鞋业老板“出走”;9月,温州奥米流体设备科技有限公司,骗员工出游,老板“出走”,温州眼镜行业龙头老大信泰集团,传其董事长胡福林可能已经“出走”。 今年以来,由于欧美债等危机导致国际经济动荡不安,出口订单的萎缩以及劳务、原材料等成本的不断上涨使以出口为主的温州等地中小企业的经营情况十分艰难,加上货币政策收紧,几乎隔断了中小企业依靠银行贷款融资的道路,让它们不得不转向民间借贷市场“解渴”。 在上述因素的作用下,民间借贷市场迅速火爆起来,借贷利率随之水涨船高,几欲“疯狂”。央行温州中心支行一份相对保守的统计数据显示,今年第一季度各月份温州民间借贷综合年利率分别为23.01%、24.14%和24.81%,单季上涨11.91%,比上季度涨幅高8个百分点。 温州中小企业发展促进会会长周德文更是指出,中小企业聚集代表地温州目前的民间借贷利率水平已超过历史最高值,一般月息是2到6分,有的甚至高达1角5,年利率高达180%。而大多数中小企业的实业毛利润不会超过10%,一般在3%-5%,借高利贷很容易导致企业资金链断裂,被逼上绝路后不得不“出走”。 “正规金融机构与民间金融间存在的利息差是导致民间借贷利率高的原因,同时也是信贷配置不合理的结果。金融危机后,银行资金愈加倾向大企业、大项目,而通胀形势出现后,国家实行了长期的货币紧缩政策,使中小企业信贷更为紧张,在此种情况下,只好转向民间借贷,风险逐渐暴露。”清华大学中国与世界经济研究中心 袁钢明 对《 国际金融报 》记者表示。 银行充当二传手 据了解,民间借贷参与者众,甚至有银行资金也充当了民间拆借的“二传手”。著名财经评论员叶檀也证实了这一点,她指出,“9月份前半个月工、农、中、建四大国有商业银行的存款比8月末大幅减少。从我们掌握的数据和一些案例来看,确实有相当资金流向了民间金融市场,以及从民间金融市场流向了高利贷企业,流向了投融资公司。” 有分析认为,钱是从银行流入民间借贷,资金链条慢慢越拉越长,而借钱的企业经营出现情况无法偿还,最终会对银行产生冲击,牵连的经济体也会越来越多,从而发生所谓“中国式的次贷危机”。 “如果国家再不‘出手’,肯定会出现次贷危机。”据袁钢明了解, 有些大企业利用优势以低息从银行贷款,然后加价转给别的企业进行投机 。那些企业因为借贷利息高,会用钱进行高 风险投资 ,如房地产等暴利行业。一旦投机产业出现风险,就会引爆次贷危机。这也是国家银行不给中小企业规范的贷款资格的后果。 袁钢明进一步指出,“最近部分中小企业因融资链条断裂跑路,很多都是因为把资金大量投入房地产、买矿等高风险暴利行业而出事的。踏踏实实做实业的,资金反而并没那么紧。”此观点也得到了国务院发展研究中心金融研究所副所长巴曙松的赞同。 民间借贷越来越疯狂,应该如何化解风险呢?对此,袁钢明给出三点建议: 一是坚决控制投机性产业投资或金融活动 ; 二是适当放松过紧的货币政策 ; 三是提高存贷款利率 。 卫容之 李慧
834 次阅读|0 个评论
摘要与关键词
热度 1 liwenbianji 2011-9-27 17:56
文章的摘要十分关键,因为很多研究人员只读摘要而不读全文。因此,摘要提供准确而详尽的研究总结十分重要:它可以帮助研究人员了解你所开展的工作、你的研究目的和研究发现以及研究结果的益处和重要性。摘要必须能够独立成文,具备研究概要的功能,使人不看全文就能读懂。在阅读摘要后对文章细节感兴趣的读者自然会继续阅读全文。因此摘要不必太面面俱到,例如,可不必列举方法细节。 尽管摘要是论文的第一部分,但事实上应最后撰写。在完成其他部分后应尽快写摘要,因为这些内容依然清晰地印在你的脑海中,使你能够对自己的工作进行简明而全面的总结,而不至于忽略任何重要的内容。不同期刊对摘要的撰写要求有所不同,因此应参照目标杂志的《稿约》了解具体要求。尽管杂志要求不同,但依然存在一些普遍应遵守的惯例: • 应注意对字数的限制。通常来讲摘要的字数限制平均为250个词,但许多杂志要求更短些(如《Nature》和《BBRC》对摘要的篇幅限制为150个字),而许多杂志(如《BioMed Central》)允许摘要篇幅稍长些。这充分说明了为什么应在写文章之前确定目标杂志。 • 应避免使用技术行话,从而使摘要更易懂,更具可读性。不同目标期刊的“技术行话”取决于杂志的读者情况(可以通过期刊网站查询)。例如:“焦虑测试”一词通常比“高架十字迷宫实验”更容易理解,除非该杂志专门针对行为研究人员。通常摘要因受篇幅所限不能对技术术语进行定义和解释。如果术语使用不可避免,应在首次提到时用简单的措辞加以定义。 • 如同技术术语一样,应尽量不使用缩略语,其可用性也取决于不同的目标期刊。例如,大多数杂志接受HIV的使用。相比之下,RT-PCR对于分子生物学技术的杂志是可以接受的,但绝大多数杂志要求在首次使用时给出完整拼写(reverse transcriptase polymerase chain reaction)。许多杂志在网页上列出可使用的缩略语。反复使用三次或以上的必要的缩略语应在首次使用时给出完整拼写。只使用一次或两次的缩略语应使用全称,除非这样做超出了字数要求。摘要中已给出全称的缩略语在正文中首次使用时也应给出全称。 • 尽管一些杂志允许在摘要中引用文献,但绝大多数杂志不允许引用文献。因此,除非你要投稿的杂志允许这样做,否则不应在摘要中引用文献。 以下是BBRC杂志作者须知给出的指导性意见: • 摘要应放在第2页,即标题页之后 • 摘要应采用一段式,总结文章的主要发现,篇幅不超过150字 • 摘要后应列出10个用于收录和检索的关键词 一些杂志要求采用结构式摘要,分为背景、目的、方法、结果和结论。临床期刊可能要求额外或不同段落,如“patients”。因此,再次强调,在动笔之前应查阅目标杂志的《稿约》,确定杂志的具体版式或格式要求。 摘要后经常需要列出由作者选择的关键词。《稿约》会指出要求列出多少个关键词,甚至提供可供参考的关键词清单。选择合适的关键词很重要,因为他们可作检索之用。选择合适的关键词可以使你的文章更容易被发现和引用。因此,关键词越切合你的文章内容越好,应避免选择多数研究所适用的一般性术语。 实例:让为这个题目选择合适的关键词: “Region-specific neuronal degeneration after okadaic acid administration” 好的关键词:okadoic acid、hippocampus、neuronal degeneration、MAP kinase signaling以及mouse (或是rat或其他实验动物)。 差的关键词:neuron、brain、OA (简写)、regional-specific neuronal degeneration以及signaling。这些词过于笼统。 英文原文 The snapshot: abstract and keywords Your paper’s abstract is critical because many researchers will read that part only, rather than reading the entire paper. Therefore, it is critical that it provides an accurate and sufficiently detailed summary of your work so that those researchers can understand what you did, why you did it, what your findings are, and why your findings are useful and important. Your abstract must be able to stand alone, that is, to function as an overview of your study that can be understood without reading the entire text. Readers who become interested in learning more details than can be included in the abstract will inevitably proceed to the full text. Therefore, the abstract does not need to be overly detailed; for example, it does not need to include a detailed methods section. Even though the abstract is one of the first parts of your paper, it should actually be written last. You should write it soon after finishing the other sections, while the rest of the manuscript is fresh in your mind, enabling you to write a concise but comprehensive summary of your study without overlooking anything important. Requirements for abstracts differ among journals, so the target journal’s instructions for authors should be consulted for specific details. Despite differences among journals, there are a few general rules that should be obeyed when writing an abstract: • The word limit should be observed; 250 words is probably about average and commonly adopted as a word limit for the abstract, but many journals request shorter abstracts (for example, Nature Articles and BBRC both have a 150-word limit) while many others (for example, BioMed Central journals) allow longer ones. This is one good reason why the target journal should be identified before you write your paper. • Technical jargon should be avoided so that the abstract is understandable for a broad readership, although what is considered “technical” may vary depending on the target journal’s audience (check the journal’s website for details of their readership). For example, “a test of anxiety” would generally be clearer than “elevated plus-maze test” in an abstract unless the journal was specifically targeted to behavioral researchers. Usually, there simply isn’t enough space in the abstract to define and explain technical terminology. If such terminology is unavoidable, it should be defined in simple terms where it is first used. • Like technical jargon, abbreviations should be limited as much as possible, although their acceptability may again depend on the target journal. For example, HIV is likely to be acceptable in abbreviated form by most journals. By contrast, RT-PCR might be considered acceptable by a journal reporting molecular biology techniques, but would it need to be spelt in full (reverse transcriptase polymerase chain reaction) in most journals at first use. Many journals provide a list of acceptable abbreviations on their websites. Necessary abbreviations used three or more times should be defined at first use; however, abbreviations used only once or twice should be spelled out in full unless doing so causes the word limit to be exceeded. Abbreviations that are defined in the abstract will need to be defined again at first use in the main text. • Although some journals do allow references to be cited in the abstract, the vast majority do not. Therefore, unless you plan to submit to a journal that allows it, you should not cite references in your abstract. If we look at the instructions to authors for BBRC, we can see the following guidelines: • The Abstract should be on page 2, i.e., after the title page • The Abstract must be a single paragraph that summarizes the main findings of the paper in fewer than 150 words. • A list of up to 10 keywords useful for indexing or searching should be included after the Abstract. Some journals request structured abstracts divided into sections such as background, objectives, methods, results, and conclusions. Clinical journals may require additional or alternative sections, such as ‘patients’. Therefore, it is again necessary to check the target journal’s instructions for authors to determine the particular formatting/outline requirements prior to writing. Abstracts are frequently followed by a list of keywords selected by the authors. The instructions for authors will state how many keywords are required and may even provide a list of recommended keywords. Choosing appropriate keywords is important, because these are used for indexing purposes. Well chosen keywords enable your manuscript to be more easily identified and cited. Thus, the keywords should be as specific to your manuscript as possible, and general terms, which could apply to an enormous number of studies, should be avoided. Examples: Let’s consider some appropriate keywords for the following title: “Region-specific neuronal degeneration after okadaic acid administration”. Good keywords would be: okadaic acid, hippocampus, neuronal degeneration, MAP kinase signaling, and possibly mouse (or rat or whatever experimental animal was used). Poor keywords would be: neuron, brain, OA (as an abbreviation), regional-specific neuronal degeneration, and signaling. These terms are simply too general. Dr Daniel McGowan 分子神经学博士 理文编辑学术总监
4245 次阅读|2 个评论
方法
热度 1 xuleiatp 2011-9-21 12:17
最近读了施一公同志谈科学方法的一篇文章。 他主要讲到了两个关键词:Follow logic和critical analysis。 好像如果直接翻译过来可能会失去一些包含其中的意思,所以这两个词就用英语表示。 突 破常规,探索真理,当然要critical analysis,只有这样,敢于批判怀疑,敢于打破常规才可能出现新鲜的事物。而这种突破不是一味追求刺激,一味的标新立异,它们之间最主要的区别我认 为就是施一公所说的,“Follow logic”。有没有Follow logic是判断运用一个方法能否成功的最关键的地方。这里我想用哈佛大学的校训来解释:“与柏拉图为友,与亚里士多德为友,更要与真理为友”。唯一要追 求的就是真理,不是任何权威,儿真理来自于科学的方法,这种科学的方法就是追寻着自然界的规律,这种规律就是“logic”。只要你是追随着logic去 做的,就不必害怕权威们,因为所有的权威的话语都可能成为过时的理论,甚至很多都将被历史后来的学者完全推翻的。唯有追随真理这件事情是永远不变的。真理 的追随自然就不会有固有的模式,更不可能用过时的模式方法来指导未来的探索之路。 将这种道理引申到生活中,我觉得就是我一直所追崇的“真诚”了。 任 何时间,任何地点,面对任何事情,面对任何人,只要你是真诚的,你就不用有过多的顾虑和恐惧,你就可以完全大胆的执行这件的判断。完全放松的去享受生活。 如果说有什么永恒的真理,那么真诚应当是一个,真诚永远都是人类的明灯。真诚包含两个意思,一是真实,二是诚恳。做事情需要认真,一个人可以没有天赋可以 不成功,但不可以不认真,她是所有成功的前提,最重要的前提。而人又是感情的动物,诚恳相待是最美丽的行为艺术,是最华丽精彩的演讲辞。 真实是大美,诚恳是大爱!
2694 次阅读|1 个评论
经络的物质基础分析
热度 4 zhaodeyu 2011-9-16 23:13
关键词:微循环、氢键、自由氢质子、有序水层、组织与离散。 摘要:经络学说是中医学的核心理论之一,它概括了人整个机体和组成它的各个部分以及人体和外在世界之间的普遍联系。经络的客观性已经逐步得到证实,但它的物质基础是什么呢?本篇文章不仅从理论上推导出它的物质基础就是连续在体内的水环境,而且从水分子特有的性质说明了它传递生物能量和信息的机理,从而解决了横在中西医之间的关键问题。   现代经络研究作为一个科学研究领域,它的存在基于如下的两大事实。一是古典经络理论的存在以及在古典经络理论指导下的几千年中医临床实践的疗效;二是现代众多经络现象的发现。现代经络研究的最终目的就是要对传统中医理论之一的经络学说作出科学的理解,从而解决中西医之间的矛盾,推动现代医学的发展。   现代经络研究大约始于本世纪50年代,当时朝鲜医生金风汉宣称发现了"风汉管"和"风汉小体",为此人们纷纷进行各种实验研究和有针对性的临床观察,结果明显的循经结构"风汉管"没有发现,但却发现穴位上的组织中某些成分特别丰富,如结缔组织、特殊感受器、神经末梢、微血管,淋巴丛等,这些发现对进一步深入研究经络提供了有用的素材。   从70年代,由于没能从解剖学上解决经络问题,我国掀起了一场全国性的可感知经络现象的研究。全国二十几个省市、自治区,成千上万的科学工作者参加了这一项科学实验。他们用统一的方法和标准,进行了17万人次的人体观测。通过这些观测发现,循经感传现象是客观存在的,但出现率较低,仅为4-13‰,但这已极大地鼓舞了中国的科学家们,他们继续努力,终于在1976年取得了较大突破。我国生物物理学家祝总骧等首次发现人类存在隐性感传线,这一发现是人类第一次揭示人体体表普遍存在十四条和古典经脉线相吻合的、连续而均一的、能够重复而确切定位的、高度敏感的线,其宽度仅为1-3mm,其位置稳定不变。令人惊奇的是,不仅这条隐性经络感传线几乎人人都有,而且几乎人人的位置都一样,并且是常年不变的。尤其令人兴奋的是十四条隐性经络感传线几乎和古典的经络描述完全重合。   研究者当然不会满足于用主观感知的方法去研究和证明经络的存在,而是千方百计地寻找用客观手段证明经络存在的方法。不过,最先取得成果的不是中国人,而是日本人和法国人。中国的经络现代化研究是内忧外患的情况下开始的。一方面是中医赖以生存的基础――经络学说如得不到证实,就谈不上科学化。另一方面是西方早已利用现代化的科研手段进行经络研究了,而且获得了一定的进展,如果我们不能迎头赶上,那么中医又会出现象四大发明那?quot;墙内开花,墙外结果"的悲剧。   我们至今不能忘记,经络虽然是中国古代中医的精华,但首先使用电阻测量的物理学方法进行经络研究并发现"良导络"的是日本的中谷一雄(1950年),现在世界各国的学者都将用现代科学方法研究经络获得的首次突破的荣誉归功于日本人;第一个使用同位素示踪及Y照相机显像进行经络研究的是法国的De   Vernejoul P(1985年);第一个使用红外热像方法进行经络研究的是法国的J Borsarello(1970年);第一个用二氧化碳测定仪研究经络的是匈牙利的Eory(1984年);第一个提出系统的经络假说(1952年)并发表专著(1980年)的是日本的藤田六郎。在国外科学界的促进下,我国经络研究也取得了一定的进展,到"八五"时期,经络的研究开始从各个角度广泛铺开,并采用了很多先进的手段,从神经的逆行性标记、生物弱磁测量用的超导量子干涉仪到能够直接探测体内某种化学物质浓度的PEX,研究取得了一大批成果。   1、 同位素示踪显示:利用法国学者建立的同位素(TC99)空位注射法,用γ照像机显象了十四经脉的同位素优势扩散线与古典经脉走行基本一致。而且进一步证明了它既非神经干,亦非淋巴或动静脉血管。   2、 声检测显示:发现沿经脉线皮下的低声阻传导通道,经线上检测到与以及同步的微波脉搏波。   3、 电特性检测显示:经络循行线与经穴表面呈低阻抗特性,其本质属非线性低电击穿阈值特性的沿经分布。   4、 红外热像仪检测显示:针刺经穴"得气"后,红外热像图呈现沿经脉方向增温,且同时伴有两侧扩散,形成沿经升温带。用毫米波辅照经穴,沿经穴位可同步升温。   5、 光检测显示:沿经线呈现串珠样冷光放射和高压高频电磁场下辉光放电。   过去科学的主流观点是从根本上否定经络的存在,一些人认为它是中国古代哲学与医学相结合的产物,是运用人天观的哲学观点在人体上虚拟的产物,是客观上不存在的,是科学实验永远无法证实的;还有一些人认为它不过是复杂的神经反射而已,根本不值得研究,然而事情并不像普通人想像的那么简单,通过80年代以来众多的生物物理检测,我们已经清楚地看到,过去解剖学看不见、摸不着的经络,终于成了一个可以用科学方法观测的客观事实,尽管这些经络以隐性的方式存在,但却在人类身上普遍存在,即使在脱离了中枢神经、被截下的肢体上仍然可以用客观的生物物理方法毫不含糊地显示出这些奇妙的线,可见,中国古代的经络绝不可能只是现代神经的代名词而已。   经络至今已经没有多少人再怀疑它的存在,而且是一种既与神经系统、血液系统和淋巴系统等有形结构有明显区别,同时又和它们有密切联系的一套系统。任何事物只要它客观存在,必然有它存在的物质基础,这是不容置疑的。既然经络是客观的存在,但为什么近百年来的解剖学没有发现它的存在呢?它真正的物质基础到底是什么呢?   翻开西方生物医学历史可以粗略地看到:自十七世纪显微镜问世以来,经典生物医学便沿着大体解剖方向成功地逐步深入认识了人体的结构和部分功能,而这一研究方向的基本特征就是还原主义。诚然,人体的许多“零部件”是可以拆开并逐一研究认识的,它可以加强对许多基本生命活动的了解与掌握。但生命体毕竟不仅仅是这些"零部件"结构机械地组合,做为一个有机的整体,它总有一种普遍联系的机制,而这种机制必然是以连续在系统内部的某种物质为基础的,否则生命体这些众多的部件怎么可能按照整体的意志统一运动呢?   人体是一个高度复杂的巨系统,它有很多物质层次,如大的有功能系统、器官、组织,小的有细胞、生物大分子、分子等等;人体同时又是一个高度统一的巨系统,每一个运动都是整体性的,"牵一发而动全身",不是用任何一个子系统的运动能够描述的。对于这种普遍联系,西方医学只是在显微镜下总结了它的主干道――神经系统、血液系统和淋巴系统,但却把更为微观的一些普遍联系的通道忽视了,如十四经脉的存在就是一个最显明的例子。   人体的普遍联系有多个层次,最明显的就是维束管道系统,它包括神经管道和血液管道;其次是半通透管路,这就是淋巴管;再往下自然就是组织间隙,它没有明显的管路,但又有明显循行的路线,十四经脉恐怕就是指这些没有管道的循行路线了;如果继续往下探寻,只能是连续的水环境了,人体约含有70%的水份,所有的细胞都悬浮在组织液中,显然,如果人体确实存在普遍联系的物质基础的话,那么这种物质非连续的水环境莫属。   水是自然界中与生物的发展、进化关系最为密切的物质之一,也是组成生物体的最多,而且最重要的成分。据统计,在两个月的胎儿中水的含量在95%以上,出生的婴儿的体内也含高达80%的水份,就是一个成年人,体内大约65%以上是水份。由此可以猜想,人体最初的普遍联系就是通过连续的水环境进行的,之后出现了组织间隙,接着在这些间隙的基础上分化成了神经和血管,应该说,人体众多层次的联系方式都是在组织间隙的基础上发展起来的,而且这些层次以组织间隙获得各组织的信息,并把各种信息从组织间隙中输送到各个组织,正是人体有了这些不同层次的联系方式,才使生物整体的信息传递普遍而又有秩序性。   西方医学之所以观察不到十四经脉,原因已经很清楚了,并不是不存在十四经脉,而是人们在显微镜下把这些组织间隙忽视了。现在,已经有越来越多的实验逐渐证实了这一点。如1995年第一期《中国针灸》刊登了徐宇瑾等人对大鼠经脉循行线表皮结构特征的文章,他们发现,经络线上的每个表皮细胞膜上的缝隙连接面积为邻近对照表皮细胞的十二倍以上。1991年,王仲涛、祝总骧等人对循经低阻线皮肤的冷冻复型的定型现象也证明,低阻线处表皮的缝隙连接明显多于对照点。这就是说经络和穴位的表层是由丰富的缝隙连接起来的。另据国外学者进行的大量解剖试验表明:经络处神经、血管显得丰富并肥大,而且角质层很薄,细胞集中,缝隙连接紧密。特别是挪威生理学家对自由组织液通道的研究更加无可置疑地证明了人体确实存在更深层次的微循环,这些微循环通道以疏松的结缔组织为基础,孔隙相通,自成网络。由此可见,人体存在多种层次的普遍联系,十四经脉只不过是一种更加微观的循环通道而已。   水分子是自然界中最简单的分子之一,但它对生物的作用却不普通人想像的那样简单。我们知道,水有三态,固态、液态、气态。水在结冰状态时,分子之间以一种极为有序的结构排列着,而在气态时则完全与之相反,它是一种相当无序的结构,所有水分子都处在一种相当混乱的振动之中,那么,水在液态的情况下呢?我们很自然地想到,它可能是一种介于有序与无序之间的结构,但这是一种什么样的状态呢?要认识这一点,我们必须从水分子的电子结构说起。   水分子由两个H原子和一个O原子组成,水分子中的O-H键角是104.5°,氢和氧原子平均间距是0.957nm。有高负电性的氧原子趋向于从氢原子撤回电子,导致共享电子的非对称分布。整个分子具有质子施主的能力,使之与其他水分子、离子或生物大分子的极性基团之间很容易形成氢键。通过对水的X射线衍射研究表明,水在结冰时,水分子之间是通过氢键连接的,一个水分子可以分别和另外四个水分子以氢键联系,从而形成较为稳定的四面体结构。这是因为当两个水分子相互接近时,一个分子的氧原子与另一个分子的氢原子之间可以通过氢键相互连接,从而形成一种有序结构。氢键并不强,这使得当冰融化为水时,大部分氢键被破坏,但不可否认的是,相邻水分子之间仍有一定的氢键联系,另外衍射研究也可以表明,在10A范围内,水仍具有某种结构。这就说明,尽管水是液体,其中局部区域仍然存在着由部分分子连接而成的微小有序结构。   液态水的另一种重要的特性是,由于O-H键中一个电子基本上被氧占有,故氢质子有从与之共价的氧原子分离的趋势,而靠向与之以氢键结构的另一水分子的氧原子,这使得氢质子有可能在连续的水环境中快速跃迁,也就是说,当质子受到能量活化时,就从一个水分子中逸出,而当另一个水分子有了多余的质子和能量时,也可以把另一个氢质子推出去,被推出去的自由质子又可重复上述过程,质子转移的结果就是氢键的断裂,结构的重排,同时转移能量。由此可见,连续的水环境本身就是一种信息传输的渠道。   水波动的本质一直是人们所不理解的,其实原因就在于水分子在液体中也是成团存在的,与冰不同的是,这里的分子集团不是稳定的,而是一旦有能量干忧,这些集团就会离散,成为无序状态的水,不过,这种无序状态并不会持久,因为从有序到无序的转换还伴随着能量的释放,而这种能量又会促使新的有序结构产生,如此往复,真正液体的水是在有序与无序的周期变换中存在的,正是这种周期性的组织与离散,才使能量流转于连续的水环境之间,而氢质子在水分子中的周期递进是这些集团周期变化的原因。   理解了水的性质,我们对人体的物质运输和信息传递就有了一个更新的认识。在人体中,水分子显然不仅仅是一种溶质,起着运输生物大分子和无机离子的作用,而且还起着信息传递的作用。不过,人体的信息传递并不象我们所描述的那样是水分子集团的周期组织与离散,因为尽管水分子是极性分子,但它的带电性并不强,吸引水分子的能力也较差,与之相比,溶解在体液环境中的无机离子带电性较强,所以水分子通常也是有序地聚集在无机离子周围,生物信息的传递也主要是通过围绕无机离子的有序水层周期组织与离散进行的,周期变化的频率的不同表征了信息的不同。   在近代科学的长期研究中,人们往往把生物体内与众不同的能量运动称之“生物电”。从字面上讲,"生物电"就是一种只存在于生物体内的一种电流,它与物理学上的电流是有所不同的,但这究竟是一种什么样的电流呢?原来,在生物体内,连续的水环境中有大量无机离子,如钠、钾、氯或钙等,这些离子并不是孤立存在的,而是它们都根据自身的带电性在其周围包络着一个较厚的有序水层,有了这个巨大的包袱,离子的运动就受到了较大的阻碍,更不会象水分子那样自由地出入细胞膜,于是,造成了离子在细胞内外不对称地积聚。显然,细胞内在的环境是相对稳定的,而它所依赖存在的外在环境却有大量自由氢质子存在,这很容易使细胞内外形成一个内负外正的电位差。科学研究证实,这个电位差通常约为-70毫伏或-80毫伏。当然,这些离子如果一直停留在一个位置上而不能流动,从而不能产生真正的电流,那么,保持电位差也就没有什么意义了。对于细胞来说,要想产生电信号,电荷就必须短暂地进出细胞膜,但离子是如何穿过那个不通透中间的脂肪层呢?   现代不少生物物理学家倾向于把这种离子的穿透看作是离子与细胞膜中的脂肪层的相互作用造成的,其实理性地想一想就可以知道,细胞膜是不会有意识地选择某一类离子定向穿透的,离子之所以能够穿透,唯一可能的原因就是这些离子包络的有序水层突然离散了,致使这些离子体积突然变小,于是产生了跨膜通透。离子包络的有序水层是通过氢键连接的,氢键并不强,如果细胞所处的体液环境中有能量激励,就有可能使一部分自由氢质子逸出,而这些氢质子破坏了有序水层的氢键联系,于是出现了这些现象。当然,这些包络在无机离子周围的有序水层并不是随意变化的,而是象任何一个有序结构一样,都有自己有限的反抗范围,只有外在环境的变化超过了它反抗的极限,它才会突然走向无序,从而使这些离子能够迅速通过细胞膜。   人体的信息传递有一条快速的传递渠道,这种渠道就是神经系统。负责传递信息的神经元。实验证明,去极化期间主要是大量Na+从胞外流向胞内。Na+的内流使膜内侧电位升高,更有利于Na+内流,这样一个正反馈过程,使膜电位快速上升到内正外负,直到Na+的平衡电位。随着去极化过程,膜对K+的通透性也逐渐增大,K+从胞内流向胞外,使膜电位下降。显然,在这个神经冲动产生的过程中,只有细胞外环境中的自由氢质子数量达到一定阈值,Na+才能够由于包络在Na+周围的有序水层离散而实现跨膜通透。K+带电性较Na+强,它因此具有更大的稳定性,只有当包络在Na+周围的有序水层离散并释放大量自由氢质子之后,它才会随之离散,并通过细胞膜向外通透,这样一个完整的神经冲动过程才得以完成。由此可见,生物电就是以氢质子的周期递进为基础、通过组织和离散包络在无机离子周围的有序水层进行的,它不仅广泛存在于神经系统之中,而且还广泛存在人体的各个部分。   经络学说是研究人体经络系统的生理功能、病理变化及其与脏腑等相互关系的传统理论,它是中医学的重要基础,也是气功学的核心理论之一。但经络的本质是什么?现代科学一直道不出个所以然。其实,它的本质早在形形色色的中医理论和气功理论中表现出来了,它不是别的,它指的就是人体这种普遍联系的基础――连续的水环境。如《素问·经脉别论》中说:"饮入于胃,游溢精气,上输于脾,脾气散经,上归于肺,通调水道,下输膀胱,水经四布,五行并行"。又如在《钟吕传道集》中讲经络中的能量运输时也说:"人身之中,阴多阳少,言水之处甚众,车则取意搬运,河乃主象于多阴,故此河车,不行于地,而行于水,自下而上,或前或后……。"结合现代科学对水的研究,我们很容易知道经络的真正含义。   经络有狭义和广义之分,狭义的经络包括神经、血管、淋巴和组织间隙;广义的经络可以说是“全身无处不经络”,因为人体的每一个细胞都是生存在连续的组织液环境中,这个环境不仅提供了运输生物大分子的作用,更重要是它还不断传递着来自全身各处的信息。正是有了这个贯穿全身的信息传递渠道,每一个细胞才和整体的发展紧密联系起来。需要指出的是,通常中医书上描述的十四经脉是指人体的微循环,它不是具体指某一种管道,而是包括了神经末梢、毛细血管、淋巴和组织间隙的混合体。神经血管负责信息和血管的快速传递,而微循环则负责联系把来自神经和血管的能量传递到局部的每一个细胞。显然,十四经脉的作用比神经血管的作用要大得多,这也是后来的中医只提十四经脉,而很少提神经和血管的原因。 现代不少人总是把经络等同于十四经脉,甚至把能够感传作为经络的依据。其实这种观念是不完备的,对中医学发展史有所了解的人都知道,受一贯的朴素唯物主义的影响,解剖学在我国古代还是比较发达的,就在《内经》中有关人体解剖的记载已经相当丰富,虽然尚不够达到理想的完整和系统,但当时的认识水平,确已远远超过了与之同期、甚至其后很多年的古希腊、古罗马的医学。所以人们不会相信神经、血管等这些显而易见的东西会观察不到,更不会对它们在人体的重要作用视而不见。只是中国的先哲们历来强调整体决定局部,微观决定宏观,因此,中医学家们很少注重组成整体的各个部分,而是将主要精力投入到体现整体意志的普遍联系研究之上,特别是普遍联系方式中更为微观的十四经脉之上。当然,这并不是轻视宏观的神经系统和血液系统,而是这些医学家们早已理所当然地把它们视为经络系统的一部分,只是它们在人体的作用不及微观的十四经脉更加重要而已,这也正是西方医学传入中国之前经络问题并不存在的原因。   中医是一门关系医学,它着重研究的是无限的自然整体和局部的人之间以及生物整体和组成它的各个部分之间的对立统一关系。由于这些关系存在于微观,而且往往不可观察,因此,东方的医学家们特别注重哲学的思辩,经络与其说是观察的产物,不如说是思辩的产物。西医学是一门实证科学,它的特点就是观察不到就不承认它的存在。这虽然使我们对可观察的世界的认识达到极至,但同时也使深藏在表象背后的普遍联系一直被人们所忽视。经络问题的出现与其说是中西医各种理论之间矛盾的一种具体体现,不如说是对现代医学提出的重大挑战,这不仅对它认识人体的方法论,而且对它治疗疾病的原则都提出了重大置疑。显然,挑战同时也意味着机遇,经络问题的解决无疑将成为东西方医学统一的突破口,而这种统一实质上就是现代医学的一次革命。 主要参考文献: 1、张维波:《经络是什么》,中国科学技术出版社,1997版。 2、李志超、祝总禳等编:《千古之谜·经络物理研究》,四川教育出版社1987版。 3、林克椿等编:《中国医学百科全书·生物物理学》,上海科学技术出版社,1985版。 4、杨文修、李正明主编:《生物医学物理概论》,天津科技翻译出版公司,1993版
个人分类: 医学|113 次阅读|6 个评论
[转载]理查德·诺兰:修正信息化航海图
zlhua 2011-9-14 14:50
支点网 作者:冯磊 责任编辑:王林 导读:要顺利完成一次海上航行,船长最应该首先掌握的,是一张详细、准确的航海图,以及自己身处何方。 关键词: 信息化   要顺利完成一次海上航行,船长最应该首先掌握的,是一张详细、准确的航海图,以及自己身处何方。   而在企业信息化领域,有一个人,已经花了40多年的时间,来绘制一幅信息化航海图。   他就是着名信息化建设“阶段理论”(Stages Theory),又称为“诺兰模型”的创始人、《创造性破坏:改造组织的六阶段进程》、《组织重整》等书的作者——理查德·诺兰(Richard L. Nolan)。   1974年,诺兰首次提出了4阶段发展模式理论。1979年,随着美国企业计算机应用的不断深入,“诺兰模型”进一步被发展为6阶段发展模式理论。   时至今日,“阶段理论”仍然被广泛应用在企业信息化建设的规划和自我审视当中。   然而,在经过了30多年的发展之后,“阶段理论”是否也得到了发展?对中国企业的信息化,这位“阶段理论”的创始人有什么样的认识?他对中国CIO又有什么建议?带着这样的问题,记者采访了诺兰博士,以下是编辑过的对话。   记者:能否先简单讲讲,你的理论的本质是什么?   诺兰:或许我可以边画边说明(见图1)。如果我建立一个横轴为时间,纵轴为以美元为单位的IT投入的坐标系,那么,我最初提出的“阶段理论”就会显示为一条S形的曲线,贯穿了从1960年到1980年的20年时间,也贯穿了IT投入不断增长的过程。这是一条“学习曲线”。   其实,人们很早就发现了“学习曲线”,也认识到人类生产、生活中很多事物的发展,都遵循这条曲线。   举例来说,当波音公司第一次生产喷气式客机的时候,一切都要从零开始:最初的设计过程非常缓慢,需要的人手也不多;而在设计完成,开始实际建造飞机时,他们需要投入更多的人力、物力来进行生产,成本快速增长;在生产规模达到一定程度之后,他们又要对飞机制造的工艺过程进行控制,以便生产更加有效,这使得生产成本增长放缓。这样,你就看到了一个由缓慢增长,到快速增长,再到缓慢增长的S形演变过程,这就是“学习曲线”。   而我发现,这种规律,同样适用于企业信息化的过程中。设想一下,一个刚刚开始IT建设的企业,起初由于认识到计算机对提升劳动效率的作用,开始进行固定资产投资,他们购买计算机,尝试建立IT组织等等。在这个过程中,企业IT投入增长缓慢,处于一个“初始状态”,因此我们称其为初始阶段(Initial Stage),或者实验阶段(Experimentation Stage),也是“阶段理论”中四个阶段的第一个;之后,企业信息化投入增长会遇到一个转折点,开始一个快速增长的阶段,我们称为成长阶段(Growth Stage)或蔓延阶段(Contagion Stage);第三阶段,是当企业信息化发展到一定程度之后,企业管理者要控制IT投入并要求提高效率的阶段,这是控制阶段(Control Stage);第四阶段,企业要将已有的子系统进行有效集成,因此它被称为集成阶段(Integration Stage)。   这就是我在上世纪60年代末,70年代初在哈佛期间发展出的“阶段理论”。   记者:你最初是怎样产生对这个理论的最初想法的呢?   诺兰:可以说,这个理论的产生得益于我之前的各种工作经验和受到的各种启发。从在波音公司任职的时候,我就开始将学习曲线的理论分析项目进展;到国防部工作后,我在描述物流项目的发展时,也应用这个学习曲线,这就是促使我发现“阶段理论”的最初苗头。   另外,我在华盛顿大学时的导师William Sharpe教授对我有很大启发,是他最早将计算机技术用于金融交易过程当中,这使我很早就接触计算机。而在伊利诺伊大学参与建造多线程计算机和互联网方面的研究工作,也一样对我很有帮助。正是把所有这些获得的经验带到了哈佛商学院并在那里总结、归纳,才得出“阶段理论”。   记者:今天的“阶段理论”是否有了新的发展?另外,能否解释一下,为什么你的“阶段理论”开始包含4个阶段,后来又变成了6个阶段?   诺兰:我想说的是,今天的“阶段理论”在描述企业信息化发展过程时,仍然是初始、成长、控制、集成4个阶段,而不是6个阶段。因为通过上世纪90年代以来的进一步的观察和研究,我发现,这4个阶段是基于不同的IT主导技术、不断循环往复的。而当时提出的6阶段模型当中,有两个阶段,也就是第五和第六阶段,实际上是第二个技术时期的前两个阶段。   记者:这听起来有点复杂,而且,你谈到的所谓“技术时期”是指什么?   诺兰:首先要指出的是,我在上世纪70年代初提出的“阶段理论”,描述的是1960年到1980年这段时间的企业信息化。在这个阶段,美国企业的信息化往往围绕一个非常重要的技术展开,那就是大型主机(Mainframe)技术。这个时期,我们称其为大型主机时期(Mainframe Era)。   以波音公司为例,在最初接触大型主机技术的时候,他们没有真正意义上的IT用户,因为他们的业务人员根本没接触过IT。同时,对IT的管理也很松散,处于初始阶段;此后,他们进入了IT高速发展的成长阶段,开发出了很多的应用,并对这些应用进行了整合;以此类推,他们逐步经历了控制和集成阶段。波音公司信息化的成长过程,证明了最初的“阶段理论”的正确性。   而在1977年,我离开哈佛并创立了Nolan Norton公司。在1991年,我们将这家公司卖给毕马威公司之前,我对将近500家主要来自美国和欧洲的企业的信息化过程进行了研究。而在这个过程当中,信息领域的一项新技术——微机(Microcomputer)逐渐发展起来,并取代大型主机技术成为当时的主导信息技术,进而让企业的信息化因新技术的应用而走上另一条学习曲线,并贯穿下一个我称为微机时代(Microcomputer Era)的时期。   当然,这个时期的企业信息化同样要经理初始、成长、控制、集成4个阶段。这就是“技术时期”概念最直接的表述。   而所谓的6“阶段理论”,今天看来是在大型主机时期的后面,加上了微机时期的两个阶段。而由于我当时还没有能够看到第二个时代的完整发展过程,因此只提出了“阶段理论”。   但值得注意的是,当主导技术从大型主机过渡到微机的过程中,两条学习曲线之间会有一些重叠,这也就造成了大型主机时代的第四阶段与微机时代的第一阶段,在时间上是重合在一起的。(见图1)   记者:这种重叠意味着什么呢?   诺兰:这意味着在这个重合阶段,企业信息化建设要面临两个不同的知识体系,一种知识体系是来自书本的,也就是从1960年到1980年的20年间,众多企业信息化及IT相关管理经验的书面总结。   另外一个知识体系是实践经验,也就是企业只有通过实践才能学习到的知识,也正是这种知识使学习曲线呈现出了它特有的“S”形状。   试想,当你想要驾驶一辆汽车的时候,我们可能已经知道开车所需要的所有书本知识,知道应该踩油门或是刹车,知道要挂档、握紧方向盘等等;但是当你真正驾驶汽车的时候,这些你所读到的知识,却并不能让你自如地操控面前的方向盘。只有通过实际驾驶,你才能获得那些书本以外的知识。   相比之下,实际应用过程获得的经验,往往比书本知识对你更有帮助。   记者:那么,在微机技术成为主导之后,有没有新的主导技术出现?有没有新的“技术时期”?   诺兰:是的,在发现微机成为主导技术之后,我们研究认为,这个时期将持续经过15~20年。果然,在1995年底,我们观察到,网络技术将会取代微机技术的主导地位,所以,我们我们定义了第三条学习曲线,也就是贯穿网络时代(Network Era)的这一条(见图1),这个时期仍然在继续,我们预计它将要持续到2010年。   也正因为这些,在突破了6阶段模型、推出当时的历史认知限制之后,“阶段理论”实际上已经成为了每个技术时期都以4个阶段为周期,围绕某一成熟的变革性的新技术发展、衍生,并在前后两个技术时期存在重叠的阶段论模型。   而且实际上,从1991年回到哈佛商学院之后,我仍在继续研究IT管理,并发展和完善了“阶段理论”。   记者:这样看来,目前中国有些理论文章中仍然将“阶段理论”表述为6个阶段,已经不准确了?   诺兰:是的,因为有了因新技术而产生的“技术时期”的概念。但是我想,由于“阶段理论”本质上是一个说明、解释性的理论,所以,在不断发展的历史轴线上,我们很难站在一个较早的时间点来描述此后的所有现象。而我们不断获得的信息和资料一方面证实了我们已有的理论,也使我们能够不断完善我们的理论。   如果我们数一数,到目前,也就是2009年为止,我们可能已经经历了9个阶段(见图1)。如果你是一家像波音这样的公司,你可能已经经历了所有这9个阶段。但对于一些成立不是很久的公司,他们甚至有可能连一个周期都没有完整经历过。   我们在重新发展和完善“阶段理论”,而那些认为企业信息化只会经历6阶段就停止的论点是很危险的,因为那可能会导致企业丢掉后面所有的阶段。   记者:你刚才说的一点很有意思,那就是中国有很多信息化起步远远晚于像波音公司这样的企业。他们信息化开始的时期,可能并不是从某一项主导技术的出现为起点的,这会使他们遇到什么样的问题?   诺兰:我曾经与清华大学的陈国青教授一起研究过中国的一些企业案例,发现很多中国企业的信息化进行到了第二(成长)或第三(控制)阶段,但是当他们刚刚通过成长阶段或控制阶段的时候,就迎来了一个新的技术时期,这是他们面临的大问题。   记者:这会给企业带来什么样的挑战呢?   诺兰:那要先阐述一下“阶段理论”的另一部分内涵。首先,我们已经基于“阶段理论”将企业信息化过程划分成了不同的“阶段”,这是第一步工作。但是对于管理者、对于企业CEO来说,“分成段”并不是最重要的,他们想知道的是,“我如何才能管理和控制企业通过这些阶段的过程?”   所以,“阶段理论”的第二个部分,就是要发展出一种分类方法。其实,发现、总结任何一个新的事物发展规律的时候,都要进行两部分的研究,一个部分是弄明白事物是如何沿着时间方向发展的,另一部分是搞清楚是什么驱动了事物按照这个规律发展(而分类方法,就是要细化这些驱动因素,编者注)。   通过探究,我总结出了一个分类方法,我称其为“4类成长过程法”(4 Growth Processes)。即企业信息化的发展,要经过四种成长过程。第一种成长,是建立应用系统的过程,在这一过程中,企业要解决的问题是建立什么样的应用,以及如何将它们整合起来;第二种成长,是IT管理和控制能力的成长;第三种成长,是IT组织的建立;第四种成长,是用户对IT认知度的提高。   有了这样的分类方法,中国企业所面临的挑战就很明显了。当中国的企业基于上一个时期的主导技术,将企业信息化推进到第二或第三阶段的时候,他们对IT的管理和控制能力、IT组织的成熟度,以及用户对IT的认知程度,也大多处于相同的阶段水平。但是当新的主导技术出现的时候,他们往往可以以更低廉的价格获得更成熟且先进的技术,从而从技术层面上,一下子跨越到新的时期,也就是进入到第四个阶段,但此时其他方面的要素还无法与新技术以及由新技术带来的管理变革相匹配,这就会造成麻烦。   比如,很多拥有服务器、虚拟化等各种今天最先进技术的企业,他们真正开始使用计算机是什么时候?答案是,大多数中国的企业真正开始使用计算机,进行信息化大概是在上世纪80年代以后,也就是说,他们只有大约15~20年左右通过实践学习的经验。   所以,很可能出现的情况是,一个使用着2009年最新技术,足以让他们应对全球化发展的技术的企业,在组织、管理、用户认知等方面的成熟度却要滞后很多年。   这种现象的后果可以用一个形象的比喻来解释,这就像一个人玩扑克牌,要想取胜的最基本要素就是玩家要有五个手指,如果你有哪怕是一两根手指太短甚至干脆没有,恐怕都没法玩好这个游戏。   记者:那么,中国企业能不能直接跨越后面的发展阶段,直接进入到下一个时期?或者哪怕是跳过一个阶段?   诺兰:在研究过程中,我们有一个很重要的发现,那就是没有哪个企业可以跳过这些阶段。如果一个企业没有足够的管理、控制方面的能力,它不能“假装”拥有这样的能力,这很危险。当企业试图进入到集成阶段的时候,他们没有能够明白如何配合集成过程的IT用户,也没有足够成熟的IT组织来承担这个任务,集成怎么可能进行呢?   但是话说回来,我们也发现,企业的确可以使用一些方法,来缩短通过某些阶段的时间。例如,在应用系统建设的过程中,你可以通过与其他企业进行合作,或者外包来缩短时间。比如,沃尔玛在中国有很多本地的供应商,沃尔玛已经与这些供应商进行了合作,将其技术人员派到各个供应商,与中国公司的技术人员合作进行技术开发,以便能将供应伙伴的系统与自己已经很成熟的物流系统对接起来。而这,实际上也帮助了中国本地的公司更快地获得了成熟的应用系统。   记者:你的意思是,相对于应用系统建设来说,中国企业可以把更多的注意力转移到管理控制、IT组织建设、用户认知度建设等方面,是吗?   诺兰:对,因为那是一个能让企业更快“通过”后续阶段、更快成长的方法。   首先,建立一整套应用系统是一件很费时间的事情,因为企业需要为此改变组织结构、重梳业务流程,这些都这会花费很长时间。而且,就算你打算尽早在其他方面下手,你也不可能在你建立应用系统的同时,开始通过培训提高用户IT认知度,也无法明显提升管理控制能力,因为其间不断增加的新项目、新开发的技术模型会打乱你的计划。而相比之下,通过合作、外包等手段缩短应用系统建立的时间,恰恰为其他过程赢得了时间,能帮助企业更快地成长。   记者:你认为目前对中国的CIO们来说最重要的是什么?   诺兰:我认为最重要的事情,是进行IT审计,并确定自己的位置。也就是了解在整个信息化过程,乃至四个不同的成长过程中,自己分别处于什么阶段。   这就好比当一个人在陌生的城市迷路时,走出困境最重要的一点,就是必须首先知道“你在哪里”。我们常看到,城市道路两旁提供的指示地图中,总是用最明显的标记告诉你“你在哪里”,这最重要。   接下来,企业要知道自己想要到哪里去。是要成为一个参与国际竞争的跨国企业?还是要在国内在某一个行业有所作为?   只有知道了“你在哪”、“你去哪”这两个问题的答案,你才能去考虑“如何去那”。
个人分类: 快乐学习|2285 次阅读|0 个评论
八月高教关键词
热度 3 lgmxxl 2011-9-1 16:52
——教育公平;教授终身制;高考改革;博士“申请制” 八月,是高考录取的日子,今年的八月注定要以此为重点。今年高考录取的一个显著特点是教育公平继续惹关注,塞门弟子难入名校问题引起中央媒体和地方媒体的广泛讨论。除此之外,以下新闻对中国高等教育发展进程也会具有影响。上海将探索建立学科(专业)末位淘汰制基础上的教授终身制;第26届世界大学生运动会于8月12日在深圳开幕,大运期间首办世界大学校长论坛,共商教育国际化,达成四项共识;中科大交叉培养少年班学生,可根据兴趣换专业;江西理工大学为学生提供就业培训;2011年世界大学学术排名发布,内地23所入围500强;“就读地高考”改革破冰,“湖北方案”出炉;多数高校章程16年难产教育部拟定新规促依法治校;200名高校书记校长共商高等教育改革发展大计;教育部公布卓越计划2011年学科专业名单;香港大学百年校庆典礼开幕,副总理李克强出席;江苏省委副书记朱善璐出任北大党委书记;全国近40位正部级及以上高官有高校工作经历;美贸促会主席、会长,美籍华人张醒亚在豫掷出大手笔:拟投资10亿,创建“中原科技大学”;北大清华试点博士“申请制” 部分院系先试点。综合讲来,八月关键词为:教育公平;教授终身制;高考改革;博士申请制。 教育公平:寒门学子难入名校门再次引发教育公平大讨论 随着《南方周末》一篇《寒门子弟为何离一线高校越来越远》(作者:潘晓凌、沈茜蓉、夏倩、刘星、何谦,南方周末,2011-8-5第一版)在该报第一版刊出,教育公平问题立时引起广泛关注。该文显示:“我国高等教育公平问题研究”表明,中国重点大学农村学生比例自1990年代起不断滑落。北大农村学生所占比例从三成落至一成。清华2010级农村生源仅占17%。”“教育学者杨东平的研究显示,农村学生主要集中在普通地方院校与专科院校。以湖北省为例,2002~2007年5年间,考取专科的农村生源比例从39%提高到62%,以军事、师范等方向为主的提前批次录取的比例亦从33%升至57%。而在重点高校,中产家庭、官员、公务员子女则是城乡无业、失业人员子女的17倍。”随后,科学网举办“科学网在线访谈:寒门子弟没有春天?”、光明日报等约部分学者对此进行座谈;人民日报以《农家子弟,读书还能改变命运吗(乡村观察)》为题对此进行了深度报道;央视《新闻1+1》栏目也以《重点大学农村生源为何减少》为题进行了电视评论。一时间,高考对势群体的关注引起国人的广泛注意与思考。 推荐理由: 教育公平的责任主要在政府,根本路径是从农村做起,从娃娃抓起,目标是确保起点公平、过程公平和结果公平。 教授终身制:上海将探索建立学科(专业)末位淘汰制基础上的教授终身制 《上海教育人才“十二五”发展规划纲要》于8月份发布,其第四条第三款规定:“建立在学科(专业)末位淘汰制基础上的教授终身制,对经过严格考核而最终得以晋升的教授授予终身教职,不再进行严格的任期考核,使其潜心学术,免受外界干扰。辅以学科(专业)末位淘汰机制,凡是排名持续垫底的学科专业将被调整,以确保高校所有学科专业的进步。”提出将建设高水平教育人才队伍。其中,建立在学科(专业)末位淘汰制基础上的教授终身制被提上日程。同时,《纲要》也规定要根据各高校、学科专业发展的不同特点,将探索任期考评、“代表作”评价、成果和科研项目效益考评、团队综合评价等多种符合教师劳动特点的评价与激励办法。 推荐理由: 教授终身制是一个泊来品,为的设计初宗是保障教授权力,让教授可以安心、无干扰地进行学术研究。但教授终身制也有其弊端,那就是教授易不思创新,安于现状。上海建立末位淘汰制基础上的教授终身制,是针对此弊的一个探索性举措。    高考改革:“就读地高考”改革破冰,“湖北方案”出炉 8月15日,《湖北省普通高校招生考试改革方案》(征求意见稿)及其说明公布,《征求意见稿》提出,只要湖北省高中学籍满3年,户口在外省的考生有望在湖北省报名参加高考。根据记者调查,“湖北方案”历经两年多的调查研究和方案起草,经过相关部门的座谈讨论,已形成初步方案,并曾多次向有关方面征求意见。其中,改革的四个重点内容之一就是“放开高考报名户口限制,以高中三年的学籍作为在鄂报考条件,推进高考报考公平”。这份试行方案一旦获批,湖北省将是中国首个就“就读地高考”问题出台相关教改方案的省份。 推荐理由: “就读地高考”问题涉及2亿多现有流动人口切身利益,随着中国城市化进程的推进,这一问题日益突出。教育部对此已有了高度重视,并在研究相关方案。希望湖北可以为解决此问题,作一个有益的探索。 博士申请制:北大清华试点博士“申请制” 部分院系先试点   日前,北大5个院系:光华管理学院、信息科学技术学院、环境科学与工程学院、心理系和分子医学研究所,清华将在机械工程系、工业工程系、航天航空学院、经济管理学院等6个院系,两校共有11个院系的博士生入学方法将进行大的改革。这11个院系将试点实行“申请制”。即院系对递交入学申请的学生进行筛选,合格者再接受考核。北大研招办负责人昨天表示,此举意在选拔到真正的“好学生”,今后还可能扩大推广范围。 推荐理由: 培养高素质创新型人才,是举国关注的一大工程。北大、清华等高校率先试行博士入学 “申请制”,有利于激发申请者的学术能力和学术潜力,是培养高级人才的一项探索。   
个人分类: 高教史料|4216 次阅读|6 个评论
[转载]高耀群:步入职场,你要清楚自己“卖”给谁,“卖”得是什么?
weisman 2011-8-25 08:55
高耀群: 步入职场之初,自己也搞不明白该怎么做。记得当时同事对我说,“你要跟着趋势走”。我理解,所谓跟着趋势走,就是“ 入对行 ”,然后还要“ 跟对人 ”。   我是学力学的,毕业于哈尔滨工业大学力学系,后来学计算机。在美国留学的时候,不知不觉步入软件行业,当时的关键词是“软件”,但是在中国,那个年代,无形资产卖不出价格,但是我认定软件是一种趋势。上世纪90年代,在美国工作5年后我回到中国,那时候,“中国”是一个关键词。当时,外企在中国的经济发展中发挥的作用非常之大,外企能否健康经营跟外企选择的中国区掌门人大有关系。那时候,外企在中国的掌门人几乎全部是外籍员工或者是从境外总部派来的,后来逐渐有海外华人,内地出生、成长的中国人担任中国区掌门人。   从微软公司到新闻集团,以前是IT产业,接着是电信、互联网,现在是传媒。传媒是市场巨大的产业,比如中国移动,把自己定义为电信提供商,表面上看,传媒面临着急剧融合,实际是一场混战。传媒在某种程度上挣的是注意力的钱,如果创作内容供大家免费观看,那就会利用这样一个免费观看过程获取广告商的钱,或者我卖的本身就是注意力。传媒收入中除了付费内容之外,很大程度上是在赚广告收入。传统传媒无非三件事:制造内容、传播内容、经营注意力。这种传统模式由于数字化而发生巨变,今天传媒已经互联网化,所以内容已经变成大众内容,不仅你在写,很多人在写,无数人在写,数字内容成为海量。这对应了原来传媒内容一贯所谓的稀缺,今天海量内容在不断分散注意力,因而搜索就很关键,搜索同时也在大范围稀释原来的广告集中度。 另外,数字内容的载体也在发生着变化,人们的注意力被电视、电脑、手机,还有平板阅读器像IPAD等分化重组,有更多新的经营注意力的商业模式出现。总而言之,传统的商业模式和思维方式在发生变化,将来会有更多更好的发展空间给参与者,特别是数字化信息的手段和方式。   “跟对人”也很重要,回首自己的职场亲历,就是跟着3个著名人物,今天是默多克,以前是卡罗尔·巴茨和比尔盖茨。不同的成长阶段紧跟能人,确实能让你快速成长和发展。好老板,首先应该是你的朋友、教练、同盟,是力量的源泉,好的老板会改变你的人生。无论你有多成功、多煊赫,都不要忘乎所以、自以为是。记得做微软中国区总裁的时候,门口堵了许多媒体,搞得我最后跳窗回家。那时候的一个感觉是安静不下来,所以,心态就变得特别重要。不管你有多成功,都要有普通人的心态,心态好坏决定职业的高度和生命的质量。招聘新员工,我关心的主要是——这个人是不是阳光的,是不是积极向上?热爱生活,才能有好的职场经历。我倒挺欣赏赵本山公司的那句名言:“快乐生产、生产快乐”,很简单的八个字,但是很有道理。    身在职场,关键的一点是沟通 。美国著名公司的中层,印度人的比例高于华人,某种程度上不见得是技术、语言上的分别,我认为主要的差异是沟通和交流。沟通是一种职场技能,沟通不仅仅是信息传递,而是一种情感交流。快乐做事,主动感恩,善待别人就是善待自己。我在跨国公司做高管已经20年了,回顾过往的职场亲历,走得就是从就业、敬业到乐业的路径,不停地设立阶段性的发展目标,把握好事业发展的拐点。今天的我谈不上成功,我始终认为,阳光心态、积极作为,在一个人的成长过程中扮演着越来越重要的作用。 高耀群: 人生成功不在起点,而在于转折点,这是我的切身感受。过去的15年,我在中国一直做跨国公司的CEO,服务过三个主要的公司:首先是微软,比尔盖茨是我的老板;一个是新闻集团,全世界最有影响力的传媒人默多克;还有就是欧特克,这家公司的掌门人卡罗尔·巴茨女士如今是雅虎公司CEO。跟随这三位老板打拼的这些年,经历了跨国公司在华发展发展的三个阶段:初始期、稳定期、发展期。   所谓成功,没有通用的公式,一定没有。当我们刚刚从大学毕业,那时候问得最多的是自己能干什么?目标特简单,去工作、去赚钱,自给自足。那一时期,是就业。那个时候是不是说你找到的工作和你的爱好完全一致?凡事常常不是以自我为中心,市场需求决定一切,这是梦想的储备期。   接下来,要自问的是,我该做什么?我有一个理想要实现。在这一时期,就是敬业、职业,是从就业向职业、敬业的转变。   职业、敬业之后,走到了一个新的节点,那就是——我想做什么?这一时期是为了兴趣爱好而工作,是一个“乐业”的过程。从最初的“我能做什么?”,到“我该做什么?”然后到“我想做什么?”。经历了自给自足、实现价值和为爱好而活的阶段,从就业到敬业,再到乐业的嬗变。   一步一个脚印亦步亦趋的时候,要清楚自己“卖”给谁,“卖”的是什么。一个职业经理人就是一个“产品”,你具备什么“功能”,“市场”上值多少钱等等。 我曾经给同事划过一条曲线,横坐标代表着“做大事”,纵坐标就是“赚大钱”,最理想的状态是“45度”曲线,沿着这根线做上去。但是,真实的职业状态并非如此,大多数时候我们是在“45度”曲线以下运行。那时候,我们常常想,“横坐标”要变得最重要,因为做事是第一位的,先不觊觎“纵坐标”。当“横坐标”走到一定阶段就会产生拐点,这个拐点是被市场认可的过程。拐点常常发生在变化之中,或者是公司重组,或者市场发生剧烈变化,或者你跳槽了,等等。经过各种努力,你最终会逼近“45度”曲线,这也就意味着你在成长中实现了成功。 http://bbs.qdqss.cn/forum.php?mod=viewthreadtid=15794
个人分类: 阅读收藏|3496 次阅读|0 个评论
[转载]供应链环境下含逆向物流的库存控制问题研究
JasonChen87 2011-8-24 16:14
作者:张娇 [摘 要]随着逆向物流的深入发展,逆向物流对供应链企业的生产库存控制产生了越来越重要的影响。本文通过对逆向物流中库存问题的分析,讨论了确定需求下包含逆向物流的供应链生产和库存控制问题,建立并求解了供应链整体环境下的生产和库存控制模型,为企业的生产及库存控制提供了参考。    [关键词]逆向物流 供应链 库存控制 订货批量      随着经济全球化和科学技术的迅速发展,消费者对产品需求的多样化和个性化以及消费量大量增加,导致了产品生命周期的缩短和生产量也随之剧增。从而产生了大量的废旧物品,引起了资源环境危机。现在我国正在探索可持续发展道路,从循环经济的角度弥补环境的不足和相关的负面影响。在这样的背景下发展逆向物流是必要的,也是重要的。如何从逆向物流的角度指导企业生产和库存控制是亟待解决的问题。   一、逆向物流库存问题分析   在传统的正向物流的库存管理中,我们关心的是三个基本的问题:①多长时间检查盘点一次库存,也就是盘点周期为多少。②什么时候补充库存或订货。③补充或订购的量是多少。   在包含逆向物流的供应链库存管理中,也就是当产品从供应链的下游方返回,经过处理之后,这些产品被再造或复原又成为可以销售出去的库存,在这样一个过程的库存管理中,传统的前向物流的库存管理要考虑的三个基本问题仍然存在。然而由于有了逆向物流回流品的存在,以上的三个基本问题要考虑的细节和复杂性与正向物流有着很大的不同。逆向物流具有不确定性、复杂性和缓慢性等特点,这些特点使得逆向物流库存控制变得更加复杂。传统的库存管理与含逆向物流的库存管理主要有以下两个基本的差异:   ①两个供应源。如果在供应链中有产品返回后又被复原,库存的来源就增加了,库存的来源包括新制造的或新订购的产品,同时也包括被复原的回流产品两个补充源。这使得传统库存管理中的三个基本问题将增加至四个,即从哪里补充库存。   由于回流品复原后成为新的库存来源,因此增加了库存管理的复杂性,比如在任何一个时间点上回流产品的数量是受到限制的。不同来源的库存不仅在产品的数量上不同,而且在产品的单价上和产品供应的可靠性上存在着很大的差异。逆向物流库存控制的复杂性,主要表现在以下三个方面:   首先,在解决传统库存控制面临的确定库存盘点周期、确定订货量、确定何时订货这三个问题的基础上还需要确定供货源的选择问题。   其次,库存费用除了传统库存的订货费、库存持有费及缺货费之外多了逆向物流费用,主要由返回产品的运输、保管、修理、处置等费用构成。   再次,两次外部补充间的库存量不再是单调递减的,从而增加了库存控制的难度。   ②不确定性。回流品的收集是一个供应驱动的物料流,而非正向物流中的市场需求驱动。这一供应驱动的物料流超出了企业的直接控制范围,造成了回收产品在数量、时间和质量条件等方面的高度不确定性。这也就导致了逆向物流的库存具有鲜明的随机不确定性。   例如不能主动去订购废旧产品,只能被动接受消费者退回的产品,这导致回流产品数量和时间上具有高度不确定性;废旧产品中零部件的回收率也是随机的,给逆向物流材料计划带来高度不确定性;回收零部件的性能在未检测之前是未知的,导致随机的准备时间等等。   二、确定需求下逆向物流库存控制研究   1. 问题的描述   在实际的市场环境中,产品从生产商到消费者手中,可以经过不同层次的分销渠道,并且每层可能由多个主体构成。本文将所有的销售渠道简化为只有一个生产商及一个销售商的单一产品二级供应链模式。在这样的二级供应链模式下,生产商负责全部产品的生产,并负责回流产品的修复。   而销售商向生产商订货,负责整个市场的销售。同时,每周期还有相当多的回流产品的存在。一般而言,回流产品先到达销售商处,并停滞一段时间,使得回流产品的数量到达一定程度后再回流到生产商处,最终生产商对其进行修复,使之与新产品无差异。当市场需求达到稳定后,这样的过程会不断重复,直到平衡被打破。   我们的目的就是在市场需求达到稳定后,通过建立此问题的数学模型来寻找使供应链成本最小化的回流方案及订货/生产方案。   2. 基本假设及符号   (1) 基本假设   ①在未来各时间点的需求率d是确定且不间断的;   ②生产能力、再制造能力、固定生产成本和固定再制造成本均为常数,库存持有成本、可变生产成本、可变再制造成本为线性可变成本;   ③生产率大于需求率,需求率大于再制造率;   ④回流至生产制造商处的所有回收品都进行再制造,且经过再制造处理后成为与新生产产品有相同性能的产品进入成品库存。   (2) 参数符号   模型参数符号:需求率d,残次率为b,生产率p,再制造率r,生产商每一批次的固定生产费用,单位产品的可变生产成本,每一批次的固定再制造费用,单位产品的可变再制造成本 ,成品单位库存成本,回流品单位库存成本,整个系统总成本C,单位成品平均成本,循环周期T内的成品总库存水平 ,循环周期T内的回收品总库存水平。每批次产品新生产量,循环周期T,周期内再制造量为,循环周期中小周期为,一周期内的生产次数n。销售商的订货固定成本为,单位成品单位时间的存储费也为,单位回流品单位时间的存储费为,订货批量为。   3.数学模型的建立与求解   在该模型中,一个循环周期内,生产商以进行多次生产制造和一次再制造来满足销售商订单需求,库存变化如图4.3所示。在循环周期开始状态阶段,生产商通过生产制造和再制造共同满足销售商需求,期间生产量为, ;在期间成品以的速率增长,结束后成品库存达到,在此后的阶段以 的速率降为0,;循环周期中的小周期 。整个循环周期的生产量和再制造量要满足周期内的订单需求,且周期内得到的回收量与再制造量相等,循环周期,其中。从而周期内生产次数为。循环周期T内的成品总库存。将n、 代入,得到。循环周期T内的回收品库存。在一个循环周期中,销售商的订货成本为,订货批量为,成品存储成本为,回收品库存成本为。   因此,由单个生产商及单个销售商构成的二级供应链的总成本为:   将分别代入上式,确定,继而确定,取最小的为N。可见,最终由该模型确定了每批次产品新生产量,周期内再制造量为以及一周期内的生产次数N。   三、结束语   本文通过分析逆向物流库存控制的特殊性,假设修复后的产品和“新产品”一样销售,针对生产商单再制造期--多生产期的处理方式,综合销售商和生产商的成本构成,建立和求解了市场需求确定情况下逆向物流对生产和库存控制的影响模型,从而实现了供应链系统总成本最低的目标,为供应链企业的实践活动提供了参考。      参考文献:    Fleischmann M,Kuik R,Dekker R.Controlling Inventories with Stochastic Item Returns:a Basic Mode1 .European Journal of Operational Research,2002,138:63-75    Kiesmuller G,Minner S,Simple expressions for finding recovery system inventory control parameter values . Journal of the Operational Research Society.2003,54:83-88   注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文
2463 次阅读|0 个评论
[转载]博士毕业后的幸福生活(转)
热度 1 xuebx 2011-8-23 11:19
博士毕业的去向:高校任教(俗称青椒),科研院所,政府,国企,外企,出国博后,国内博后,大致分为这么7种,下文将以国内高校为例详细谈谈博士如何自我定位与培养。 1. 工作两年后的第一道坎,职称,刺刀见红的拼杀,概述 关键词:定岗定编,评聘分开按照教育部的要求,部分学校已经实行定岗定编,并且将陆续推广到所有学校,在这原则下,高校铁饭碗已破,以天津某著名高校的一个有名学院为例,教授已经超编,这就 意味着,第一,部分教授聘不上教授岗,第二,除非有些教授over了或者调离,否则副教授是基本升不上教授的。第三,一场高校教师之间的腥风血雨般的厮杀即将拉开战幕 。。。。。。 你做好准备了吗? 国内高校又可分为一流院校985和部分211高校,以及地方院校,下文统称三流院校,二流的就是夹在这两者之间的部分有一定知名度的院校对于青椒来说,除硕博连读的外,一般毕业年龄在28左右,这是个很尴尬的年龄,该结婚了,结婚就要买房,买房就需要钱,钱从哪来?买房的钱一般有如下三种途径:父母提供,学校提供部分,自己提供 一流学校待遇:0-6万左右房屋补贴,0-2万左右安家费,1年左右周转房,不安排配偶工作,工资2000以下,讲师待遇,两年后可以申请副高(副教授或副研究员),科研启动费2万左右,一年工作缓冲期,不参加岗位考核,一年后考评,直接决定岗位津贴数目。博贴基本没有,除非当地政府出。生活滋润度,最差,甚至有可能入不敷出,年收入3-4万。 三流高校待遇:房屋补贴5-20万左右,越差的学校待遇越高,有的博士来了直接给副教授待遇,工资1700-2500左右(税前),基本不解决配偶工作,安家费2-5万,1年周转房,1-2年缓冲期,随后参加岗位考评,一般会有博士津贴,有的地方有政府的博士津贴,例如福建。2年后可申请副教授,有的学校评定职称时承认工作以前包括博士和硕士期间发表的文章,有的学校不承认,若找工作时,一定要问清楚。生活滋润度,勉强温饱,年收入4-6万 三本与四流高校:房屋补贴20万左右,安排配偶工作,年收入税后6-8万,有的提供住房,服务n年后给产权,一般有博士津贴。科研启动费2-10都有可能。有的可以直接聘入校博士为副高。生活滋润度,最好。 发展前途: 一流高校最苦,成名前可能一无所有,三本与四流院校最滋润,但是职业发展最受限。 申请课题难度 一流高校与研究所最容易,三流以下学校非常困难,后文将对项目申请有详细叙述,但是对于大多数青椒来说,没有项目=没有职称 2.两年后的考验, 副教授=项目? 博士工作两年后可以申请副高,下面看看不同院校的要求 一流高校与研究所:主持并完成1-2项国家级项目(国家自然基金,973,863),SCI有影响力的文章若干。由于这个限制,国内毕业青椒想在工作后2年顺利拿下副高简直是做梦 三流高校:主持并完成1项厅级项目(例如教育厅项目)或作为主要参与人(前三)参与完成省部级(地方省级基金委、科委或者国家教育部,人事部等)项目一项或者完成横向项目达到一定经费数额,例如我所在学校要求横向一次到位经费10万以上。SCI/EI检索论文至少一篇,其他重要文章一篇。注意,要求是完成结题的项目,论文有的要求是必须署名为工作单位的,有的没要求,也就是你在读博士期间发的也可以。由于项目的限制,都要求完成的项目,因此,想在工作两年后拿下副高,最快的方法是弄到一个大额横向,然后与企业商量迅速结题。纵向项目,拿到完成,最少需要3年。 三本与四流高校:参与完成厅级以上项目,几篇文章即可对于女博士来说,可以考虑三流与四流院校,工作压力小,有利于家庭稳定,收入很不错 对于有志于有所成就的博士,那么下面的问题,就需要仔细考虑了 影响青椒前途最重要的,是两个东西,项目和文章,文章各个行业不同,很难说清。 项目,这个是每个大学青年教师头上最大的一座大山,没有项目,一事无成。下文将就项目仔细评说 对于青椒来说,若无导师帮忙或者相当的人脉积累,横向项目(企业项目)是基本无望的,现在企业已经很狡诈了,一般要求你有成果,拿过来,可转化为生产,才会给钱。不象以前了,不会支持前期探索的。 纵向项目:973,963,国家自然(社科)基金,教育部博士点新教师基金,地方省市自然科学基金,教育厅基金,中医药管理局基金等 973,863那是谁拿项目谁写项目申请指南,一般青椒就不用考虑了。地方省部级自然科学基金与教育厅项目,限项申报。也就是规定了每个学校能申报多少项。以我所处学校为例,每年允许申报30项左右,最后批准3-6项不等。由于限项,所以很多人的本子连学校都出不去。所以青椒的努力方向就剩两个,国家自然科学基金与博士点新教师基金,这两个自由申请,但是如果你跟我一样,所在的院系没有博士点,那么只有国家自然科学基金一途了。 3. 国家自然科学基金,通往职称的华山一条路?谁是你的伯乐? 号称国内最公平的基金,能不能申请到全看个人本事。08年以后,国基将青年科学基金从面上项目中分离出来,列为人才基金,总体命中率25%左右,各个学科不尽相同,其中生物医学类是死亡之组,地球和数学好些。国基在本人眼里,最容易拿到的基金,其难度低于省部级基金和教育厅基金,教育部新教师基金没申请过,不知难易。 申请要求:博士学位35岁以下,在职博士需要导师推荐信 国家基金考察什么:创新点,排名第一,其次为研究基础,课题组组成等。 评审方式:3个以上匿名专家评审人(简称函评),评审人的意见为三种,优先资助,资助,不予资助。根据三个评审人的意见决定你的本子是否提交学科组开会评议(简称会评,需要至少一个优先资助),会评通过,则获得国家基金,上会率,据说今年青基是30%,也就是会评时还需要灭到30%的人。 国家基金与博士期间的工作 创新点,国家基金的灵魂,如果你在博士期间完全依赖老师,老师交代什么做什么,很抱歉,你无法提出能够让评审人欣赏的idea,那么你的博士是失败的。 申请青基的思想来源一般为三种:博士论文的延续,工作单位的新方向,以上两者结合为什么要从这三个方面入手,很简单,国基要求,创新+工作基础,虽然国家基金委一直强调说,对于青年基金申请者,可以放松对工作基础的要求。但是,这条相当于无用,因为很多人有工作基础,你没有工作基础申请,简直是找死。什么是工作基础,就是你的文章和项目与现在申请课题的紧密度,你现在单位的条件是否能够满足你完成改项目,还有你的课题组成员搭配是否合理。因此,最容易让青椒入手的是,博士论文的延续或者将工作单位新的方向与以前博士课题结合起来,这样所有的文章都能用上。文章越牛,希望越大。 4. 博士的订单式培养---以科研创新与文章为主体,死亡赛跑的起点 我的警告:浪费博士3年,等于浪费你的未来 目前现状:中国博士产量世界第一,以我所在学校为例,06年,我们学院两人申请副教授,07年,13人,08年,24人,全院接近100教师,近三年引进博士约60人 课题现状:省自然基金全校每年限报30项左右,教育厅项目限报25项左右,全校每年新引进博士约100人 如何才能申请到国家基金? 创新,在博士期间对本领域一定要做到世界级的领悟,对于每个缺点,发展方向要做到了然于胸,看100篇英文文章?拜托,这才入门而已。并且,看,不代表你了解,要了解每一篇文章为什么这么做,有什么缺点,有什么优点。如果你能将100篇文章的背景全部了解,算是合格的博士了,记住,合格,不是优秀。 国家基金的最高原则 优中选优,即所谓锦上添花,国家基金不是扶贫项目,也从来不会雪中送炭 在我眼中什么样的博士是优秀的,能够一毕业就能申请到国基的? SCI3篇以上,影响因子越大越好,博士老板越牛越好,最好是能当会评评委的那种,创新点越新越好,解决某个领域的基础性问题。因此,还是我上篇帖子的哪句话,大量的阅读文献,流利的英文阅读与写作,勤奋的工作,那么你将来的路,要平坦很多。天天一到实验室就上网聊天打屁,整天都不知道干了什么的博士,进了高校也会被淘汰。当然,也有例外,例如你找到一个棵大树靠,那算我没说。 国基会评的几条原则:1. 有人在会上坚决支持的项目一定能获得资助,即使全体学科组成员投票没过半数,而这个支持者则必须签字表示支持,即所谓非共识项目。2. 有人坚决反对的项目也基本通不过。 因此,博士时导师非常重要,如果你的函评专家认识你导师(认识你的可能性不大), 如果你导师在会评时力挺,这些都是不可忽略的资源。所以说,导师越牛越好,文章IF越大越好。如何处理与导师的关系,请看我的第一个帖子。在这场死亡赛跑中,如果失去了导师的支持,那么你就只剩下你一个人 ----------------------------------------------------------- 总结 博士期间的论文水平参加项目水平=工作基础 博士期间的独立能力+领悟能力+对本领域的了解=创新能力 工作基础+创新能力+一些运气=国家基金 国家基金=课题组的经费+你的职业发展
个人分类: 职业规划|2247 次阅读|1 个评论
[转载]lucene介绍
热度 1 hanhuijian 2011-8-22 20:02
1 lucene简介 1.1 什么是lucene Lucene是一个全文搜索框架,而不是应用产品。因此它并不像 www.baidu.com 或者google Desktop那么拿来就能用,它只是提供了一种工具让你能实现这些产品。 1.2 lucene能做什么 要回答这个问题,先要了解lucene的本质。实际上lucene的功能很单一,说到底,就是你给它若干个字符串,然后它为你提供一个全文搜索服务,告诉你你要搜索的关键词出现在哪里。知道了这个本质,你就可以发挥想象做任何符合这个条件的事情了。你可以把站内新闻都索引了,做个资料库;你可以把一个数据库表的若干个字段索引起来,那就不用再担心因为“%like%”而锁表了;你也可以写个自己的搜索引擎…… 1.3 你该不该选择lucene 下面给出一些测试数据,如果你觉得可以接受,那么可以选择。 测试一:250万记录,300M左右文本,生成索引380M左右,800线程下平均处理时间300ms。 测试二:37000记录,索引数据库中的两个varchar字段,索引文件2.6M,800线程下平均处理时间1.5ms。 2 lucene的工作方式 lucene提供的服务实际包含两部分:一入一出。所谓入是写入,即将你提供的源(本质是字符串)写入索引或者将其从索引中删除;所谓出是读出,即向用户提供全文搜索服务,让用户可以通过关键词定位源。 2.1写入流程 源字符串首先经过analyzer处理,包括:分词,分成一个个单词;去除stopword(可选)。 将源中需要的信息加入Document的各个Field中,并把需要索引的Field索引起来,把需要存储的Field存储起来。 将索引写入存储器,存储器可以是内存或磁盘。 2.2读出流程 用户提供搜索关键词,经过analyzer处理。 对处理后的关键词搜索索引找出对应的Document。 用户根据需要从找到的Document中提取需要的Field。 3 一些需要知道的概念 lucene用到一些概念,了解它们的含义,有利于下面的讲解。 3.1 analyzer Analyzer 是分析器,它的作用是把一个字符串按某种规则划分成一个个词语,并去除其中的无效词语,这里说的无效词语是指英文中的“of”、 “the”,中文中的 “的”、“地”等词语,这些词语在文章中大量出现,但是本身不包含什么关键信息,去掉有利于缩小索引文件、提高效率、提高命中率。 分词的规则千变万化,但目的只有一个:按语义划分。这点在英文中比较容易实现,因为英文本身就是以单词为单位的,已经用空格分开;而中文则必须以某种方法将连成一片的句子划分成一个个词语。具体划分方法下面再详细介绍,这里只需了解分析器的概念即可。 3.2 document 用户提供的源是一条条记录,它们可以是文本文件、字符串或者数据库表的一条记录等等。一条记录经过索引之后,就是以一个Document的形式存储在索引文件中的。用户进行搜索,也是以Document列表的形式返回。 3.3 field 一个Document可以包含多个信息域,例如一篇文章可以包含“标题”、“正文”、“最后修改时间”等信息域,这些信息域就是通过Field在Document中存储的。 Field有两个属性可选:存储和索引。通过存储属性你可以控制是否对这个Field进行存储;通过索引属性你可以控制是否对该Field进行索引。这看起来似乎有些废话,事实上对这两个属性的正确组合很重要,下面举例说明: 还是以刚才的文章为例子,我们需要对标题和正文进行全文搜索,所以我们要把索引属性设置为真,同时我们希望能直接从搜索结果中提取文章标题,所以我们把标题域的存储属性设置为真,但是由于正文域太大了,我们为了缩小索引文件大小,将正文域的存储属性设置为假,当需要时再直接读取文件;我们只是希望能从搜索解果中提取最后修改时间,不需要对它进行搜索,所以我们把最后修改时间域的存储属性设置为真,索引属性设置为假。上面的三个域涵盖了两个属性的三种组合,还有一种全为假的没有用到,事实上Field不允许你那么设置,因为既不存储又不索引的域是没有意义的。 3.4 term term是搜索的最小单位,它表示文档的一个词语,term由两部分组成:它表示的词语和这个词语所出现的field。 3.5 tocken tocken是term的一次出现,它包含trem文本和相应的起止偏移,以及一个类型字符串。一句话中可以出现多次相同的词语,它们都用同一个term表示,但是用不同的tocken,每个tocken标记该词语出现的地方。 3.6 segment 添加索引时并不是每个document都马上添加到同一个索引文件,它们首先被写入到不同的小文件,然后再合并成一个大索引文件,这里每个小文件都是一个segment。 4 lucene的结构 lucene包括core和sandbox两部分,其中core是lucene稳定的核心部分,sandbox包含了一些附加功能,例如highlighter、各种分析器。 Lucene core有七个包:analysis,document,index,queryParser,search,store,util。 4.1 analysis Analysis包含一些内建的分析器,例如按空白字符分词的WhitespaceAnalyzer,添加了stopwrod过滤的StopAnalyzer,最常用的StandardAnalyzer。 4.2 document Document包含文档的数据结构,例如Document类定义了存储文档的数据结构,Field类定义了Document的一个域。 4.3 index Index 包含了索引的读写类,例如对索引文件的segment进行写、合并、优化的IndexWriter类和对索引进行读取和删除操作的 IndexReader类,这里要注意的是不要被IndexReader这个名字误导,以为它是索引文件的读取类,实际上删除索引也是由它完成, IndexWriter只关心如何将索引写入一个个segment,并将它们合并优化;IndexReader则关注索引文件中各个文档的组织形式。 4.4 queryParser QueryParser 包含了解析查询语句的类,lucene的查询语句和sql语句有点类似,有各种保留字,按照一定的语法可以组成各种查询。 Lucene有很多种 Query类,它们都继承自Query,执行各种特殊的查询,QueryParser的作用就是解析查询语句,按顺序调用各种 Query类查找出结果。 4.5 search Search包含了从索引中搜索结果的各种类,例如刚才说的各种Query类,包括TermQuery、BooleanQuery等就在这个包里。 4.6 store Store包含了索引的存储类,例如Directory定义了索引文件的存储结构,FSDirectory为存储在文件中的索引,RAMDirectory为存储在内存中的索引,MmapDirectory为使用内存映射的索引。 4.7 util Util包含一些公共工具类,例如时间和字符串之间的转换工具。 5 如何建索引 5.1 最简单的能完成索引的代码片断 IndexWriter writer = new IndexWriter(“/data/index/”, new StandardAnalyzer(), true); Document doc = new Document(); doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED)); doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED)); writer.addDocument(doc); writer.optimize(); writer.close(); 下面我们分析一下这段代码。 首先我们创建了一个writer,并指定存放索引的目录为“/data/index”,使用的分析器为StandardAnalyzer,第三个参数说明如果已经有索引文件在索引目录下,我们将覆盖它们。 然后我们新建一个document。 我们向document添加一个field,名字是“title”,内容是“lucene introduction”,对它进行存储并索引。 再添加一个名字是“content”的field,内容是“lucene works well”,也是存储并索引。 然后我们将这个文档添加到索引中,如果有多个文档,可以重复上面的操作,创建document并添加。 添加完所有document,我们对索引进行优化,优化主要是将多个segment合并到一个,有利于提高索引速度。 随后将writer关闭,这点很重要。 对,创建索引就这么简单! 当然你可能修改上面的代码获得更具个性化的服务。 5.2 将索引直接写在内存 你需要首先创建一个RAMDirectory,并将其传给writer,代码如下: Directory dir = new RAMDirectory(); IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(), true); Document doc = new Document(); doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED)); doc.add(new Field("content", "lucene works well", Field.Store.YES, Field.Index.TOKENIZED)); writer.addDocument(doc); writer.optimize(); writer.close(); 5.3 索引文本文件 如果你想把纯文本文件索引起来,而不想自己将它们读入字符串创建field,你可以用下面的代码创建field: Field field = new Field("content", new FileReader(file)); 这里的file就是该文本文件。该构造函数实际上是读去文件内容,并对其进行索引,但不存储。 6 如何维护索引 索引的维护操作都是由IndexReader类提供。 6.1 如何删除索引 lucene提供了两种从索引中删除document的方法,一种是 void deleteDocument(int docNum) 这种方法是根据document在索引中的编号来删除,每个document加进索引后都会有个唯一编号,所以根据编号删除是一种精确删除,但是这个编号是索引的内部结构,一般我们不会知道某个文件的编号到底是几,所以用处不大。另一种是 void deleteDocuments(Term term) 这种方法实际上是首先根据参数term执行一个搜索操作,然后把搜索到的结果批量删除了。我们可以通过这个方法提供一个严格的查询条件,达到删除指定document的目的。 下面给出一个例子: Directory dir = FSDirectory.getDirectory(PATH, false); IndexReader reader = IndexReader.open(dir); Term term = new Term(field, key); reader.deleteDocuments(term); reader.close(); 6.2 如何更新索引 lucene并没有提供专门的索引更新方法,我们需要先将相应的document删除,然后再将新的document加入索引。例如: Directory dir = FSDirectory.getDirectory(PATH, false); IndexReader reader = IndexReader.open(dir); Term term = new Term(“title”, “lucene introduction”); reader.deleteDocuments(term); reader.close(); IndexWriter writer = new IndexWriter(dir, new StandardAnalyzer(), true); Document doc = new Document(); doc.add(new Field("title", "lucene introduction", Field.Store.YES, Field.Index.TOKENIZED)); doc.add(new Field("content", "lucene is funny", Field.Store.YES, Field.Index.TOKENIZED)); writer.addDocument(doc); writer.optimize(); writer.close(); 7 如何搜索 lucene 的搜索相当强大,它提供了很多辅助查询类,每个类都继承自Query类,各自完成一种特殊的查询,你可以像搭积木一样将它们任意组合使用,完成一些复杂操作;另外lucene还提供了Sort类对结果进行排序,提供了Filter类对查询条件进行限制。你或许会不自觉地拿它跟SQL语句进行比较: “lucene能执行and、or、order by、where、like ‘%xx%’操作吗?”回答是:“当然没问题!” 7.1 各种各样的Query 下面我们看看lucene到底允许我们进行哪些查询操作: 7.1.1 TermQuery 首先介绍最基本的查询,如果你想执行一个这样的查询:“在content域中包含‘lucene’的document”,那么你可以用TermQuery: Term t = new Term("content", " lucene"; Query query = new TermQuery(t); 7.1.2 BooleanQuery 如果你想这么查询:“在content域中包含java或perl的document”,那么你可以建立两个TermQuery并把它们用BooleanQuery连接起来: TermQuery termQuery1 = new TermQuery(new Term("content", "java"); TermQuery termQuery 2 = new TermQuery(new Term("content", "perl"); BooleanQuery booleanQuery = new BooleanQuery(); booleanQuery.add(termQuery 1, BooleanClause.Occur.SHOULD); booleanQuery.add(termQuery 2, BooleanClause.Occur.SHOULD); 7.1.3 WildcardQuery 如果你想对某单词进行通配符查询,你可以用WildcardQuery,通配符包括’?’匹配一个任意字符和’*’匹配零个或多个任意字符,例如你搜索’use*’,你可能找到’useful’或者’useless’: Query query = new WildcardQuery(new Term("content", "use*"); 7.1.4 PhraseQuery 你可能对中日关系比较感兴趣,想查找‘中’和‘日’挨得比较近(5个字的距离内)的文章,超过这个距离的不予考虑,你可以: PhraseQuery query = new PhraseQuery(); query.setSlop(5); query.add(new Term("content ", “中”)); query.add(new Term(“content”, “日”)); 那么它可能搜到“中日合作……”、“中方和日方……”,但是搜不到“中国某高层领导说日本欠扁”。 7.1.5 PrefixQuery 如果你想搜以‘中’开头的词语,你可以用PrefixQuery: PrefixQuery query = new PrefixQuery(new Term("content ", "中"); 7.1.6 FuzzyQuery FuzzyQuery用来搜索相似的term,使用Levenshtein算法。假设你想搜索跟‘wuzza’相似的词语,你可以: Query query = new FuzzyQuery(new Term("content", "wuzza"); 你可能得到‘fuzzy’和‘wuzzy’。 7.1.7 RangeQuery 另一个常用的Query是RangeQuery,你也许想搜索时间域从20060101到20060130之间的document,你可以用RangeQuery: RangeQuery query = new RangeQuery(new Term(“time”, “20060101”), new Term(“time”, “20060130”), true); 最后的true表示用闭合区间。 7.2 QueryParser 看了这么多Query,你可能会问:“不会让我自己组合各种Query吧,太麻烦了!”当然不会,lucene提供了一种类似于SQL语句的查询语句,我们姑且叫它lucene语句,通过它,你可以把各种查询一句话搞定,lucene会自动把它们查分成小块交给相应Query执行。下面我们对应每种 Query演示一下: TermQuery可以用“field:key”方式,例如“content:lucene”。 BooleanQuery中‘与’用‘+’,‘或’用‘ ’,例如“content:java contenterl”。 WildcardQuery仍然用‘?’和‘*’,例如“content:use*”。 PhraseQuery用‘~’,例如“content:"中日"~5”。 PrefixQuery用‘*’,例如“中*”。 FuzzyQuery用‘~’,例如“content: wuzza ~”。 RangeQuery用‘ ”,注意TO区分大小写。 你可以任意组合query string,完成复杂操作,例如“标题或正文包括lucene,并且时间在20060101到20060130之间的文章”可以表示为:“+ (title:lucene content:lucene) +time: ”。代码如下: Directory dir = FSDirectory.getDirectory(PATH, false); IndexSearcher is = new IndexSearcher(dir); QueryParser parser = new QueryParser("content", new StandardAnalyzer()); Query query = parser.parse("+(title:lucene content:lucene) +time: "; Hits hits = is.search(query); for (int i = 0; i hits.length(); i++) { Document doc = hits.doc(i); System.out.println(doc.get("title"); } is.close(); 首先我们创建一个在指定文件目录上的IndexSearcher。 然后创建一个使用StandardAnalyzer作为分析器的QueryParser,它默认搜索的域是content。 接着我们用QueryParser来parse查询字串,生成一个Query。 然后利用这个Query去查找结果,结果以Hits的形式返回。 这个Hits对象包含一个列表,我们挨个把它的内容显示出来。 7.3 Filter filter 的作用就是限制只查询索引的某个子集,它的作用有点像SQL语句里的where,但又有区别,它不是正规查询的一部分,只是对数据源进行预处理,然后交给查询语句。注意它执行的是预处理,而不是对查询结果进行过滤,所以使用filter的代价是很大的,它可能会使一次查询耗时提高一百倍。 最常用的filter是RangeFilter和QueryFilter。RangeFilter是设定只搜索指定范围内的索引;QueryFilter是在上次查询的结果中搜索。 Filter的使用非常简单,你只需创建一个filter实例,然后把它传给searcher。继续上面的例子,查询“时间在20060101到20060130之间的文章”除了将限制写在query string中,你还可以写在RangeFilter中: Directory dir = FSDirectory.getDirectory(PATH, false); IndexSearcher is = new IndexSearcher(dir); QueryParser parser = new QueryParser("content", new StandardAnalyzer()); Query query = parser.parse("title:lucene content:lucene"; RangeFilter filter = new RangeFilter("time", "20060101", "20060230", true, true); Hits hits = is.search(query, filter); for (int i = 0; i hits.length(); i++) { Document doc = hits.doc(i); System.out.println(doc.get("title"); } is.close(); 7.4 Sort 有时你想要一个排好序的结果集,就像SQL语句的“order by”,lucene能做到:通过Sort。 Sort sort = new Sort(“time”); //相当于SQL的“order by time” Sort sort = new Sort(“time”, true); // 相当于SQL的“order by time desc” 下面是一个完整的例子: Directory dir = FSDirectory.getDirectory(PATH, false); IndexSearcher is = new IndexSearcher(dir); QueryParser parser = new QueryParser("content", new StandardAnalyzer()); Query query = parser.parse("title:lucene content:lucene"; RangeFilter filter = new RangeFilter("time", "20060101", "20060230", true, true); Sort sort = new Sort(“time”); Hits hits = is.search(query, filter, sort); for (int i = 0; i hits.length(); i++) { Document doc = hits.doc(i); System.out.println(doc.get("title"); } is.close(); 8 分析器 在前面的概念介绍中我们已经知道了分析器的作用,就是把句子按照语义切分成一个个词语。英文切分已经有了很成熟的分析器: StandardAnalyzer,很多情况下StandardAnalyzer是个不错的选择。甚至你会发现StandardAnalyzer也能对中文进行分词。 但是我们的焦点是中文分词,StandardAnalyzer能支持中文分词吗?实践证明是可以的,但是效果并不好,搜索“如果” 会把“牛奶不如果汁好喝”也搜索出来,而且索引文件很大。那么我们手头上还有什么分析器可以使用呢?core里面没有,我们可以在sandbox里面找到两个: ChineseAnalyzer和CJKAnalyzer。但是它们同样都有分词不准的问题。相比之下用StandardAnalyzer和 ChineseAnalyzer建立索引时间差不多,索引文件大小也差不多,CJKAnalyzer表现会差些,索引文件大且耗时比较长。 要解决问题,首先分析一下这三个分析器的分词方式。StandardAnalyzer和ChineseAnalyzer都是把句子按单个字切分,也就是说 “牛奶不如果汁好喝”会被它们切分成“牛 奶 不 如 果 汁 好 喝”;而CJKAnalyzer则会切分成“牛奶 奶不 不如 如果 果汁 汁好好喝”。这也就解释了为什么搜索“果汁”都能匹配这个句子。 以上分词的缺点至少有两个:匹配不准确和索引文件大。我们的目标是将上面的句子分解成 “牛奶 不如 果汁好喝”。这里的关键就是语义识别,我们如何识别“牛奶”是一个词而“奶不”不是词语?我们很自然会想到基于词库的分词法,也就是我们先得到一个词库,里面列举了大部分词语,我们把句子按某种方式切分,当得到的词语与词库中的项匹配时,我们就认为这种切分是正确的。这样切词的过程就转变成匹配的过程,而匹配的方式最简单的有正向最大匹配和逆向最大匹配两种,说白了就是一个从句子开头向后进行匹配,一个从句子末尾向前进行匹配。基于词库的分词词库非常重要,词库的容量直接影响搜索结果,在相同词库的前提下,据说逆向最大匹配优于正向最大匹配。 当然还有别的分词方法,这本身就是一个学科,我这里也没有深入研究。回到具体应用,我们的目标是能找到成熟的、现成的分词工具,避免重新发明车轮。经过网上搜索,用的比较多的是中科院的 ICTCLAS和一个不开放源码但是免费的JE-Analysis。ICTCLAS有个问题是它是一个动态链接库, java调用需要本地方法调用,不方便也有安全隐患,而且口碑也确实不大好。JE-Analysis效果还不错,当然也会有分词不准的地方,相比比较方便放心。 9 性能优化 一直到这里,我们还是在讨论怎么样使lucene跑起来,完成指定任务。利用前面说的也确实能完成大部分功能。但是测试表明lucene的性能并不是很好,在大数据量大并发的条件下甚至会有半分钟返回的情况。另外大数据量的数据初始化建立索引也是一个十分耗时的过程。那么如何提高lucene的性能呢?下面从优化创建索引性能和优化搜索性能两方面介绍。 9.1 优化创建索引性能 这方面的优化途径比较有限,IndexWriter提供了一些接口可以控制建立索引的操作,另外我们可以先将索引写入RAMDirectory,再批量写入FSDirectory,不管怎样,目的都是尽量少的文件IO,因为创建索引的最大瓶颈在于磁盘IO。另外选择一个较好的分析器也能提高一些性能。 9.1.1 通过设置IndexWriter的参数优化索引建立 setMaxBufferedDocs(int maxBufferedDocs) 控制写入一个新的segment前内存中保存的document的数目,设置较大的数目可以加快建索引速度,默认为10。 setMaxMergeDocs(int maxMergeDocs) 控制一个segment中可以保存的最大document数目,值较小有利于追加索引的速度,默认Integer.MAX_VALUE,无需修改。 setMergeFactor(int mergeFactor) 控制多个segment合并的频率,值较大时建立索引速度较快,默认是10,可以在建立索引时设置为100。 9.1.2 通过RAMDirectory缓写提高性能 我们可以先把索引写入RAMDirectory,达到一定数量时再批量写进FSDirectory,减少磁盘IO次数。 FSDirectory fsDir = FSDirectory.getDirectory("/data/index", true); RAMDirectory ramDir = new RAMDirectory(); IndexWriter fsWriter = new IndexWriter(fsDir, new StandardAnalyzer(), true); IndexWriter ramWriter = new IndexWriter(ramDir, new StandardAnalyzer(), true); while (there are documents to index) { ... create Document ... ramWriter.addDocument(doc); if (condition for flushing memory to disk has been met) { fsWriter.addIndexes(new Directory   文章2的所有关键词为:  2) 倒排索引 :有了关键词后,我们就可以建立倒排索引了。上面的对应关系是:“文章号”对“文章中所有关键词”。倒排索引把这个关系倒过来,变成 :“关键词”对“拥有该关键词的所有文章号”。 文章1,2经过倒排后变成 关键词 文章号   guangzhou 1   he 2   i 1   live 1,2   shanghai 2   tom 1   通常仅知道关键词在哪些文章中出现还不够,我们还需要知道关键词在文章中出现次数和出现的位置,通常有两种位置:a)字符位置,即记录该词是文章中第几个字符(优点是关键词亮显时定位快);b)关键词位置,即记录该词是文章中第几个关键词(优点是节约索引空间、词组(phase)查询快),lucene中记录的就是这种位置。 加上“出现频率”和“出现位置”信息后,我们的索引结构变为: 关键词 文章号 出现位置 guangzhou 1 3,6 he 2 1 i 1 4 live 1 2,5 2 2 shanghai 2 3 tom 1 1   以live 这行为例我们说明一下该结构:live在文章1中出现了2次,文章2中出现了一次,它的出现位置为“2,5,2”这表示什么呢?我们需要结合文章号和出现频率来分析,文章1中出现了2次,那么“2,5”就表示live在文章1中出现的两个位置,文章2中出现了一次,剩下的“2”就表示live是文章2中第 2个关键字。   以上就是lucene索引结构中最核心的部分。我们注意到关键字是 按字符顺序排列的(lucene没有使用B树结构), 因此lucene可以用 二元搜索算法 快速定位关键词。   实现时 lucene将上面三列分别作为 词典文件 (Term Dictionary)、 频率文件 (frequencies)、 位置文件 (positions)保存。其中 词典文件不仅保存有每个关键词,还保留了指向频率文件和位置文件的指针, 通过指针可以找到该关键字的频率信息和位置信息。   Lucene中使用了 field 的概念,用于 表达信息所在位置(如标题中,文章中,url中), 在建索引中,该 field信息也记录在词典文件中 ,每个关键词都有一个field信息(因为每个关键字一定属于一个或多个field)。   为了减小索引文件的大小,Lucene对索引还使用了 压缩技术 。首先,对词典文件中的关键词进行了压缩,关键词压缩为前缀长度,后缀,例如:当前词为“阿拉伯语”,上一个词为“阿拉伯”,那么“阿拉伯语”压缩为3,语。其次大量用到的是对数字的压缩,数字只保存与上一个值的差值(这样可以减小数字的长度,进而减少保存该数字需要的字节数)。例如当前文章号是16389(不压缩要用3个字节保存),上一文章号是16382,压缩后保存7(只用一个字节)。 注意是“上一个词”。由于词典是按顺序排列的,这种压缩方法的效果会非常显著。   下面我们可以通过对该索引的查询来解释一下为什么要建立索引。 假设要查询单词 “live”,lucene先对词典二元查找、找到该词,通过指向频率文件的指针读出所有文章号,然后返回结果。词典通常非常小,因而,整个过程的时间是毫秒级的。 而用普通的顺序匹配算法,不建索引,而是对所有文章的内容进行字符串匹配,这个过程将会相当缓慢,当文章数目很大时,时间往往是无法忍受的。 12.全文检索框架的实现机制   Lucene的API接口设计的比较通用,输入输出结构都很像数据库的表==记录==字段,所以很多传统的应用的文件、数据库等都可以比较方便的映射到Lucene的存储结构/接口中。总体上看:可以先把Lucene当成一个支持全文索引的数据库系统。 比较一下Lucene和数据库: Lucene 数据库 索引数据源:doc(field1,field2...) doc(field1,field2...) \ indexer / _____________ | Lucene Index | -------------- / searcher \ 结果输出:Hits(doc(field1,field2) doc(field1...)) 索引数据源:record(field1,field2...) record(field1..) \ SQL: insert/ _____________ | DB Index | ------------- / SQL: select \ 结果输出:results(record(field1,field2..) record(field1...)) Document:一个需要进行索引的“单元,一个Document由多个字段组成 Record:记录,包含多个字段 Field:字段 Field:字段 Hits:查询结果集,由匹配的Document组成 RecordSet:查询结果集,由多个Record组成 全文检索 ≠ like "%keyword%"   由于数据库索引不是为全文索引设计的,因此,使用like "%keyword%"时,数据库索引是不起作用的,在使用like查询时,搜索过程又变成类似于一页页翻书的遍历过程了,所以对于含有模糊查询的数据库服务来说,LIKE对性能的危害是极大的。如果是需要对多个关键词进行模糊匹配:like"%keyword1%" and like "%keyword2%" ...其效率也就可想而知了。   通常比较厚的书籍后面常常附关键词索引表(比如:北京:12, 34页,上海:3,77页……),它能够帮助读者比较快地找到相关内容的页码。而数据库索引能够大大提高查询的速度原理也是一样,想像一下通过书后面的索引查找的速度要比一页一页地翻内容高多少倍……而索引之所以效率高,另外一个原因是它是排好序的。对于检索系统来说核心是一个排序问题。   所以建立一个高效检索系统的关键是建立一个类似于科技索引一样的反向索引机制,将数据源(比如多篇文章)排序顺序存储的同时,有另外一个排好序的关键词列表,用于存储关键词==文章映射关系,利用这样的映射关系索引: ,检索过程就是把模糊查询变成多个可以利用索引的精确查询的逻辑组合的过程。从而大大提高了多关键词查询的效率,所以,全文检索问题归结到最后是一个排序问题。   由此可以看出模糊查询相对数据库的精确查询是一个非常不确定的问题,这也是大部分数据库对全文检索支持有限的原因。Lucene最核心的特征是通过特殊的索引结构实现了传统数据库不擅长的全文索引机制,并提供了扩展接口,以方便针对不同应用的定制。   可以通过一下表格对比一下数据库的模糊查询: Lucene全文索引引擎 数据库 索引 将数据源中的数据都通过全文索引一一建立反向索引 对于LIKE查询来说,数据传统的索引是根本用不上的。数据需要逐个便利记录进行GREP式的模糊匹配,比有索引的搜索速度要有多个数量级的下降。 匹配效果 通过词元(term)进行匹配,通过语言分析接口的实现,可以实现对中文等非英语的支持。 使用:like "%net%" 会把netherlands也匹配出来, 多个关键词的模糊匹配:使用like "%com%net%":就不能匹配词序颠倒的xxx.net..xxx.com 匹配度 有匹配度算法,将匹配程度(相似度)比较高的结果排在前面。 没有匹配程度的控制:比如有记录中net出现5词和出现1次的,结果是一样的 结果输出 通过特别的算法,将最匹配度最高的头100条结果输出,结果集是缓冲式的小批量读取的。 返回所有的结果集,在匹配条目非常多的时候(比如上万条)需要大量的内存存放这些临时结果集。 可定制性 通过不同的语言分析接口实现,可以方便的定制出符合应用需要的索引规则(包括对中文的支持) 没有接口或接口复杂,无法定制 结论 高负载的模糊查询应用,需要负责的模糊查询的规则,索引的资料量比较大 使用率低,模糊匹配规则简单或者需要模糊查询的资料量少 全文检索和数据库应用最大的不同在于:让 最相关的 头100条结果满足98%以上用户的需求。 13.Lucene的创新之处   大部分的搜索(数据库)引擎都是用B树结构来维护索引,索引的更新会导致大量的IO操作,Lucene在实现中,对此稍微有所改进:不是维护一个索引文件,而是在扩展索引的时候不断创建新的索引文件,然后定期的把这些新的小索引文件合并到原先的大索引中(针对不同的更新策略,批次的大小可以调整),这样在不影响检索的效率的前提下,提高了索引的效率。 Lucene和其他一些全文检索系统/应用的比较: Lucene 其他开源全文检索系统 增量索引和批量索引 可以进行增量的索引(Append),可以对于大量数据进行批量索引,并且接口设计用于优化批量索引和小批量的增量索引。 很多系统只支持批量的索引,有时数据源有一点增加也需要重建索引。 数据源 Lucene没有定义具体的数据源,而是一个文档的结构,因此可以非常灵活的适应各种应用(只要前端有合适的转换器把数据源转换成相应结构)。 很多系统只针对网页,缺乏其他格式文档的灵活性。 索引内容抓取 Lucene的文档是由多个字段组成的,甚至可以控制那些字段需要进行索引,那些字段不需要索引,近一步索引的字段也分为需要分词和不需要分词的类型: 需要进行分词的索引,比如:标题,文章内容字段 不需要进行分词的索引,比如:作者/日期字段 缺乏通用性,往往将文档整个索引了 语言分析 通过语言分析器的不同扩展实现: 可以过滤掉不需要的词:an the of 等, 西文语法分析:将jumps jumped jumper都归结成jump进行索引/检索 非英文支持:对亚洲语言,阿拉伯语言的索引支持 缺乏通用接口实现 查询分析 通过查询分析接口的实现,可以定制自己的查询语法规则: 比如: 多个关键词之间的 + - and or关系等 功能较强大 并发访问 能够支持多用户的使用 功能较强大 14.关于亚洲语言的的切分词问题(Word Segment)   对于中文来说,全文索引首先还要解决一个语言分析的问题,对于英文来说,语句中单词之间是天然通过空格分开的,但亚洲语言的中日韩文语句中的字是一个字挨一个,所有,首先要把语句中按“词”进行索引的话,这个词如何切分出来就是一个很大的问题。   首先,肯定不能用单个字符作(si-gram)为索引单元,否则查“上海”时,不能让含有“海上”也匹配。 但一句话:“北京天安门”,计算机如何按照中文的语言习惯进行切分呢?   “北京 天安门” 还是“北 京 天安门”?让计算机能够按照语言习惯进行切分,往往需要机器有一个比较丰富的词库才能够比较准确的识别出语句中的单词。   另外一个解决的办法是采用自动切分算法:将单词按照2元语法(bigram)方式切分出来,比如:     "北京天安门" == "北京 京天 天安 安门"。 这样,在查询的时候,无论是查询"北京" 还是查询"天安门",将查询词组按同样的规则进行切分:"北京","天安安门",多个关键词之间按与"and"的关系组合,同样能够正确地映射到相应的索引中。这种方式对于其他亚洲语言:韩文,日文都是通用的。   基于自动切分的最大优点是没有词表维护成本,实现简单,缺点是索引效率低,但对于中小型应用来说,基于2元语法的切分还是够用的。基于2元切分后的索引一般大小和源文件差不多,而对于英文,索引文件一般只有原文件的30%-40%不同。 自动切分 词表切分 实现 实现非常简单 实现复杂 查询 增加了查询分析的复杂程度 适于实现比较复杂的查询语法规则 存储效率 索引冗余大,索引几乎和原文一样大 索引效率高,为原文大小的30%左右 维护成本 无词表维护成本 词表维护成本非常高:中日韩等语言需要分别维护。 还需要包括词频统计等内容 适用领域 嵌入式系统:运行环境资源有限 分布式系统:无词表同步问题 多语言环境:无词表维护成本 对查询和存储效率要求高的专业搜索引擎 目前比较大的搜索引擎的语言分析算法一般是基于以上2个机制的结合。关于中文的语言分析算法,大家可以在Google查关键词"wordsegment search"能找到更多相关的资料。 15.Lucene的结构框架   注意:Lucene中的一些比较复杂的词法分析是用JavaCC生成的(JavaCC:JavaCompilerCompiler,纯Java的词法分析生成器),所以如果从源代码编译或需要修改其中的QueryParser、定制自己的词法分析器,还需要从 https://javacc.dev.java.net/ 下载javacc。   lucene的组成结构:对于外部应用来说索引模块(index)和检索模块(search)是主要的外部应用入口。 org.apache.Lucene.search/ 搜索入口 org.apache.Lucene.index/ 索引入口 org.apache.Lucene.analysis/ 语言分析器 org.apache.Lucene.queryParser/ 查询分析器 org.apache.Lucene.document/ 存储结构 org.apache.Lucene.store/ 底层IO/存储结构 org.apache.Lucene.util/ 一些公用的数据结构 16.从Lucene学到更多   Luene的确是一个面对对象设计的典范。 1)所有的问题都通过一个额外抽象层来方便以后的扩展和重用:你可以通过重新实现来达到自己的目的,而对其他模块而不需要; 2)简单的应用入口Searcher, Indexer,并调用底层一系列组件协同的完成搜索任务; 3)所有的对象的任务都非常专一:比如搜索过程:QueryParser分析将查询语句转换成一系列的精确查询的组合(Query),通过底层的索引读取结构IndexReader进行索引的读取,并用相应的打分器给搜索结果进行打分/排序等。所有的功能模块原子化程度非常高,因此可以通过重新实现而不需要修改其他模块。 4)除了灵活的应用接口设计,Lucene还提供了一些适合大多数应用的语言分析器实现(SimpleAnalyser,StandardAnalyser),这也是新用户能够很快上手的重要原因之一。 这些优点都是非常值得在以后的开发中学习借鉴的。作为一个通用工具包,Lunece的确给予了需要将全文检索功能嵌入到应用中的开发者很多的便利。   此外,通过对Lucene的学习和使用,我也更深刻地理解了为什么很多数据库优化设计中要求,比如: 1)尽可能对字段进行索引来提高查询速度,但过多的索引会对数据库表的更新操作变慢,而对结果过多的排序条件,实际上往往也是性能的杀手之一。 2)很多商业数据库对大批量的数据插入操作会提供一些优化参数,这个作用和索引器的merge_factor的作用是类似的。 3)20%/80%原则:查的结果多并不等于质量好,尤其对于返回结果集很大,如何优化这头几十条结果的质量往往才是最重要的。 4)尽可能让应用从数据库中获得比较小的结果集,因为即使对于大型数据库,对结果集的随机访问也是一个非常消耗资源的操作。
个人分类: 数字媒体|1863 次阅读|0 个评论
[转载]SCI论文发表的关键词问题
zhao1198 2011-8-22 18:58
SCI论文发表的关键词属于主题词中的一类。主题词除关键词外,还包含有单元词、标题词的叙词。   主题词是用来描述文献资料主题和给出检索文献资料的一种新型的情报检索语言词汇,正是由于它的出现和发展,才使得情报检索计算机化(计算机检索)成为 可能。 主题词是指以概念的特性关系来区分事物,用自然语言来表达,并且具有组配功能,用以准确显示词与词之间的语义概念关系的动态性的词或词组。   SCI论文发表的关键词是标示文献关建主题内容,但未经规范处理的主题词。关键词是为了文献标引工作,从论文中选取出来,用以表示全文主要内容信息款目的单词或术语。一篇论文可选取3~8个词作为关键词。   关键词或主题词的一般选择方法是:   由作者在完成论文写作后,纵观全文,先出能表示论文主要内容的信息或词汇,这些住处或词江,可以从论文标题中去找和选,也可以从论文内容中去找和选。 例如上例,关键词选用了6个,其中前三个就是从论文标题中选出的,而后三个却是从论文内容中选取出来的。后三个关键词的选取,补充了论文标题所未能表示出 的主要内容信息,也提高了所涉及的概念深度。需要选出,与从标题中选出的关键词一道,组成该论文的关键词组。   关键词与主题词的运用,主要是为了适应计算机检索的需要,以及适应国际计算机联机检索的需要。一个刊物增加“关键词”这一项,就为该刊物提高“引用率”、增加“知名度”开辟了一个新的途径。 本文来自辑文编译(http://www.jwedit.net),欢迎转载并加上连接
个人分类: Writing|1 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-25 07:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部