本文主要是关于文本表示的一些模型的介绍,其实就是想推荐给你们一些容易理解的资源。我就给链接,具体要了解,还是大家自己去看,有觉得不正确的地方可以交流,我来更正。 主要有这样几个模型:VSM(不解释),LSI,LDA,D2V。 VSM模型是非常基础的文本表示方式,把要表示的文本分词,可以做做降维,选出文本特征,然后基本上就完成了VSM模型表示的90%的工作量。 好了下面开始正题: 首先是LSI。在用LSI的时候一直在纠结我是写LSI还是LSA。虽然两个是差不多的感觉,而且看到的资料总是一会儿用LSI,一会儿用LSA。后来看到一个资料是这么写的,估计也是看到文献中的: LSI refers to using this technique for indexing, or information retrieval. LSA refers to using it for everything else. 所以他们指的是同一种技术,只是应用场景不同。 转自 : http://www.datalab.sinaapp.com/?p=277 潜语义分析利用奇异值分解技术把文本从高维空间映射到低维空间,称之为潜语义空间,文档的相似性在这个空间内进行比较。空间的维度个数可以自己指定,往往比传统向量空间维度更少,所以LSA也是一种降维技术。而关于奇异值分解技术的说明,大家可以看看这个链接: http://blog.csdn.net/wangzhiqing3/article/details/7446444 其他相关的有用链接: http://blog.csdn.net/bob007/article/details/30496559 http://blog.csdn.net/roger__wong/article/details/41175967 http://blog.sina.com.cn/s/blog_7d43383e0101eecu.html LSI模型总结一下关键要理解奇异值分解的步骤,感觉就是利用数学的方法,把一个大矩阵缩小为一个小矩阵,而这个小的就是潜在语义空间了。 说完LSI,说一下LDA( Latent Dirichlet Allocation )。不得不提到 LDA数学八卦(给一个微盘链接: http://vdisk.weibo.com/s/q0sGh/1360334108?utm_source=weibolife ),初学的时候觉得自己能把这个PDF看懂就胜利了,结果看到最后看晕了,至今没再探究过。虽然每次看到别人的论文将LDA模型翻来覆去得玩很是羡慕,但是自己确实连弄懂都困难,又不去搞清楚,实在怪自己咯~ 好吧,这个如果不深究其中的数学原理,可以看看这几个链接: http://www.xperseverance.net/blogs/2012/03/17/ (不错的!) http://blog.csdn.net/poson/article/details/8195908 (有讲到 Gibbs Sampling,浅显 ) http://blog.csdn.net/poson/article/details/8195908 http://blog.csdn.net/wangran51/article/details/7408399 不过,如果觉得自己数学水平还是可以的,可以看看下面这个链接: http://blog.csdn.net/v_july_v/article/details/41209515?utm_source=tuicoolutm_medium=referral 除此之外,LDA在进行参数学习时,较为常用的方法是Gibbs采样,想要了解何为Gibbs Sampling可以看一下 如下的链接: http://blog.csdn.net/yangliuy/article/details/8302599 http://download.csdn.net/detail/zouhch/4352762 另外推荐文章: Heinrich G. Parameter estimation for text analysis . University of Leipzig, Tech. Rep, 2008. Oh 终于到了深度学习模型了么?这个我是真的还没研究透,连梯度下降我都迷糊,更别说这个了。 做研究的时候主要用了Mikolov团队开发的doc2vec还不是word2vec,不过是差不多的原理啦。来个原话: The only change in this model compared to the word vector framework is in equation 1, where h is constructed from W and D. 给你们看一下公式1 其中, every paragraph is mapp ed to a unique vector, represented by a column in matrix D and every word is also mapped to a unique vector, represented by a column in matrix W. 经典文献,我就不给了,还是给一些别人写的资源: http://blog.csdn.net/mytestmy/article/details/26961315?utm_source=tuicoolutm_medium=referral http://blog.csdn.net/mytestmy/article/details/26969149?utm_source=tuicoolutm_medium=referral 还有来自知乎的资源: https://www.zhihu.com/question/21661274/answer/19331979 其中见解还是大家懂的去探究吧,我觉得我还是小白。 这里还有一个实战链接: http://techblog.youdao.com/?p=915 实践证明学好数学是一件大事啊! 结束。
11月23、24日,管坤良教授系列学术报告在医学院附楼大报告厅及蒙民伟楼139报告厅隆重举行。 11月23日上午管教授在医学院科研辅楼大报告厅举行了题为 The mTOR and Hippo Pathways: How Key Discoveries We Made? 的学术讲座,全校数百名师生的积极参与, 全场热情高涨,座无虚席。管教授介绍了其实验室在mTOR领域的工作,详细分析了生长因子和细胞内的氨基酸水平以及能量水平多因素对mTOR激酶的调控机制;然后介绍了最近几年所做的关于Hippo信号通路的相关工作,阐释了Hippo通路在控制器官大小中的作用,并介绍了Hippo信号通路的最新进展。 11月23日下午管教授在蒙民伟楼139报告厅作了题为“我的学术生涯:从农民的儿子到生命科学家”的第二场报告。讲座中管坤良教授与广大师生分享了他的成长历程,从农村孩子考入浙江大学(原杭州大学),并于1983年通过第二届CUSBEA考试赴美留学,通过自身不懈努力,成为PI并组建自己独立实验室。最后管教授介绍了在促进国内生命科学发展中所做的杰出工作。管教授诙谐幽默的讲演引起在座师生们的阵阵笑语,掌声不断。 11月24日上午管坤良教授作了题为“Metabolism Regulation and Cancer”的第三场学术报告,介绍了近几年在国内科学研究的工作。主要包括乙酰化对代谢的调控,以及代谢基因突变与肿瘤发生之间的关系。在提问环节,现场气氛热烈,在座的老师和学生频频提问,管教授与师生们展开了热烈的交流和讨论。 管坤良教授在生命科学上的高深造诣和对科学研究的孜孜不倦使广大师生深受鼓舞,受益匪浅。至此,管坤良教授系列报告圆满落幕。 ------生命科学研究院:孙双午(供稿)
2010 年 5 月 21 日,冯新华院长应邀参加第九届生命科学节闭幕式,本科生院学务处和生命科学学院的领导和嘉宾也出席了闭幕式。冯新华教授给广大师生作了精彩的主题报告“我的学术生涯: A Roundtrip between East and West ”。 冯教授和学生分享了他的求学经历、学术生涯和对于人生的感悟,不仅让听众领略了著名学者的风采,也为同学们思考自己未来的人生之路、科研之路开启了一盏启明灯,与会的每位同学都受益匪浅。此外,冯教授还向现场的各位师生简单介绍了生命科学研究院目前的发展和将来的规划,使得同学们对于生研院有了更加深刻的认识。
Zhejiang University is committed to the highest standards of excellence in education and research, and has been at the forefront of academic scholarship in China. Its newly established Life Sciences Institute (LSI) aspires to become a top research institute in a broad range of biological and medical research. LSI seeks 30 exceptional principal investigators at all levels to conduct innovative research in the areas of life and medical sciences, including (but not limited to) cancer biology, cell biology, biochemistry, development, immunology, systems biology, structural biology, and any disciplines related to cancer and major human diseases. All applicants should have demonstrated their outstanding track records with high impact publications in the field; senior applicants should have an independent and exciting research program. A very generous recruiting package will be offered to tenure-track faculty members according to qualifications and experience, including salary and benefits (300K-800K RMB), housing (or housing subsidies), and internationally competitive start-up research support. LSI and the university in general provide outstanding state-of-the-art research facilities and strong supporting staffs. The city of Hangzhou provides an ideal urban living and cultural environment with natural beauty, outstanding school systems and ready access to other metropolitan areas (including Shanghai). To apply, please login in website http://lsi.zju.edu.cn to sign up and submit application, including a full CV, cover letter, and future plan. Application can also be sent to lsi@zju.edu.cn . In addition, at least three letters of references should be sent to lsi@zju.edu.cn . Applications will be accepted until the positions are filled. For further information, please contact the LSI main office, Tel: +86-571-8898-1336, Fax: +86-571-8898-1337, email: lsi@zju.edu.cn .