科学网

 找回密码
  注册

tag 标签: 进度

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

依存句法分析实验进度
dudong 2013-6-1 18:39
本周主要工作是写程序,基本上已经接近尾声 inference算法用的是dual decomposition(这个不会再变了) learning算法用的是averaged perceptron(这个可能还会再变) 没完成的工作包括: (1)写代码的过程比较混乱,所以代码组织很不清晰,类的定义以及功能太乱,准备先把代码组织结构修改一下 (2)调试工作可能会比较费时间。上周写的程序都调试过了,但是本周写的有点快,也有点乱 (3)文件读写工作:里边涉及以很多预处理工作,而且在inference算法和learning算法中也涉及到许多与算法无关的细节工作。每次运行都会花很多时间。之前调试程序的麻烦是每次要等将近5分钟才遇到bug出现。所以打算把已经调试过没有问题的结果暂时保存到文件中,这样就可以省去大量的调试时间 潜在的问题: 正常来讲要用的数据集是WSJ,但是那个需要花钱买。如果有这个数据集的话,就只需要运行自己的算法,与别人的现有结果比较即可。 但是现在用的是另外一个略不同的数据集Ontonotes 4.0。所以一直在联系要比较算法的那几个作者,希望把他们的实验在新数据集上比较一下。。。
3217 次阅读|0 个评论
依存句法分析实验进度
dudong 2013-5-25 14:41
本周做的工作主要是把EGSTRA的源代码看完了,然后自己也写了点代码 用C++写的代码,有点慢。打算这次实验之后开始学习python 本周写的代码主要是关于上下文敏感信息的抽取: 比如一个结点会有多个子结点,这几个子结点按照一定顺序的排列可以看成是这个单词的一个用法,这个结点的 结点以及兄弟结点可以看成这个用法的上下文。 context sensitive rules不仅可以用来做为特征,还可以在inference的时候用。 接下来的计划: 1.把VerbNet的模板信息与上下文敏感信息合并 2.写特征抽取的代码 3.写dual decomposition的代码,这个与特征有很大关系 4.写learning代码,这个比较简单,用averaged perceptron就好了
2899 次阅读|0 个评论
依存句法分析实验进度
dudong 2013-5-18 08:50
说细说一下现在实验的进度吧,主要是实验背景、需要做的工作以及已经完成的工作: 1.实验背景 之前论文都是Penn Treebank上进行的实验,但是这个面要付费。所以我找到另外一个与之非常相似的数据集OntoNotes 4.0。OntoNotes 4.0数据集的目标并不是依存分析,但是Penn Treebank是它的子集(稍有区别)。里边的raw data略有差别,而且标注方法也稍微有点区别。 依存句法分析(传统方法)的实验大致分为三个环节: 1.1 特征提取 1.2 inference算法(多数工作都是集中在这里) 1.3 learning算法(就是参数学习,是个最优化问题,很少有人关注) 这几个算法之间是相互独立的,因此会有很多搭配。 最近两年(新方法)还会引用一些外部知识来提高依存句法分析的准确率: 比如单词聚类、从互联网中提取的知识等半监督方法。 2.需要做的工作 如果在Penn Treebank上进行实验的话,只需要把自己的实验做完与现有的结果进行比较即可。但由于刚才提到的数据集的区别,需要把别人的实验在新数据集上重复一下。需要做的工作有: 2.1 自己实验 在传统方法的基础上添加Propbank信息和WordNet、VerbNet信息。 2.2 别人实验(部分已经要到源代码,还有几个没有联系上) 3.已经完成的工作 之前的想法效果不太好,本周决定使用其他的inference算法来替代原来的。 已经把WordNet、VerbNet相关代码写完,其他的正在进行中。。
3527 次阅读|0 个评论
小白鼠成长日记2013年0213——缺乏讨论导致科研进度慢
热度 2 summerice9 2013-2-12 17:08
老师: 新年快乐 ~~ 。 估计您对我去年那一天离开有些不满。周五确实是心情很不平静,斟酌之下就没再去了。 非常感谢您让我在您的组里待了一周。在这一周里,我观察了您如何指导学生科研。对比我的科研过程,我发现了自己很多问题。 我看您每天下午都和学生就项目中遇到的问题展开讨论。甚至您和您的学生为了一个参数讨论很长时间。可以想象您每周至少和您的学生讨论好几次。而我和小老板甚至和您,一个月都没讨论过一次。而缺乏讨论其实是在 2012 下半年中我的实验和论文写作进度慢的重要原因之一。 其实跟人多讨论并非显示该人能力的缺失。讨论可以帮助人在短期内梳理思路,特别是跟有经验人多讨论。因为每个人的看问题的角度不一样,跟人讨论就是用别人的角度看问题,这样很容易看出自己想法的漏洞。 其实我在做 video retargeting 时,参数设置也出现了很大的问题,但是我都自己留着慢慢折腾了。当时如果我及时去找您的话,实验估计也不会进行两个月之久。 另外,我想您和您的学生在讨论对论文写作业也有好处。比如实验分析要说的话,方法部分的步骤,引论中的动机就一一提炼出来了。这样,学生实验走的弯路少,论文的构思也在平时讨论中完成了一部分。 而我和您讨论太少了,特别是面对面讨论。虽然我们有时用 MSN 讨论,虽然 MSN 能够通过书面梳理思路,但是能够碰触思维火花的机会较小,而且不知道对方法是否理解。 总之,就是自己和老师配合的不好。 李冰
4589 次阅读|5 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 18:24

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部