科学网

 找回密码
  注册

tag 标签: 股市预测

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

舆情挖掘系统独立验证的意义
热度 5 liwei999 2015-11-22 01:40
一个偶然的机会,做了一个偶然的HTC中文舆情挖掘的实验,结果发在博文 到底社媒曲线与股市曲线有没有、有多少相关度 ,引起很多的兴趣,也激发了不少关于利用大数据做股市预测的想象。但这个实验对于我却有另一层难得的系统独立验证的意义。 这个实验本来只是为了回应投资人的问题,同时也满足自己的好奇,尝试寻找社交媒体大数据的舆情与股市波动之间的相关性。熟悉股市,帮助我制图的老友看到结果后评论说: It is interesting, to say the least. HTC中文舆情指数(net-sentiment)与其美国股市表现曲线图的对比(谢谢老友帮助制图) 股市预测是无数人的梦想,哪怕有一点突破,可以用来 beat the market,那也是不得了的效应。但是造成股市波动的因素太多,反映股民信心的舆情只是众多因素之一种。虽然从中长期看,股市波动的总体趋势似乎有迹可循,但股市崩盘这样的突发事件应该是不可具体预测的。这就好像地震一样,什么时候到临界点是无法精确预知的。 撇开这个非常诱人的应用领域不谈,本博文要说明的是,该实验对我本人,对我研制的以parsing为基础的中文舆情挖掘系统的独特意义。 这个意义的实质在于,它独立验证了该系统的质量,结论是:用 parsing 做底的中文社交媒体的舆情挖掘是靠谱的。 我们研制一个自然语言的舆情挖掘系统,特别是对中文社交这样的高度复杂的分析抽取引擎,自然有各种质量检测(QA),从我们开发者自己设立的各种 regression tests 来保障系统质量永远向上,到专门的QA组利用 Crowd Sourcing 的第三方资源帮助判定每一期开发的质量变动。后者也算是独立的质量监测。但这一切仍然是内部进行的过程。外部的独立验证很有必要,但难以操作。譬如学界(academia)会有一些系统竞赛,好处是标准是透明公开的,缺点是每个任务的制定与我们要实际应用的现场需求往往不能很好地吻合。为了做 apples to apples comparison,必须花费很多精力去适应学界制定的那个标准及其 format。另外一点是,学界的系统竞赛很少关注系统运行的效率,其宗旨是鼓励新方法的探索和科学的进步,而不是应用性的考量。其结果是,很少见到学界中的竞赛优胜者成长为一个工业卓越的应用,也很少见到工业大规模应用的系统去学界竞赛。 王婆卖瓜没有说不甜的。那么除了内部测试,怎样才能得到有说服力的独立验证呢?一个办法是客户的使用反馈,特别是大客户,他们往往尝试使用了一批同类型的工具,对于数据质量,会有切身的感受和非常有价值的比较,具有相当大的 due diligence 的参考价值(实际上我们有很多这样的客户反馈和见证)。缺点是客户的主观验证(或见证 testimony)往往不系统,而且数据质量与应用层面的其他 features 的主观感受容易混在一起。 恰好在这一点,上述实验的结果提供了一个极好的具有客观性的系统独立验证,令人鼓舞。数据挖掘的结果与股市波动的数据是完全独立的两个来源,如今居然吻合得这么好。于是,在验证了舆情与股市正相关之外,我们客观上得到了一个额外的系统独立验证的 bonus:本挖掘系统是靠谱的,质量是有保证的,因为在一年这样长的时间区间,两条完全独立来源的相关数据曲线恰好能相伴而舞,步调一致,这不可能是碰巧。具体说来有两点。如果舆情挖掘的结果曲线与股市波动有时吻合有时不吻合,我们不能得出结论说系统质量不可靠(当然也不能得出可靠的结论),因为股市波动的触发因素不仅仅是舆情。然而,如果舆情挖掘结果与股市波动吻合了,唯一的逻辑结论就是,舆情挖掘是靠谱的。这就是这次偶然的实验对我本人和我的开发团队的独特意义,这个独立验证是经得起逻辑推论的。 最有意思的是,我们还同时比较了同一个时间区间的热度(mentions)曲线(见下图),发现它与股市波动有不少不相吻合的地方。这个比较更具有说服力,因为 mentions 实际上给舆情提供了背景和不带情感因素的baseline。它帮助突显了舆情挖掘的价值,谈论多少虽然与舆情密切相关,但它不能反映舆情的方向(polarity),自然无法与股市波动协调。 HTC中文热议度与股市表现曲线图的对比 (谢谢老友帮助制图 ) 【相关】 到底社媒曲线与股市曲线有没有、有多少相关度? 再谈舆情与股市的相关性 一切声称用机器学习做社会媒体舆情挖掘的系统,都值得怀疑 2015-11-21 【立委科普:NLP 中的一袋子词是什么】 2015-11-27 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 立委科普|6818 次阅读|8 个评论
到底社媒曲线与股市曲线有没有、有多少相关度?
热度 1 liwei999 2014-8-16 23:35
看看到底社会媒体的曲线与股市曲线有没有、有多少相关度,我正好有 HTC 过去一年的中文社媒数据 作者: 立委 (*) 日期: 08/16/2014 09:59:26 这是我们系统的关于 HTC 的中文媒体热议度(mentions)和褒贬度(net sentiment)的过去一年的曲线。 这是纯粹的社媒热议度(mentions)曲线。 这张图似乎更清晰一些:下面的曲线是热议度,上面的曲线是褒贬度(社媒舆情)。 路透社的HTC过去一年股市曲线图 雅虎的HTC过去一年股市曲线图 热议度与股市表现曲线图的对比 (谢谢老友帮助制图 ) 褒贬度与股市表现曲线图的对比(谢谢老友帮助制图) daily data 太稀疏和起伏,可上述 weekly data 似乎又间隔太长(颗粒度太粗)了,不好做吻合度滞后性的观察。也许最好是每隔三四天的数据来做,既让曲线 smooth,也不失时间的精度。以后做吧。 似乎 媒体褒贬度(net sentiment)的曲线比较热议度(mentions)的曲线与股市曲线吻合度更好?这也是合理的。 从这个例子看,似乎net sentiment略领先于market. 如果过去的历史有相关度,那么因为我们可以实时监测,对未来的走向的预示也就有搞头。历史是未来之母。 真要做股市预测,应该多做实验比较,精心挑选资料来源,排除来自不可靠资料源(包括更新不及时)的干扰或副作用,也许才更可靠一些? 对于英文社媒,除了 Twitter 和 Facebook 的实时(real time)性可以指靠,其他论坛应该只选专门议论股票的 BBS 吧? 当然,影响股市的有其他不可测因素,但社媒应该是很重要的一个指标,它反映的是股民的情绪和市场的冷暖。 谁说过,准确的短期股市与地震预报一样不可测。但是中长期趋势应该有迹可寻。 好玩,好玩。 做这个比较是由于有王宁博士说,用最简单的关键词社媒大数据指导股市投资,有非常高 的回报率 (七年300%, 年化之后大概17%,还是远高于绝大多数专家投资的回报率 )。 Quote 信息会影响股市的走向 。波士顿大学的一个研究团队分析了从2004年到2011年道琼斯指数走势跟谷歌趋势的相关性,每次股市剧烈的变化伴随而来的都是搜索量急剧的增加。 利用这个策略,他们设计了一个基于谷歌搜索引擎的交易策略,这个策略使用的一个关键词就是“负债”。这个交易策略很简单,当搜索引擎的数据量减少的时候,我们就可以买进下一个星期的道琼斯指数,当搜索量增加的时候,我们卖出下一星期的道琼斯指数。 我们可以很明显地看到蓝色的线是谷歌的交易模型创造的,如果套用这个交易模型,最终它的投资收益率是300%,你投资一块钱,最后能够收回三块钱。红色的线就是你买了这个指数之后一直放在那儿,实际上收益是非常低的。这证明搜索引擎,包括社交媒体的很多东西能够帮助人类做很多决定,也就是今天汤道生先生谈到的怎么利用大数据帮助人类做一些决定。 摘自: http://chuansongme.com/n/588516 王宁博士说的那个社媒股市预测模型太简单了,只选取关键词,仗着数据之巨,也有效。 我们可以准确检测股民和市场的情绪,用得得当,应该可以做出好得多的模型来。 实验值得继续做下去,到底看不准的时候为什么不准,准的时候有多少,足以支持一个预测模型否。 不用 17% 回报率,只要有稳定的 10%,哥们就大发啦! 其实这个路子的实验和模型不难做,因为有几乎无限的历史上的标准答案在。 可以反复调整,数据来源,数据量,热议度影响度褒贬度或某种综合,等等,看怎样的 config 最能符合历史,以此建立未来的预测模型,应该相当靠谱(当然任何模型都无法预测突发因素,特别是媒体数据外的因素,但是对于股市的大趋势应该可以预测到位)。 认真设计研究路线,应该可以搞出点名堂来。应该与金融机构合作做这个研究。 【相关】 再谈舆情与股市的相关性研究 ZT:牛津大学王宁博士:大数据与有限理性 【『科学』预测:A-股 看好】 舆情挖掘用于股市房市预测靠谱么? 【舆情挖掘:房市总体看好】 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 社媒挖掘|7063 次阅读|2 个评论
[转载]ZT:牛津大学王宁博士:大数据与有限理性
liwei999 2014-8-16 23:10
大数据似乎在一夜之间迅速走红,它势不可挡地冲击着金融、零售等各个行业。 云计算将如何改变计算的世界?未来将有怎样的应用前景?如何解决“信息孤岛”的问题? 大数据又将如何提高我们决策的准确性,帮助我们更准确地预测未来? 牛津大学互联网研究院研究员王宁博士分享了《大数据与有限理性》。 大数据与有限理性 要生存还是要毁灭,这是个值得思考的问题,它道出了我们所有人一个共同的难题,就是选择,很多人都惧怕选择,有些人有选择恐惧症,特别是面对一些关于人生、事业、爱情这种重大选择的时候,我们往往看不清楚未来,算不清楚得失,不知道该怎么选,有时候非常纠结。上至一个国家的领导人,大政方针的制定者,再至很多公司的管理层,最后到普通的老百姓,选择可能都是每天需要面对的一个问题。 人类是如何进行选择的呢?早期的经济学家认为人类是理性的,这也就是亚当·斯密在《国富论》中论述的,市场是一只看不见的手,每个人在他个体利益最大化的同时也达到整个群体的利益最大化。然而经济学家可能往往都生活在理性的乌托邦中,当我们的脑科学家在解剖,打开人的大脑后,发现人的大脑是一个异常复杂的系统,是一个复杂性网络,它可能有上亿个节点,可能是迄今为止最复杂的一个系统,正是因为它的复杂性导致了人类很多的行动都是不可知的,也是不可预测的。所以,从另一个方面讲是非理性的。 我们今天讨论的可能是一个有限理性的理论,行为经济学理论,介于理性和非理性之间,人类的理性受制于很多外部条件的限制,最重要的外部条件就是信息,你获取到什么样的信息将直接影响到你所做的选择。 2013年4月23号黑客给Twitter发布了一条虚假信息,白宫有两次爆炸,奥巴马受伤,我们可以看到美国道琼斯指数在相同的时间段应声下跌近140点,这也可能是人类历史上第一次通过社交媒体影响到整个股市行情的崩盘。 信息会影响股市的走向。波士顿大学的一个研究团队分析了从2004年到2011年道琼斯指数走势跟谷歌趋势的相关性,每次股市剧烈的变化伴随而来的都是搜索量急剧的增加。 利用这个策略,他们设计了一个基于谷歌搜索引擎的交易策略,这个策略使用的一个关键词就是“负债”。这个交易策略很简单,当搜索引擎的数据量减少的时候,我们就可以买进下一个星期的道琼斯指数,当搜索量增加的时候,我们卖出下一星期的道琼斯指数。 我们可以很明显地看到蓝色的线是谷歌的交易模型创造的,如果套用这个交易模型,最终它的投资收益率是300%,你投资一块钱,最后能够收回三块钱。红色的线就是你买了这个指数之后一直放在那儿,实际上收益是非常低的。这证明搜索引擎,包括社交媒体的很多东西能够帮助人类做很多决定,也就是今天汤道生先生谈到的怎么利用大数据帮助人类做一些决定。 相同的研究还包括一篇发表在《自然》杂志的文章,关于面向未来的指数,它做的方式是利用搜索量,比如今年的搜索量,明年的搜索量和前年的搜索量。它用明年的搜索量除以前年的搜索量,未来的数据除以过去的数据,这个数据就是基于未来的指数。 通过相关的模型,我们可以发现这个基于未来的指数跟每个国家的GDP有很好的正相关性,从另一个方面讲,当一个国家的国民或者网民更加的偏向于搜索未来的东西,那这个国家的经济情况往往是比较好的。 2012年我跟牛津大学互联网研究院(OII)的一个同事马克一起做了一个基于英国洪水的可视化分析,可以看到在大家左手边的这个是英国官方气象局的一个降雨量的分析,而右边是我们把所有的相关时段内在Twitter里跟洪水相关的信息下载了之后分布到地图上。我们可以看到在一些洪水特别泛滥的地区,我们的图形跟英国的官方的图形有很好的吻合,但是有很多地方也是没有的,可能网上没有这种信息。但是好处是我们数据是实时的,能实时分析出洪水分布的情况,官方的数据可能要等到好几个星期以后。所以, 社交媒体的很多数据能帮我们做一些自然灾害预防的决策。 2012年我们做过一个关于美国大选的分析方案,当时美国有两个候选人,罗姆尼跟奥巴马,我们把所有大选之前一个月的跟罗姆尼和奥巴马相关的Twitter上的信息都下载之后,按美国每个区的分布做成了一个可视化图。大家都知道美国的总统选举是选举人制度,就是根据每个州的投票所决定的,我们在美国大选之前已经明显的可以看出网上讨论奥巴马的要远远大于讨论罗姆尼的,基于此我们预言奥巴马的胜算更大一点儿,我们把提到奥巴马的数据和罗姆尼的数据进行对比,52.4%有关于奥巴马,47.6%有关于罗姆尼。下面是大选之后官方的数据,两个数据有很大的相似性。 当时我们这个结果发布出来以后,很多政治评论家都怀疑,说罗姆尼不可能赢得马萨诸塞州的选举。而且奥巴马赢得得克萨斯州的选举也是很多人预测不到的,但是最后结果证明我们的数据对这两个州的分析都是正确的。 Facebook做了一个关于社交网络中人的行为传播的实验,号称是迄今为止最大的一个实验,分析了六千万人的样本,也是美国大选期间,每个人投过票之后可以在Facebook上发布一个消息,Facebook的分析员把人的亲疏关系分成十等,数据越大证明你跟这个人越亲密,10就代表人跟人的关系非常亲密,我们可以通过这个图看到当亲疏关系增加,人跟人的影响力也是在增长的,越亲密它的传播跟影响就会越大。这样我们每个人做的决定,不但影响到你,有可能你这个决定还会影响到别人。比如我更加倾向于投奥巴马,有可能周边的人也更加倾向于投奥巴马。 之前谈了很多大数据的应用,都是很正面的东西,这里我想提两点,大数据研究的风险。 首先,第一个风险是数据的误读, 谷歌流感的分析提的很多了,特别是牛津互联网研究院维克多教授《大数据时代》的开篇就以这个案例作为大数据成功应用的典型,但是我们仔细地看这个大数据分析,2012年和2013年之间这一根红色的线就是谷歌流感的数据,绿色的是美国官方疾病控制中心的数据。在2012年至2013年的6、7月份,谷歌流感的数据远远大于疾病控制中心的数据,所以,我们如果基于谷歌的数据做一些预判、风险的预防,有可能导致预判错误,有些网上的数据有可能是夸张地显示出了实际生活的一些情况。 另外一个例子,我们进行大数据研究时,很多学者都忽略了一个最根本的问题就是偏差的问题, 这是我们今年发表的一篇文章,我们研究了三个不同的数据库,针对同一种关键词用不同的方法提取,最后我们得到三种不同的数据库。我们把这三个不同的数据进行比较,然后计算各个数据跟各个数据之间的相关性,我们发现这种相关性随着时间的流逝是有变化的,也就是说从另一个方面理解,当三个不同的学者在做一个同样的研究,有可能你用不同的方法,不同的数据采集方式,最后提取的数据不同。你再基于这种数据做出很多的结论,有可能这个结论到最后是有偏差的,而这个偏差是基于数据的,有可能蕴藏于你原始的数据之中。 我们人类在很长一段时间,因为互联网到现在也就几十年的时间,针对人类上千年的历史,人类在很长的时间处于信息稀缺的时代,我们很多决定的时候可能没有信息或者信息不够,就像今天汤道生讲的是一种近似于赌博式的方法,就像中国古代早期很多占卜的方式,没有什么好选择就去占卜、抽签或者利用龟壳的方式。大数据实际上对于人类做决定最重要的影响可能就是改变了这个现状。现在我们不是在一个信息稀缺的时代,而是在一个信息过剩的时代,我们每个人所有的行为模式、方法都会被映射到网上,不但你的,还有你朋友的,社交媒体的行为模式都被映射到网上,这个数据是源源不断的, 我们不再担心数据不够,而更需要担心数据过剩的问题。 在传统的人类决策模型中,每个人做一个决定,这个决定转化为信息,它转化的方式更多的通过口传心授,比如你朋友买了一个什么东西,他告诉你,然后你去买,影响到你做决定。或者通过书本的方式,我们通过读书摄取之后转化成自己的知识,通过这个方式做决定,最后形成了一个反馈回路。但是大数据时代这个反馈回路可能要进行扩展。我们有了第二层外环的反馈回路, 人类做决定之后,这些所有的决定都会被转化为数据,这就是我们所说的大数据时代, 所有人的行为模式,各种各样的东西通过手机、无线互联网都会被转化为数据,这些数据通过大数据分析转化为信息,然后信息给相关的决策者,决策者通过这些信息做判断,这样形成另外一层的反馈回路,通过这种反馈回路的信息数据不停地循环,最后达到一个终极目的:会不会有可能通过机器取代人的位置,人类最大的一个难题可能就解决了,不是人去做,让机器去做很多决定。 谈到机器决定,现在用数据的模式让机器做决定也是非常热的一个话题,我们觉得机器做决定可能有三步走的方式。首先,第一步很明显,人自己做决定。而现在在大数据时代,更多的是人跟机器交互做决定,比如一些常规的决定,一些比较重复性的决定,都是通过机器来做,而人去做一些机器所不能做的决定。最简单的一个例子,你去信用卡公司买东西,你地址换了,信用卡公司会发现有可能是有人盗用你的信用卡,通过数据判断出之后他把这个信息转给一个接线生或者公司员工,这个员工会给你打电话,这就是一个典型的人机交互做决定的模式,人跟你谈完话以后决定到底是不是有人盗用你的信用卡,最后会不会有可能所有的决定都会让机器来做,今天时间有限,我可以在最后再跟大家讨论。 最后我想以一句话结束我今天的演讲,“ 数据是一种知识源,但是除非数据进行很好的组织加工,并按照正确的方式提供给正确的人进行决策,否则它就是一种负担,不是一种收益 ”。 ==关于我们== 大数据实验室 公众平台【 ID:bigdata-lab 】由资深大数据方向专业人士管理运营,观点聚焦于大数据领域,大数据实验室和顶尖的研究机构和诸多企业建立合作,并 汇聚了学界、商界、业界顶尖的智囊,为开拓者指点迷津。我们将精选大数据行业内最精华的文章或报告,汇聚专业精英,促进学习交流,互相提升思维的深度、广 度和高度。 大数据实验室致力于国内 “ 大数据 ” 领域投资,凡入选的初创企业将获得大数据实验室孵化基金提供的 “ 种子资金 ” ,将会有导师协助完善他们的商业模式,建立一个完整的核心团队,并进行初步的客户反馈和验证。感兴趣的创业团队或初创企业,可以通过以下方式与我们取得**。 感谢关注公众微信: bigdata-lab 也请推荐更多的朋友关注或添加! **方式: 邮箱: contact@bigdata-lab.com QQ: 361993695 微信:shangjingfu_nus 网址: www.bigdata-lab.com 新浪微博:大数据实验室 也可直接在对话框内给我们留言并留下您的**方式。 来源: http://chuansongme.com/n/588516 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 社媒挖掘|3069 次阅读|0 个评论
沪深指数5连阴阳预示作用的实证研究
fuqisi 2009-1-31 08:48
关键词 股指动量效益 股市技术分析 五连阳 五连阴 动量交易策略 沪深股市 股价预测 股价动量效应( momentum effect ) 的一些研究结果显示:前期业绩最好的一组股票与业绩最差的股票比较,年度收益可高出 10% 左右,即如果以 2 个月左右为衡量时间,那么过去业绩好的股票继续表现良好,而过去业绩不好的股票持续走低。如果将这一表述一般化,股价动量效应的定义为:中期内( 2 个月左右),股价具有保持原有趋势的惯性或趋向。 如果动量效应一定程度反映了股价中期波动的规律,那么通过技术分析的指标和方法也可以展现这一规律,进而应用技术指标可以一定程度上预测股价的中期走势,从而成为具有实用价值的操作策略。我们以沪深大盘 5 连阴阳为指标,通过回顾性分析的方法,验证股价短期动量效应的性质和比例。 1 资料与方法 1.1 指标 预示指标:选用指数的五连或五连以上的阴阳线,即:在沪深证卷交易所终端的乾隆行情交易系统的 K 线图出现连续的 5 根或 5 根以上的阴线或阳线。 预测指标(标的):选用指数的涨跌情况,即:从五连或五连以上阴阳线的末日起,随后 10 日、 1 月、 2 月和 3 月时指数的涨跌的频次和构成比。 大盘指数:选用沪深 300 指数(成分)、上证指数(综合)、深证成指、深证综指。 1.2 研究时段 2005 年 6 月至 2008 年 7 月。 1.3 数据处理和结果含义 只进行描述性统计:预示指标出现后,预测指标出现顺向变化(阴跌阳涨)和逆向变化(阴涨阳跌)的比例。 2 结果 2.1 沪深 300 指数 研究期间,出现 15 次 5 连或 5 连以上的连续阴阳预示指标( 10 连 2 次, 9 连 1 次, 7 连 2 次, 6 连 2 次, 5 连 8 次), 观察到指数涨跌预测指标 57 次(见表 1 )。在 57 次观测中, 9 次为逆向变化, 48 次为顺向变化,分别为 16 % 和 84 % 。 表 1 沪深 300 指数 5 或 5 以上连阴阳后 10 日、 1,2,3 月时指数涨跌情况 指数名称 时段 连续阴阳型别 指数涨跌 (% 或涨跌 ) 合计 10 日 1 月 2 月 3 月 沪深 300 20060821-0831 9 阳 - 8 10 28 0915-0921 5 阳 4 2 17 38 1117-1127 7 阳 9 21 57 50 1129-1205 5 阳 7 16 27 39 20070330-0412 10 阳 12 19 29 22 0430-0514 6 阳 10 10 - 29 0516-0523 6 阳 - 5 + 7 32 0605-0613 7 阳 - -5 17 32 0717-0723 5 阳 18 29 37 39 0725-0731 5 阳 8 20 28 29 0820-0824 5 阳 3 7 8 -6 1218-1224 5 阳 10 -1 -3 -24 20080220-0226 5 阴 -4 -13 -17 -21 0312-0318 5 阴 -9 -17 -1 -24 0603-0617 10 阴 -8 合计 15 次 3 逆 2 逆 2 逆 2 逆 9 逆 (0.16) 12 顺 12 顺 12 顺 12 顺 48 顺 (0.84) 注 : 日为交易日 , 月为自然日 ; + 和 -: 涨和跌小于 1%; 2.2 上证指数 研究期间,出现 20 次 5 连或 5 连以上的连续阴阳预示指标, 观察到指数涨跌预测指标 57 次。在 78 次观测中, 17 次为逆向变化, 61 次为顺向变化,分别为 22 % 和 78 % (见表 2 )。 2.3 深证成指、综指及四大指数合计 研究期间,深证成份指数出现 24 次 5 连或 5 连以上的连续阴阳预示指标, 观察到指数涨跌预测指标 92 次(见表 3 )。在 92 次观测中, 24 次为逆向变化, 68 次为顺向变化,分别为 26 % 和 74 % 。 深证综合指数出现 24 次 5 连或 5 连以上的连续阴阳预示指标, 观察到指数涨跌预测指标 99 次(见表 3 )。在 99 次观测中, 28 次为逆向变化, 71 次为顺向变化,分别为 28 % 和 72 % 。 四大指数共出现 84 次 5 连或 5 连以上的连续阴阳预示指标, 观察到指数涨跌预测指标 326 次(见表 3 )。在 326 次观测中, 78 次为逆向变化, 248 次为顺向变化,分别为 24 % 和 76% 。 表 2 上证指数 5 或以上连阴阳后 10 日、 1,2,3 月时指数涨跌情况 指数名称 时段 连续阴阳型别 指数涨跌 (% 或涨跌 ) 合计 10 日 1 月 2 月 3 月 上证指数 20050628-0706 7 阴 -1 9 12 9 0805-0811 5 阳 + 2 - -6 20060104-0110 5 阳 4 5 2 11 0117-0123 5 阳 3 2 3 12 0615-0629 11 阳 1 -1 + 6 0726-0801 5 阴 - 4 12 16 0927-1011 6 阳 + 4 22 55 1114-1123 8 阳 5 18 44 47 1214-1220 5 阳 14 24 28 28 1222-1229 6 阳 4 10 5 20 20070306-0113 6 阳 6 19 36 40 0323-0403 8 阳 10 20 12 16 0405-0412 6 阳 7 15 15 11 0607-0613 5 阳 -2 - 6 15 26 0802-0814 9 阳 7 9 24 11 0820-0828 7 阳 -2 7 11 -7 0927-1011 6 阳 -6 -12 -12 7 1031-1106 5 阴 -4 -9 -3 -19 20080220-0226 5 阴 -2 -15 -18 -21 0603-0617 10 阴 -5 - 小计 4 逆 5 逆 4 逆 4 逆 17 逆 (0.22) 16 顺 15 顺 15 顺 15 顺 61 顺 (0.78) 注 : 2008 年 7 月下旬统计 ; 日为交易日 , 月为自然日 ; + 和 -: 涨和跌小于 1%; 2.4 其他 以预示指标 5 、 6 、 7 、 8 、 9 、 10 、 11 连阴阳分别合计的沪深 300 和上证指数的顺向变化的构成比为: 0.82 、 0.79 、 0.56 、 1.0 、 0.88 、 1.0 和 0.75 。似乎没有规律。 以观察时点(持续期) 10 日、 1 月、 2 月和 3 月分别合计四大指数的顺向变化的结果为: 0.71 、 0.76 、 0.80 和 0.77 (见表 3 )。似乎 2 个月为顺向变化比例最高的时点(不是涨幅)。 表 3 沪深大盘指数 5 或 5 以上连阴阳后 10 日、 1,2,3 月时指数涨跌情况合计 指数名称 时段 趋势 指数顺逆频次和构成比 10 日 1 月 2 月 3 月 小计 构成比 沪深 300 指数 200607-200807 逆向 3 2 2 2 9 0.16 顺向 12 12 12 12 48 0.84 上证指数 200505-200806 逆向 4 5 4 4 17 0.22 顺向 16 15 15 15 61 0.78 深证成指 200505-200806 逆向 7 5 5 7 24 0.26 顺向 17 19 17 15 68 0.74 深证综指 200505-200806 逆向 10 8 5 5 28 0.28 顺向 15 17 20 19 71 0.72 合计 逆向 24(0.29) 20(0.24) 16(0.20) 18(0.23) 78 0.24 顺向 60(0.71) 63(0.76) 64(0.80) 61(0.77) 248 0.76 注 : 2008 年 7 月下旬统计 ; 日为交易日 , 月为自然日 ; + 和 -: 涨和跌小于 1%. 3 讨论 上述的初步研究显示:在出现 5 连或 5 连以上的连续阴阳预示指标后,指数的 24 % 为逆向和 76% 为顺向变化,即约 3/4 为顺向变化。我们相信,相对于理论上 50% 或一半的顺向变化, 3/4 的预测作用,不仅具有一定实际操作价值,而且应该具有统计学意义。然而,为了慎重,我们没有公布显著性检验的结果。 通过《 Google 学术》,键入动量效应 五连阳或动量效应 五连阴,没有检索到有关文献。通过《 Google 学术》,键入动量效应 技术分析或股价动量效应或股指动量效应,检索到许多文献,但大部分为无关文献。经过对 3 份检索结果前 100 项共 300 项条目的浏览,有十几篇文献涉及股市的动量效应研究或综述,但没有一篇包含动量效应和技术指标两个方面。然而,上述检索办法只是简单快捷的资料收集方法,查全率不高,特别是对于外文文献。 如果从五连或五连以上阴阳线的第 5 日起,记录随后 10 日、 1 月、 2 月和 3 月时指数的涨跌的频次和构成比,顺向变化的构成比应该与上述结果一致或略高。在实际操作中,以第 5 日为预示确定日,或许更有价值。 观察期间正处于大牛市和大熊市。在平衡行情时,顺向变化的比例或动量效应的程度可能比上述结果低,或五连阴阳的出现频度比较低。 有必要进行下列研究: 3 、 4 连阴阳的预示效果、平衡行情时的动量效应情况、其他指数或个股的动量效应情况、以涨跌幅度为指标的动量效应情况等。 附录 : 检索到的部分文献 关键词 : 股价动量效益 股指动量效益 技术分析 五连阳 五连阴 GOOGL 学术:股价动量效应 徐信忠 , 郑纯毅 . 中国股票市场动量效应成因分析 . 经济科学 , 2006,(1) 贺学会 , 陈诤 . 基于牛市和熊市不同周期的股票市场动量效应研究 . 财经理论与实践 , 2006,27(5) 王永宏 赵学军 . 中国股市 惯性策略 和 反转策略 的实证分析 . 经济研究 , 周琳杰 . 中国股票市场动量策略赢利性研究 . 世界经济 , 2002,(8) 王永宏 , 赵学军 . 中国股市 惯性策略 和 反转策略 的实证分析 . 经济研究 , 2001,(6) 王志强 , 王月盈 , 徐波 , 段谕 . 中国股市动量效应的表现特征 . 财经问题研究 , 2006,(11) 陈乔 , 汪弢 ; 我国股市的惯性效应 : 一个基于行业组合的实证研究 . 当代 财经 , 2003,(12) 邵晓阳 , 苏敬勤 , 于圣睿 ; 沪市 A 股反转效应与惯性效应实证研究 . 当代经济管理 , 2005,(2) 徐元栋 , 刘思峰 ; 动量效应研究的最新进展 . 财贸研究 , 2007,(1) GOOGL 学术:动量效应 技术分析 阳建伟 . 行为金融及其投资策略 . 外国经济与管理 , 2002,24(2) 阳建伟 . 行为金融:理论、模型与实践 . 上海经济研究 , 2002,(4) 王志强 , 等 . 动量效应的最新研究进展 . 世界经济 , 2006 , 29(2) : 82 - 92 程兵 , 等 . 动量和反转投资策略在我国股市中的实证分析 . 财经问题研究 , 2004
个人分类: 投资:笔记与实证|1772 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 16:37

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部