科学网

 找回密码
  注册

tag 标签: 社媒

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

全球社交媒体热议阿里巴巴上市
热度 10 liwei999 2014-9-22 08:35
对近一个月做了一个多语言社交媒体的自动挖掘调查,看看阿里巴巴上市和上市前夕都有什么热议。 好家伙短短一个月阿里巴巴有近三百万的帖子提到它,绝大多数是英文帖子,推特和脸书是热议最多的两大来源。Net-sentiment 反映的形象分 61 非常正面,说明追捧远多于批评。 2,855,797 Mentions 14,393,386,158 Potential Impressions 61% Net Sentiment 122,935 Positive 29,496 Negative 380,946 Unique Authors 这是阿里巴巴近一个月热议度的两张时间曲线表。 越来越热,九月15是第一个高峰,九月19 IPO 日自然达到顶峰 舆情晴雨表 起伏不大,相当正面,IPO 前几天起伏加剧,毁誉交加,终于一路上扬,成就全球最大的IPO资本盛筵。 关键热词 Hash 热话题 正反比例:追捧成风啊 网民情绪 正面热词:love, thank, happy, good, worth Facebook,看好,成功,关注,支持,感谢,心仪 反面词很零散,不成气候,诸如:mad joke,concerned,stupid,ridiculous,质疑,不接受,惊讶,黯然神伤,傻瓜,阿里妈妈的,发横财 显然是嫉妒为多嘛。 买还是不买:这是个问题? 看来还是主买派的声音分贝高,虽然风险警告声亦不绝于耳。 优劣任人评说 最大的好处是爆牛的IPO(废话,有奶便是娘,带来财运当然是第一位)。第二个长处呢,自创了IPO最牛的品牌 BABA:老子天下第一的气派嘛,还是与 IPO 相关。第三呢,好像是德语,Börsendebut feiern ( Celebrate Exchange Debu t ),还是庆祝 IPO。接下去都与 IPO 的相关报道有关,IPO价值超过 Facebook 和 Visa 当年的风光,股价飙升(surge),产出了首富(richest man)等。这一切其实是建立在丰厚利润(profit,consistently profitable)的基础上,利润才是核心的理由,否则一切都会是泡沫。 不喜欢的理由呢?原来抱怨最大的是IPO股价定价提高(raise price),提高了搭便车的门槛。其他的问题包括严重造假 (counterfeit) ,股权结构的复杂等。利润高到荒唐(insane),显然是优点,系统标注错了,今后应该 debug 掉。 谁吐槽最多 谁影响最大:当然是权威媒体的报道。 男议女亦议 热议地理分布 美利坚为最,东土次之。遍及全球,包括非洲(不住人鬼的北冰洋除外:不知魏晋,遑论阿里)。地中海下面那个深色区域是哪个国家?怎么对阿里IPO那么热衷呢? 媒体分布 【相关】 互联网盛世英雄马云的媒体形象 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 社媒挖掘|11959 次阅读|14 个评论
到底社媒曲线与股市曲线有没有、有多少相关度?
热度 1 liwei999 2014-8-16 23:35
看看到底社会媒体的曲线与股市曲线有没有、有多少相关度,我正好有 HTC 过去一年的中文社媒数据 作者: 立委 (*) 日期: 08/16/2014 09:59:26 这是我们系统的关于 HTC 的中文媒体热议度(mentions)和褒贬度(net sentiment)的过去一年的曲线。 这是纯粹的社媒热议度(mentions)曲线。 这张图似乎更清晰一些:下面的曲线是热议度,上面的曲线是褒贬度(社媒舆情)。 路透社的HTC过去一年股市曲线图 雅虎的HTC过去一年股市曲线图 热议度与股市表现曲线图的对比 (谢谢老友帮助制图 ) 褒贬度与股市表现曲线图的对比(谢谢老友帮助制图) daily data 太稀疏和起伏,可上述 weekly data 似乎又间隔太长(颗粒度太粗)了,不好做吻合度滞后性的观察。也许最好是每隔三四天的数据来做,既让曲线 smooth,也不失时间的精度。以后做吧。 似乎 媒体褒贬度(net sentiment)的曲线比较热议度(mentions)的曲线与股市曲线吻合度更好?这也是合理的。 从这个例子看,似乎net sentiment略领先于market. 如果过去的历史有相关度,那么因为我们可以实时监测,对未来的走向的预示也就有搞头。历史是未来之母。 真要做股市预测,应该多做实验比较,精心挑选资料来源,排除来自不可靠资料源(包括更新不及时)的干扰或副作用,也许才更可靠一些? 对于英文社媒,除了 Twitter 和 Facebook 的实时(real time)性可以指靠,其他论坛应该只选专门议论股票的 BBS 吧? 当然,影响股市的有其他不可测因素,但社媒应该是很重要的一个指标,它反映的是股民的情绪和市场的冷暖。 谁说过,准确的短期股市与地震预报一样不可测。但是中长期趋势应该有迹可寻。 好玩,好玩。 做这个比较是由于有王宁博士说,用最简单的关键词社媒大数据指导股市投资,有非常高 的回报率 (七年300%, 年化之后大概17%,还是远高于绝大多数专家投资的回报率 )。 Quote 信息会影响股市的走向 。波士顿大学的一个研究团队分析了从2004年到2011年道琼斯指数走势跟谷歌趋势的相关性,每次股市剧烈的变化伴随而来的都是搜索量急剧的增加。 利用这个策略,他们设计了一个基于谷歌搜索引擎的交易策略,这个策略使用的一个关键词就是“负债”。这个交易策略很简单,当搜索引擎的数据量减少的时候,我们就可以买进下一个星期的道琼斯指数,当搜索量增加的时候,我们卖出下一星期的道琼斯指数。 我们可以很明显地看到蓝色的线是谷歌的交易模型创造的,如果套用这个交易模型,最终它的投资收益率是300%,你投资一块钱,最后能够收回三块钱。红色的线就是你买了这个指数之后一直放在那儿,实际上收益是非常低的。这证明搜索引擎,包括社交媒体的很多东西能够帮助人类做很多决定,也就是今天汤道生先生谈到的怎么利用大数据帮助人类做一些决定。 摘自: http://chuansongme.com/n/588516 王宁博士说的那个社媒股市预测模型太简单了,只选取关键词,仗着数据之巨,也有效。 我们可以准确检测股民和市场的情绪,用得得当,应该可以做出好得多的模型来。 实验值得继续做下去,到底看不准的时候为什么不准,准的时候有多少,足以支持一个预测模型否。 不用 17% 回报率,只要有稳定的 10%,哥们就大发啦! 其实这个路子的实验和模型不难做,因为有几乎无限的历史上的标准答案在。 可以反复调整,数据来源,数据量,热议度影响度褒贬度或某种综合,等等,看怎样的 config 最能符合历史,以此建立未来的预测模型,应该相当靠谱(当然任何模型都无法预测突发因素,特别是媒体数据外的因素,但是对于股市的大趋势应该可以预测到位)。 认真设计研究路线,应该可以搞出点名堂来。应该与金融机构合作做这个研究。 【相关】 再谈舆情与股市的相关性研究 ZT:牛津大学王宁博士:大数据与有限理性 【『科学』预测:A-股 看好】 舆情挖掘用于股市房市预测靠谱么? 【舆情挖掘:房市总体看好】 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 社媒挖掘|7063 次阅读|2 个评论
新浪微博下周要大跌?舆情指数不看好,负面评价太多(疑似虚惊)
热度 9 liwei999 2014-4-19 23:00
怎么了,新浪微博要大跌,我们实时监控刚显示舆情指数为零下100 的坏评价 日期: 04/19/2014 09:39:03 这两天看校园刚回来,没顾上追踪股票市场以及我们的 社会媒体自动检测 数据,据说weibo一开始上涨得 厉害(他们有意减少了发行量,此前又回购了股票,为防止 Facebook IPO 重演)。 在这里 可看实时监控: 新浪微博(WB)舆情的实时监控 每分钟自动更新。 这是几分钟前的截图: 这是雅虎给出的微博股票曲线: 美国社交舆情的正反评价是美国股市一个重要指针。目前的-100指数让人诧异,诸如:Weibo is basically a Fake Chinese twitter website! 历史上看,美国股市对于中国概念股一直视为 高危区,大起大落不断。 如果本周末的舆情指数维持在 -100 极冰点不变,下周开市应该是大跌。不是乌鸦嘴,这是大数据舆情监控所指,unless 此后情势有逆转。 其实,个人觉得新浪微薄会有前途的,因为目前与可预见的将来,它的独特影响力仍无可取代。因此,如果真大跌,倒是进场的好机会。这类社会媒体的股票,IPO 初期都是过山车似的。如果不想靠短期投机,倒是值得趁虚而入,长期(半年以上)持有,应该有赚,除非微博是笨蛋,半年一年还交不出好的财务报表成绩来。 【补记】 回暖了,回暖了,虚惊一场。写此博文的时候正赶上舆情最低点,现在(4/19/2014 8:47am pacific time)明显回暖,舆情指数已经达到正 60,仍需持续密切关注。 【相关】 Sina Weibo IPO and its automatic real time monitoring 2014-04-17 【置顶:立委科学网博客NLP博文一览(定期更新版)】
个人分类: 社媒挖掘|8817 次阅读|15 个评论
【社媒挖掘:社会媒体眼中的臺灣綠營大佬】
liwei999 2013-2-24 06:33
除了在民眾輿論已經貶出局的在押阿扁外,民進黨大佬主要包括蔡蔡謝蘇(蔡英文、謝長廷、蘇貞昌),下面就看看社會媒體對這三位綠營大佬毀譽如何。 Cai COns CaiXieSuLEE LikesDislikes contrast 【相关篇什】 【 社媒挖掘:臺灣政壇輿情圖 】 【 社媒挖掘:馬英九施政一年來輿情晴雨表 】
个人分类: 社媒挖掘|4 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-16 17:01

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部