科学网 › 标签 › 舆情

标签: 舆情

相关帖子	版块	作者	回复/查看	最后发表

没有相关内容

相关日志

什么是社会舆情？作为一门科学（学科）定义。: francy 2014-1-24 23:20; 今天,有人问我一个问题，什么是社会舆情？特别是网络舆情，即如何给它作为一门科学（学科）定义。我给了四个自己的说法：首先，这是研究事件趋势的学科，有点似未来学那样，带有预测（“第三次浪潮”）味道。背后是大数据支持的依据。其次，它是用数据去说明事件未来走势的数理模式学科，没有数据分析，叫做胡猜，0和原则那是算命先生的玩法。第三，它是受事件波及（影响）方，不论是国际、一个国、一个地区、民众、动物、社区、机构、政府、家庭、组织团体、个人，采取对策（行动，Action）：处置措施、外交应对、新闻宣传、行政法律救济、甚至军事行动的决策参考依据。最后，它是事件结束后，有人用证据去总结、分析、检讨，留下供后人借鉴材料的学科。只有这件事做了，才能促进舆情学科的发展。网络舆情是社会舆情的一个视角，但是它绝对不会是孤立的一个学科，它只能是社会舆情学科的一个部分。沈阳（sz1961sy） 22:50 2014-1-24 http://w.org.cn/user1/4/archives/2014/3219.html; 个人分类: 热点话题|997 次阅读|0 个评论

只认数据不认人：IRT 的鼓噪左右美国民情了么？: 热度 3 liwei999 2013-12-30 06:27; 套用北韩最近流行的歌颂红太阳金正恩的红歌，数据，数据，《除了它我们谁也不认！》当然，还有上帝： In God We Trust. In everyone else we need data. 大数据时代更是如此，只认数据不认人。道理很简单，在信息爆炸的时代，任何个人的精力、能力和阅历都是有限的，所看到听到的都是冰山一角。小崔如此，其他大V也如此，大家都在盲人摸象。唯有大数据挖掘才有资格为纵览全貌提供导引。当然，这不是说，大数据挖掘就是完美的解决方案。但是，正如一人一票的民主选举也不是人类社会完美的体制，而只是最少犯错误的机制一样，大数据挖掘比任何其他个人或利益集团的分析，较少受到主观偏见的干扰。这是由大数据本性决定的。不过，挖掘本身也有可能有 bug（但即便是 bug 或者其他不完善之处，它们对所有搜索的话题也是一视同仁的，是独立于话题的，因为系统的编制针对的是开放话题），挖掘的结果可以从不同角度验证或质疑。值得注意的是，即便被认为是真实反映的同一组数据结果也完全可能有不同的解读（interpretations），人们就是在这种解读的争辩中逼近真相。一个好的大数据系统，必须创造条件，便于用户 drill down 去验证或否定一种解读，便于用户通过不同的条件限制及其比较来探究真相。上篇转载博文（ ZT: 为啥立委的报告认为GMO造成gluten intolerance 2013-12-28 ）就是老友在质疑和解读这方面做出的有意义的努力。老友指出，其所以造成 gluton intolerance 成为反对转基因的主要理由，是由于美国反转极端组织 IRT 的鼓噪的效应。从时间上看，IRT 确实在上个月的大数据调查区间内制造了反转新闻，似乎影响颇大（drill down 显示 twitter 在很短时间里对 cause gluten related illness “新闻” 有 700 多条大同小异的微博或转发，下面是“鼓噪”及其社媒传播样品）。 RT | @tree_details http://t.co/i8PV0y3Ev2 Future Epidemic? Monsanto GM foods cause gluten-related illnesses. econ/food/soci- gmo. Monsanto GM foods cause gluten-related illnesses (silveristhenew.com) GM foods cause gluten-related illnesses -- I added a video to a @YouTube playlist http://t.co/rywMnDKtlU Future Epidemic? Monsanto GM foods cause gluten-related illnesses. Future Epidemic? Monsanto GM foods cause gluten-related illnesses. Future Epidemic Monsanto GM foods cause gluten related illnesses: Published on Dec 7, 2013 18 million of Ameri... http://t.co/86SnUlUmxv . Monsanto GM foods cause gluten-related illnesses http://www.youtube.com/watch?v=VyV001qX2i4 7 December 2013 , RT. Monsanto GM foods cause gluten-related illnesses http://www.youtube.com/watch?v=VyV001qX2i4 7 December 2013, RT. Monsanto GM foods cause gluten-related illnesses • 'March of Millions': Ukraine braces for massive anti-govt rally • Spiritual Journey: Valaam monastery in Russia's far north (RT Documentary). Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/qceiGYiPWM . #RT Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/qceiGYiPWM . #RT Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/leNyyCI1G4 . #RT Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/kZlxQso6T4 . #RT ......... RT @LuminatedSlave: Future Epidemic? Monsanto GM foods cause gluten-related illnesses https://t.co/purlWn3ztO . RT @LuminatedSlave: Future Epidemic? Monsanto GM foods cause gluten-related illnesses https://t.co/purlWn3ztO . Future Epidemic? Monsanto GM foods cause gluten-related illnesses https://t.co/purlWn3ztO . RT @RT_com: Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/FbJhDufXzn . @portnayanyc Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/lknWlC2CP2 . ......... Future Epidemic? Monsanto GM foods cause gluten-related illnesses: http://t.co/XOJYHwyci4 via. @youtube Future Epidemic? Monsanto GM foods cause gluten-related illnesses: http://t.co/EUYyOsnFyV via. @youtube Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/mAPr2RkyLL . #FutureEpidemic #GM #GMO #RT Future Epidemic? Monsanto GM foods cause gluten-related illnesses http://t.co/MwzyJkqjLI . #FutureEpidemic #GM #GMO #RT ......... 有了上述解读，我们有两个问题需要解答：（1）一小撮 IRT 分子的 “鼓噪” 可以左右舆情么？影响度如何？（2）反对转基因的理由除去 gluten intolerance 后是怎样分布的？于是我们继续做转基因的大数据自动挖掘来寻求答案，以便看清西方当今舆情和民情的真相。根据老友们的建议，我们可以设置条件，做一个对照调查。下面就是这次对照调查的条件和结果。（1） Baseline：为做到 apple to apple 式的 minimal pair 对照比较，我们先把最近一个月的自动调查重复一次（除去了原 query 中的害群之马歧义词 GMC，因为发现它绝大多数是与 GM 品牌汽车相关，而不是指转基因谷物），结果拷贝如下：这是 baseline，没有加限制词的结果，似乎没有多大改变作者: 立委 (*) 日期: 12/29/2013 02:08:05 Download Download Download Download Download Download （2）在上述自动挖掘中加入限制词 “cause gluten” 以屏蔽由于 IRT 鼓噪事件带来的反转中最大，据专家认证也最不靠谱的理由：嗨，我加了一个限制词 ”cause gluten“，舆情面貌变了哎日期: 12/29/2013 08:16:59 不过褒贬指数还是很低：零下 33 度（比零下 37 度稍微升温 5 度）。似乎说明网络舆情对转基因还是充满抱怨的情绪。 Download Download Download Download Download 【相关博文】 ZT: 为啥立委的报告认为GMO造成gluten intolerance 2013-12-28 继续转基因的大数据挖掘：谁在说话？发自何处？能代表美国人民么 2013-12-26 【美国网民怎么看转基因：英文社交媒体大数据调查告诉你】 2013-12-24 【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 社媒挖掘|4109 次阅读|15 个评论

【舆情挖掘：房市总体看好】: liwei999 2013-4-17 16:44; 回国期间我现场展示系统，问热点话题，有人说查查“房市”吧于是我搜索了房市，无论是简体还是繁体的社交媒体，发现舆情指向都是“看好”两个大字主宰，就跟我上回查询A股类似（见【『科学』预测：A-股看好】）。因此目前似乎仍然是投资房市的好时机。国内形势也很不错。过去几年在中土，投资一线城市房市的都大发了，翻了好几倍。二线三线也涨，但幅度小很多。有意思的是，以后房市如果要跌，估计是从中小城市开始，那里的房子空置太多资金也相对不足。一线城市如北京广州不会很快跌下来，因为有投资的需求在。【相关】到底社媒曲线与股市曲线有没有、有多少相关度? 转载]ZT：牛津大学王宁博士：大数据与有限理性【『科学』预测：A-股看好】舆情挖掘用于股市房市预测靠谱么？【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 社媒挖掘|5166 次阅读|0 个评论

Coarse-grained vs. fine-grained sentiment extraction: liwei999 2013-3-12 06:51; As for sentiment extraction itself, there are different layers: 1. sentiment classification: thumbs-up and down (or plus neutral) 2. sentiment association: to associate a sentiment with a topic or brand 3. fine-grained sentiment extraction: for example, who made the sentiment comment? about which topic or brand this sentiment is about (= 2 above)? how intense is the sentiment? what is the reason of the sentiment? Can the system associate sentiments not only with topics or brands (e.g iPhone), but also with a feature of a brand (e.g. screen) and how well they do so? In addition to sentiments related to emotions about agents (love/hate/happy/annoy etc), can system identify positive or negative evaluations of a topic/brand (cost-effective/poorly-designed) ? How about the agents' needs and wishlist for brands? How about agents' positive or negative action towards a brand (including consumers' purchase intent such as will buy; negative actions such as abandon; discontinue the use of)? What are the brands' functionality (positive features (designed to do what)? Can system identify comparisons between brands/topics (iPhone is better than Blackberry)? Most learning systems stop at 1 and sometimes at 2. We do all 3 based on deep parsing. The most popular and easiest is the sentiment classification of documents based on keyword density: they perform well in domains where there are large labeled data available (e.g Amazon review; movie reviews etc), but they are too coarse-grained. They face challenges when they move to a new domain where labeled data are not sufficient for the algorithm to learn a classifier. The more severe challenge comes from 2 when comparative text mentions two brands in proximity with a detected sentiment (I prefer iPhone to Blackberry; iPhone is better than Blackberry) : because they are based on keywords and do not understand the sentence structures, they do not know how to associate the sentiment with iPhone or with Blackberry. Finally for 3, so far no learning systems have even attempted that degree of fine-grainedness of sentiments in industry, but this is super important for a social media monitoring product which will then be able to support extracting actionable intelligence for decision makers. We are one of the first, if not THE first, to do 3. For fine-grained extraction, rules are more flexible to apply, especially after there is a parser built to support it. Having said that, usually the QA (Quality Assurance) should still focus on 1 and 2, not so much on 3 for cost considerations. We want to make sure the benchmarks reflect the global picture of how well the system performs in sentiments. As long as the global quality control is there, the fine-grained extraction in 3 cannot go too wrong. But in order to test every detail of sentiment related intelligence, there is huge cost that is required. We cannot afford that, but we perform in a self-adjusting mode: each difference the system makes for any development or change of the system, we developers are demanded to eyeball the results to decide if they are good catches or not. This way, we ensure 3 stays on track and makes improvement every day. 【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 立委科普|5548 次阅读|0 个评论

舆情分析，情报人的新本领: xupeiyang 2013-3-5 10:22; 习总强调加强学习，提高本领，很有道理。网络舆情跟踪分析，是情报人的新本领，必须学习，必须掌握。关注两会（第1集）社会热点 http://blog.sciencenet.cn/home.php?mod=spaceuid=280034do=blogquickforward=1id=666658 关注两会（第2集）两会热点调查结果 http://blog.sciencenet.cn/home.php?mod=spaceuid=280034do=blogid=666727 关注两会(第3集)：大部制改革方案 http://blog.sciencenet.cn/home.php?mod=spaceuid=280034do=blogquickforward=1id=666888 关注两会(第4集) 全国人大会议首位女发言人傅莹 http://blog.sciencenet.cn/blog-280034-666980.html 关注两会（第5集）北京人象过节的日子里 http://blog.sciencenet.cn/home.php?mod=spaceuid=280034do=blogquickforward=1id=667023 关注两会（第6集）今天是个好日子 http://blog.sciencenet.cn/home.php?mod=spaceuid=280034do=blogid=667217 新“国五条”一出，上海、兰州、济南等各大城市二手房交易量激增。一些群众表示，时间紧，任务急，根本无暇关注两会直播了。【3月4日：南京购房登记数涨7倍离婚夫妻数为平时2倍】3月4日，南京住建委产权市场处发布统计数据显示，截至下午5点半收件1571份，等于购房登记数照平时增长近7倍。南京市民政局数据显示，截至下午5点，协议离婚的夫妻达294对，是平时两倍。婚姻登记处夏主任分析，绝大多人都是为了房子。（汉网）; 个人分类: 信息分析|1438 次阅读|5 个评论

【立委科普：舆情挖掘的背后】: 热度 2 liwei999 2013-2-4 10:22; 中文版品牌舆情图设计方案展示后，有不少反馈，其中有朋友认为，四极二维（love／hate，like／dislike）的图示不自然，因为它们实际上是在同一个维度上。今天就这个题目多写几句科普式随笔，看看舆情自动挖掘以及舆情表达（representation）背后的设计思想。褒贬在客观语言事实上确实是一个连续体，因此把 love ... like ...dislike ...hate, 放在一个连续轴上 makes sense，特别是如果褒贬分析做得细的话。但是实际上，多数褒贬分析系统做得很粗，最粗的就是褒、贬、中三分法。我们算做得细的，是切了五刀，强褒（love），弱褒（like），中（default），弱贬（dislike），强贬（hate）。这是我们褒贬分析的目标和结果。如果对具体语言单位要切出比5更细的刀法，不是不可能，而是没必要，因为对大数据进行褒贬挖掘的时候，还有一个褒贬数量的因素可以参与计算，总体的量可以弥补个体的质之粗疏。于是褒贬指数（所谓净情绪）出笼了，它是企业最想知道的情报之一。就是通过褒贬语的数量比，来看网民的总体情绪如何。这个褒贬指数 by nature 是连续的，因为每个品牌的褒贬量都可能不同。理论上，当然可以 argue 在计算褒贬指数的时候，不但用褒贬的量，而且每个量应该根据褒贬程度来加权或discount，这样个体语言的褒贬分类就可以整合到整体大数据褒贬指数的一根轴上去了，其结果理应更反映实际舆情。但实际上，这样做也没什么必要，因为褒贬的个体加权或discount与否，最终结果大同小异。何况统一到一个维轴上，我们系统的细颗粒度（5刀）就隐藏起来不显了，容易混同于那些偷懒只切两刀的系统（他们根据数量也可以计算出净情绪来）。横轴是为强调情绪强度（intensity），这一点很多系统不做，或不会做。如今抽取挖掘情绪强度已然成为舆情系统之间评价的一个 feature 了。而客户似乎也欣然接受这种表达了，客户迄今的反应是这样四极表达直观简捷。我们另外一个更重要的图示工具是 trends，在那里褒贬指数依然存在，但是情绪强度被时间的维度取代了，这样出来的曲线可能更有意义，可以看到一个品牌的形象消长。缺点是把褒贬舆论分解到时间长河中，数据量有时候不足，结果就显得不太牢靠。而《品牌舆情图》这种图示往往以一年的数据量作为基础，常常有几十万、几百万个数据点（data points），反映出来的形象真实可靠，即便有杂音，也被大数据自然过滤掉了。所以说，情绪分类过细的思路不是大数据（big data）的思路。从个体而言，没错，语言表达中 love 比 like 强烈，crazy 比 love 强，love deeply 比 love 强，very crazy 比 crazy 强，insane 似乎比 crazy 更强，这样下去，别说三刀、五刀，就是 10 刀也不能区别种种细微差别及其语义组合的可能性，因为人的情绪是连续体，其表达也相应千变万化。但是，我们还是要用离散来model连续，而且要限制离散度，以便宏观把握：语义上太细琐了标准就难掌握，难以操作和实现，最重要的是，劳而无功。作为连续的模型化，切五刀已经很不错了，这也正好与多数客户调查使用五颗星的制度相吻合（学生总成绩的评判也多采用五分制，偶尔采用两分制 pass/not pass，单个测验为方便计算采用百分制，但随后还是要整合到五分制去）。舆情（舆论情绪/舆论情势）是什么？人民（或网民）的声音。人民是由个体组成的，网民是由网虫组成的。网民的声音来自一个个网虫的帖子。网民声音的载体就是社会媒体大数据。在大数据的尺度下，个体声音的过细分类没有太大意义，因为只要数据足够大，其最终舆情结果（结论）是不变的。举例来说，10万个正面呼声，100万个负面呼声，其综合舆情结果并不会因为这10万中有 1万crazy，1万love，8万like，负面中有10万fuck，10万hate，80万dislike 等等而有大的改变。无论如何计算，结论依然是天怒人怨。 again，采样大就可以弥补个体颗粒度的粗疏，这在机器学习领域被一再证明，也是很多统计学家不屑于语言学家精雕细刻雕虫小技的缘由之一。这么说，为舆情挖掘，情绪分类褒贬两分法（thumbs-up thumbs-down）就够了，或者最多三分法？语言学可以退出舞台了？并非如此。主要原因有二。第一是大数据并非总存在。冷门品牌或者新出的品牌的数据量就往往不够，另外很多分析要求对数据进行切割，比如从时间维度的切割可以反映舆情的消长（trends），是制定决策时非常重要的情报，可是大数据一切隔往往就成了小数据，没有语言学上比较细致的分析来弥补，舆情分析就不靠谱，没有足够的置信度。第二是褒贬分析只提供舆情的一个概览，它本身并不是 actionable insights. 知道很多人喜欢或者不喜欢一个品牌，so what？企业还是不知道怎么办，最多是在广告宣传投资量的决策上有些参考价值，对于改进品牌产品，适应用户需求，褒贬舆情太过抽象，不能提供有价值的情报。这就要求舆情分析冲破两分、三分、五分的分类法，去发掘这些情绪的背后的动因（reasons/motivation），回答为什么网民喜欢（不喜欢）一个品牌的问题。譬如挖掘发现，原来喜欢麦当劳的主要原因是它发放优惠券，而不喜欢它的原因主要是嫌它热量太大，不利减肥。这样的舆情才是企业在了解自己品牌基本形象以后，最渴望得到的 actionable 情报，因为他们可以据此调整产品方向（如增加绿色品种和花样，水果、色拉等），改变广告策略（如强调其绿色的部分）。从问答（question answering）系统的角度看，why 的问题和 how 的问题是公认的最难自动回答的问题。我们从根本上解决了这个问题。镜子提到用 like/dislike 表达品牌的优劣作为情绪之外的另一维度，这实际是很有见解的一个思路。具体说就是，一维专门表达情绪（管它强度），另一维表达优劣（pros/cons），作为情绪的理由。这样的图示也许更insightful，但是有相当困难。维度通常只善于表达可以归类的概念（比如褒贬，比如烈度），而pros/cons千差万别，不同领域不同产品也很不同，不好统一归类到一根轴上去展示。除非 pros n cons 的具体内容隐而不显，likes／dislikes 这个维度只反映提到 pros／cons 的数量，否则似乎是不可行的。我们目前表达pros/cons（也叫 likes/dislikes，用其可数名词的复数，正好与镜兄提议吻合），常常用 top n 来表达，对于成千上万的 pros/cons，只选取 top n （如 top 10）利用 pie chart 或者 word cloud 来显示，以此来应对不好归纳的困难。 RE: 投票的时候，每个人只有一票，不管是like love crazy 还是 can't live without 都只有一票的用处。一人一票制就是要排除 passion indensity 作者: 立委 (*) 日期: 02/04/2013 14:12:25 就客户而言，一个苹果饭可能会买n个iPhones，比如作为礼物给家人、朋友等，因此 intensity 加个权也许还有一点意义。 anyway，大数据统计时，一人一票足矣。加权与否，只要一视同仁，对于大数据（譬如一州的选民），最终的投票（或舆情）统计结果是基本不变的。有意思的是，网上客户反馈机制有二分法（喜欢/讨厌），有五星制（Amazon review），而 Facebook 和 Google + 则只允许正面据说是因为允许人扔网络臭鸡蛋影响他们的客户。即便如此，大数据下，褒贬还是可以计算得很靠谱。一个帖子的点击数多，可是却很少有 + 的，往往是不好的帖子。褒贬之间的分野可以设定一个经验阀值。至于去网上购物（如Amazon），我总是选择4星以上反馈基数大的商家，价格处于中下即可。不敢选择价格最好，但是反馈基数少的，也尽量不选4星下的商家。这个策略从未失手过，因为商家的信誉 at stake，他不会也不值当胡来。还是信息流通好哇。【立委名言：数据改变生活，技术改变世界，拥抱大数据】【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 立委科普|8536 次阅读|5 个评论

交通舆情，一个无奈的新方向？: 热度 33 王飞跃 2013-1-11 11:11; Transportation Analytics and Traffic Sentiment Analysis: A New Direction for ITS Research? 去年国庆节，我正在外地。经过高速路上的收费站时，车还得停下来，接受工作人员发来的一张卡。问司机不是不收费吗？为何还发卡，司机说可能是为了统计流量计算损失吧。到了晚上才知主要城市大堵，网上一片沸腾，引发了我把交通舆情作为一个问题来研究的想法，当即电话曾轲和文礼准备数据，进行分析，写一篇论文（见附件3）。当时乱想，万一有什么灾难或动乱，汽车坦克是没用了，必须是飞机才行。 2013年1月5日，晨9点出行，遇到自己在京最长时间的堵车，平时20分钟的车程，用了1小时56分！车上无事，我把所有的时间节点都记下，准备有时间写自己的第一篇 Field Traffic Studies 实证研究的文章。文礼基于现场写了一篇黄灯的分析短文，希望将来扩展成论文（见附件1）。附件2是在我的新浪微博上转的关于交通相关的微博，希望曾刘两位在此基础下写出第二篇交通舆情的论文，使之真正地成为一个研究方向，为社会大众出行和公共政策制定提供有用的信息。附件1：“黄灯3秒 ”VS“ 大堵车”——交通瓶颈的提前范文博 :也谈黄灯的交通问题兼提改善建议【Jan. 12, 2013编辑】 http://blog.sciencenet.cn/blog-92473-652210.html 附件2：我的新浪微博上转的关于交通相关的微博附件3： Traffic Congestion and Socia l Media in China 附件1： “黄灯 3 秒” VS “大堵车” ——交通瓶颈的提前从 1 月 1 日开始实施《新交规》以来，各地公布的交通违章数据显示交通违章呈下降趋势。控制“闯黄灯”成为《新交规》减少驾驶员违章行为的功臣之一。诚然，控制闯黄灯在一定层面上保障了安全，但同时也带来了许多负面效应。有人调侃说该规定违反“牛顿定律”，因为绿变黄的一瞬间，车没办法立刻停下来。有人甚至因为黄灯急停而造成了追尾事故。而大多数人的体会则是回家的路仿佛更长，更容易堵，更容易造成大堵车。《新交规》实行以来，大家都在质疑“黄灯 3 秒”会不会是近几天出现大堵车的原因。我认为，“黄灯 3 秒”是否主要原因大家各有见解，但这 3 秒必定会使交通系统提前到达拥堵瓶颈，使以往同期高峰时段提前形成大堵车。交通系统中，以交通灯控制车流。从这个角度看，《新交规》使黄灯成为控制车流停车的信号灯之一，这就大大增加了停车的信号灯周期。这样带来的危害是巨大的：原本 5 分钟可通过的路口现在可能需要 20 分钟才能通过；原本同时 100 辆车到达路口才到达堵车瓶颈的，现在可能 80 辆车就开始大堵车了。因此，黄灯的这三秒，将增加车流通过路口的时间，增大堵车的概率。以下是 2013 年 1 月 5 日傍晚北京中关村东路至保福寺桥路段造成大堵车的一个实例。如图 1 所示， 1 月 5 日傍晚，保福寺桥南，中关村东路南北双向行车压力大，堵车严重。图 1: 1 月 5 日晚 18 时 45 分保福寺桥南车行路况为何黄灯的这 3 秒，会使交通路口提前达到输流瓶颈，增加堵车的概率？实际上，每一个交通灯，都有其控制车流的极限。如图 2 所示，在交通灯 1 下，汽车停排的长度为 Lc ，交通灯 1 在一个红灯期内，最大能承受的排队长度为 Lr 。一般地，当时，交通系统可正常运行；当时，则交通灯 1 出现排队溢出。《新交规》的出台，无疑是将黄灯归入汽车停止信号灯，车流在此信号灯前停止时间增加，车流陆续到达，使 Lc 比以往更快、更容易达到 Lr 极限。一旦交通灯前的车流达到排队极限，出现排队溢出，将造成不只一个方向堵车，而是大面积的堵车。图 3 至图 8 是 1 月 5 日保福寺桥南，中关村东路南北向排队溢出的实景，经过 T1 （图 3 、图 4 ）， T2 （图 5 、图 6 ） ,T3 （图 7 、图 8 ）三个时期后，该路口各个方向出现了大量拥堵。图 2 ：交通灯的红灯期容量。 Lc 表示交通灯 1 指示停止时，汽车的排队长度； Lr 表示交通灯 1 在一个周期内最大能承受的排队长度，即红灯期容量图 3 ： T1 时期南北向排队溢出实景，往中关村南路方向可通行。图 4 ： T1 时期南北向排队溢出，往中关村南路方向可通行。图 5 ： T2 时期中关村南路北转绿灯实景，此时将遭遇中关村东路排队溢出图 6 ： T2 时期中关村南路北转绿灯，此时将遭遇中关村东路排队溢出图 7 ： T3 时期中关村东路直行绿灯实景，此时将遭遇被排队溢出滞留的车队图 8 ： T3 时期造成堵车情况。中关村东路南向直行绿灯，此时将遭遇被排队溢出滞留的车队至此，该路口出现大面积堵车，各个方向的车流越来越多。如图 9 所示，整个道路出现“全红”瘫痪状态。图 9 ：百度实时路况信息。绿色道路代表道路畅通，红色代表道路拥堵。经过几个红灯周期后， 1 月 5 日 18 时 21 分，中关村南路、北四环保福寺桥段、中关村东路出现大面积堵车。简短的 3 秒，使某些固定路段提前到达“红灯期容量”，提前达到了堵车瓶颈。任何一个方向排队溢出，将迅速导致其他方向形成堵车。这个恶性循环长期难以解决，黄灯的三秒，更是提前促成恶性循环的重要原因，这是我们值得思考的问题。附件2：我的新浪微博上转的关于交通相关的微博 // @ 岂不快哉 wzk : 扯。让不让闯黄灯不是规则问题，是科学问题。 // @ 凡事望聞問切 : 一直步行上下班，个人感受：禁闯黃燈實行後，過馬路是安全了些；無論自己還是觀察別的行人；這就是坐在車里的和走在車外的不同角度。黃燈如果行人和機動車都能闖，不又跟綠燈一樣了 // @ 为明天忧 : 另一种钓鱼执法！ ◆ ◆ @ 李开复【中国式黄灯的谬论】 1 ） ” 中国人见黄加速，外国人不会 “ ：我在美国三十多年，许多美国人也见黄加速，没去过外国别乱说， 2 ） ” 危险驾车行为该严惩 ” ：请勿偷换概念，问题存在不代表解决方案正确，可用闪秒等合理解决方案。 3 ） “ 需要实践再修正 ” ：全球已实验 1000 万亿次，有桥有船，不必摸石子过河。转发 (31157) | 评论 (7767) 1 月 5 日 09:30 来自脉搏网 1 月 9 日 08:56 来自新浪微博转发 (2) | 评论 ———————————————————————————————————————————— ———— // @Geek 李睿蛟 : // @jlijames :// @ 邓侃 : 美国有个笑话，说，开车的人见到黄灯，就像西班牙的牛，见到了红布。 // @leekayak : 转发微博 ◆ ◆ @ 李开复【中国式黄灯的谬论】 1 ） ” 中国人见黄加速，外国人不会 “ ：我在美国三十多年，许多美国人也见黄加速，没去过外国别乱说， 2 ） ” 危险驾车行为该严惩 ” ：请勿偷换概念，问题存在不代表解决方案正确，可用闪秒等合理解决方案。 3 ） “ 需要实践再修正 ” ：全球已实验 1000 万亿次，有桥有船，不必摸石子过河。转发 (31157) | 评论 (7767) 1 月 5 日 09:30 来自脉搏网 1 月 6 日 06:21 来自新浪微博转发 | 评论 ——————————————————————————————————————— ——————— ———— 个人观点：自适应程度越高，越应显示红绿时间，使驾驶员能明确情况，否则不可避免的靠经验估计行为可能导致更多的事故。 // @ 智能交通 - 王志彪 : 区域控制自适应系统根据车流情况调整绿灯时间也不是随意的，都会在最后执行一个最小的绿灯时间来保证相位衔接的秩序。杭州的 ..... 所以这个观点是站不住脚的 // ◆ ◆ @ 郭继孚公安部解释北京为什么没有采取倒计时装置的信号灯：北京主城区采取的是区域控制的自适应系统，智能化程度比较高，信号机道路流量变化，及时调整信号灯配时。为了防止信号突变造成的紊乱，北京市没有采用倒计时装置 @ 中国新闻网 # 中新分享 # http://t.cn/zjR754G （分享自 @ 中国新闻网） 1 月 3 日 12:48 来自中新网微博转发 (45) | 评论 (20) 1 月 4 日 13:00 来自新浪微博转发 | 评论 ——————————————————————————————————————— ——————— // @ 智能交通王志彪 : 区域控制自适应系统据车流调整绿灯时间也不是随意的，都会在最后执行一个最小绿灯时间来保证相位衔接秩序。杭州 SCATS 系统是自适应控制系统，在相位变换前最后几秒中会开始倒计时，而平时是不显示。所以当你看到倒计时牌点亮时，就要准备停车或要起步了。所以这个观点是站不住脚 // ◆ ◆ @ 郭继孚公安部解释北京为什么没有采取倒计时装置的信号灯：北京主城区采取的是区域控制的自适应系统，智能化程度比较高，信号机道路流量变化，及时调整信号灯配时。为了防止信号突变造成的紊乱，北京市没有采用倒计时装置 @ 中国新闻网 # 中新分享 # http://t.cn/zjR754G （分享自 @ 中国新闻网） 1 月 3 日 12:48 来自中新网微博 | 转发 (45) | 评论 (20) 1 月 4 日 12:49 来自新浪微博转发 | 评论 ——————————————————————————————————————— ——————— // @ 马少平 THU : “ 小心熊出没 ”// @Avatar_C : 小心黄灯出现 // @ 左南 ZuoNan : 马老师 ...... // @Leon_ 里昂王 : 绿灯恐惧症。 // @ 酒井鱼鱼 : 绝对要转！ ◆ ◆ @ 马少平 THU 问：路况这么好，为什么你开这么慢？答：你没看见前面是绿灯吗？ 1 月 3 日 09:33 来自新浪微博转发 (75) | 评论 (4) 1 月 3 日 13:04 来自新浪微博转发 (1) | 评论 ——————————————————————————————————————— ——————— // @ 科研战线上的工兵 : // @ 译言 : 遇到黄灯，停不住，有错的是交管部门，因为他们的黄灯设置不合理；不停车，有错的就是你。 # 交规都不遵守，谈什么尊重法律 # ◆ ◆ @ 译言【你以为黄灯是个新问题？】其实全世界司机碰到黄灯都头疼。为什么？一般黄灯的时长是按照 1 秒的反应时间加上车辆的制动时间设置的。但问题是，司机的反应时间远远要超过 1 秒： http://t.cn/zj8s3pQ 但归根到底，无论老交规还是新交规， # 见到黄灯就应该准备停车 # ，不信回家翻翻你几年前学驾照的课本去。 1 月 3 日 11:17 来自专业版微博转发 (225) | 评论 (77) 1 月 3 日 13:04 来自新浪微博转发 | 评论 ——————————————————————————————————————— ——————— “1927 年，他发明变速电机和红绿灯转换时中间所出现的黄色，获得奖励。于是，红、黄、绿三色信号灯即以一个完整的指挥信号系统，遍及世界陆、海、空交通领域。 ” 这段描述只能推出胡老先生实现黄色信号灯，但无法确认是否发明黄色信号灯，而且百度也不是科技文献。 ◆ ◆ @ 瀟湘墨人【黄灯居然是中国人发明的】胡汝鼎（ 1905~1985 ），杭州人，早年留学美国。 1927 年，小胡在美国的一个繁华十字路口，绿灯亮了，正要向前走，一辆汽车擦身而过，小胡吓了一跳。小胡琢磨，觉得应该在红绿灯中间加个黄灯，提醒司机慢行，注意行人。小胡的建议得到了美国人的重视和采纳，最终全世界通行。 1 月 3 日 08:21 来自享拍微博通转发 (36) | 评论 (10) 1 月 3 日 09:50 来自新浪微博转发 (2) | 评论 ——————————————————————————————————————— ——————— 被堵胡汝鼎： http://t.cn/zOIvyFC // @ 中科院王飞跃 : 黄种人发明黄色信号灯，是信史吗？有文献吗？应当核查一下。 // @ 中科院王飞跃 : 转发微博 ◆ ◆ @ 瀟湘墨人【黄灯居然是中国人发明的】胡汝鼎（ 1905~1985 ），杭州人，早年留学美国。 1927 年，小胡在美国的一个繁华十字路口，绿灯亮了，正要向前走，一辆汽车擦身而过，小胡吓了一跳。小胡琢磨，觉得应该在红绿灯中间加个黄灯，提醒司机慢行，注意行人。小胡的建议得到了美国人的重视和采纳，最终全世界通行。 1 月 3 日 08:21 来自享拍微博通转发 (36) | 评论 (10) 1 月 3 日 09:44 来自新浪微博转发 (3) | 评论 (1) ——————————————————————————————————————— ——————— 黄种人发明黄色信号灯，是信史吗？有文献吗？应当核查一下。 // @ 中科院王飞跃 : 转发微博 ◆ ◆ @ 瀟湘墨人【黄灯居然是中国人发明的】胡汝鼎（ 1905~1985 ），杭州人，早年留学美国。 1927 年，小胡在美国的一个繁华十字路口，绿灯亮了，正要向前走，一辆汽车擦身而过，小胡吓了一跳。小胡琢磨，觉得应该在红绿灯中间加个黄灯，提醒司机慢行，注意行人。小胡的建议得到了美国人的重视和采纳，最终全世界通行。 1 月 3 日 08:21 来自享拍微博通转发 (36) | 评论 (10) 1 月 3 日 09:42 来自新浪微博转发 (4) | 评论 (1) ——————————————————————————————————————— ——————— // @ 概而不论 : 黄灯儿从本质上说啊！是这么回事儿！不等于红灯，就等于绿灯！不等于绿灯，就等于红灯！ ◆ ◆ @ 刘仰新的关于黄灯的交规，是否等同于取消黄灯？黄灯 = 红灯？ 1 月 3 日 00:12 来自新浪微博转发 (20) | 评论 (23) 1 月 3 日 09:27 来自新浪微博转发 (1) | 评论 (1) ——————————————————————————————————————— ——————— // @ 古长宏 : 民意亮起黄灯，权力何去何从？晚安。 ◆ ◆ @ 人民日报【你好，明天】红灯停绿灯行，黄灯怎么办？新年伊始，一部史上最严交规引发网络吐槽。人们赞同严格执法，却疑惑规定是否合理可行。法规的统一严肃需要维护，民众的意见也要耐心倾听。强制的权力或可带来服从，却不必然带来权威与公信，懂得检视修正才能让人心悦诚服。民意亮起黄灯，权力何去何从？安。 1 月 2 日 23:33 来自人民日报微博转发 (4598) | 评论 (1533) 1 月 3 日 09:20 来自新浪微博转发 (2) 评论 ——————————————————————————————————————— ——————— // @silverspring : 目前的系统好像读秒就无法实现按流量实时控制红绿灯时长这样的智能控制。北京曾为两种方案论证过，郊区也试点过读秒。未推广，应也有改造成本因素。当初也没预料会出台这样的交规吧 // @ 传奇没那么简单 : 新法大家可遵。但问题是为什么北京不能在信号灯上显倒计数呢，为什么别城都可 ◆ ◆ @ 新华社中国网事【公安部： “ 抢黄灯 ” 和追尾事故可以避免】针对网友提出的黄灯亮时紧急制动造成的车辆惯性前行，公安部交管局有关负责人表示，黄灯亮时，只要机动车车身任何一部分已越过停止线即可继续通行。驾驶人注意力集中、与前车保持安全车距，行经路口时减速慢行、谨慎驾驶， “ 抢黄灯 ” 和追尾事故是可以避免的。 1 月 2 日 18:23 来自新华新媒体转发 (5509) | 评论 (1173) 1 月 3 日 09:19 来自新浪微博转发 (2) | 评论 (1) ——————————————————————————————————————— ——————— // @ 钅彡壴 : 大数据中数据挖掘 // @cnsns : 爷，这是屁股问题，不是数据问题！ // @ 叶开 : 从大数据角度讲北京海量的路口数据、红绿灯数据及事故监测数据，如进行数据挖掘和预测分析，足可支撑一合理的决策出来，可为什么还要拍脑袋？ // @ 我是大刚 : 想起那句话 : 肉食者鄙，未能远谋。 // @ 牛文文 : 一个开文艺酒店 ◆ ◆ @ 桔子水晶吴海《承认一个错误值多少钱？试算关于黄灯的新交规让北京损失多少钱》：现行黄灯方案每年北京间接损失达到约为 36 亿，如果采用更傻的修补方案，有可能北京间接损失每年 60 亿左右。原文链接： http://t.cn/zjQHX7h 1 月 1 日 17:00 来自新浪微博转发 (20679) | 评论 (3426) 1 月 2 日 23:29 来自新浪微博转发 (1) | 评论 ——————————————————————————————————————— ——————— // @ 云泉微博 : // @ 蓝旗主的当代微博版史记 :// @ 漆洪波 : 都是倡导创新社会整的，交通局也搞创新。下回教委创新一下数学，说一加一不再等于二。 // @ 王冉 : 我很怀疑是不是交管局有什么情绪才会这样有意找骂。 // @ 光头王凯 : 今后只设一个绿灯就好，亮了走灭了停。低碳中国，从交管局做起，耶！ ◆ ◆ @ 光头王凯黄灯的作用就是作为红灯即将来临的提示。如果闯黄灯罚六分，就等于黄灯变成了红灯。这时候，红灯再也找不到自己，只能在性工作者身上找到些许价值。 1 月 1 日 20:54 来自新浪微博转发 (2955) | 评论 (528) 1 月 2 日 09:50 来自新浪微博转发 (2) | 评论 ——————————————————————————————————————— ——————— // @ 段永朝 : // @ 曹增辉 : # 修订黄灯 # // @ 王亚彬 : 转 ◆ ◆ @ 楊葵新交规实行第一天上路，试验几十次黄灯问题，很难掌控。要么灯前 50 米左右就把车速降至极低 —— 这必将给本就拥堵不堪的交通造成更大灾难；要么随时准备灯前急刹 —— 这必将造成更多追尾事故。我积极赞成交规从严，但这一条确实极不合理，民意反对声音也极大，郑重呼吁 @ 北京交通修订此条。同意者请转发 1 月 1 日 13:26 来自新浪微博转发 (18306) | 评论 (3388) 1 月 2 日 09:48 来自新浪微博转发 (1) | 评论 ——————————————————————————————————————— ——————— // @ 云泉微博 : // @ 施力勤 : 谁是做信号灯系统的老大 ? ◆ ◆ @ 人民日报【微评论：让黄灯不再 “ 纠结 ” 】新交规首日， “ 抢黄灯 ” 成吐槽焦点。培养文明行车，提升道路安全，是新规本意。然而，执法标准能否统一？取证方式如何规范？现有信号灯设施是否合理？网友 “ 纠结 ” 的背后，是对规则漏洞的疑惑，对公平执法的期待。提升文明，不能只靠严法，更需完善而人性化的配套措施。 1 月 1 日 22:10 来自人民日报微博转发 (1901) | 评论 (744) 1 月 2 日 09:48 来自新浪微博转发 (1) | 评论 ——————————————————————————————————————— ——————— // @ 马少平 THU : 另一种可能的修改方案就是在红绿灯前加一条黄线，过了这个黄线的车可以闯黄灯但不能闯红灯。也许是最经济的不就措施了。 // @ 程序员邹欣 : 文章有理有据 . 天朝在黄灯这件事上也要摸自己的石头过河么 ?! // @ 牛文文 : 一个开文艺酒店的愤青老板，能把黄灯这点事研究得这么门清！ ◆ ◆ @ 桔子水晶吴海《承认一个错误值多少钱？试算关于黄灯的新交规让北京损失多少钱》：现行黄灯方案每年北京间接损失达到约为 36 亿，如果采用更傻的修补方案，有可能北京间接损失每年 60 亿左右。原文链接： http://t.cn/zjQHX7h 1 月 1 日 17:00 来自新浪微博转发 (20679) | 评论 (3426) 1 月 1 日 20:57 来自新浪微博转发 (4) | 评论 ——————————————————————————————————————— ——————— 旧文：交通设计管理须重视行为心理因素 http://t.cn/zlEARiy 有些路口设计几乎不考虑车的行为和人的心理，不但行人乱穿，车也被逼乱闯。有些路口设计太大，一个信号周期得等很长，早不耐烦，按奈不住抢道心理，结果绿灯来了，可其它方向车占着路，无法通行， “ 绿灯不绿，红灯不红 ” 一片混乱恶性循环。 2012-10-20 23:01 来自新浪微博转发 (2) | 评论 ——————————————————————————————————————— ——————— 附件3： Traffic Congestion and Socia l Media in China Ke Zeng Xi’an Jiaotong University, China Wenli Liu National University of Defense and Technology, China Xiao Wang and Songhang Chen Chinese Academy of Sciences The 1st of October is Chinese National Day; in celebration, Chinese citizens get an eight-day holiday, known as the Golden Week, from 30 September to 7 October //au: rewording correct? Ok // . During this week? , the Chinese government implements a policy in which vehicles with seven seats or less travel toll-free on the highways //au: rewording correct? Ok // . Unfortunately, this policy over stimulates domestic travel and creates more traffic congestion. As Figure 1 shows, the highway turns into a giant parking lot. In 2012 , Chinese citizens took 189 million trips while this policy was in place and received //received? ok // 6.54 billion free tolls; however, 68,422 traffic accidents occurred over the Golden Week (Statistical result via URL: http://finance.people.com.cn/money/BIG5/n/2012/1011/c218900-19226060.html) , and 794 people lost their lives (Statistical result via URL: http://leaders.people.com.cn/n/2012/1008/c58278-19186170.html) . Figure 1. Traffic congestion on China’s National Day. The government’s policy of allowing many vehicles to use the highways for free during the Golden Week increases congestion //au: correct? ok / . (Figure via http://tieba.baidu.com/p/1893369318 and http://tieba.baidu.com/p/1922476418 ). Unexpectedly, traffic congestion on roads in physical space also caused an “opinion explosion” in cyberspace. Participants in social media included potential travelers and people who got caught in the holiday traffic jams. Online social media participants have shown great enthusiasm for road trips. Figure 2 shows the growth of topics about road trips on social media sites over the past few years. The number of road-trip related topics were far fewer prior to 2008, but the topic type increased significantly over the past four years . E specially in 2012 , s uch a high growth rate and high occupancy on such sites //correct? Yes // could provide early warning signals, giving a preview of road traffic conditions via social media that indicates that traffic for the holiday could experience unprecedented growth. Figure 2. Growth in road-trip-related topics. Such topics have increased steadily on social media over the past few years. Here, we examine Golden-Week-related topics’ evolution over the past 10 years //au: ok? ok // using comprehensive online communities such as xcar.com.cn, tianya.cn, autohome.com.cn, and Sina Weibo (weibo.com, a Twitter equivalent in China). Using methods based on topic clustering, we can analyze the attention users give to various topics , study the geographic distribution of online topics concerning Golden Week, get travelers’ growth tendencies and geographic distributions, and provide primary research for traffic emergencies during holidays. //au: IS avoids “signposting,” or summarizing point by point what the article will discuss, so I’ve deleted the last few sentences of the introduction . Agree // Topic Evolution With the development of SNS(Social Network Site) //au: SMS? Or what does SNS stand for? Stand for Social Network Site //, IM, Twitter, and other social media platforms, more people prefer to communicate and exchange opinions online. 1,2 Plenty of topic threads let people exchange tourism experiences, such as discussions of travel routes. Right before the 2012//2012? ok // holiday, a few topics about the Golden Week and travel became popular. As highway traffic congestion emerged in real time //au: correct? Just ok, and I prefer to emphasize the synchronism between physical world and online world. // , related topics quickly grew on the Internet. As time passed, the traffic jam became a larger traffic disaster. Concurrently, the deterioration of the situation due to high traffic conditions attracted the attention of users from various social communities and triggered a furious discussion about the Golden Week traffic policy and the traffic congestion. Moreover, online users put forward some emergency strategies to dealing with the congestion and got great support //from or for who/what? The word “put forward” is much better than “developed…from”. // . To illustrate the topic transformation during the entire Golden Week, we constructed dynamic evolutionary social networks to reveal topic participants’ characteristics in accordance with online discussions on Tianya.cn. The Internet contains many Golden-Week-related topics, but most of these have low participation, so their discussions are insignificant. Such topic threads can’t reflect the overall attention and tendencies of online holiday-related topics. For our study, we chose only threads with high reply and user-engagement rates, selecting 11 threads on road travel from different online communities. Figure 3a shows different communities’ discussions concerning holiday trips from 28 September. The discussion thread content and direction was very different; although many people participated, the overlapping coefficient among them is small, and no users participated in different topics at the same time. Topics at that moment mainly focused on scenic spots and travel routes. Figure 3. The evolution network of Golden-Week-related topics on social media. We can see (a) the discussion concerning holiday trips on 28 September; (b) topics related to the toll-free policy; (c) and (d) policy-related topics becoming more prevalent over time; and (e) our social network of participants in Golden-Week-related topics. Nodes represent participants in road-trip related topics; node size is proportional to the degree of online users. Lines between nodes represent different users’ reply and reposting behaviors, whereas the node color represents different topics. In the time leading up to the Golden Week, new topics arose (Figure 3b) about the toll-free policy and road traffic conditions (in pink and red, respectively). As we can see, these two topics attracted few online users until 30 September. As time passed, the policy-related topics became more prevalent (Figures 3c and 3d). They attracted many participants from other travel-related topics and communities. More and more online users took part in the discussion about the toll-free policy; some also suggested reasonable emergency responses. By 8 October, we could construct a social network of participants in Golden-Week-related topics (Figure 3e). Apparently, almost every topic thread included some participants who also took part in the policy-related discussion threads. Simultaneously, topics about road traffic conditions and policy feedback were attracting participants from different communities, and became hot topics on Tianya.cn. Moreover, the crossover and overlap rates of holiday-related topics were at their highest at that time. Opinion Analysis Topics about the Golden Week not only attracted considerable attention in social communities but also generated furious discussion among Sina Weibo users. Analysis about traffic jams, feedback on traffic flow and conditions, and traffic congestion suggestions are still debate topics. The most popular Weibo on Sina.com comes from Daokui Li, a professor from Tsinghua University who asked, “Why not increase the highway toll by 50 percent and give this money to welfare institutions?” This caused immediate and enormous attention. As shown in Figure 4 , w e constructed a dynamic network to illustrate how holiday-related topics evolved and grew on social networks and thus study their dynamic evolution characteristics. The growth process is similar to that of the topic evolution we discussed previously, where topics analyzing traffic conditions and providing feedback on the policy were the most critical. Many online users gave suggestions for improving traffic congestion, while others also put forward temporary suggestions such as “cancel the ‘pass’ card at the highway entrance,” which attracted considerable attention from online users. We extracted various relevant suggestions, analysis, and viewpoints and classified them in accordance with their helpfulness as regards traffic congestion (see Figure 5) //au: where in the text should Figure 4 be called out? Added // . Figure 4. A dynamic Sina Weibo network. The nodes represent the participants in policy feedback topic threads; lines between nodes represents the reply and reposting relationship between different users; and node color represents the time period during which the information was posted: the earlier the post, the darker the node. Figure 5. Categories of suggestions, analysis, and viewpoints. We classified this feedback according to its helpfulness as regards traffic congestion. Traffic Flow Information from Social Media Social media can also forecast the geographic distribution of potential tourists. We did considerable data mining work on several communities; analyzed the travel-related topics that emerged online from 1 to 30 September in those communities; and extracted online users’ attributes and their published content to study potential travelers’ geographic distribution features. We studied the data in detail and categorized it in accordance with its geographic distribution. Simultaneously, we gathered travelers’ geographic distributions and the proportional relationships between travel-related topics from 2011 and 2012 (see Figure 6). More importantly, as our analysis indicates, the geographic distribution features of different provinces reflect road travelers’ potential distribution as well. We can also get each region’s growth proportion in accordance with last year’s travel-related topics and participants. Thus, we can use our analysis to strengthen the accuracy of geographic distribution forecasts as compared to real-world traffic conditions. In the future, besides looking at the number of tourists, we will deploy text mining technologies 3 to travel-related content mining from social media, and to identify tourists’ time of departure , origin, and destination. This data is key for traffic-flow forecasts. With the increase in those using social media while traveling, this method could let users obtain more detailed and useful data for traffic management. For example, travelers could access information about traffic emergencies (such as subway crashes or floods) from social media in real time. Figure 6. The geographic distribution of traffic flow on social media. This chart includes data from 298 online communities, 1,842 travel-related topics, and 42,232 posted messages from autohome.com.cn. Social media plays an increasingly important role in our lives. 4 Here, we’ve used social network analysis 5 methods to analyze online topic evolution for traffic management. Our results could potentially support government decisions and help officials more efficiently manage traffic. Social media has obvious advantages during traffic emergencies—compared to wireless sensors, for example, it isn’t limited by information sources and can get different types of online data, such as videos or pictures. Compared to traditional media, social media is more flexible and more applicable to road emergency management and traffic dispersion. References 1. J. Zhang et al., “Data-Driven Intelligent Transportation Systems: A Survey,” IEEE Trans. Intelligent Transportation Systems , vol. 12, no. 4, 2011, pp. 1624-1639. 2. F. Qu, F.-Y. Wang, and L. Yang, “Intelligent Transportation Spaces: Vehicles, Traffic, Communications, and Beyond,” IEEE Comm. , vol. 48, no. 11, 2010, pp. 136-142. 3. K. Lerman, “Social Information Processing in News Aggregation,” IEEE Internet Computing , vol. 11, no. 6, 2007, pp. 16-28. 4. J. Sutton, L. Palen, and I. Shklovsk, “Backchannels on the Front Lines: Emergent Uses of Social Media in the 2007 Southern California Wildfires,” Proceedings of the 5th International Conference on Information Systems for Crisis Response and Management (ISCRAM) , C aptus P ress I nc . (Eds. F. Fiedrich and B. Van de Walle) , 2008, pp.624-632 . 5. F.-Y. Wang et al., “Social Computing: From Social Informatics to Social Intelligence,” IEEE Intelligent Systems , vol. 22, no. 4, 2007, pp. 79-83. Ke Zeng is a PhD student in the School of Electronic and Information Engineering at Xi’an Jiaotong University, China . Contact him at ke.zeng@live.cn. Wenli Liu is a PhD student in the Center of Military Computational Experiments and Parallel Systems Technology, National University of Defense Technology, China . Contact him at lwl_david@163.com. Xiao Wang is a PhD candidate at the State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences . Contact her at kara0807@gmail.com. Songhang Chen is a PhD student at the State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Sciences . Contact him at chensohg@gmail.com. Research on social media has been applied to various academic fields. During this year’s Chinese National Holiday traffic congestion event, online users showed great enthusiasm on social media, such as forums, Weibo, communities, and other platforms. This article describes the construction of a dynamic evolution network, analyzes the transformation of online users’ concentration, and studies the geographic distribution of travelers by analyzing online users’ attributes. social media, Chinese National Holiday, traffic congestion, online forums, Weibo, dynamic evolution network ————————————————————————————————————————————————— ————————————————————————————————————————————————— ————————————————————————————————————————————————— ————————————————————————————————————————————————— —————————————————————————————————————————————————; 61412 次阅读|44 个评论

社会媒体测试知名品牌百度，有惊人发现: 热度 2 liwei999 2012-12-13 08:54; 今天测试知名品牌百度的TagCloud，有惊人发现日期: 12/12/2012 18:51:14 在简体字的world里面，与百度最紧密关联的词语是：哪里有小姐在繁体字的 world，最关联的词是美元不知怎么就想起了 Google 被赶出中国前对谷歌的指责：说 Google 太黄了。黄得过百度么？ A follow-up post at: 小姐年年讲、月月讲、天天讲？【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 社媒挖掘|4336 次阅读|3 个评论

【『科学』预测：A-股看好】: 热度 1 liwei999 2012-12-4 13:37; 有什么大众话题想要测试我的中文系统么？作者: 立委日期: 12/03/2012 17:40:25 RE: 老李，你这玩意儿能不能用来炒股啊？要是能预测股票走向，哪怕一点点，就牛大了。能啊。见图：自动舆情监测分析表明：A-股看好哎！！！那谁谁，还不进场！据说外资已经陆续到位抄底了呢。股市应该不久会反弹。【免责声明】舆情检测虽然大数据，很客观，无人为干扰，但是过去和现在的舆情不能成为未来预测的保证。有网友听信陪钱，概不负责。但有听信而赚钱者，务请捐款1/10至：大数据NLP立委基金，c/o 通天塔委员会 @ 牛市。【立委名言】总统人气犹可预测，况股市走向乎？想起前不久总统竞选辩论来。两位总统候选人比着对中国强硬。这是美国政客惯用的竞选伎俩。由于种种原因，起飞中的中国在美国选民中隐隐成为某种威胁，对中国强硬有利于吸引选票。在野总统候选人打中国牌比较有利，因为他不必顾忌对中国现实贸易的相互依赖和利害关系。于是，罗姆尼一直批评奥巴马对中国太软弱，宣称他一旦当选，就立即宣布中国是汇率操纵国，列入操纵者黑名单意味着贸易制裁的强硬态度。奥巴马反守为攻，辩论中告诉听众，千万不要相信罗姆尼的口头激进。他指着罗姆尼说：他对中国最不可能强硬，因为亿万家财的罗姆尼有大笔投资在中国呢。罗姆尼急了，反驳说，你奥巴马回去查查你自己的退休基金的流向，我担保里面有中国概念股，这么说你也有中国投资，因此影响你对中国的政策，笑话嘛。确实，资本唯利是图。投资理财的美国资本顾问，一个个猴精，一方面不断唱衰中国，一方面绝不会放过中国经济这块蛋糕。一边把中国概念股系列弄得垃圾似的，一方面又不失时机进来抄底。总统候选人怎么可能摘得清呢。【相关】到底社媒曲线与股市曲线有没有、有多少相关度? 转载]ZT：牛津大学王宁博士：大数据与有限理性舆情挖掘用于股市房市预测靠谱么？【舆情挖掘：房市总体看好】【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 社媒挖掘|4306 次阅读|1 个评论

舆情、谣言与情报手段: bfzhao2001 2012-10-14 10:44; @山西赵冰峰：谣言，神鬼莫测，兵不血刃，致敌死地，为情报典型手段之一种！舆情管理重点之一就是避谣与击谣。中国无数企业和品牌就死于谣言。西人尤以美人善于造谣！转发(10) | 评论(8) 10月6日10:12 来自华为Ascend智能手机 // @民航货运刘海明 :舆情管理重点之一就是避谣与击谣。不知舆情管理中是？回复 @民航货运刘海明 :颜色革命是與情管理在国家安全领域的应用，不过玩的很大。企业的部分公共危机如特殊的食品安全事件，是與情管理在经济竞争领域的应用。二者原理同一。危机管理的部分工作可算作“反间”，要视危机性质而定。; 个人分类: 情报学|2712 次阅读|0 个评论

“哈尔滨杀医案”舆情折射出什么......: 热度 3 fqng1008 2012-3-26 08:53; 张海峰的日志：为我们哈医大一院刚刚死去的同学致哀！大约4个多小时前，在哈医大一院风湿免疫病房发生了血案：一个20多岁的强直性脊柱炎患者（未提示精神病史）在祖父陪同下来院复诊。患者要求使用“乐克”（一种治疗强脊很有效，但是较昂贵的药物），1.3万元一只，医保后2000元），但患者患有结核病，属于用药禁忌，医生建议他控制结核后在考虑使用，患者与其祖父随即离去，30分钟后，也就是16时，患者突然冲进医生办公室，用水果刀见人就刺，值夜班的王浩同学在没有任何防备的情况下被扎颈动脉，半小时后死亡。一名计划夏天结婚的男医生，现在却在开颅手术台上。两名女医生现已被毁容（其中之一为颊部贯穿伤）。王浩同学今年已考上了香港大学博士，有着让很多人羡慕的未来，却在即将毕业的时候被无知的患者杀死。后续的情况我们会继续关注。在此，强烈呼吁警方尽快破案，告慰无辜死难者以在天之灵，给家属、同学、老师、朋友以安慰；强烈要求有关部门勿要封锁消息，给公众以事实真相；强烈要求有关部门给予医务人员尤其是在校学生安全的工作学习环境和保障，避免此类悲剧再次发生！ @头条新闻：【哈尔滨患者持刀捅医生致1死3伤被抓】23日16时许，哈尔滨医科大学附属第一医院1名患者，持水果刀对4名医生行凶，后将自己颈部捅伤企图自杀未遂，然后逃至急诊室包扎伤口被民警抓获。目前1名医生因伤势严重死亡。据疑犯供认，他认为医生故意刁难不给自己看病，随即心生不满行凶。 http://t.cn/zO6zy7n @石典 :媒体有倾向性的报道会令罹难者死不瞑目的。出于对患者健康的考虑，一位医生没有给凶手开他点名要的药物。凶手却挥刀砍向了从未对他进行过任何诊疗活动，只是不幸背对门口坐诊的一名才考上香港医学博士的医生！ @魉皇鬼无用：医者，治病救人之士也// @沁雨绅_海的女儿 :昨天杀人的那个强脊患者自杀未遂，准备给他手术的时候，他要求喝水，老师告诉他要手术不能喝水，结果被他威胁，我们的老师告诉他：就算你再十恶不赦，我们也不会害你...... @我是有多热爱生活 :// @Dr任 :昨天和今天，至少被问两次，救他，手术他的医生会是一种什么心情。老师回答与我想到的一样，就算他十恶不赦，其实，现在要求判他死的心情也没了。我们的悲和愤应该对向谁呢？ @侯金林医生肝病频道：八旬老师知“杀医”事说: “医生一生与‘狼'共舞：邓爷爷开放前, 白天阳关下被批被斗被整, 夜幕下偷偷在厕所学习、学习、再学习；开放后被媒体黑被家属骂被病友杀，还是学习、学习、再学习。总怕为病人服务的技术不过硬！怕掌握的知识已过时！‘狼’既不是民，也不是媒，是落后的体制！温总都无奈！织围脖的叶子：我爷爷解放前也是医生，他告诉我：“医生一条腿在医院，一条腿在法院。”现在我们的医生，半条命在自己手中，半条命在病人手中，更危险啊。(3月25日 23:22) @医生哥波子：“哈医323事件”引起业内的极度愤怒，业外却是“若无其事”，甚至发出一些“冷若冰霜”和喝倒彩的声音。如果社会对“哈医323事件”这样不可思议的刑事案件如此冷漠的话，着实令人寒栗。来自医生哥波子：谁能留住他们？ @一蟹不如一蟹：其实这样的事情的确是个别现象，凶手精神不稳定，今日杀医生明天可能到幼儿园行凶。问题是看看各网站评论，很多条反而在同情凶手指责医务人员态度，这才是让我们寒心的地方。 @中国医师协会：关于哈医大附属医院一死三伤恶性伤害事件，中国医师协会发表正式声明强烈要求对残害医生的暴行给予最严厉的制裁！我们用愤怒无法反映我们的情绪，这种行为已经到了惨无人道人神共愤的程度，我们呼吁政府职能部门切实履行职责保护医务人员的合法权益，呼吁全社会尊重医务人员。 http://t.cn/zO6fIVS @协和张羽：// @健康教育何超：“手术室外，站满了来自各大附属医院的同学。这些奋斗在各自岗位上的朋友，毕业后一直未能聚会，没想到因为一场暴行！大家祈祷着，他们能够挺过重创，重新站起来，回到我们中间。可是，我们的心，还能像以前一样坚定么？而他们的心，还有力气和从前一样善良么？ @健康教育何超： #哈医大一院血案# 【无处释放的心情转自哈医大一风湿科护士的心声！】医改，改什么了？提高医疗服务质量，优质护理病房，质量万里行，你做的有人看吗？说捅你，整死你不一样！一个250换三个博士，人家值了，......记者朋友们，你们就不能少报道点负面新闻吗？......不只病人是弱势群体，我们也很被动！杨道泓 2012-03-26 03:01：医患问题究其本质是社会保障制度问题。唉，为那同学默哀。张梦 2012-03-26 07:35：另据相关人士透露，犯罪嫌疑人李某某，内蒙古人，生于1994年5月，现年未满18周岁，3岁父母离异，父亲正在服刑，母亲也不在其身边，常年与他一起生活的祖父现患有癌症。记者就其家庭状况向警方求证，但警方未予答复。张梦 2012-03-26 07:39：腾讯网转载的此事件新闻报道后面，竟然有4018人次在网站设置的“读完这篇文章后，您心情如何”的投票中选择了“高兴”，而选择“愤怒”、“难过”和“同情”的，分别只有879、410和258 。王守业 2012-3-26 02:21：最近丁香园对此事的讨论很多，科学网上很少，大概是有由于科学网上做医生的博主很少吧，这类的事最终损害的是每个人的利益，在国家层面应该从根本上根治，减少甚至杜绝此类的悲剧发生，这类的事在欧美发达国家是不可想象的。王华民 2012-3-25 23:49 ：我们全程参与了那位位研究生和三位同事的抢救，很伤心，不想上班，睡不着觉。但我依然坚信医者仁心！可怜那位医学生。 http://blog.sciencenet.cn/home.php?mod=spaceuid=629841do=blogid=551711 http://bbs.sciencenet.cn/home.php?mod=spaceuid=629841do=blogid=551087 dunkelblau 2012-3-25 13:14：每次发生这样的事，医生一骂体制，二骂患者，从来没有见到从自身检讨问题。既然是医患冲突，作为第一线的医生，会一点责任都没有吗？总说媒体妖魔化，难道媒体就能把你们从白硬说成黑？我们的媒体还天天为政府，为官员唱赞歌，那现在中国人都认为我们的官员是最廉洁奉公的吗？人们对一件事形成的看法，主要还是来自于自身的体验。一般人在医院获得什么体验，我想就不用说了。 laokanke 2012-3-25 13:13：当全社会的价值观、道德观都堕落到只有“金钱”二字上的时候，当国民都不知何为真善美的时候，发生这样的血案也就是理所当然的了（删除部分猜测到的敏感词后看能否显示出来）。史波 2012-3-25 13:08：看到一些评论，总让我想起了911事件后，很多国人或拍手欢呼，或似有理性地分析到这是美国霸权主义的结果，是必然的......; 个人分类: 时事评论|4818 次阅读|3 个评论

社会媒体比烂，但国骂隐含舆情: 热度 3 liwei999 2012-3-20 03:59; 本池有几个是物理出身啊？以后见他们退三舍。都是怎样的炼狱过来的。李剑芒这小子吹嘘小方见他这个师兄躲得远远地，不为别的，就为他学物理而且敢骂街。我感兴趣的是其中的社会媒体的国骂变种。前两天写了个regexp，不知道能抓住它多少：国骂： 1. { ? ? }? /* 你妈了个逼的 */ ? 2 ? 3. ? { ? ? }? /* CAO 你妈的 */ ? 为什么要抓国骂呢？逐臭呢。殊不知多数国骂隐含着负面评价和抱怨，而这正是我必须抽取的舆情。 http://bbs.wenxuecity.com/joke/388913.html ZT：学物理 (且会国骂) 的人你伤不起啊！老子七年前高考一个手贱填了个物理的志愿啊！！！就尼玛走上物理这条不归路了啊！！！迎新典礼里院长说学好物理走遍天下都不怕的啊！！！几年下来老子真特么开了狗眼了神马没见过都不怕啦！！！你们叫嚣着要上一学期物理要学一年物理期末大物好难的啊！！！老子大学四年天天都是物理课啊！！！！电磁学学完了还有电动力学啊！！！狭义相对论学完了还有广义相对论啊！！！经典力学学完了还有量子力学啊！！！量子力学祖师级大牛都特么说了世界上没人懂量子力学的啊！！！有木有的啊！！！特么数学系的人哭天喊地的微分几何，群论，复变函数，泛函分析，我们特么通通都要学的啊！！！！特么超对称、超弦老子提都不想提啊！！！！！导体不好玩要玩超导体的啊！！！！绝缘体不好玩要玩拓扑绝缘体的啊！！！时间特么是虚坐标啊！！！温度特么是虚时间啊！！！温度特么又是质量的倒数啊！！！！这样颠覆世界观的，有木有啊！！！尼玛老子学完场论手表上都不知道怎么看的啊！！！尼玛倒是告诉我温度计上显示的那是什么啊！！！三维空间好好的，要玩四维时空的啊！！！！心情一好还尼玛磕十维十一维的空间啊！！！光速特么还可以不是常数的啊！！！！基本粒子特么还有色有味，尼玛色香味俱全特么感情做菜啊！！！！尼玛说微积分难，你知道你学的是黎曼积分吗！！！解个微分方程99%都没有解析解的啊都特么是近似的啊！！！好好的函数为毛要展开成 Taylor 级数、Fourier 级数、Laurent 级数啊！！！ ∫dθ 等于零的啊！！！∫dθ θ等于 1 的啊！！！！神马 Grassmann 代数微分就是积分、积分就是微分的啊！！！！ 1/xy 特么写成 ∫da/(ax+(1-a)y)^2 这样子，算起来会更简单的啊！！！！ det A 特么写成 ∫dθ dη exp(θAη) 这样子，算起来很方便的啊！！！！尼玛给你个泛函路径积分，你积给我看啊你积啊你积啊！！！尼玛的黑洞啊奇点啊到底是个神马东西啊！！！尼玛不懂爱因斯坦求和那些公式看过去就是一串 ijk 啊！！！尼玛一个公式里几十个英文字母希腊字母都不够用的啊！！！！尼玛一共公式写成分量有四五十个分量一点都不奇怪的啊！！！标准模型一个作用量要写一页纸的啊！！！还特么是最紧凑的写法啊！！！微扰展开展个六级十级的你特么算给我看呀，你算呀你算呀！！！物理的随便个神马变换都是写成一本书的啊！！！宇称变换，电荷共轭变换，时间反演变换！！！这三个货特么还能搅和在一起变的啊！！！变毛啊！！！！ Lorentz 变换，加上个平移变换和转动变换，就叫 Poincaré 变换了啊！！！！升级版还特么有 Super Poincaré 变换的啊！！尼玛命名很开心的啊！！！！还有保角变换，Fourier 变换，Laplace 变化，Legendre 变换，Bogoliubov 变换，都特么是神马啊！！！！你有过一天坐在自习室只做出两道题的经历么！！！！你有过一句“不难证明”从大清早证到图书馆关门都证不出来的经历么！！！你有过一句“不难算得”算掉尼玛十好几张草稿纸的经历么！！！！！计算机都能算到死机的东西特么我们要手算的啊！！！！不难证明，学物理的人你伤不起啊！！！！！【置顶：立委科学网博客NLP博文一览（定期更新版）】; 个人分类: 立委科普|5771 次阅读|4 个评论

有的时候看的是态度而不是道理: 热度 5 cutefay 2012-1-21 19:22; 今天看到一个电视节目之后，再回想起以前的所见所闻，不禁有这样的感慨：有的时候，人们对一个人、一个企业或一个部门，一件事情进行评价的时候，不是看是否讲道理，而是是否态度好。也就是，所谓的理性，是不能用在所有场合的，在很多时候，感性的东西也是很重要的。我觉得做科研的人容易犯的毛病是试图把所有的东西都赋予科学解释，都要讲出个道理来，而人类社会的很多东西，似乎只用科学的角度去看，有很大的局限性。今天我看到的电视上报道了一个人新买的车在两年之内修过30多次，车胎总是有问题，这个人很生气，就在记者的陪同下，去找卖他车的4s店理论。4s店的经理说要必须先鉴定这车胎的问题是外人故意破坏的，还是车胎本身的问题，有了定论之后才能判断4s店是否应该给他换轮胎。这经理说的话从道理上讲是没有问题的，因为的确存在着跟这个人有仇的人故意破坏车胎的可能性，并不一定就是轮胎质量本身的问题。如果经理就按照原本规定的这程序来应付着买家的话，估计记者会添油加醋地报道这家4s店如何不好。所以这个经理很精明，说那我们先给你免费换轮胎，于是买家也无话可说地回去了。所以，在这种情况下，用所谓的道理来应对，是不行的。因为如果因为讲道理而被记者曝光后，看到节目的人肯定会觉得这家4s店太霸道，从而可能影响到这家店的信誉和以后的生意。所以，经理在还不能确定是否自己应该负责的情况下，先负起责任来，顾客和记者就没的说了。这样的结果也是好事，也算是给自己店做个广告。这让我想起一些企业问题而引起的网络舆情事件。在中国，发生这种舆情之后，相关的企业经常是立刻去给个解释，撇清自己和这件事情的关系，结果导致舆情越来越大，然后上级下令彻查此事。如果事情发展至此，无论最后彻查的结果对企业有利还是有弊，企业在这件事情上已经是输了一半了，因为企业之前的态度会失去民心。往往社会大众看的是企业的态度，而对于企业究竟负多大的责任我，往往是次要考虑的事情了。因此，在网络舆情事件的处理上，最重要的是用好的态度先平息民愤，而不要先考虑自己是否在这件事情上受委屈。2011年蓬莱19-3油田溢油事件中，如果根据法律条款，中海油和这件事情没有任何关系，因为根据合同的规定，康菲公司负全责，而民众除了把矛头指向康菲公司之外，还把矛头指向了中海油。中海油虽然觉得委屈，但这个时候，也要对民众的态度负责，要表现出诚恳的态度。; 个人分类: 菲亦所思|3167 次阅读|10 个评论

眼花撩乱：利益博弈下的舆情: 热度 2 陈龙珠 2011-12-14 07:37; 网络发达，啥事哪人咋想的，只要想说肯写，很快就能看到，既能了解国情，也很能满足人们的好奇心。这不，两院院士增选结果公布后，科学网争吵于大海归对科学院院士头衔的不得志，而包括相关少数官员在内的大众，则更高道德地质疑工程院新晋院士谢剑平研究“烟草减害”是为了高效杀人。本博不屑的是，封建因专制遭弃可换来民主，可崇洋就能因面目一新而不谋私利吗？还有，若对未被禁止的卷烟，研究“烟草减害”技术的院士是帮助烟草商高效杀人，那正儿八经研究杀人武器的为啥就可以供奉为民族英雄呢？人类史，不过是一部这里亮剑、那里藏刀的小说而已，争夺物质和精神资源的本质，千秋万代不变。; 个人分类: 社会思考|2334 次阅读|4 个评论

抨击不端，您敬畏事实了吗？: 热度 7 陈龙珠 2011-8-25 08:00; 网络信息发布受行政限制相对较小，传播速度快，对揭露社会各种不端甚至犯罪，正发挥着越来越瞩目的正面作用。然而，这种良好的社会监督机制，正在被一些别有用心（中性词）的人当成达到自己预期目的（中性词）的一种手段。若对此没有一定的法规约束，相关传媒平台又管理不力，则蔓延起来，也将会对当前已颇为争议的社会诚信状态带来雪上加霜的效应。【阅读1】上海交大曹谊林教授回应昔日同事甚至同学对其“人耳鼠”造假和骗取国家数亿科研经费：无所谓的，是黑是白，不是我一个人在做，全国、全世界都在做组织工程。不去调查，就听信个别人来讲述，真的把中国的科学环境搞得很糟糕。 http://epaper.bjnews.com.cn/html/2011-08/25/content_268210.htm?div=-1 【阅读2】交通肇事后杀人已被处死刑的药家鑫之父诉张妙家属王辉的代理人、西安电子科技大学副教授张显“侵犯名誉权”一案的代理律师观点：自由的网络言行也要有所敬畏，不能没有边界。否则，我们每一个人都有可能成为受害者。 http://zqb.cyol.com/html/2011-08/25/nw.D110000zgqnb_20110825_1-11.htm 【阅读3】科学网博客上也经常出现人身攻击其他学者的博文：此处省略N字，不链接凭据实例注：本博部分文中所用 gif 插图源自网络，对原作者一并致谢！; 个人分类: 社会思考|6796 次阅读|12 个评论

舆情非敌情媒体能预警[转载]: halcon 2011-6-17 00:21; 《人民日报》评论部6月16日文章：舆情不是“敌情”，相反，媒体是社会的预警器，它对热点事件、敏感问题的反映和关注，眼前或许会让一些地方政府一时难堪，但从长远来说，对维护人民群众利益、推动社会进步利莫大焉。从一定意义上讲，我们正处在一个媒体事件时代。翻开报纸，转发微博，评论新闻……公众对社会、对政府的关切，大多以媒介为平台。“华南虎”、“躲猫猫”、“钓鱼执法”、“宜黄强拆”，这些借助媒介迅速蹿红全国的符号提醒我们，今天，治理的方式和理念往往通过媒介呈现、传播甚至放大，一个“治理媒介化”的时代已经到来。当公开透明逐渐成为执政共识，知情、参与、表达和监督成为公民基本权利，我们看到，各级政府的媒介意识也在不断提升。新闻发布制度日益完善，新闻发言人不断亮相，越来越多党政干部回复留言板、走进直播间，1700多个政府机构微博随时发布权威信息，各级领导干部面对聚光灯越来越自信自如，这样的变化令人欣喜。当然，变化是一个过程，在总体的发展进步中，一些地方在媒介应对上仍有诸多不足。或是忽视媒介，把媒介当做摆设，很少更新的“沉睡网站”体现媒介意识的淡薄。或是躲避媒介，“杞人忧钴”、“响水逃城”等事件，暴露引导手段的缺失。或是害怕媒介，断定媒介是“找事”的麻烦源，“封、捂、堵、压、瞒”五字诀时有出现，“防火防盗防记者”心态屡有所闻。或是滥用媒介，视之为文过饰非的工具，漠视民意，打压舆论，为某些地方和单位违规行为“背书”。如果说媒介已来到双向交流的2.0时代，那么政府治理同样进入了2.0时代，从高音喇叭、报纸刊物的宣讲，变成了新闻发布、网络留言的互动。如果没有必要的媒介素养，没有回应关注的能力，只知打压甚至封堵，无疑会使“沟通”没有了“通”，只剩下一条无法跨越的“沟”。舆情不是“敌情”，相反，媒体是社会的预警器，它对热点事件、敏感问题的反映和关注，眼前或许会让一些地方一时难堪，但对于我们准确全面地体察民情，保持头脑清醒，大有益处。从长远来说，对维护人民群众利益、推动社会进步利莫大焉，正如一位省委书记所言，“舆论监督也是正面报道”。面对社会转型、体制转轨、思想转变，无论是解说政策、疏导情绪，还是沟通思想、促成共识，都需要媒体来主动设置议题，求同存异、凝聚力量、推动工作。也正是从这个角度，中央领导强调媒体是治国理政的重要资源和手段，各级领导干部必须提高跟媒体打交道的能力，切实做到善待、善用、善管。被各种信息和媒介包围的领导干部，亟需养成对突发事件的新闻敏感和价值判断，学会“新闻执政”。否则，介入迟缓或干预不当，不仅可能“小事闹大，大事闹炸”，而且会消解改革发展共识，损耗政府“无形资产”。对领导干部而言，媒介素养不仅是能力，更是一种心态。有平等的心态，才不会有“替党说话还是替人民说话”的傲慢官腔；有尊重的心态，才不会有“没时间跟你闲扯”的敷衍轻慢；有开放的心态，面对监督才能正视问题而不是列“记者黑名单”；有坦诚的心态，遭遇批评才会反躬自省而不是“诽谤定罪”……说到底，媒介是政府与公众交流沟通的平台，对待媒体的态度，也就是对待公众的态度，这是执政水平和执政理念的一个具体体现和检验。每一起突发事件，处理不好会成为损伤政府公信的消极因素，应对得当则可能是增加政府公信的契机。真诚回应社会关切，积极提振政府公信，自觉维护“无形资产”，是每个党政干部的政治责任。相对于经济发展成就、社会财富积累等“有形资产”，公信力属于“无形资产”。如同有形资产的建树需要集腋成裘，无形资产的聚集也靠点滴积攒。不同的是，政府“无形资产”的流失，却要容易得多、迅速得多。在近年来诸多社会关注的热点事件上，各级政府的不同回应，见证了“无形资产”的消长变化。还记得2009年成都公交大火惨剧发生之后，信息公开的主动、及时，不仅消解了种种疑问、猜想，也使公众和政府“站在一起”去共同面对。而最近的深圳大运会，面对公众对“禁止农民工集体讨薪”的质疑，住建部门追回禁令并公开道歉，不仅呈现了特区的城市精神，也有效地维护了地方的形象。每一起突发事件，处理不好会成为损伤政府公信的消极因素，应对得当则可能是增加政府公信的契机。如果事情出现后不是衔恨披露信息者“瞎捅娄子”，而是尽力促成政府与民众的顺畅互动；事态激化后不是推卸责任，而是着力解决实际存在的问题，那么，我们就会看到化危为机的“双赢局面”——政府提升了公共管理的水平与公信力，百姓实现了正当的诉求和利益的公平。我们有的干部，常误以为虚心听取批评、积极回应质疑，就会失了身份、丢了面子，甚至会削弱权威、消减威信。实际上，任何人都不可能永远正确，任何治理也不可能万无一失，出现批评质疑并不可怕，可怕的是面对矛盾拖延塞责，一错再错。一些突发事件发生发酵的路线图表明，回应失当、进退失据，才是公信受损的症结所在，也才会陷入动辄得咎的“信任困境”：做好事和做坏事一样会受到批评，说真话和说假话一样会被质疑。在社会转型期矛盾凸显期，我们应充分理解治国理政的各种艰难，了解地方政府承担的发展责任，体会广大领导干部面临的现实挑战。但越是这种时候，就越需恪守我们党为人民服务的政党宗旨，越需增强科学发展的执政理念，越需坚定对人心向背的清醒认识：政府公信的“无形资产”，远比经济成就等“有形资产”更为重要。不能让一些地方建起了气派摩登的高楼大厦，却在违规的强拆中离散了人心；构建了四通八达的现代交通，却因工程腐败蚕食了信任；创造了引以为傲的GDP，却让子孙在不断蔓延的污染中承受痛楚。一边建树“有形政绩”，一边流失“无形资产”，这样的发展，这样的行为，怎能不降低“信任指数”？人民信任方可载舟。纵观90年风雨历程，我们党之所以由小到大、由弱到强，走向全国执政，正是因为“为全中国人民谋利益”始终是我们党不变的信念和不懈的追求。这就是为什么中央一再告诫党政干部要“权为民所用、情为民所系、利为民所谋”，当前又特别提出新形势下必须“加强和改进群众工作”、“加强和创新社会管理”。群众利益高于一切，维护群众利益，政府才能赢得人民信任，才能获得奋发作为的价值保障。民心是最根本的执政资源。真诚回应社会关切，积极提振政府公信，自觉维护“无形资产”，是每个党政干部的政治责任。只要从这个高度去认识并身体力行，就能赢得人民群众的支持，同心协力推进国家的现代化建设。在百姓眼里，从善如流、知错即改，远比“一贯正确”更加可信、可敬、可亲。纵观这些年的情况，大凡能够及时回应公众质疑、正确对待社情民意的，往往会在良性互动中提升政府公信力。就此而言，群众的诉求、媒体的监督恰恰是党和政府宝贵的执政资源。今天的中国，民众的诉求日益多元，舆论质疑时有耳闻。各级政府的回应能力，已经成为衡量执政水平、检验执政理念的重要标杆。以近期新闻为例。一是故宫失窃，一是广州“举牌哥”。同样面对质疑，从“失窃”、“错字”，到“经营会所”，故宫的回应左支右绌、差强人意。而广州地铁公司则一周内三次主动回应，约谈学生“举牌哥”，赢得舆论一致好评。仅从回应能力而言，广州更胜一筹。一个重要原因，是广州有过多次面对群众问政的历练。从番禺垃圾焚烧事件到与建委对话的“口罩男”事件，经常面对诉求和质疑，才使得“权力”尊重“权利”的意识日益提高。近些年来，正是在中央“公开及时、准确透明”的明确要求下，在与公众的良性互动中，不少领导干部逐步形成共识：对批评或质疑，不必过于敏感，甚至将其视为不和谐声音，能捂则捂，能压就压；也不能玩弄技巧，将其视为“危机公关”，忙不迭撇清责任。这样的共识，正在促进各级政府执政理念的提升和治理水平的提高。当初的陕西华南虎事件，历时两年不断质疑与被动处置，耗费了极大的社会成本，也透支了地方政府公信。这些年，“躲猫猫事件”、“钓鱼执法事件”、“梧桐让路事件”、“高速公路天价收费案”，政府回应的速度在不断加快，回应的态度在不断改善，回应的方式在不断调整。从被动到主动，从消极到积极，一次次的进步，成为撬动事件解决、提高执政能力的有力支点。尽管也还有“没工夫跟你闲扯”的粗暴、文过饰非的搪塞，但总体而言，面对网络爆料，很少有人再会一厢情愿地怀念“没有互联网”的时代；面对舆论质疑，“无可奉告”之类的遁词不再那么振振有词；面对突发事件，隐瞒、封锁等手段也逐渐不再是“最优选项”。相反，直面质疑，北京市居民水价调整听证会首次上网直播；回应期待，卫生部明确禁止将携带乙肝病毒作为入学、就业的限制条件。迄今为止，已有17个省区市以红头文件的形式，将网友留言办理工作纳入制度轨道。民有所呼，我有所应，正由社会治理的“选答题”变成“必答题”。不少人常有这样的误解，以为没有质疑声音，才算工作平妥；以为掩盖了问题，才算治理有方。事实上，在社会转型、改革攻坚的关键时期，有矛盾暴露，有冲突产生，有分歧出现，正是多元多样利益和价值在寻找渠道相互对话、彼此辩驳。对话胜于对峙，从倾听民众的诉求中改善治理，在回应舆论的质疑中寻求进步，实现政府与社会、公民之间的良性互动，这是现代行政的基本理念。在百姓眼里，从善如流、知错即改，远比“一贯正确”更加可信、可敬、可亲。纵观这些年的情况，大凡能够及时回应公众质疑、正确对待社情民意的，往往会在良性互动中提升政府公信力。就此而言，群众的诉求、媒体的监督恰恰是党和政府宝贵的执政资源。时刻关注民意的温度和风向，以公开透明化解疑虑，以闻过则喜树立公信，以真诚维护群众利益赢得民心，在良性互动中促进社会共识、完善公共治理，这是我们加强和创新社会管理的重要目标和现实途径。; 1419 次阅读|0 个评论

新鲜事“蹭指导”与体验微博: 热度 11 tangchangjie 2011-6-2 08:45; 　　学生要求 “蹭被指导” 今年有位来自另一学院的本科生做毕业论文时，选题为“微博短信息分类”，给笔者写了一份诚恳的“求指”信，希望来我的小组接受跨学院的指导。此事很新鲜，也是对我的信任，虽然当初我还没体验过微博，也很高兴接受了；答应他，我们一起来学微博、研微博。　　可是，这样的好事，未得到有关部门批准。本来，跨学科学习是好事，是新生事物，说不定还可成为管理部门的政绩。虽未走通官方渠道，笔者仍然欢迎他“私下”来“蹭被指导”，对称地，是我去“蹭指导”。　　于是，在我指导的毕业生小组中增加了一位同学，在给同学们修改论文，解答问题时候，一起讨论，相关的信件在小组中群发，与“组织分配”的毕业生同学一视同仁。　　　　多四个“子”，不费多少力 .记得小时候，家里来了不速之客，锅里掺一瓢水，桌上添一双筷子，园里抓一把菜，席上多一片笑声。类似地，今年的毕业论文小组中增加一位同学，只不过多了四个“子”，即：讨论时候多一个椅子，发邮件时多一个信子（址），修改论文时多一篇稿子，从师生关系看，多了一位客座弟子；并不多费力。　　　　如今这位学生的论文已经完成，马上就要答辩了，这一“蹭指导与蹭被指导”的互动也结束了，有下列体会：不跳进水里，还学不会游泳. 开始觉得问题的难点在分类，微博仅仅是众多的分类对象之一；在微博江湖潜水看了一些微博，回答了一些关于分类的问题，修改了若干次论文。经过一段时间，发现，微博的特殊性导致了微博分类的特殊性，不结合这些特殊性，学生论文写不好，老师指导做不好；真个是：不跳进水里，还学不会游泳。　　于是，以学习体验为目的，先以化装舞会参与者的角色，戴着马甲体验了一下；最近在新浪微博上实名开了微博，在刊头词中写了 “过去在科学网上开博《学到老》，今天来体验微博，探究为什么有人为它兴奋为它忙、为它喝彩为它狂”。　　用电脑、也用手机看过和发过微博文，体验到了为什么有人为它兴奋为它忙、还没有体验到为什么有人为它狂。　　各有各的用法微博与科学博客不冲突. 各有各的用法。笔者怀“学到老”的态度，为满足好奇，也爱新鲜，在微博上看得多，写得少;多听年轻人的观点，可以减缓out的速度。大概实践了下列用法：　　知新。微博上可结实许多年轻朋友，了解他们的思维和动向（研究什么，出差到了那里，有什么新鲜事，新鲜话题）；　　链接。如果在科学博客上发了新的博文，则可在微博上发一个链接和内容简介；可能会引进一些新读者，增加一些点击量。　　下面的观点纯属个人爱好：能一两句话说的事，在微博发比在科学博客上更合适；而比较深刻凝重的话题，需要解析为什么，愿意在科学博客上写。　　　　网上麦克风，更大众化. 如果说，博客是网上大字报，则微博是网上麦克风。50岁以上的人可能都见识过大字报和大辩论；须知，拿起麦克说几句话，比拿起笔写大字报更容易；微博主有了想法，开门见山，两三句就表达了观点，像武侠高手过招，点到即止；在机场、在车上，在会间休息时，都可以读写博文，更草根化，更大众化，更移动化，这就是微博。　　　　重于事，轻于因 . 微博有字数限制，但能把发生的事情、时间、地点、人物说清楚。微博常只说是什么、有什么，发生了什么；还不能表达为什么，有厚果薄因的特色。　　　　信息质量与圈子关联大. 微博江湖是有一个个小的社区（圈子）组成的，不同的圈子有不同的风格，不同的博文质量。　　　　敏感的舆情传感器 .微博的转发者可能在没有搞清原因，没有核实事实时，就开始了传递。好事传千里，坏事也传千里（可能坏事传得更快），真消息传千里，假信息也传千里。如果把跨媒体集合比喻成为一个有机体，微博就是其过敏的皮肤，是过敏的舆情传感器。研究公共突发事件的部门，研究舆情的官员，不可漠视微博，更不可鄙视微博。　　　　惯性小，容易转向。因为我的课题组做过关于干预规则挖掘的的自然科学基金项目，三句话不离本行，就要说到干预。微博字数少，惯量也比较小，记微博惯量为m，干预的力度为F，类似于牛顿第二定律，微博在受到干预F时，加速度a=F/m 就比较大。微博的传递空间有摩擦力或粘滞力（怎样建模，怎样描述，尚待研究，或请专家来解释），当施加的干预力撤销后，摩擦力会使得一个话题被淡忘，而被新的话题取代。这蕴含了一个现象，在微博江湖中，比较容易兴风作浪（包括褒义的和贬义的），比较容易掀起潮流；但只要掌握了其动力学规律，就可以引导、可以干预、可以循律促变（看，真的是三句话不离本行）。　　　　值得研究，值得参与. 微博是新事物，是个新技术，不同的社会角色，关心其不同的侧面。技术人关心其传播技术，企业老总关心其盈理机制，舆情研究者关心其内容,… 　　　　关于微博，笔者虽体验还不多，但相信它是值得研究，值得参与，值得关注的。　　据我所知，人民大学的M教授，在微博信息的收集，处理和挖掘方面，有深入的研究，取得了若干好的结果。据悉，他将在科学博客上开博，也许，不久我们就能听到他精彩的解释，笔者在此透露消息，略有冒昧。; 个人分类: 教学科研|10542 次阅读|21 个评论

[转载]网络舆情监控系统——中科点击（军犬网络舆情监控）: 热度 2 hanpu0725 2010-5-21 21:25; 军犬网络舆情监控系统利用互联网信息采集、智能信息处理技术（文本挖掘技术）和全文检索技术，对境内外网络中的新闻网页、论坛、博客、新闻评论，贴吧等网络资源进行精确采集、定向采集和智能分析，提供舆情信息检索、热点信息的发现、热点跟踪定位、敏感信息监控、辅助决策支持、舆情实时预警、舆情监管、统计分析等多层次、多维度的舆情信息的服务，实现用户的网络舆情监测和定向追踪等信息需求，形成简报、报告、图表等分析结果，从而帮助政府、企业及时掌握舆情动向，准确捕捉预警信息，对有较大影响的重要事件快速发现、快速处理，从正面引导舆论和宣传，构建积极向上的主流舆论，并为政府、企业决策提供信息依据。实现对舆情分析提出的目标。对不同的企业和政府职能部门而言，舆情监控的需求既有通用性，也有个性化的特点存在，军犬网络舆情监控系统具有极大的扩展性，凡是需要对舆情、民情、商情关注的政府、企业、行业主管部门都可以通过本系统进行量身打造，建立适合自己的舆情监控体系。网络舆情实时采集舆情自动分类舆情自动关联舆情热点发现网络舆情预警网络舆情的正负面判断舆情信息的多维度挖掘和展现舆情协同办公平台舆情统计分析舆情简报核心技术：网络舆情监控系统是中科点击公司开发的一个体系结构先进、功能强大的面向政府、企业提供网络舆情监测和决策参考的应用系统，广泛地用于舆情监控监测，竞争情报以及风险预警等领域。它的主要功能和性能如下：网络舆情监控系统的核心技术为互联网信息采集技术、自然语言智能处理技术（文本挖掘技术）、全文检索技术和舆情应用技术。 1.1 互联网信息采集技术 1.1.1 强大的信息采集功能强大的信息采集功能是其他所有功能的保障。采集技术不过硬的产品不可能达到有效的舆情监测效果。军犬的数据采集与数据挖掘居全行业之首，为信息的深度处理提供了强有利的保证。 1.1.2 支持各种网络载体的监控可监控各大搜索引擎，新闻门户，BBS，博客，留言版 1.1.3 元数据搜索功能元搜索引擎集成了不同性能和不同风格的搜索引擎并发展了一些新的查询功能。查一个元搜索引擎就相当于查多个独立搜索引擎。进行网络信息检索与收集时，元搜索可指定搜索条件，从而既提高信息采集的针对性又扩大了采集范围的广度，收到事半功倍的效果。 1.1.4 内置数千个监控网站无需过多配置便可轻松对数千网站实施监控。 1.1.5 可监控各种语言，各种编码的网站无需配置自动识别语言和网站编码。 1.1.6 信息智能提取技术网页内容智能提取技术能有效地提取网页中的有效信息，区分网页中的标题、正文等信息项，并对内容具有连续性的多个网页内容进行自动合并、网络论坛信息自动提取等。 1.1.7 结构化采集技术对非结构化的网页数据在采集的时候进行结构化的信息抽取和数据存储，以满足多维度的信息挖掘和统计需要。 1.1.8 全天候不间断监控可定时监控，也可7*24全天候监控。实际应用中可以做到分钟级的采集更新。 1.2 自然语言智能处理技术 1.2.1 自动分词技术采用以词典为基础，规则与统计相结合的分词技术，有效解决了切分歧义。综合利用了基于概率分析的语言模型方法，使分词的准确性达到99%，并可根据不同的应用进行适合特定要求的分词分词速度快。 1.2.2 自动关键词和自动摘要技术在文本语义分析的基础上，综合考虑词频、词性、位置信息，实现准确的自动关键词与自动摘要。同时利用指代消解等技术使得摘要更具可读性。 1.2.3 自动分类技术不需要人工干预的自动分类技术，有效提高非结构化信息的加工效率。文本分类是指计算机根据文本内容进行类别划分的功能。中科点击自动分类技术包括以下两中分类方式： A 基于内容的文本自动分类 B 基于规则的文本分类 1.2.4 自动聚类技术自动聚类技术是基于相似性算法的自动聚类技术，自动对海量的无类别文档进行归类，把内容相近的文档归为一类，并自动为其生成主题词，为确定类目名称提供方便。可应用于自动生成舆情专题，重大新闻事件追踪等等 1.2.5 相似性检索和查重技术基于文档指纹的文本查重技术，支持海量数据的信息查重。相似性检索是指对于给定样本的文本，在文本集合中查找出与之内容相似的其他文本的技术。在实际应用中，找出舆情信息内容几乎相同的文章，实现对舆情信息的消重；根据文章主题相似性，形成专题报道，背景分析等等。 1.3 智能检索技术本系统的全文引擎将传统的全文检索技术与最新的WEB搜索技术相结合，大大提高检索引擎的性能指标。同时融合了多种相关技术，提供丰富的检索手段以及同义词等智能检索方式。军犬舆情监控系统由舆情采集工具（军犬网络信息采集系统）、舆情加工和分析引擎、舆情服务平台、和舆情检索引擎（军犬智能检索系统）四部分组成。系统架构如下图所示：军犬网络舆情监控系统采用B/S与C/S结构相结合的系统架构，利用先进的系统架构，并形成了优势互补，实现基于浏览器的廋客户端或者普通客户端、服务器模式。在军犬网络舆情监控系统中，各部分的主要功能是：（1）军犬网络信息采集系统从互联网采集新闻、论坛、博客、评论等舆情信息，并存储到舆情数据库中，并通过军犬舆情搜索引擎对海量的舆情数据进行实时索引。（2）舆情分析引擎负责对舆情数据库进行智能分析和加工。（3）舆情服务平台把舆情数据库中经过加工处理的舆情数据发布到Web界面上并展示给用户。（4）用户通过舆情服务平台浏览舆情信息，通过简报生成等功能完成对舆情的深度加工。; 个人分类: 技术开发|9791 次阅读|1 个评论

更多...

帐号		自动登录	找回密码
密码			注册

关闭 安全验证

标签: 舆情

相关帖子

相关日志

关闭安全验证