科学网—标签

相关帖子	版块	作者	回复/查看	最后发表

wangdongsheng 2020-2-6 22:53

现在所有的预测大家都感觉不是很靠谱，只好等待卫计委每天数据的播报与累积。最近日本的“钻石公主号”邮轮游客感染武汉肺炎案例，倒是为公众提供了一个好的新型冠状病毒感染传播案例。有点类似我们工程问题研究的“模型试验”！！ “钻石公主号”邮轮上船员与客人共计3700余人。日本方面称，一名80多岁的中国香港男性于1月20日登船，25日在香港下船后被检测出感染新型冠状病毒。3日该船停靠横滨港开始接受检疫检查。目前已采集273名有症状者和密切接触者的样本。在5日首批31份中检出10名感染者，在6日第二批报告中再检出10名感染者。其余报告仍在检测中。从1月20至2月6日这段时间，共计是18天时间，这个目前感染率为20/3700 ，约为万分之54的概率。下面的工作是将其推广至武汉的情况，这个是一项困难的工作：1）邮轮上人员“居住”密集；2）邮轮上人员接触频繁,3) 人员进出（到站停靠，类似流动人口）没有城市多。所以我们要引入一个相似系数来考虑这个问题。用这个相似系数数我们可以估计武汉的感染数（至1月23日封城前）：设武汉人口（常住）1100万X0.0054/（相似系数=5）=5.94万/5=1.188万。考虑时间上的指数增长性，武汉的第1例假定为12月8日（目前认定的官方报道），至1月23日封城共46天，近似是“试验“天数的2.55倍。因此取1.188万的2.55次幂，结果为1.55万，其含义是至1月23日潜在的感染总人数。余下是参数讨论的结果，1）不同相似系数的影向是不同的。相似系数与潜在感染数有近似的正相关关系，若将相似系数扩大到10，则人数为0.2649万。2）人口基数的影响，若将武汉的流动人口500万（见武汉市长访谈）纳入，总人口变为1600万，上述数据分别变为6.25万和1.06万。余下是相似系数的估计：1）钻石公主号邮轮信息可以在百度找到，位列全球十五大豪华邮轮之一，排水量11万6千吨。轮船长290m，宽38m，甲板上18层。我们以类似建筑面积的方式计算人均情况为53平米每人，换算为人口密度，约为1.9万/平方公里。查武汉的统计资料，各区不同，但汉汉区、硚口区和武昌区就都超过这个值，最大值江汉区是2.5万/平方公里。就人口密度二者比例近似是的。2）再看“居住”情况，钻石公主号邮轮舱位规格有四种，但估算下来，人均约7平米；查武汉人均居住面积是35平（2015年统计？？作者有点怀疑偏大），由人均居住面积比可能得到的相似系数是5，这个应该是相似系数的下限。直觉告诉我，相似系数取比这个值大点可能是合适的，所以博文讨论了5和10的两种情况。结论与比较： 1）就武汉肺炎最初的感染数（至1月23日封城），较少估计是0.2649万至1.06万，较多估计是1.55万至6.25万。事实上2月6日已经超过14天，感染者已经发病，这数据读者可以自行评判。 2）与香港研究者数据的比较：香港大学研究团队利用SIR模型，认为截至2020年1月25日，武汉预计有95% CrI 37304-130330人数感染？？（博文没有考证，数据源于网络），论文发表在国际知名期刊“柳叶刀”。 3）英国兰卡斯特大学等同样基于SIR模型预测结果显示，至1月20号，武汉市约有3500名感染病例（预测区间3050-4017），从2020年初到21日，预计总感染人数约为11000余例（预测区间9217-14245）。特别强调：本文仅是学术讨论，供大家参考。不信谣！不传谣！！！

0 个评论

《生物统计学》教材提纲——试验设计数据分析、计量经济学与流行病学

dzrdez 2019-3-23 10:16

《生物统计学》教材提纲 outline of Biostatistics 一，试验设计 Ⅰ Experiment design 二，采集和记录数据 Ⅱ Collection and recording of data 三，单变量分析 Ⅲ Univariate 1，估计 1 Estimate 2，比较 2 Comparison 3，相关 3 Correlation 4，回归 4 Regression 四，多变量分析 Ⅳ Multivariate 1，降维 Reduction 主成分分析 Principle component analysis, PCA 偏最小二乘 Partial least square, PLS 正交化偏最小二乘 Orthogonal partial least square, OPLS 2，聚类 Clustet 3，独立分析 Indepent compent analysis 4，多元线性回归 Multivariate linear regression 5，联立方程 Equation group 五，非参数分析 Ⅴ Nonparameter 1，率的检验 Test of ratio 2，逻辑斯谛回归 Logistic 3，生存分析 Survival analysis 六，非线性 Ⅵ Nonlinear 1，混沌动力学 Chaotic dynamics 2，复杂性与自组织 Complicity and self-organization 【正文待续】To be continued.

2313 次阅读|0 个评论

状态估计的新框架？！

JRoy 2018-12-14 14:59

50 年代末到60 年代初, 航天技术的发展涉及到大量的多输入多输出系统的最优控制问题, 用经典控制理论已难以解决. 数字计算机的出现使得亨利￠庞加莱(1875-1906) 的状态空间表述方法可以作为被控对象的数学模型和控制器设计与分析的工具.于是产生了以极大值原理、动态规划和状态空间法为核心的现代控制理论。 1. 经典状态空间法： State Space Model 状态空间模型包括两个模型：一是状态方程模型，反映动态系统在输入变量作用下在某时刻所转移到的状态；二是输出或量测方程模型，它将系统在某时刻的输出和系统的状态及输入变量联系起来。如下 : 离散状态空间模型. 其中， k 为离散时间， x k 为状态变量， y k 为观测， u k ,v k 为噪声。 f k (.)为状态模型， h k (.) 为观测模型。状态空间模型提供一种方便、有效的时序递归的贝叶斯最优估计框架，因此有了坚实的理论基础。开山之作就是卡尔曼滤波，见下文的回顾： Approximate Gaussian Conjugacy: Parametric Recursive Filtering under Nonlinearity, Multimodality, Uncertainty, and Constraint, and Beyond, Frontiers of Information Technology Electronic Engineering, 2017, 18(12):1913-1939, ＬＩＮＫ其中特别值得一提的是，哈佛终身教授何毓琦院士1964年发表于TAC的经典文章最早（之一）阐释了卡尔曼滤波和贝叶斯最优估计的关系。这极大助力了后来卡尔曼滤波的蓬勃发展，至今已有近六十年（因为一个方法关联一个伟大的理论，将如虎添翼！）： Ho, Y., Lee, R., 1964. A Bayesian approach to problems in stochastic estimation and control. IEEE Trans. Autom. Contr., 9(4):333-339. 状态空间模型的假设条件是动态系统符合马尔科夫Hidden Markov Model (HMM)特性，即上面的 x k = f k ( x k- 1 , u k ) ，即给定系统的现在状态，则系统的将来与其过去独立；这给建模和递归计算带来了极大方便。然而，HMM受限很多，对真实世界的刻画并不一定准确甚至有效，特别是，随着传感大数据时代的到来，其一些弊端日益突出. 毕竟我们今天的传感器和外界条件和卡尔曼、何院士的60年代完全不可同日而语: 目标变得越来越狡猾，难以用简单的HMM建模。特别是系统统计信息缺失(如不知道目标的运动模型，不知道系统噪声、甚至观测噪声模型，以及各种的复杂系统关联、时滞和耦合等等)，根本无法构建较为准确甚至有效的的状态空间模型， 2. 抛弃HMM：对于传感器数据越来越多，传感器精度越来越高的情况，是否可以有新的解决方案（HMM弃之不用）呐？见：如果我有成百上千个传感器，是否还需要动态模型？以及轻松多传感器多目标探测与跟踪！这类方案主要应对完全未知系统背景，但数据量很大的情况 Remember that all models are wrong; the practical question is how wrong do they have to be to not be useful. -- Box, George E. P.; Norman R. Draper (1987). Empirical Model-Building and Response Surfaces, p. 74 3. 数据驱动的新框架：既然经典方法成也萧何（HMM）败也萧何（HMM），除了弃之不用（太过消极了点）之外，更恰当的解决方法是寻找一个更符合自然规律和更能够准确描述真实世界的替代模型。下文提出了一种取代HMM的新框架： Joint Smoothing, Tracking, and Forecasting Based on Continuous-Time Target Trajectory Fitting, IEEE Trans. Automation Science and Engineering, Oct. 2018. DOI:10.1109/TASE.2018.2882641. @ IEEE Xplore Pre-print @ arXiv:1708.02196 Joint Smoothing and Tracking Based on Continuous-Time Target Trajectory Function Fitting 论文中提供了程序源代码(链接) Abstract: This paper presents a joint trajectory smoothing and tracking framework for a specific class of targets with smooth motion. We model the target trajectory by a continuous function of time (FoT), which leads to a curve fitting approach that finds a trajectory FoT fitting the sensor data in a sliding time-window. A simulation study is conducted to demonstrate the effectiveness of our approach in tracking a maneuvering target, in comparison with the conventional filters and smoothers. 基于数据驱动的估计新框架（与基于HMM的经典状态空间法的思路相比）的核心在于将HMM替换为一个连续时间上的目标轨迹曲线函数 FoT (Function of Time) x k = f ( t ) , 从而将传统的滤波、平滑与预报等估计问题转化为一个连续时间窗内的曲线拟合和参数学习问题，即可用一个参数化的函数近似曲线轨迹函数： F ( t ; C k ) ≈ f ( t ) , 其中 C k 为待求参数。从而可以采用聚类、拟合与机器学习等数据驱动的工具与方法解决复杂场景下的（多）目标探测、跟踪与预报问题，这样就有望克服传统方法严重依赖目标模型假设、机动探测时滞、对错序数据敏感等难题。如下图所示：上图中，左侧为经典的滤波估计方法： KF : Kalman Filter, AGC : Approximate Gaussian Conjugacy, PF : Particle Filter, MHT :Multiple hypothesis tracking, FISST :Finite-Set Statistics. 等等.....近六十年的发展，出现了非常多的理论和方法。右侧为数据驱动的新范式： O2 : Observation-only ， C4F : Clustering for Filtering ， F4S ：Fitting for Smoothing ， FTC ： Flooding-then-Clustering -， T-FoT : Trajectory Function of Time。两者均采用相同的观测模型 y k = h k ( x k , v k ) , 但是不同的状态模型: 经典状态空间法采用HMM，新范式采用轨迹FoT。一提到曲线拟合或者回归分析，可能会觉得计算效率低，不如递归迭代计算所以不能满足实时性？事实上：对于线性观测系统，那么只需要线性拟合，并一般定义量测误差为范数2的马氏距离，曲线拟合退化为加权最小二乘直接给出，计算效率胜过线性卡尔曼滤波。对于非线性观测系统进行线性拟合如多项式拟合，拟合需要往往需要迭代近似。对于非线性观测系统下的曲线拟合计算效率至关重要的是参数的初始化， C k = C k -1 + ρ k 可大大加速计算效率（甚至一两步的梯度下降法就可以搜索到收敛的参数估计），从而可能使得拟合的计算效率扩展卡尔曼滤波（需要计算雅可比阵）还快 --- 这可能超出我们直觉想象 -- 不试不知道！更进一步，如果系统含有约束条件呐？仍然可以有效解决，请参考下文： 4. 约束下的SSM和轨迹曲线拟合： Single-Road-Constrained Positioning Based on Deterministic Trajectory Geometry Tiancheng Li， IEEE Communications Letters (Volume: 23, Issue: 1 , Jan. 2019) pp.。 80-83 论文中提供了程序源代码(链接) Abstract: We consider the single-road-constrained estimation problem for positioning a target that moves on a single, deterministic and exactly known trajectory. Based on the geometry of the trajectory curve, we cast the constrained estimation problem as an unconstrained problem with reduced state dimension. Two approaches are devised based on a Markov transition model for unscented Kalman filtering and a continuous function of time for (weighted) least square fitting, respectively. A popular simulation model has been used for demonstrating the performance of the proposed approaches in comparison to existing approaches. 请参考论文。下面给出该短文关键部分的一些截图。

个人分类: 科研笔记|6351 次阅读|1 个评论

轻松多传感器多目标探测与跟踪！

热度 2 JRoy 2018-9-13 00:56

在几乎所有（有关传感器的）参数和（有关目标的）模型条件均未知的情况下，怎么做到：采用一个无线传感网（节点之间还可能非相互独立）去探测、跟踪未知数目的一群目标？传统上来说，就是采用一个传感器去跟踪估计一个目标，滤波器的设计也往往要基于准确的传感器参数（比如噪声统计特性、杂波率、漏检率等）和相对准确的目标模型信息（否则就需要构建多模型或者自适应模型进行近似或学习逼近），这些所涉及的参数和模型，任何一个未知都会给估计跟踪带来很大困难！比如常常借助于有效的系统辨识或者参数学习机制等等，滤波器才能够有效运行。那么一堆传感器（特别是分布式网络链接起来）和一堆目标呐，什么属性都完全未知的时候呐？不仅仅是数量的升级，还可能带来传感器之间和目标之间的交互关联等复杂问题！这就使得多传感器多目标跟踪成为一个更为棘手的难题！大道至简，难到一定程度的问题也许可以用简单的方法解决！请看下文所提出的一中 Lazy Networking Approach: 轻松网络协作方法，只需要Flooding 和 Clustering两个操作，就可以应对各种参数和模型未知，方法简单计算快、效果可以胜过提供了真实参数和模型信息的传统滤波器（也就是先不让滤波器去操心参数和模型未知的问题，给它们最理想的条件）！ Distributed Flooding-then-Clustering: A Lazy Networking Approach for Distributed Multiple Target Tracking Authors: Tiancheng Li ; Juan M Corchado ; Huimin Chen Abstract: We propose a straightforward but efficient networking approach to distributed multi-target tracking, which is free of ingenious target model design. We confront two challenges: One is from the lack of statistical knowledge about the target appearance/disappearance and movement, and about the sensors, e.g., the rates of clutter and misdetection; The other is from the severely limited computing and communication capability of the low-powered sensors, which may prevent them from running a full-fledged tracker/filter. To overcome these challenges, a flooding-then-clustering (FTC) approach is proposed which comprises two components: a distributed flooding scheme for iteratively sharing the measurements between sensors and a clustering-for-filtering approach for target detection and position estimation from the local aggregated measurements. We compare the FTC approach with cutting edge distributed probability hypothesis density (PHD) filters that are modeled with appropriate statistical knowledge about the target motion and the sensors. A series of simulation studies using either linear or nonlinear sensors, have been presented to verify the effectiveness of the FTC approach. Published in: https://ieeexplore.ieee.org/document/8455759 DOI: 10.23919/ICIF.2018.8455759

个人分类: 科研笔记|3907 次阅读|8 个评论

估计 Largest Lyapunov exponent 的 matlab 程序搜集（网址）

zlyang 2018-8-26 12:50

估计 Largest Lyapunov exponent 的 matlab 程序搜集（网址）（1）Lyapunov exponent estimation from a time series. Documentation added version 1.2.0.0 (2.49 MB) by Alan Wolf A Matlab version of the Lyapunov exponent estimation algorithm of Wolf et al. -- Physica 16D, 1985. https://ww2.mathworks.cn/matlabcentral/fileexchange/48084-lyapunov-exponent-estimation-from-a-time-series-documentation-added （2）Largest Lyapunov Exponent with Rosenstein's Algorithm version 1.1.0.0 (1.61 KB) by mirwais This code calculates the largest lyapunov exponent of time series with Rosenstein's Algorithm. https://ww2.mathworks.cn/matlabcentral/fileexchange/38424-largest-lyapunov-exponent-with-rosenstein-s-algorithm （3）LYAPROSEN: MATLAB function to calculate Lyapunov exponent Shapour Mohammadi (shmohammadi@gmail.com) (University of Tehran) https://ideas.repec.org/c/boc/bocode/t741502.html 感谢您的指教！感谢您指正以上任何错误！感谢您提供更多的相关资料！

5744 次阅读|0 个评论

如果我有成百上千个传感器，是否还需要动态模型？

热度 12 JRoy 2017-10-30 07:46

传感器的飞速升级主要表现在两个方面 1. 硬件质量的快速升级，变得越来越高精。比如 1976 年发射的第一个电子成像卫星 KH11 所携带的当时最先进的相机成像精度是 800X800( 还不到一百万 ) 像素，而今天随处可见的智能手机的像素都轻松在千万级别。另外，更主要的说，传感器的扫描频率越来越高！从分钟级别到毫秒微秒！ 2. 价格的巨幅跳水导致，大量传感器协同的应用 Joint massive deployment 。现在一个千万级别像素的手机摄像头不过几十元造价，且得益于WIFI的快速发展，构建传感网轻而易举，协作不但可以大大提高精度和观测范围等，而且可以有效应对单个的“不工作”和外在的攻击等。据传美军在中东沙漠“撒播”大量探测微小型传感器，探测恐怖分子地面部队移动，根本不担心很多的一些被当地居民或者恐怖分子“打捞”，因为量大呀！真可谓土豪越来越多，什么问题？多买几个传感器得了，费那劲搞什么提升5%的算法改进去呐！这种情况下，一些基于传感器的数据的算法开发是否需要本质性的升级或者说更新？比如，滤波跟踪研究？特别是，已有很清晰的数据显示：当传感数据质量很高的时候（无论传感器扫描频率还是精度，以及高探测率和低漏检低杂波率等），滤波器就会变得对于状态动态模型的偏差和误差（基本所有的基于模型的滤波器都是基于对外界的假设近似，都含有误差甚至偏差）非常非常敏感！见之前一文的点对点分析： http://www.sciencedirect.com/science/article/pii/S0020025515006969 T.Li, J.M. Corchado, J. Bajo, S. Sun and J. F. Paz, Effectiveness of Bayesian Filters : An Information Fusion Perspective , Information Sciences , 2016, 329: 670-689 而清晰地事实是，传感器硬件的进步不会停止，只会更快！越来越高精，越来越“眼里揉不进沙子”对模型的任何误差偏差不稳定等等敏感，而导致模型不但没用反而成为累赘甚至帮倒忙！在数据贫乏和低效的时候（传说的物资匮乏的年代），很多目标假设模型等还非常有用甚至非常必要，但是当数据量多而好的时候呐？而且又当我们对外界基本一无所知、目标等又特别狡猾（建模非常困难，而且冒着巨大误差和偏差风险；更何况道高一尺魔高一丈呐，对方的目标也变得机动和反建模反锁定啊）呐 ? 难道我们不断地打补丁一个模型套一个模型般地维护着传统理论和方法，小打小闹的不断改进改进在改进，要让脚来适应鞋子（比如某款滤波器）吗？是否可以抛弃滤波器，采用纯粹的数据聚类学习来解决滤波问题？见新文展示的一种聚类方法实现目标探测和估计： FreeLink T. Li, F. De la Prieta Pintado, J. M. Corchado, J. Bajo, Multi-source Homogeneous Data Clustering for Multi-target Detection from Cluttered Background with Misdetection ,Applied Soft Computing 60 (2017) 436–446 @ ScienceDirect . （集中式多传感器） T. Li, J.M. Corchado, H. Chen, Distributed Flooding-then-Clustering: A lazy networking approach for Distributed Multitarget Tracking , 21th Int. Conf. on Information Fusion ( FUSION’18 ) , Cambridge, UK, July 10-13, 2018, pp. 2415 - 2422 . IEEE Xplore （分布式多传感器的假设更具有实际意义）这可能对于计算机领域做纯粹聚类算法的人来说是个小 case – 但本文主要展示的核心理念是拿 clustering 来做完全 filtering，场景和目标模型及个数等完全处于黑箱内。模型完全未知对于做滤波来说的是个棘手问题。。如果你有 4 个传感器，你该如何利用传感器的优势解决模型的劣势。而实际上，退一步讲，聚类结果也可以反过来和传统滤波器结合。下文即展现了一种基于传感数据聚类分析的新的概率假设密度（PHD）滤波器。其将不同传感器的测量数据集合、聚类转换为一组合成的代理、同源测量数据。这些合成测量取代原始量测数据可以实现线性PHD更新，克服了虚警和漏检数据以及未知传感器统计信息的挑战。适用于集中式或点对点分布式网络链接的多个甚至大量传感器下的多目标跟踪。 Tiancheng Li ; Javier Prieto ; Hongqi Fan ; Juan M. Corchado， A Robust Multi-Sensor PHD Filter Based on Multi-Sensor Measurement Clustering ，IEEE Communications Letters, 2018, Vol. 22 , no. 10 ，pp. 2064 - 2067. 量变到一定程度就会引起质变！最新的研究进展特意强调并展示了：如果有任何模型信息（包括模糊的，语言描述的非精确的统计信息）的话，还（也）可以怎么融合模型和数据 T. Li, Single- road-constrained positioning based on deterministic trajectory geometry, IEEE Communications Letters, 2018. DOI: 10.1109/LCOMM.2018.2879478 @ IEEEXplore 上文展示了，基于道路几何约束的经典状态空间模型下的滤波跟踪与基于所提出的曲线拟合新方法对比 T. Li , H. Chen, S. Sun and J. M. Corchado. Joint Smoothing, Tracking, and Forecasting Based on Continuous-Time Target Trajectory Fitting , IEEE Trans. Automation Science and Engineering, @ IEEE Xplore . Pre-print @ arXiv:1708.02196 （预引版更详细）上文主要的基础性贡献是将HMM替换为一个连续时间上的目标轨迹曲线函数 f(t)，从而将将传统的滤波、平滑与预报等估计问题转化为一个连续时间函数拟合和参数学习问题，从而可以采用聚类、拟合分析与机器学习等数据驱动的工具与方法解决复杂场景下的多目标探测、跟踪与预报问题，这样就有望克服传统方法严重依赖目标模型假设、机动探测时滞、对错序数据敏感等难题 \0 相关连接博文：轻松多传感器多目标探测与跟踪！

个人分类: 科研笔记|14499 次阅读|35 个评论

不用滤波器的滤波！

热度 6 JRoy 2017-1-20 09:19

信号和信息科学领域，非线性估计与滤波是一个持久不衰的主题，而主流Markov-Bayes理论统治这个领域太久太流行了。。。然而科学不是一成不变的真理条条，科研的兴趣在于不牢记教条、尝试突破不断超越兴许别有洞天。尤其是随着时代进步，硬件条件升级，也会促进理论格局变化。。比如很简单：一个百万像素级别的高速摄像机需要解决的传感问题跟一个KB级别的黑白相机能一样吗？下文给出一种不用滤波器的滤波去杂方法（思想简单，但是意味深远），承接上文： Effectiveness of Bayesian filters: An information fusion perspective 链接： Clustering for filtering: Multi-bject detection and estimation using multiple/massive sensors Highlights • Multi-sensor multi-object detection and estimation is solved by a clustering approach. • Accommodate little prior information about targets, background and sensors. • Neither sophisticated modeling nor unrealistic assumption is required. • Outperform state-of-the-art filters in average multi-sensor cases. Abstract Advanced multi-sensor systems are expected to combat the challenges that arise in object recognition and state estimation in harsh environments with poor or even no prior information, while bringing new challenges mainly related to data fusion and computational burden. Unlike the prevailing Markov-Bayes framework that is the basis of a large variety of stochastic filters and the approximate, we propose a clustering-based methodology for multi-sensor multi-object detection and estimation (MODE), named clustering for filtering (C4F), which abandons unrealistic assumptions with respect to the objects, background and sensors. Rather, based on cluster analysis of the input multi-sensor data, the C4F approach needs no prior knowledge about the latent objects (whether quantity or dynamics), can handle time-varying uncertainties regarding the background and sensors such as noises, clutter and misdetection, and does so computationally fast. This offers an inherently robust and computationally efficient alternative to conventional Markov–Bayes filters for dealing with the scenario with little prior knowledge but rich observation data. Simulations based on representative scenarios of both complete and little prior information have demonstrated the superiority of our C4F approach. 进一步的研究：能够不需要任何传感器参数和场景假设的【参数自学习】的多源传感数据聚类 Multi-source Homogeneous Data Clustering for Multi-target Detection from Cluttered Background with Misdetection

个人分类: 科研笔记|10296 次阅读|10 个评论

对狂犬病发病率的估计，WHO错了？

热度 25 yanjx45 2014-1-9 11:43

狂犬病的发病率可区分为两种：　实际发病率（SF）和自然发病率（ZF）。实际发病率（SF）是通过直接调查统计实际的死亡人数获得的客观数值。自然发病率（ZF）是在假定不进行暴露后处置（主要指不接种疫苗）的情况下的发病率，需要根据一些间接的相关参数和理论模型进行估算，通常误差较大，争议更多。如果获得了这两个数值，就可以推算出疫苗挽救的病人人数（YW）：疫苗挽救的病人人数　＝　自然发病率 - 实际发病率（YW＝ZF－SF）反过来，如果能先推算出较可靠的“ 疫苗挽救的病人人数（YW） ”，也可获得较可靠的自然发病率（ZF）：　实际发病率 + 疫苗挽救的病人人数 =自然发病率（SF＋YW＝ZF）在WHO《关于狂犬病疫苗的立场文件（2010年8月6日）》中，WHO宣称：全球“每年约有 5.5 万人死于狂犬病。” “据估计，如果未施行暴露后预防，亚洲和非洲每年死于狂犬病的人数约为 32.7 万。” 即WHO认为，全球狂犬病的实际发病率为每年 5.5万人，自然发病率为每年 32.7万人。后者是前者的大约 6倍。这意味着每年疫苗挽救的病人人数为 27.2 万人，大约是实际发病率的 5倍。 WHO 的上述结论论据不足，明显地都是过高的估计，其中疫苗挽救的病人人数（YW）还高得离谱。首先讨论对狂犬病实际发病率的估计。对有关被忽视的热带疾病（neglected tropicaldiseases ）负担的估计存在相当大的争议，而对狂犬病直接导致的死亡率估计的争议则可能是最激烈的。 WHO 也承认，在许多发展中国家，对狂犬病缺乏完善的监测、报告系统，经常误诊，缺乏相关部门间的协调，结果可能导致无法获得全球狂犬病负担的可靠估计。 WHO 对全球狂犬病死亡人数的说法最近已发生了一些变化。 2013 年7月3日正式发布的《WHO狂犬病专家谘询会第二次报告（英文版）》（ http://blog.sciencenet.cn/blog-347754-713177.html ），第1章第3节是“ 全球的狂犬病负担 ”，其中首先介绍了对全球狂犬病死亡人数的一种较低的估计数：由美国华盛顿大学健康指标与评估研究所（IHME， InstituteforHealthMetrics and Evaluation, Seattle, WA, USA ）发布的估计数是 26,400 人（95％CI为15,200-45,200）（CI为置信区间）（按“总体死因”模型方法）。本博主认为，WHO　原来关于全球每年狂犬病的实际发病率 5.5万人的说法偏离了实际情况，而 2.64 万的数字更加科学、可靠。再讨论对全球狂犬病的自然发病率和疫苗挽救的病人人数的估计。要讨论此类问题，目前在全球只有中国能提供相对较系统、完备的基本统计数据。所以这种讨论必须也只能以中国为范例和出发点。只有首先弄清中国的相应数值，才可能进一步推算或估计全球的相应数值。人狂犬病目前只在发展中国家流行，而在有狂犬病流行的发展中国家中，中国是唯一将狂犬病作为法定应上报和统计的传染病的国家。其他发展中国家的相关统计数字或者完全是空白，或者只是一种非常粗略的估计，可信度很低，在抽样调查中常常被证明相差百倍甚至千倍，几乎没有参考价值。中国的相关统计数字尽管也可能存在相当大的误差，但有一些旁证材料可验证其相对合理性，所以有重要参考价值，可作为进一步讨论的基础。以中国为典型案例，依据相对可靠的统计数据来进行评估和延伸推测，所得的结果与原来由国外某些WHO专家仅凭个人的印象和感觉所推断出来的结果相比，肯定要更接近实际一些。中国是全球狂犬病疫苗的头号生产国和使用国。中国每年狂犬病疫苗的使用量已达1500万人份，占全球80%以上的份额。如果要统计狂犬病疫苗挽救的病人的数目，中国的结果应当是最有代表性、最有份量的了。然而实际的统计显示，在中国，每年近乎疯狂地使用的大量狂犬病疫苗挽救的人数其实并不多，与WHO的估计相去甚远。（参见博文： http://blog.sciencenet.cn/blog-347754-756717.html ）据中国CDC监测系统最近十年的抽样统计，中国人群在狂犬病暴露后的疫苗接种复盖率平均只有12% ，即将近90%的人在被狗咬后并未接种狂犬病疫苗（或者说，每年中国被狗咬伤的人中只有大约1成的人接种了疫苗）。考虑到抽样和统计误差，可保守地估计中国每年被狗咬的人中有1/3都接种了疫苗，只有2/3未接种疫苗，即中国未接种疫苗的人数是接种疫苗人数的2倍。因此可推断：中国每年因接种狂犬病疫苗而生命得到挽救的人数（YW）不会超过当年狂犬病实际死亡人数（SF）的 1/2 ，这与WHO关于YW是SF 5 倍的估计相去甚远。特别是中国还普遍存在低风险人群（即城市和非疫区人群）大量、盲目、反复接种狂犬病疫苗的情况，而重点疫区（特别是偏远农村）有相当多应当接种疫苗的高风险病人却因经济等原因未能接种疫苗。中国近年每年狂犬病死亡人数平均约为2,000人。按50%计算，中国每年因接种狂犬病疫苗而挽救的病人人数可能不足1,000人。近期中国每年狂犬病疫苗的使用量超过1000万人份，所以平均至少1万人份疫苗才可挽救一条人命。再来看全球其他有狂犬病流行的发展中国家。这些国家大都是比中国在经济上要落后得多的国家。由于中国人用狂犬病疫苗的用量超过全球用量的80%，中国仍有将近90%被狗咬的人未接种疫苗，所以推测这些国家被狗咬过的人群中接种疫苗的人数不会超过5%。假定全球除中国以外的所有国家每年狂犬病实际死亡人数是 2.5万人，即占所有被咬人群95%的未接种过疫苗的人中死亡了 2.5 万人，那么另5%的打过疫苗的人中真正的狂犬病人推算应当只有 1,250 人。即预期疫苗挽救的病人人数（YW） ”只占实际发病率（SF）的1/20，而不可能是WHO估计的 YW是SF 的大约 5 倍，即在全球范围，人狂犬病的实际发病率与自然发病率（ZF）的差别其实很小。　对全球狂犬病发病率的分析，可以得出与对中国的分析相同的结论：人用狂犬病疫苗对降低全球人狂犬病发病率的实际贡献并没有原来预期的那么大，其中滥用和浪费占的比例很大。人用狂犬病疫苗不可能根本解决全球的狂犬病问题。狂犬病疫苗大量用于人而不用于狗，这是狂犬病疫苗的最大滥用。解决狂犬病问题主要靠兽用疫苗而不是人用疫苗。全球所有的发达国家和部分发展中国家已经消除了人狂犬病，它们已经提供了成功的经验。　　　所有正承受狂犬病危害的国家或地区只有尽快将狂犬病疫苗接种的重点由人转向狗，才可能实现 WHO 倡导的在全球消除狂犬病的目标。

个人分类: 狂犬病防治|23771 次阅读|72 个评论

全球8.5级以上地震的震源体粗略估计

seisman 2013-2-18 17:17

壳下地震活动的研究 (5) 全球 8.5 级以上地震的震源体粗略估计陈立军根据 ANSS 地震目录，自 1963 年以来，全球发生过 5 次 8.5 级以上的地震（表 1 ）。其中， 2005 年印尼的 8.6 级地震其实是以 2004 年 9.0 级地震的余震形式发生的，因此全球独立的 8.5 级以上地震只有 4 次。对于这 4 次 8.5 级以上地震，取其震后 2 年内的地震活动分析，发现它们的震源体特征是有较大区别的。表 1 1963 年以来全球 8.5 级以上地震目录年月日时分秒纬度经度震级深度地点备注 20041226 005853 3.29 95.98 9.0 30 印尼 20050328 160936 2.08 97.10 8.6 30 印尼余震 20100227 063411 -36.12 -72.89 8.8 22 智利 20110311 054624 38.29 142.37 9.1 29 日本 20120411 083836 2.32 93.06 8.6 20 印尼 20120411 104310 0.80 92.46 8.2 25 印尼双震型 1 印尼 2004 年 12 月 26 日的 9.0 级地震印尼 2004 年 12 月 26 日的 9.0 级地震，震后 2 年内地震活动的地理分布如图 1.1 所示，三维立体分布见图 1.2 ，震源深度时序图见图 1.3 。由这 3 张图可见，印尼 2004 年 12 月 26 日的 9.0 级地震震后 2 年内地震活动的地理分布面积约为 48 万平方公里（以每平方度约为 1 万平方公里计，下同），震源深度密集分布在 20 ～ 50km 范围内，因而估计震源体大小约为 1440 万立方公里。图 1.1 印尼 2004 年 12 月 26 日的 9.0 级地震震后 2 年内地震活动的地理分布图 1.2 印尼 2004 年 12 月 26 日的 9.0 级地震震后 2 年内地震活动的三维立体分布图 1.3 印尼 2004 年 12 月 26 日的 9.0 级地震震后 2 年内地震活动的震源深度时序图 2 智利 2010 年 02 月 27 日的 8.8 级地震智利 2010 年 02 月 27 日的 8.8 级地震，震后 2 年内地震活动的地理分布如图 2.1 所示，三维立体分布见图 2.2 ，震源深度时序图见图 2.3 。由这 3 张图可见，智利 2010 年 02 月 27 日的 8.8 级地震震后 2 年内地震活动的地理分布面积约为 16 万平方公里，震源深度密集分布在 10 ～ 50km 范围内，因而估计震源体大小约为 640 万立方公里。图 2.1 智利 2010 年 02 月 27 日的 8.8 级地震震后 2 年内地震活动的地理分布图 2.2 智利 2010 年 02 月 27 日的 8.8 级地震震后 2 年内地震活动的三维立体分布图 2.3 智利 2010 年 02 月 27 日的 8.8 级地震震后 2 年内地震活动的震源深度时序图 3 日本 2011 年 03 月 11 日的 9.1 级地震日本 2011 年 03 月 11 日的 9.1 级地震，震后 2 年内地震活动的地理分布如图 1.1 所示，三维立体分布见图 1.2 ，震源深度时序图见图 1.3 。由这 3 张图可见，日本 2011 年 03 月 11 日的 9.1 级地震震后 2 年内地震活动的地理分布面积约为 28 万平方公里，震源深度密集分布在 10 ～ 70km 范围内，因而估计震源体大小约为 1680 万立方公里。图 3.1 日本 2011 年 03 月 11 日的 9.1 级地震震后 2 年内地震活动的地理分布图 3.2 日本 2011 年 03 月 11 日的 9.1 级地震震后 2 年内地震活动的三维立体分布图 3.3 日本 2011 年 03 月 11 日的 9.1 级地震震后 2 年内地震活动的震源深度时序图 4 印尼 2012 年 04 月 11 日的 8.6 级地震印尼 2012 年 04 月 11 日的 8.6 级地震，震后 2 年内地震活动的地理分布如图 1.1 所示，三维立体分布见图 1.2 ，震源深度时序图见图 1.3 。由这 3 张图可见，印尼 2012 年 04 月 11 日的 8.6 级地震震后 2 年内地震活动的地理分布面积约为 16 万平方公里，震源深度密集分布在 10 ～ 60km 范围内，因而估计震源体大小约为 800 万立方公里。图 4.1 印尼 2012 年 04 月 11 日的 8.6 级地震震后 10 月内地震活动的地理分布图 4.2 印尼 2012 年 04 月 11 日的 8.6 级地震震后 10 月内地震活动的三维立体分布图 4.3 印尼 2012 年 04 月 11 日的 8.6 级地震震后 10 月内地震活动的震源深度时序图表 2 全球 8.5 级以上地震震源体粗略估计年月日时分秒纬度经度震级深度震源体 * 地点 20041226 005853 3.29 95.98 9.0 30 1440 印尼 20100227 063411 -36.12 -72.89 8.8 22 640 智利 20110311 054624 38.29 142.37 9.1 29 1680 日本 20120411 083836 2.32 93.06 8.6 20 800 印尼 * 震源体单位：万立方公里 5 几点说明 (1) 上述 4 次 8.5 级以上地震震源体大小的粗略估计如表 2 所示。 (2) 各个时序图表明在壳内强震活动后深部 100 ～ 200km 均出现明显的扰动，以图 2.3 最为鲜明，呈几个月的波动，似乎是对壳内地震活动的能量补给。 (3) 日本 9.1 级地震震源体牵扯的深度最大，可达 70km ，其余地震均在 50km 左右。究其原因，可能与日本地震柱深部能量的持续补给有关 ( 图 5) 。由图 5 可见，日本 9.1 级地震震源体深部有一条细细的补给线，其画面如同放风筝一般。其余 3 次强震未见同样图像。 (4) 除智利外，其余各时序图均有 10km 和 33km 两条深度密集线，显然这些地方震源深度的精度并不是很高的。 (5) 发表在 2012 年 9 月 27 日出版的《自然》杂志上的 3 篇论文，（认为）分裂印度—澳大利亚板块的地质应力很可能导致了（印尼 2012 年 04 月 11 日） 8.6 级和 8.2 级的大地震（据 http://news.sciencenet.cn/htmlpaper/201292816293733625970.shtm ）。这种说法还被英国《新科学家》周刊网站 12 月 26 日的文章列为 2012 年的“十大环境新闻”之一（据 2012.12.28 《参考消息》第 7 版）。由本文分析可以看到，这两次地震的影响范围很有限，比起 2004 年的印尼 9.0 级地震简直是小巫见大巫，如何切割偌大的“板块”呢。如果说这两次地震显示 2004 年的印尼 9.0 级地震导致了印尼地震柱有向西扩展的趋势倒还说得过去。图 5 日本 2011 年 03 月 11 日的 9.1 级地震震源体的深部特征（ 2013.2.18 初稿）

3542 次阅读|0 个评论

对目前流感流行形势的估计

qujiangwen 2013-2-16 10:20

现代流感世纪之交大流行有人将此与1918年西班牙大流感相提并论现代流感最为显著的特点，是在20世纪与21世纪新旧世纪之交大流行。时间范围是1999年11月至2000年4月，欧洲、美洲、亚洲均发生中度以上流感流行，其中最为严重的为法国，流行高峰时发病率达每10万人中有861人感染。与往年同期相比，这次流感的发病人数并未增加，引发流行的毒株仍然是H3N2亚型。我国受到的危害也较为严重。以北京为例，1998年至1999年流感流行期间，流行高峰时发病率高达26.49%，非高峰期也有10%的发病率。同样，在2000年1月，据英国首席医疗顾问利马·唐纳森教授估计，全国约5900万总人口中，平均每300人/10万人遭到流感袭击；而在苏格兰地区，平均每540人/10万人染上流感。短短数天，至少有50万人染病，而且染病人数一直呈急剧上升之势，这次流感被认为是英国11年来最严重的流感暴发。1989年，英国暴发的流感死亡人数2.6万。当时人们的关注焦点似乎在电脑的千年虫病毒，但没有想到，生物病毒首先袭击了英国人。由此，英国媒体戏谑，“感冒虫比千年虫威力更大”。同样，2000年新年一过，加拿大的多伦多、蒙特利尔和温哥华等大城市，多家医院都出现流感病人爆满的情况，使得当地卫生部门迅速批准缓解流感症状的首种药丸“Tamiflu”上市。 2000年，感冒同样没有放过美国，最初在西岸暴发，首先出现在加利福尼亚州和亚利桑那州，此后蔓延至包括纽约、宾夕法尼亚、新泽西、佛吉尼亚、马里兰等19个州和首都华盛顿。如同1918年的流感，在美国，流感通常先在阿拉斯加开始，继而南移入侵美国西岸，然后抵达东岸。流感出现的季节通常在12月至翌年3 月。 2000年初，继英国、美国和加拿大相继暴发流感后，欧洲其他国家也相继出现流感潮，其中法国的患者多达数百万人。法国传染病监察机构“警戒站”说，在法国肆虐的流感，到1月5日已有近100万人受感染。从12月27日至1月3日期间，平均每10万人中有741人患病。根据法国卫生部门的规定，如果每10万人中有157人受流感影响，就被视为疫症。因此2000年初的法国也被视流感疫区。同样，意大利2000年初也暴发流感，初步统计每1000人中就有4人患病，患者病情持续3天~4天，引起并发症的病人可能有近万人。这次流感连雀鸟也不能幸免，当局捕杀了200万只雀鸟。而荷兰全国流感中心统计，2000年该国平均10万人中有260人发病，患病人数达全国总人口的10%~20%。在西班牙，流感病例比1999年多出30%，在南斯拉夫，流感病例达5年来的最高峰，贝尔格莱德有4万~10万人患流行性感冒。2000年初，阿尔巴尼亚流感的大规模暴发已导致至少数十人死亡，拉脱维亚有5人死于流感。挪威、丹麦、芬兰、瑞典、捷克、德国、保加利亚和以色列等国，都不同程度地受到流感肆虐。 http://www.stdaily.com/other/dzkj/2009/0505/5-4.htm

个人分类: 流感进展|1 次阅读|0 个评论

基于距离的权重回归、估计

hyalone 2013-2-4 20:41

回归时如果有异常点，会增大回归偏差，异常点是难界定的，因此数据量大时剔除异常点就变得不太可行。回归时如果给每个点设置权重，权重的取值与回归中心的距离负相关，就可以在不剔除异常点的情况下回归，且基本不受异常点的影响。这种回归对预测、估计很有用，对某个点Y值的估计，参考X值取值，用已知样本对X值进行回归、估计，离X值距离近的权重大、距离远的权重小，估计Y时更准确。方法用优化方法解决，权重可取范围，目标是X回归的离差平方和＋距离权重的偏离平方和。缺失值处理同理，也可以用这种方法，但计算量会比较大。

个人分类: 统计|3019 次阅读|1 个评论

暑期学校的主题：热核估计

zhouda1112 2010-7-31 23:53

暑期学校已经结束。这几天都忙着分享在美国的生活体验，还没有机会跟大家讨论本次来美国真正的主题。利用这次机会，跟大家聊聊康奈尔的概率暑期学校。康奈尔概率暑期学校已经办了六届（含本次），每一次主办方会确定一个主题，然后邀请该领域最权威的若干位专家为来自世界各地的概率研究学子授课。本次暑期学校确定的主题是热核估计。热核估计(heat kernel estimation)，字面理解就是针对热核这个量做一些上下界的估计。首先什么是热核？数学中很多领域都关心热核，粗略来讲，它就是一个以时间和空间为自变量的函数，所以在一定物理背景之下，热核能表征一个沿着时间变化的量，在不同区域的取值。这里我介绍两个引入热核的角度：1）偏微分方程：热核就是热方程的基本解。换句话说，热核表征了不同时间，热（温度）在区域内的分布；2）概率论：热核对应了某个随机过程（马氏过程）沿着时间变化的概率密度。所以，热核在偏微分方程和概率论中都处于非常核心的地位。但是可惜的是，准确算出热核在绝大多数情况下是不太可能的，因此关于热核的大部分工作都是期望给出热核比较精细的上下界估计。大家熟悉的丘成桐教授早年也做过热核估计方面的工作。当然热核的概念现在变得更加广泛。比如在图，甚至是随机图上，我们同样可以定义类似的热核，然后给予它相应的估计。那热核估计在概率中的用处有哪些。比如，大家关心图上随机游动的常返性或者两个随机游动的相遇问题。而在相应的热核估计问题得到解决之后，常返性问题就往往是直接的推论。总而言之，热核刻画了随时间变化的转移密度，原则上说，对转移密度的刻画是对过程最直截的刻画。加上研究热核的过程中，会联系多个重要的数学分支，所以热核估计问题是不折不扣的好数学。据说，Perelman在证明poincare 猜想的工作中，就用到了热核估计方面的一些内容。当然，我本人离热核估计的研究相距甚远，热核估计又是一个很深很广的领域，很多细致的东西很难在此跟大家讲明白，大家有兴趣可以参阅本次暑期学校的网页 http://www.math.cornell.edu/~cpss/ ，至少可以领略多位从概率角度讨论热核的顶尖专家。

个人分类: 概率论问题讨论|9299 次阅读|2 个评论

答：评论人：huayuwu姐 [2010-5-5 18:38:35]

ccpicasso 2010-5-5 20:28

发表评论人： huayuwujie 博主：即使是有信念，估计都宁愿躺着这样比较舒服。粉丝：那么请问问在医院里躺着的人是否舒服？在战场上流血躺着的是否舒服发表评论人： huayuwujie 博主：即使是有信念，估计都宁愿躺着这样比较舒服。华域无界：那么请问问在医院里躺着的人是否舒服？在战场上流血躺着的是否舒服答：为什么之间相隔仅仅 21 秒，却换了两个名字把华域无界改为粉丝了呢还是觉得华玉武姐比华域无界好听吧哎，其实不必这样较真吧，厚道点哦，呵。其实，你发现了么，在即使舒服里面有两个字估计，咱不说这个不较真文章中我实际的意思是说，考虑到当前各方面的压力迫使大家，压得大家气喘吁吁，可能坚挺信念是心有余力不足，而且，你知道，人都是有惰性的，当然妥协是比较容易的。再者说，妥协了的也还是可以有信念的，只不过的没有坚挺，却仍然信守啊。是吧，华玉武姐？哈。

个人分类: 答复读者|3049 次阅读|2 个评论

帐号		自动登录	找回密码
密码			注册

关闭安全验证

标签: 估计

相关帖子

相关日志

关闭 安全验证

标签: 估计

相关帖子

相关日志

关闭安全验证