科学网

 找回密码
  注册

tag 标签: 多项式

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

[转载]bootstrps 、bagging与 boosting
hailuo0112 2012-6-1 22:27
bootstrps bagging boosting这几个概念经常用到,现仔细学习了一下: 他们都属于集成学习方法,(如:Bagging,Boosting,Stacking),将训练的学习器集成在一起,原理来源于PAC学习模型(Probably Approximately CorrectK)。Kearns和Valiant指出,在PAC学习模型中,若存在一个多项式级的学习算法来识别一组概念,并且识别正确率很高,那么这组概念是强可学习的;而如果学习算法识别一组概念的正确率仅比随机猜测略好,那么这组概念是弱可学习的。他们提出了弱学习算法与强学习算法的等价性问题,即是否可以将弱学习算法提升成强学习算法。如果两者等价,那么在学习概念时,只要找到一个比随机猜测略好的弱学习算法,就可以将其提升为强学习算法,而不必直接去找通常情况下很难获得的强学习算法。 bootstraps: 名字来自成语“pull up by your own bootstraps”,意思是依靠你自己的资源,它是一种有放回的抽样方法,学习中还发现有种叫jackknife的方法,它是每一次移除一个样本。 bagging: bootstrap aggregating的缩写。让该学习算法训练多轮,每轮的训练集由从初始的训练集中随机取出的n个训练倒组成,初始训练例在某轮训练集中可以出现多次或根本不出现训练之后可得到一个预测函数序列h.,… …h 最终的预测函数H对分类问题采用投票方式,对回归问题采用简单平均方法对新示例进行判别。 –(训练 R 个分类器 f i ,分类器之间其他相同就是参数不同。其中 f i 是通过从训练集合中 (N 篇文档 ) 随机取 ( 取后放回 )N 次文档构成的训练集合训练得到的。–对于新文档 d ,用这 R 个分类器去分类,得到的最多的那个类别作为 d 的最终类别.) boosting: 其中主要的是AdaBoost(Adaptive Boosting)。初始化时对每一个训练例赋相等的权重1/n,然后用该学算法对训练集训练t轮,每次训练后,对训练失败的训练例赋以较大的权重,也就是让学习算法在后续的学习中集中对比较难的训练铡进行学习,从而得到一个预测函数序列h 一…h其中h.也有一定的权重,预测效果好的预测函数权重较大,反之较小。最终的预测函数H对分类问题采用有权重的投票方式,对回归问题采用加权平均的方法对新示例进行判别。(类似 Bagging 方法,但是训练是串行进行的,第 k 个分类器训练时关注对前 k-1 分类器中错分的文档,即不是随机取,而是加大取这些文档的概率). Bagging与Boosting的区别: 在于Bagging的训练集的选择是随机的,各轮训练集之间相互独立,而Boostlng的训练集的选择是独立的,各轮训练集的选择与前面各轮的学习结果有关;Bagging的各个预测函数没有权重,而Boosting是有权重的;Bagging的各个预测函数可以并行生成,而Boosting的各个预测函数只能顺序生成。对于象神经网络这样极为耗时的学习方法。Bagging可通过并行训练节省大量时间开销。   bagging和boosting都可以有效地提高分类的准确性。在大多数数据集中,boosting的准确性比bagging高。在有些数据集中,boosting会引起退化。---Overfit 文本分类中使用的投票方法( Voting ,也叫组合分类器)就是一种典型的集成机器学习方法。它通过组合多个弱分类器来得到一个强分类器,包括 Bagging 和 Boosting 两种方式,二者的主要区别是取样方式不同。 Bagging 采用均匀取样,而 Boosting 根据错误率来取样,因此 Boosting 的分类精度要优于 Bagging 。投票分类方法虽然分类精度较高,但训练时间较长。 Boosting 思想的一种改进型 AdaBoost 方法在邮件过滤、文本分类方面都有很好的性能。
个人分类: Adaboost|4066 次阅读|0 个评论
数学物理笔记(三)无穷级数展开
热度 1 qianlivan 2012-5-8 21:30
仔细观察可以发现下面的式子是恒等式 \begin{equation} \frac{{\rm d}}{{\rm d}t}\sum^{n}_{m=1}(-)^m (z-a)^m\varphi^{(n-m)}(t)f^{(m)} =(z-a)\varphi^{(n)}(t)f' +(-)^n(z-a)^{n+1}\varphi(t)f^{(n+1)} \end{equation} 对于$\varphi(t)$是$t$的$n$次多项式的情况,式子两边乘以${\rm d}t$,从0到1积分,注意到$\varphi^{(n)}(t)=\varphi^{(n)}(0)$可以得到达布(Darboux)公式 \begin{equation} \varphi^{(n)}(0)\{f(z)-f(a)\}=\sum^{n}_{m=1}(-)^{m-1} (z-a)^m\{\varphi^{(n-m)}(1)f^{(m)}(z)-\varphi^{(0)}(t)f^{(m)}(a)\}+(-)^n(z-a)^{n+1}\int^1_0\varphi(t)f^{(n+1)} {\rm d}t \end{equation} 若$\varphi(t)$是伯努利多项式$\varphi_n(t)$,将$n$换为$2n$。令$F(x)=f'(x)$,$z-a=h$,可以得到 \begin{equation} \int^{a+h}_aF(x){\rm d}x=\frac{h}{2} +\sum^{n}_{k=1}\frac{(-)^k h^{2k} B_k}{(2k)!} +\frac{h^{2n+1}}{(2n)!}\int^1_0\varphi_{2n}(t)F^{(2n)}(a+ht){\rm d}t. \end{equation} 将$a$换为$a+h$,$a+2h$,...$a+(m-1)h$,将结果相加,得到欧勒公式 \begin{equation} \int^{a+mh}_aF(x){\rm d}x=h\left\{\frac{F(a)}{2}+F(a+h)+...+F +\frac{F(a+mh)}{2}\right\}+\sum^{n}_{k=1}\frac{(-)^k h^{2k} B_k}{(2k)!} +\frac{h^{2n+1}}{(2n)!}\int^1_0\varphi_{2n}(t)\sum^{m-1}_{s=0}F^{(2n)}(a+hs+ht){\rm d}t. \end{equation}
个人分类: 知识|5194 次阅读|4 个评论
数学物理笔记(一)伯努利多项式
qianlivan 2012-5-6 08:39
伯努利多项式是一种正交多项式,其生成函数为(王竹溪,郭敦仁《特殊函数概论》) \begin{equation} \frac{te^{xt}}{e^t-1}=\sum^{\infty}_{n=0}\frac{t^n}{n!}\varphi_n(x) \end{equation} 对$\frac{t}{e^t-1}$和$e^{xt}$分别进行展开,再和生成函数公式中的同幂次项进行比较可以得到$\varphi_n(x)$的明显表达式 \begin{equation} \varphi_n(x)=\sum^n_{k=0} \left( \begin{array}{c} n\\ k\\ \end{array} \right) \varphi_k x^{n-k} \end{equation} $\varphi_k$的递推公式 \begin{equation} \varphi_0=1,\ \ \ \ \sum^{n-1}_{k=0}\frac{1}{k!(n-k)!}\varphi_k=0 \end{equation} 可以由生成函数得到。 使用生成函数也可以直接证明互余宗量定理 \begin{equation} \varphi_n(1-x)=(-)^n\varphi_n(x) \end{equation} 和加法公式 \begin{equation} \varphi_n(x+y)=\sum^n_{k=0} \left( \begin{array}{c} n\\ k\\ \end{array} \right) \varphi_k(x)y^{n-k} \end{equation} 伯努利多项式的另一个吸引人的性质是加法公式 \begin{equation} \varphi_n(mx)=m^{n-1}\sum^{m-1}_{r=0}\varphi_n\left(x+\frac{r}{m}\right) \end{equation}
10553 次阅读|0 个评论
逼近函数的构造(II)—拟合
热度 1 zjmjz 2012-4-12 23:24
逼近函数的构造(II)—拟合 背景 :用曲线近似地刻画平面上离散数据点组所表示的坐标之间的函数关系问题。 定义 :求一个函数y=f(x)使其通过或近似通过数据点序列(x i ,y i )(i=1,2,...,m),用多项式函数(常见类型)通过最小二乘法求得此拟合函数。 方法 :最小二乘原理(最佳平方逼近) 函数 :选择简单合适的函数来拟合未知函数 应用 :拟合曲线,超定方程组的最小二乘解等 NOTE: 1 选择函数后 注意将非线性拟合转化为线性拟合 2 推广到曲面拟合 3 结合方差分析考虑回归分析 4 利用数据散点特征,经验选取合适的函数。 5 运用Matlab编程求解拟合曲线曲面
个人分类: 教学札记|5040 次阅读|2 个评论
多项式的伙伴矩阵
zjzhang 2012-4-11 21:58
多项式 的伙伴矩阵定义为
个人分类: 矩阵论|3802 次阅读|0 个评论
逼近函数的构造(I)—插值
热度 1 zjmjz 2012-4-11 12:33
逼近函数的构造(I)—插值 背景 :所得采样数据信息具有较高的真实性和可靠性。 问题 :被插值函数的复杂性和未知特点需构造简单函数(如代数多项式、三角多项式等)来近似表示未知函数。 条件 :在节点处条件完全吻合。 方法 :Lagrange插值,Newton插值,Hermite插值,样条插值,有理插值,连分式插值等。 分析 :误差估计,插值的存在性,唯一性,适定性,不可达点(插值函数验证时不能满足插值条件的节点)分析等。 NOTE: 1 Lagrange插值结构对称、简单易于记忆,然而不具有承袭性。 2 Newton插值结构利用差商作为多项式的系数易于记忆且具有承袭性。 3 Hermite插值注意应用于带导数的插值,对插值函数的光滑性要求较高。 4 Spline插值(大部分会用 cubic spline),该方法是避免一味追求精度和提高次数可能会出现的Runge现象而提出。 5 当被插值函数在某节点处无界或当自变量趋于无穷时有固定的常数时,采用Rational插值和Continued fractional插值效果较好。特别是连分式插值具有递推公式,便于计算插值函数。 6 应用时根据需要灵活选择相应的插值方法。 7 应用案例 Conventional computerised tomography systems (CT) are usually equipped with polyenergetic X-ray sources, which prevents accurate density measurements because of the general CT-image artefact called beam hardening (BH). BH results in false gradients of the linear attenuation coefficient in the CT cross section images, indicating a non-existent density or composition gradient in the imaged object. A number of methods have been proposed to correct for, or limit the effect of, beam hardening. One of these is called linearisation of the CT-data, in which the polyenergetic CT-data are transformed to monoenergetic CT-data. This requires knowledge of the CT-data as a function of object thickness. Data points to derive this function are usually measured using a set of samples of different object material thicknesses at the imaging parameter settings used and fitted with a polynomial. However, the sample preparation makes this method tedious to use. In this work a simulation method has been developed, which can accurately simulate the polyenergetic CT-data for any arbitrary object material and thickness if a priori information of the object material density and composition exists. The simulation method requires detailed knowledge of the imaging system, that is, X-ray energy spectra, detector response and information transfer from detector to digitised data. Besides developing the simulation tool, it has been shown that one of the major difficulties with this BH-correction method is to accurately determine the curvature of the function representing the polyenergetic CT-data. Earlier proposed endorsements to fit a second-degree polynomial to the polyenergetic CT-data are not sufficient to describe its curvature, at least a polynomial of degree eight or higher is required. Here cubic-spine interpolation is used, which avoids the problem. (1998)"Correction for beam hardening artefacts in computerised tomography." J Xray Sci Technol 8(1): 75-93.
个人分类: 教学札记|4501 次阅读|2 个评论
矩阵的特征多项式
热度 1 zjzhang 2012-4-9 11:55
定理. 设 表示 的所有 阶主子式的和, 则 的特征多项式为 注记. 特征多项式是矩阵的连续函数.
个人分类: 矩阵论|4340 次阅读|2 个评论
多项式操作特性
xiaoxinghe 2012-4-8 16:45
多项式操作特性 conv(a, b) 乘法 =deconv(a, b) 除法 poly(r) 用根构造多项式 polyder(a) 对多项式或有利多项式求导 polyfit(x, y, n) 多项式数据拟合 polyval(p, x) 计算多项式中多项式值 =residue(a, b) 部分分式展开式 =residue(r, p,k)部分分式组合 roots(a) 求多项式的根 __________________________________________ mmp2str(a) 多项式向量到字符串变换,a(s) mmp2str(a, ' x ') 多项式向量到字符串变换,a(x) mmp2str(a, ' x ', 1) 常数和符号多项式变换 mmpadd(a,b) 多项式加法 mmpsim(a) 多项式减法 code.pdf
个人分类: Matlab|2706 次阅读|0 个评论
多项式操作
xiaoxinghe 2012-4-8 15:58
//************** 根 ************** 1 求线性方程的根:输入多项式系数:P= ,r=roots(P),规定多项式是行向量,根是列向量。。 2 根据根构造多项式:pp=poly(r),real(pp);因为MATLAB无隙地处理复数,当用根重组多项式时,如果一些根有虚部.则poly的结果有一些小的虚部,这是很普通的.只要使用函数real抽取实部. *************** 乘法 ************ 函数conv支持多项式乘法(执行两个数组的卷积) 系数a= ,b= ,c=conv(a,b),d=a+b M文件代码: ———————————————— 调用;test(c,d),c,d要先赋值多项式的系数。 %加法和减法(减法时,调用参数改为-d即可) function p=mmpadd(a,b) % mmpadd Polynomial addition % mmpadd(A,B) adds the polynomial A and B if nargin2 error('Not enough input arguments') end a=a(:).'; %make sure inputs are polynomial row vector %使输入的的为行向量 b=b(:).'; na=length(a); nb=length(b); p= + ; %增加必要的系数00000 ———————————————————————— 除法: =deconv(c , b) %结果是b被c除,给出商多项式q和余数r,在现在情况下r是零因为b和q的乘积恰好是c 求导:polyder,h=polyder(g) --------------**** 估值:****--------------------------------- 函数polyval来完成 x=linspace(-1, 3) ; % choose 100 data points between -1and 3. p= ; % uses polynomial p(x) = x^3+4x^2-7x-10 v=polyval(p , x) ; %计算计算x值上的p(x),把结果存在v里。然后用函数plot绘出结果 plot(x , v),title(' x^3+4x^2-7x-10 '), xlabel(' x ') %绘制出结果 //*******有理多项式: 有理多项式由它们的分子多项式和分母多项式表示,对有理多项式进行运算的两个函数,residue和polyder.函数residue 执行部分分式展开 test.m
个人分类: Matlab|2515 次阅读|0 个评论
[转载]data assimilation
lvlisuccess 2012-3-25 16:47
1、插值法:由已知的离散因变量的值来估计未知的中间插值的方法。插值法又称“内插法”,是利用函数f (x)在某区间中若干点的函数值,作出适当的特定函数,在这些点上取已知值,在区间的其他点上用这特定函数的值作为函数f (x)的近似值,这种方法称为插值法。如果这特定函数是多项式,就称它为插值多项式。 2、最优插值法:在均方根误差最小约束下进行插值的方法。 3、逐步订正法:以反比于网格点和测站间距离的平方为权重, 在某范围内求各站初估值和观测值之差的加权平均作为该点的初估值的订正, 再逐步缩小范围求新的订正的分析方法。 三维四维变分同化通过一种最优的方式把观测资料和背景场信息有机的结合起来形成最佳的模式初值。三维变分资料同化是目前世界许多业务预报中心普遍使用的一种模式初始化工具,因为它比四维变分资料同化经济得多。但该方法最主要的缺点有两个:一个是它把同化窗口 内不同时刻的观测资料都当作是同一t0时刻的观测资料,这实际上假设了天气状况在该同化窗口内是静止不变,显然与实际情况不符,会明显引起误差而影响同化的质量;另一个是它缺乏模式约束,尽管它可以包含一些简单的方程约束和平衡关系,但远远不能起到模式约束的作用,难以保证初值与模式的协调性。为了克服三维变分资料同化的缺点,四维变分资料同化显然是一个好的选择,它能产生一个与模式协调的、在同化窗口内通过模式解的轨迹最优拟合观测资料的初值。然而,由于目标函数中模式约束的引入,给四维变分资料同化中目标函数梯度的计算带来了很大的困难,尽管伴随技术对此给出了很好的解决方案,但梯度的计算仍然需要花费巨大的计算量。另外,伴随模式也不是在短时间内能够完成的,以至同化系统的建立需要较长的周期。尤其,由于现有最优化算法的局限性,其收敛性因模式约束的引入而降低,并因初猜场的粗糙而往往收敛不到最小值,而是收敛到局部极值,从而严重影响了四维变分同化所应有的效果。这些缺点正是导致它没有三维变分资料那样流行的主要原因,尤其是伴随模式的巨大计算量成为了阻碍该方法全面推广应用的最大瓶颈。因此,怎样最大限度减少四维变分资料同化的计算量变成了一个十分紧迫和意义重大的问题。
2725 次阅读|0 个评论
[转载]关于Origin的多项式拟合
willzhang198 2012-3-24 22:03
[转载]关于Origin的多项式拟合
Origin软件提供了多种非线性拟合工具,可以在“分析”菜单栏下找到。其中的多项式拟合对于许多不规则的函数曲线有比较好的拟合功能,一般需要选择合适的阶数才能达到比较好的拟合效果。下面针对一个实际例子,说明在应用多项式拟合功能时需要注意的问题。以某两列数据为例,其图形如下图: 上图中空白圆点为给定的数据点,而红线为多项式拟合得到的曲线,其项数取为9阶,对应的多项式表达式为: Y =-0.19458+1.80324E-4*X-5.26164E-9*X^2-7.17185E-13*X^3+4.99335E-17*X^4 -1.3961E-21*X^5+2.11857E-26*X^6-1.83728E-31*X^7+8.59577E-37*X^8-1.68907E-42*X^9 相关系数R^2=0.99179,与给定数据点拟合很好。但使用该表达式时需要特别注意,在X比较大的情况下,多项式的高次项将会对计算结果产生较大的影响。图中的红点是采用上述表达式得到的对应X点处的Y值,在X=80000时,函数值即与实验点和曲线发生了较大偏离。很明显,这是由于小数点舍入误差的原因造成的,因此,这个表达式还不能应用。否则在取较大X值时将产生发散现象。对于这个问题,有两种处理方法: 1、加大多项式中小数点后的位数,从而保证精度; 2、适当降低多项式的阶数,将高次项的影响降低,从而得到合理的曲线。 第一种方法这里不再述及,给出第2种处理方法。如下图: 从上图可以看出,按阶数=6得到的表达式可以应用。用Fortran计算得到的离散点(红点)与实验数据吻合的也较好。附Fortran程序: program test implicit none integer x,y,time,tmax real ft,A,b1,b2,b3,b4,b5,b6 parameter(A=-0.36515,B1=2.84281E-4,B2=-2.36972E-8,B3=7.33018E-13,B4=-1.07321E-17,B5=7.56699E-23,B6=-2.07544E-28) open(unit=10,file='ft.txt') tmax=100000 do time=0,tmax,10000 ft=A+B1*(time)+B2*(time)**2.0+B3*(time)**3.0+B4*(time)**4.0+B5*(time)**5.0+B6*(time)**6.0 write(10,*) time,ft enddo close(10) end 从上面的实例可以看出,在进行多项式拟合时,多项式阶数的选择是比较关键的。
6927 次阅读|0 个评论
[转载]NP-hard NP问题
热度 1 ivymissjlu 2011-7-5 09:48
就是没有一个多项式可以表示,需要运用穷举等方法可以得到答案,如旅行商问题等。 上午在看廖老师关于anysee的文章时看到了NP-hard一次,NP问题早就听说过,一直搞不懂它的真正含义。百度了一下,有不少忽悠的文章。挑出了一篇好的。 1.NP 是 Non-deterministic Polynomial 的缩写(意思就是非确定性的多项式时间),NP 问题通俗来说是其解的正确性能够被很容易检查的问题,这里"很容易检查"指的是存在一个多项式检查算法。 2.NP-complete 问题是所有 NP 问题中最难的问题。它的定义是,如果你可以找到一个解决某个 NP-complete 问题的多项式算法,那么所有的 NP 问题都将可以很容易地解决。 3.通常证明一个问题 A 是 NP-complete 需要两步,第一先证明 A 是 NP 的,即满足容易被检查这个性质; 第二步是构造一个从某个已知的 NP-complete 问题 B 到 A 的多项式变换,使得如果 B 能够被容易地求解,A 也能被容易地解决。 4.我们定义凡对一个问题中最重要的参数 n 而言,若能找到一个方法可以以方次上升的计算量完成,我们称此问题为一 P-问题(P 为英文多项式 Polynomial 之第一字母),包含所有此类问题之集合以 P 表示之。 5.到目前为止,我们尚不知道 P 之外是否是一个空集合。 6.在60年代,已有些人把某些问题归于一类了,即是几个问题是互依的,若其中之一若属于 P,则其它几个也属于 P,其证明方法大都是证明两个互依问题中间有一个只需要用 O(nk) 时间来完成的桥梁。直到1971年古克 (Stephen A. Cook) 发表了〈The Complexity of Theorem Proving Procedures〉才把 P 之外约问题归成了三大类,即 NP, NP-complete 及 NP-hard 4 。 转载如下: 摘自太傻BBS:《第一个 NP-complete 问题》 NP 是 Non-deterministic Polynomial 的缩写,NP 问题通俗来说是其解的正确性能够被很容易检查的问题,这里"很容易检查"指的是存在一个多项式检查算法。 例如,著名的推销员旅行问题(Travel Saleman Problem or TSP):假设一个推销员需要从香港出发,经过广州,北京,上海,…,等 n 个城市, 最后返回香港。 任意两个城市之间都有飞机直达,但票价不等。现在假设公司只给报销 $C 块钱,问是否存在一个行程安排,使得他能遍历所有城市,而且总的路费小于 $C? 推销员旅行问题显然是 NP 的。因为如果你任意给出一个行程安排,可以很容易算出旅行总开销。但是,要想知道一条总路费小于 $C 的行程是否存在,在最坏情况下,必须检查所有可能的旅行安排! 这将是个天文数字。 NP-complete 问题是所有 NP 问题中最难的问题。它的定义是,如果你可以找到一个解决某个 NP-complete 问题的多项式算法,那么所有的 NP 问题都将可以很容易地解决。 通常证明一个问题 A 是 NP-complete 需要两步,第一先证明 A 是 NP 的,即满足容易被检查这个性质; 第二步是构造一个从某个已知的 NP-complete 问题 B 到 A 的多项式变换,使得如果 B 能够被容易地求解,A 也能被容易地解决。这样一来,我们至少需要知道一个 NP-complete 问题。 第一个 NP complete 问题是 SAT 问题,由 COOK 在 1971 年证明。SAT 问题指的是,给定一个包含 n 个布尔变量(只能为真或假) X1,X2,…,Xn 的逻辑析取范式,是否存在它们的一个取值组合,使得该析取范式被满足? 可以用一个具体例子来说明这一问题,假设你要安排一个 1000 人的晚宴,每桌 10 人,共 100 桌。主人给了你一张纸,上面写明其中哪些 人因为江湖恩怨不能坐在同一张桌子上,问是否存在一个满足所有这些约束条件的晚宴安排? 这个问题显然是 NP 的,因为如果有人建议一个安排方式,你可以很容易检查它是否满足所有约束。COOK 证明了这个问题是 NP-complete 的,即如果你有一个好的方法能解决晚宴安排问题,那你就能解决所有的 NP 问题。 这听起来很困难,因为你必须面对所有的 NP 问题,而且现在你并不知道任何的 NP-complete 问题可以利用。COOK 用非确定性图灵机( Non-deterministic Turing Machine ) 巧妙地解决了这一问题。 正式地,NP 问题是用非确定性图灵机来定义的,即所有可以被非确定性图灵机在多项式时间内解决的问题。非确定性图灵机是一个特殊的图灵机,它的定义抓住了"解容易被检查" 这一特性。非确定性图灵机有一个"具有魔力的"猜想部件,只要问题有一个解,它一定可以猜中。例如,只要存在哪怕一个满足约束的晚宴安排方式,或是一个满足旅行预算的行程安排,都无法逃过它的法眼,它可以在瞬间猜中。在猜出这个解以后,检查确认部分和一台普通的确定性图灵机完全相同,也即是等价于任何一个实际的计算机程序。 COOK 证明了,任意一个非确定性图灵机的计算过程,即先猜想再验证的过程,都可以被描述成一个 SAT 问题,这个 SAT 问题实际上总结了该非确定性图灵机在计算过程中必须满足的所有约束条件的总和(包括状态转移,数据读写的方式等等),这样,如果你有一个能解决该 SAT 问题的好的算法,你就可以解决相应的那个非确定性图灵机计算问题,因为每个 NP 问题都不过是一个非确定性图灵机计算问题,所以,如果你可以解决 SAT ,你就可以解决所有 NP 问题。因此,SAT 是一个 NP-complete 问题。 有了一个 NP-complete 问题,剩下的就好办了,我们不用每次都要和非确定性图灵机打交道,而可以用前面介绍的两步走的方法证明其它的 NP-complete 问题。迄今为止,人们已经发现了成千上万的NP-complete 问题,它们都具有容易被检查的性质,包括前面介绍的推销员旅行问题。当然更重要的是,它们是否也容易被求解,这就是著名的 P vs NP 的问题。 未来数学家的挑战 计算量问题 杨照昆;杨重骏 一、前言 二、计算量 三、P 之外? 四、古克定律与 NP-completeness 五、NP-complete 问题之近似解 六、 NP-hardness 与围棋 七、结论 一、前言 有数学家说过「一个好的问题胜过十个好解答」。因为解答一出,此问题已是到了终点,对不断求创新的人们而言,已不构成挑战。而新的问题是源头活水,能开拓新的境界。多数人都不愿沉醉在好的解答中不断的玩味,而希望找到新的问题,不断的思考,摸索。 大家在《数播》上已看见了不少好的问题,尤其最近康明昌教授谈到的费马定理,几何三大难题,都是极有趣的问题。有的已有了解答,有的尚待解决。除了上面的题目外,像四色问题(即任何一个地图只要用四种颜色就可以把国界分开),五次以上方程序的公式解,及数论上质数分布问题,都曾在职业及业余数学家的心目中占有相当的地位。本文所要介绍的是一个最近(1970年代开始)一种许多数学家及电子计算器学家所关心的大问题──NP 问题。 NP 所代表的意思,你看完本文之后自然会明白,现在你不妨记住「NP-hard」这个伟大的字。将来如果你对某人说你的问题是「NP-hard」,他也许就要对你刮目相看了,NP-hard 不但代表 hard(难),而且是 NP 的难! NP 问题的代表问题之一是售货员旅行问题 (traveling salesman problem)。有一个售货员要开汽车到 n 个指定的城市去推销货物,他必须经过全部的 n 个城。现在他有一个有此 n 城的地图及各城之间的公路距离,试问他应如何取最短的行程从家中出发再到家中? ________________________________________图1 售货员之地图,A,B,C,… 表城名,数字表两城之间之里数。 如图1中,A,B,C,…,G 表示 7 个城市,而售货员要从 A 城出发再回到 A 城并访问 B,C,…,G,所有的城,一个可行的方法是 问题是:这是否是最短的途径?也许更近呢?加起来的结果第一路径总长235里,而第二路径总长为230里,故第二路径较短,但是否存在一个更短的路径呢?目前的方法接近一个一个的排着试,还没有找到更好可以寻得最短路径的方法。对七个城而言,共有 6!=720 个排法,尚不算难,但若有 20 个城,则排法就有 19! 种。因故在排列组合里 n! 写起来轻松,但 1.21 x 1017 是一个大得不得了的数字,若每秒钟排一次,要排 3.84 x 109 年(一年约为 3.15 x 107 秒),即使使用计算器,每秒排一百万次(不容易做到)也得重做三千年才能找到答案。「生也有涯,知也无涯」,想不到区区二十个城,要三十个世纪才能找到答案。 由于电子计算器的发展,有许多以前认为枉费时的计算,像行列式之值,反矩阵,高次方程式的解,都可以在极短的时间内解决。但也突然出现了一些新问题,连大型计算器也望之兴叹。像售货员问题,因为找不到比硬排好得很多的做法,使得数学家们开始想要证明,根本找不到比硬排好得很多的做法。这个证明至今尚未找到。就像以前一角三等分问题一样,既然找了几千年找不到用圆规直尺三等分任一角的方法,也许我们可以证明绝对不可能用圆规直尺三等分一角。现在我们要证明绝不可能写一个计算器程序大大的简化售货员旅行问题。与三等分一角问题不同的是,前者是一种数学上的好奇,而当今的问题与实际用途却有密切的关连。 在此我们一直强调一个好得很多的方法。原因是对这类的问题,你若能计算快一倍或十倍、千倍,往往起不了什么大作用,好像刚才的二十城旅行问题,即使快了千倍,仍需三年的计算时间,而再加三城立刻就把这个计算法的效果抵消了,因此我们所要的是计算量基本层次的减少,这就是我们在下一节所要讨论的。 二、计算量 计算量,顾名思意,是指解决某问题所需要计算的时间,但因每个复杂问题的计算往往都要经过许多不同的运算,除加减乘除四则外,还要包含比较,取数据,存数据等等,若仔细计算起来,十分困难,一般都只绘出一两个主要的量,加以统计,以上节中售货员旅行问题为例,其主要的工作是对每一个排法加起总路径之长,因对 n 城而言,有 (n-1)! 的排法,我们就定其计算量为 O(n!),即在 n! 之层次(order 即 O 缩写之来源)之内。 举二个例子,我们若要求 n 个数的和或平均值,则其计算量为 O(n)。但若我们要把 n 个数字依次排列,则其计算量会因做法的不同而有相当的差别,一个直接了当的方法是,先求出最大的(比 (n-1) 次),再从不是最大的中间求次大的(比 (n-2) 次),再求第三大的(比 (n-3) 次),……如此一共比了 次就可以完成此工作。因此我们以 O(n2),即在 n2 之层次来表此方法的计算量。另外一种快排法,先把 n 个数分成若干小块,每块排好之后再合起来,则可以证明此种方法之计算量为 1 ,因排数字与排名字,电话号码相同,这种排法很有实用价值,例如某大城有一百万户,则 n2=1012,而 只有 2 x 107,其差别三个月与一分钟之比。 一般计算量的层次多以下表来区分, 在上表中,k 为某一大于 2 的正整数,它们中间都有一道鸿沟,有基本层之不同,在计算器理论上,若某人能发现一个新的方法,降低一个层次的计算量,那么他的新方法有资格称之为一个突破,可以不朽矣。表1 有一个对上项各量之比较,是以计算器每秒作一百万次 (106) 计算为原则。 n n n2 n3 2n 3n n! 10 10-6 10-5 10-5 10-4 10-3 10-3 0.059 0.45 20 10-6 10-5 10-5 10-4 10-2 1(秒) 58(分) 1年 50 10-5 10-4 10-4 0.0025 0.125 36年 2 x 1010年 1057年 1000 10-5 10-3 10-3 1 16小时 10333年 极大 极大 106 10-5 1 6 1月 105年 极大 极大 极大 109 10-5 16小时 6天 3年 3 x 109年 极大 极大 极大 表一:以计算器每秒做一百万次时完成各层次计算量所约需的时间(若无单位,均以秒为单位) 在这个表中,特别注意 n3 与 2n 中之差异,一般称 2n 为计算量呈指数上升,而 n3 或 nk 之计算量呈 n 的方次上升 2 ,对目前及未来的计算器而言,一个呈方次上升的计算量应可以应付,但对一个呈指数上升的计算量在 n 相当大时则毫无希望。因此计算器学家所集中精力的方向在如何将一个呈指数上升的计算量问题,简化成一个方次上升的计算量问题。我们定义凡对一个问题中最重要的参数 n 而言,若能找到一个方法可以以方次上升的计算量完成,我们称此问题为一 P-问题(P 为英文多项式 Polynomial 之第一字母),包含所有此类问题之集合以 P 表示之。 三、P 之外? 本节之题目有点不平常,我们的目的是提醒读者本文中常用之英文大写的 P 是一个凡能用 O(nk) 计算量解决之问题之集合。而 P 之外加一个问号系指到目前为止,我们尚不知道 P 之外是否是一个空集合。 到目前为止,除了售货员旅行问题之外,已经有上百有趣或有用的问题,无法用 O(nk) 的计算量来解决,我们在此列举几个例子。 问题1:售货员旅行问题(甲) 即第一节所述之问题,不再重复,不过假定所有距离均为正整数 3 。 问题2:售货员旅行问题(乙) 与第一题之条件相同,但现在有一个给定之正整数 B,问题是是否存在一条路径其总距离不大于 B。(问题1与问题2在表面上相似,但在以后的理论上有很大的不同) 问题3:背袋问题(甲) 有物体 n 个,各重 w1,w2,…,wn,今欲将它们分为二袋,试问如何分法可使两袋之重量最为接近。(不妨假定 wi 皆为正整数,这并未失去一般性。) 问题4:背袋问题(乙) 如上题,并给定一正整数 B,试问可否选出若干 wi,使其和 问题5:包装问题 有 n 个各别重量小于 1 公斤的物品及足够可以装 1 公斤东西的盒子,今将物品装于盒子之中,多个物品可装于一盒,但任何一盒不得重于 1 公斤,试求最小的盒子数。 问题6:舞伴问题 今有 n 个男孩子与 n 个女孩子参加舞会,每个男孩与女孩均交给主持一个名单,写上他(她)中意的舞伴(至少一人,但可以多于一人)。试问主持人在收到名单后,是否可以分成 n 对,使每人均得到他(她)所喜欢的舞伴。 问题7:库存问题 某仓库有 D 个存仓,排成一列,今有 n 批货物,各可占有一个或多个存仓,并已知各批物品存入与提出之日期。试问可否将各货物存入库里不发生存仓不够的困难且同一批货物若需一个以上存仓时,其存仓必须相邻。 问题8: 已知 a,b,n 三正整数,问是否存在一小于 n 位之正整数使得 问题9: (甲) 给定一 n 位正整数 a,试问其是否为质数? (乙) 给定一 n 位正整数 a,试问是否存在 m,n 1 且 a=mn? 问题10:分丛问题 已知空间 n 个点,并假定各点之间之距离为正整数,又给定两正整数 K 与 B,问是否可将此 n 点分成小于 K 个不重合的子集,使得在同一子集内之任意二点距离均不大于 B? 现在可以看出这类问题的一般结构了。很显然的,有些是极有用的问题,而有些可以转换成有用的问题。例如舞伴问题,若把男孩与女孩换成工人与工头,或医生与病人就有大用了。这些问题到目前没有一个可以证明是属于 P 的,大家都猜测它们可能在 P 之外,即其计算量是呈指数增加的。 在60年代,已有些人把某些问题归于一类了,即是几个问题是互依的,若其中之一若属于 P,则其它几个也属于 P,其证明方法大都是证明两个互依问题中间有一个只需要用 O(nk) 时间来完成的桥梁。直到1971年古克 (Stephen A. Cook) 发表了〈The Complexity of Theorem Proving Procedures〉才把 P 之外约问题归成了三大类,即 NP, NP-complete 及 NP-hard 4 ,现在谈古克定律。 四、古克定律与 NP-completeness 古克定律的证明很难,就是了解它也不容易,我们将从几个角度来看这个问题,试着去暸解它。它的主要结果是把前节那类问题大部归于一个较易证明的集合,称之为 NP,而在 NP 中找到一批互依的问题称之为 NP-complete 类并得到下面的结果。 1. 若有一个 NP-complete 问题可以用 O(nk) 计算量来解决,则全体的 NP 问题都可以用 O(nk) 之计算量来解决,即 1' 若有一个 NP-complete且 ,则 P=NP。 又换句话说,NP-complete 是 NP 中的难题,NP-complete 解决了 5 , NP 就解决了。但若有一个属于 NP 而不属于 NP-complete 的问题解决了,则其它的 NP 问题不一定可以解决。 什么叫做 NP?NP 是英文 nondeterministic polynomial 的缩写,意思就是非确定性的多项式时间。要暸解这个字。我们先看一看普通计算器的作用。 现在已知用一个计算器,要解决售货员旅行问题非常困难,但若我们有许多计算器同时用,是否可以快到把原问题在 O(nk) 时间内解决?「许多」,不是一、二,多一二个是于事无补的,多百个千个仍是杯水车薪,不能有很大的作用,因为就是一千个机子可以分开做,也最多只能快一千倍,在第一节内已说过,帮助不大。因此计算器学家先放眼望去,干脆允许你可以无限的增加机器。现在我们要注意的是并不是有了无限多的机器所有的问题就可以立刻解决了,因有的问题有先后次序,例如在算下式的时候 a5 a6 除非换个形式,否则必须一步一步的解括号,机子多了并不能加快计算的速度,而且机子多了,其间之联络千变万化,一个机子要应付千千万万别的机子送来的信号也疲于奔命了。因此我们只假定所有的机子都只承上启下,单线作业,不作任何横向联络 6 ,也就是说,机器1可以把它的结果传给它下面的机子,像 a1,a2,…,an 而每一个机子又可以把它们的结果传给自己的子机,但在 a1,a2,…,an 之间不互相联络。以售货员旅行问题为例,若有20个城,第一个机子开始,叫下面19个机子各取一个不同的城及计算与 A 距离,而这个19个机子又将它所求得的距离交给自己的18个子机令它们取一个与自己不同的城加上距离,如此往下,在第十次时,第十阶段的机子把它已取9城及总距离告诉下一个机子,叫他们再取一与已取之城不同之城加上距离,如此一直做到第19次,所有路线的距离都有了,在时间上求得所有的距离是 O(n)(但用了 19! 个计算器),古克定义凡可以在 O(nk) 时间内用无限多计算器解决的问题为一 NP 问题。 现在要记住的是由于无横向连络,在所有路径的距离都有了之后,并没有解决售货员问题(甲),因为不知谁是最短(若加以比较以求最短距离,则要 O(n!) 个比较),因此我们不能说售货员旅行问题(甲)是一个 NP 问题。但上节问题2,售货员旅行问题乙,任何一个单线都可以知道它的总距离是否不大于 B,因此每单线都有一个「Yes」或「No」的答案。只要有一个「Yes」的答案,我们即知道本问题已解决,故问题二是一个 NP 问题。在单线作业中,每个机子可以作三件事。 1. 目前答案不明确,大家各自作业。 2. 某线已找到答案,立刻叫停,大家停止作业,解题完毕。 3. 此路不通,本线不再作业,但不叫停,别线仍然作业。 从上项作用,很容易看出找出答案的计算时间即某线叫停的时间,亦即任何一个有「Yes」答案线中计算量之总和,也就是说找到答案「快捷方式」上所需的时间。易言之,在一非确定性计算器系统下,其子机像有「猜测」到快捷方式的功能。若在任何计算步骤中,某人猜了一个答案,而计算器可以在 O(nk) 时间内回答「Yes」或「No」,这个问题即是一个 NP 问题。再以售货员旅行(甲)及图1为例,若你猜一个路径 我们无法知道此路是否最短,但在(B)问题中,一个「Yes」或「No」的结果只要7个加法就可以回答了。因此根据新的定义,问题2是一个 NP 问题。 由这两个定义,读者不难看出问题2,4,6,7,8,9(乙)与10皆为 NP 问题,特别是问题9之(甲),(乙),其实是一样的问题,但如果你猜二个 m,n,立刻就可知道 a 是否是 mn。 古克定理的关键在证明若一种叫满足问题 (Satisfactability Problem) 的例子属于 P,则所有 NP 问题均属于 P(即此问题属于 NP-complete),令 , ,-(且,或,反)表三个基本的逻辑运算(即对0与1逻辑符号而言, , ,除了1 1=1之外, , 与一般代数之加乘相同)。令 f 为一个含有 n 个逻辑变量 (u1,u2,…,un) 的函数。假如我们可以找到一组 u1,u2,…,un,使得 f(u1,u2,…,un) = 1,则 f(u1,u2,…,un) 称为可满足。例如 为一可满足函数,取 u1=u2=u3=1 即可,但 永为 0,故此 f 为不可满足。 直觉上,这类问题除了将 u1, u2,…,un 一个一个以 0,1 代入检查 2n 次之外,显无快捷方式可循,古克1971年之论文即证明这是一切 NP 问题之母。 古克定理: 满足问题为 NP-complete。 现在已可证明在前节中之问题,除了问题1,3,5,9 之外,全是 NP-complete 问题。 五、NP-complete 问题之近似解 NP-complete 问题既找不到可行的解法,而很大部分的 NP-complete 问题都在计算器语言,程序,电路设计,统计学,程序作业上有大用,因此只好退而求其次找一个可行的近似解。很可惜的是,所有的 NP-complete 问题虽在 NP 的层次上相联,在近似解上往往各需不同的解法,这些解法多从直观而来,我们在此举二个例子。 例1 在第三节问题5,包装问题中,若采取「能装就装」法,即现有的盒子若可以装得下,就不用新盒子,则此法所需用之盒子数 k1 与最可能少的盒子数 k0 满足 。 证明 今令 n 个物品之重为 w1,w2,…,wn 公斤,因每个盒子只可以装1公斤,故 另一方面,「能装就装」法不可能有两个以上的盒子同时少于 公斤,故 本例得证。 这个问题的结果是说,我们大约可以用「能装就装」法做得最好情形的一半好。经过较复杂的证明,Johnson 在1974年证得,当 n 很大时, (i) ,且存在一种情形能产生。 (ii) 也就是用「能装就装」法不会坏到 70% 以上,但可以坏到多用了 70% 的盒子。 售货员旅行问题的一个直观走法是先访问最近那个尚未访问过的城,称为「先访近城」法,以图1为例,其走法为 Rosenkrantz 等在1977年证明这并不是一个很理想的走法,他们证出若各城间的距离满足三角不等式 7 ,则「先访近城」法所走之总程 D1 与最短路径 D0 之关系为 且当 n 很大时,可以有一种情形使得 上式中之 表示大于 x 之最小整数,例如 =5, =3。因 当 n 大时可以很大,故 D1 可与 D0 相差非常之大,但在同一篇论文之中,Rosenkrantz 等证明另一种复杂的「直观」走法可以达到 之地步。 在上面的定理中,三角不等式的条件很重要,若城之距离无此关系存在时,Sahni 与Gonzalez 在1976年证得:若 NP,则不可能存在一个有限的 m,及一个 O(nk) 计算量的走法,能使其全程长 D1 在任何 n 时满足 即上式中 m 非等于无限大不可,亦即所有 O(nk) 的做法都不很好。 六、NP-hardness 与围棋 不是所有的难题都可归结为 NP 问题,像下得一手绝对好的围棋现在目前的推测是比所有 NP 问题还要难的计算问题,即 NP-hard 问题,NP-hard 问题的定义如下: 定义: 若 x 为一 NP-hard 问题,则若 NP ,则 。 也就是说,即使 P=NP,x 还不一定属于 P,但 NP, 则 x 绝不比 NP 的问题容易。在第三节中的问题1、3不一定是 NP 问题,但若能以 O(nk) 的计算量解决它们,则比较容易的问题2与4也可以 O(nk) 解决,故若问题1、3 则问题2、4 ,又因2、4是 NP-complete,即推出 NP=P。这与 NP-hard 之定义相合,故问题1、3均为 NP-hard 问题。同理问题5也属于 NP-hard,不过这些 NP-hard 似乎比 NP 难不了多少,但下棋问题可能比 NP 问题要难得多,围棋问题可以作如下观。 问题11.(围棋问题) 以平常的围棋规则在一个 n x n 的棋盘上下,给定一个残局(下了二个子就可以算残局),首先,是否可以确定黑子在最好的下法之下,一定会赢? 这个问题不能用一般的方法证明它是不是为 NP。因为目前没有人能猜一个必胜的下法且在 O(np) 时内证明它是对的,因为它与对方如何应付有关,而敌方的应付又与他对你以后的下法的推测有关,如此往下走,首先发生困难的是记忆上亮了红灯,即所需要的记忆可能呈方次以上的进展。 因每一个记忆至少要用(来计算)一次,否则这个记忆就不如不要,因此一个问题的记忆若呈指数上升,则其计算量亦非呈指数似的上升不可,但若某问题只需要方次上升的记忆,即不能保证它只需要方次上升的计算量。 因此计算器学家定义三个新的集合: PSPACE={x:x 只需要方次上升的记忆 } 注:x 均指问题。 PSPACE-complete: 若 PSPACE, 又 PSPACE-complete, 且 , 则 P= PSPACE。 PSPACE-hard: 若 PSPACE-hard, 且 , 则 P= PSPACE。 注意在上式中 PSPACE-complete PSPACE,即 PSPACE-complete 是 PSPACE 中的难题,但 PSPACE-hard 不一定属于 PSPACE。 Stockmeyer and Meyer 在1937年证明了一个与古克相似的定理。 若令 表示存在一个 x, 表对所有的 x,Q 表 , 中的一个,x 为布氏变量0与1,则我们称 f(Q1 x1,Q2 x2,…,Qn xn) 为一量化布氏公式。若 f 有可能为1,则 f 称之为可满足,例如把第四节中之(1)式改写成 则上式不可能满足,因对 (u3 为 0 或 1)而言,f 不全是1。 Stockmeyer 与 Meyer 之定理为: 定理: 检定一个量化布氏公式为可满足是一个 PSPACE-complete 问题。 当我们下棋面对着一盘残局沉思的时候,我们的要求是 对我是否存在一着必胜棋可以对付 敌人任何一着应付棋 此后我是否存在一着必胜棋可以对付 敌人任何一着应付棋 …… 我是否存在一着必胜棋可以对付 敌人任何一着棋 我赢了 因此这完全是 , , , ,… 之交替作用与Stockmeyer 与 Meyer 定理之关系至为密切, Robertson 与 Munro 在1918年证得围棋是一种 PSPACE-hard 的问题,目前有人计算到围棋 8 必胜法之记忆计算量在 10600 以上,不论人脑或计算机的记忆绝少不了一个原子,而现今所知的宇宙原子数约只有 1075。棋之道,大矣哉!要做一个下围棋必胜的机器人是谈何容易! 七、结论 现在你明白二十世纪的大难题了,P=NP?用简单的语言说,就是是否能找到一个只呈方次增加的方法去解决旅行、包装、舞会等问题。平凡的问题,期待您不平凡的解答。 1. Gorey, M.R. and Johnson, D.S.《Computers and Intractability-A Guide to Theory of NP-Completeness》, 1979, Freeman and Company. 2. Pearl, J.《Hearistics-Intelligent Search Strategies for Computer Problem Solving》,1984, Addsion-Wesley. 3. Cook, S.A.〈The complexity of theorm-proving procedure〉, Proc. 3rd Ann. ACM Symp. on Theory of Computing, 1971, 151-158. 4. Jonhson, D.S. et. al.〈Worst case performance bounds for simple one-dimensional packing algorithms〉, SIAM J. Comp., 1974, 299-325. 5. Rosenkrantz, D.J. et. tl.〈An analysis of several heurishics for the traveling salesman problem〉, SIAM J. Comp., 1977, 563-581. 6. Sahin,S. and Gonzalez,〈P-complete approximation problems〉, J. ACM, 1976, 555-565. 7. Stockmeyer, L.J. and Meyer, P.R.〈Word problems requiring exponential time〉, Proc. 5th. Ann. ACM Symp. on Theory of Computing, 1973, 1-9. 8. Robertson,E. and Munro, I. 〈NP-completeness, puzzles, and games〉 Utilifas Math., 1978, 99-116. http://cs.cuc.edu.cn/linweiguo/archives/000338.html
个人分类: 名词术语|5033 次阅读|1 个评论
研学小记:卷积不卷(3)――支持域计算和强制不可约多项式
热度 1 zoumouyan 2011-4-4 08:40
研学小记:卷积不卷( 3 ) ―― 支持域计算和强制不可约多项式 邹谋炎 二维分配函数支持域估计对盲目反卷积和相位恢复有重要意义。 图 1 示出了支持域计算的一个例子。 D1 和 D2 是两个图像的支持域。按“不卷”或叠加原理计算两个图像卷积结果的支持域,也就是计算集合运算 D = D1+D2 。在 D2 上任意地选择一个参考点。让这个点带着 D2 扫遍 D1 的每个点, 扫描覆盖的整个面积 就是 D = D1+D2 ,即卷积结果的支持域。可以看出,简单地扫遍 D1 的各个 角点 就能够得到希望的结果。 这个计算过程直接引导下列结论: ( 1 ) D1 或 D2 都能够被嵌入到卷积结果的支持域中。例如移动 D1 可以完全覆盖 D ,移动的轨迹正好覆盖 D2 。 D1 和 D2 反过来也对。 ( 2 )如果 D1 和 D2 是凸的,它们的外边界会完全、正好地保留在 D 的外边界上。例如, D 的红色边界段正好是 D1 的外边界;而 D 的其余边界段正好是 D2 的外边界。 这两条简单性质与二变量多项式可分解性、盲目反卷积支持域估计直接相关。 盲目反卷积 支持域估计问题 是:给定 D ,估计它的两个因子 D1 和 D2 。如果 D 是凸的,问题转化为:将 D 的外边界划分为两个边的集合,使得每个边的集合能够形成一个封闭图形(每个边的取向和内侧方向须不变)。解不一定存在,还可能不唯一,需找出所有解。这是一个组合规划问题。 二变量多项式可分解性需额外说明。一个二变量多项式系数不为零项的全体对应着一个支持域。例如 在这个例子中,如果系数( a,b,c,d,e,f )无论取何值,多项式 p(z1,z2) 都不能表示为两个低阶多项式的乘积,称多项式是 强制不可约的 。给定一个二变量多项式,有什么办法来检测它是不是强制不可约的呢?这是“代数几何”中的一个问题。由于多项式乘积等价于它们系数数组的卷积,那么, 支持域的不可分解性就完全对应着多项式的强制不可约性 。所谓支持域的不可分解性就是找不到一个可以嵌入它、并且可以通过移动覆盖它的因子。这个事实是前面的观察( 1 )的直接结果。由这个结果可以推出若干应用性的判据。一个很简单的判据说明如下:在支持域的边界上如果存在一个只含两个点的边(称为 单位边 ),在支持域中找不到另一个可嵌入它的位置,这个支持域就是不可分解的。在文中的多项式 p(z1,z2) 的支持域上,坐标点( 0,1 ) - ( 2,2 )是单位边,( 2,0 ) - ( 2,2 )也是单位边,它们在支持域中都没有另外的可嵌入位置。因此 p(z1,z2) 是强制不可约的。作为读者练习,判断如下的一种 Eisenstein 支持域,是强制不可约的。 附记: 博文 “ 卷积不 ‘ 卷 ’” 支持域计算的答案。
个人分类: 研学小记|4183 次阅读|2 个评论
研学小记:卷积不卷(3)――支持域计算和强制不可约多项式
热度 3 zoumouyan 2011-4-4 08:37
研学小记:卷积不卷(3)――支持域计算和强制不可约多项式
研学小记:卷积不卷( 3 ) ―― 支持域计算和强制不可约多项式 邹谋炎 二维分配函数支持域估计对盲目反卷积和相位恢复有重要意义。 图 1 示出了支持域计算的一个例子。 D1 和 D2 是两个图像的支持域。按“不卷”或叠加原理计算两个图像卷积结果的支持域,也就是计算集合运算 D = D1+D2 。在 D2 上任意地选择一个参考点。让这个点带着 D2 扫遍 D1 的每个点, 扫描覆盖的整个面积 就是 D = D1+D2 ,即卷积结果的支持域。可以看出,简单地扫遍 D1 的各个 角点 就能够得到希望的结果。 这个计算过程直接引导下列结论: ( 1 ) D1 或 D2 都能够被嵌入到卷积结果的支持域中。例如移动 D1 可以完全覆盖 D ,移动的轨迹正好覆盖 D2 。 D1 和 D2 反过来也对。 ( 2 )如果 D1 和 D2 是凸的,它们的外边界会完全、正好地保留在 D 的外边界上。例如, D 的红色边界段正好是 D1 的外边界;而 D 的其余边界段正好是 D2 的外边界。 这两条简单性质与二变量多项式可分解性、盲目反卷积支持域估计直接相关。 盲目反卷积 支持域估计问题 是:给定 D ,估计它的两个因子 D1 和 D2 。如果 D 是凸的,问题转化为:将 D 的外边界划分为两个边的集合,使得每个边的集合能够形成一个封闭图形(每个边的取向和内侧方向须不变)。解不一定存在,还可能不唯一,需找出所有解。这是一个组合规划问题。 二变量多项式可分解性需额外说明。一个二变量多项式系数不为零项的全体对应着一个支持域。例如 在这个例子中,如果系数( a,b,c,d,e,f )无论取何值,多项式 p(z1,z2) 都不能表示为两个低阶多项式的乘积,称多项式是 强制不可约的 。给定一个二变量多项式,有什么办法来检测它是不是强制不可约的呢?这是“代数几何”中的一个问题。由于多项式乘积等价于它们系数数组的卷积,那么, 支持域的不可分解性就完全对应着多项式的强制不可约性 。所谓支持域的不可分解性就是找不到一个可以嵌入它、并且可以通过移动覆盖它的因子。这个事实是前面的观察( 1 )的直接结果。由这个结果可以推出若干应用性的判据。一个很简单的判据说明如下:在支持域的边界上如果存在一个只含两个点的边(称为 单位边 ),在支持域中找不到另一个可嵌入它的位置,这个支持域就是不可分解的。在文中的多项式 p(z1,z2) 的支持域上,坐标点( 0,1 ) - ( 2,2 )是单位边,( 2,0 ) - ( 2,2 )也是单位边,它们在支持域中都没有另外的可嵌入位置。因此 p(z1,z2) 是强制不可约的。作为读者练习,判断如下的一种 Eisenstein 支持域,是强制不可约的。 附记: 博文 “ 卷积不 ‘ 卷 ’” 支持域计算的答案。
个人分类: 研学小记|8892 次阅读|2 个评论
关于代数数域的问题
热度 2 guoyangmath 2011-1-20 22:37
有理数域上的一元多项式环全体复根的集合构成代数数域,全体根的集合就是所有代数数,而代数数对加减乘除运算是封闭的。对吗?
4510 次阅读|3 个评论
宇宙是一台庞大的非确定性图灵机
热度 1 dulizhi95 2010-1-31 11:21
宇宙是一台庞大的非确定性图灵机
个人分类: 未分类|4449 次阅读|3 个评论
多项式的根之美
songshuhui 2009-12-11 16:31
木遥 发表于 2009-12-10 11:20 木遥按:这是美国数学家 John Baez 今年 11 月 14 日在他的网页上贴出来的一篇文章( 原文 ),很快引起了许多人的兴趣。标题中的根是指数学中一个多项式的解。如果你还没有忘光你的高中数学课,就应该知道下面这两个事实:任何一个多项式在复数域中必有根,并且每个复数都可以在复平面上对应于一个点。这样,给定一系列多项式,我们就可以把它们的根都画在复平面上,从而形成一些特定的图案。请放心,即使你对多项式毫不了解,也不会妨碍你欣赏这些图案之美的。也许你曾经听说过经典的 曼德布洛特集合 (Mandelbrot set),那你很容易就能在这里看到某些相似之处。所不同的是,人们对这些新的图案还所知甚少。 下面所有括号中的文字都是我所添加,以帮助不熟悉复平面的朋友了解所说那些的点的位置。每幅图都可以点击放大。 我的朋友 Dan Christensen 发现了一幅令人赞叹的图画(见题图)。它是由所有系数为 -4 到 4 之间的整数的 5 次以下多项式的根在复平面上的对应点构成的。 点击图片可以看大图。二次多项式的根是灰色的,三次多项式的根是青蓝色的,四次多项式的根是红色的,五次多项式的根是黑色的。横轴是实轴,纵轴是虚轴,中间的大洞的中心是原点。两侧小一点的洞的中心是 1,在 i 处和 1 的所有六个虚根出也各有一个小洞(即中间那个大洞上下不远处对称的那些小洞)。 你可以在这里看到许多迷人的图案,给人的感觉是这些整系数多项式的根在竭力避开那些整点和单位根似的,──除非这些整点和单位根本身就是多项式的根。如果你把图案放大,可以看到更多细节: 在这里你可以看到,在 1 这个点所在的空白区域周围环绕着一些美丽的羽毛,在 exp(i/3) 这个点周围有一个六瓣的星形(即左上角那个梅花形状的洞),还有一条奇特的红色连线把这两个点连接起来,还有很多其他的点周围的星形的洞,诸如此类。 人们应该开始研究这些东西才对!让我们把所有系数为 -n 到 n 之间的整数的 d 次以下多项式的全体根构成的集合称为 Christensen 集 C d,n ,很显然当 d 和 n 越大, C d,n 这个集合就越大,并且当 n 趋于无穷大时这个集合趋于布满全复平面。如果固定 d, 令 n 趋向于无穷大,那么我们就能得到全体有理复数;如果令 d 和 n 同时趋于无穷大,那么我们就能得到全体代数复数。于是一个有趣的问题就是,如果我们固定 n,令 d 趋于无穷大,会得到什么呢? 在上面这些图片的鼓舞下,Sam Derbyshire 决定绘制一些分辨率更高的多项式根的图片。试验了几次之后,他觉得他最喜欢的是系数为 1 的多项式。他把所有 24 次以下的这样的的多项式的根绘制成一副高清晰度的图片,这些多项式一共有 2 24 个,其根大约共有 24 2 24 个,也就是大约四亿个。他用 mathematica (一个数学软件)花了大概四天时间才计算出所有这些根,得到了大约 5G 的数据。然后他用 Java 语言生成了这幅美妙的图案: 颜色表示根的密度,从黑色到暗红色到黄色再到白色。上图是低分辨率版本, 这里 有一个 90M 的文件可供下载。我们可以放大一点看到更多细节: 请注意单位根周围的那些小洞,还有圆弧内部的那些羽毛。为了更清楚地观察,我们把下面这些标记出来的区域放大: 这里是 1 这个点处的那个洞。(即上面最右边那个标记出来的区域。) 中间那条白线是实轴。这是因为有非常多的多项式根都是实数。 然后这里是 i 这个点处的洞。(即最上面那个标记区域。) 这是 exp(i/4) 这个点周围。(差不多位于 1 和 i 正中央。) 请注意,根的密度在接近这个点的时候会变大,然后又突然变小。可以看到这些密度所形成的微妙的图案。 但是更漂亮的是当我们来到单位圆内部时的那些羽毛状图案!这里是实轴附近的样子,这个图的中心位于 4/5 点处。(右边数第二个标记区域。) 在 (4/5)i 点处的样子就截然不同了。(从上数第二个标记区域。) 但是我觉得最漂亮的还要说是 (1/2) exp(i / 5) 这个点周围的区域。(剩下的那个标记区域。)这幅图生动的展示出,在我们的数学研究中,规律性是如何从一团混沌中逐渐成型的,就像从薄雾中隐约显现出来一样。 这里有太多东西需要解释了,每幅图片都至少需要一两个定理来描述。如果想看到更多的这类结果,可以参见: Loki Jrgenson, 限定系数多项式的根 以及 相关图片 。 Dan Christensen, 整系数多项式的根的图案 。
个人分类: 数学|2824 次阅读|2 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-28 22:15

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部