概率论的局限性分析 0 引 言 概率论是一门研究随机现象的数量规律学科。概率论在发展的过程中有许多的流派,对于概率本身也有许多不同的解释,各有自身的缺陷,造成了学术界的争论。概率论的公理化方面也存在一定的争议,目前的概率论是以柯尔莫哥洛夫( kolmogorov )公理系统为基础的 。该公理系统具有一定的局限性,比如菲纳特和熊大国等学者指出了该公理系统的一些缺点和不足 。目前的概率理论要解决许多问题都是有前提条件的,并非可以解决所有的概率问题,比如对事件的概率,可能不同的条件,或者不同的人会给出不同的概率,那么应当如何来综合和折衷,概率论并没有解决。而笔者在研究中发现,概率论本身在许多时候也是有前提的,并不能解决所有的概率问题,而其中有一个根源在于概率值完全可能是随机变量,而不是一个固定的值,而这种随机不确定性如果在概率论模型中推演下去,其中的许多参数、变量和方法都可能是不确定的,这就意味着一种自由的、不受限的概率表达方式可能需要更多的参数,乃至于无限参数。这一问题可以说明现有概率论的局限性,乃至于类似的问题可能存在于数学的其他领域,而这也将对其他的学科产生影响。 1 概率定义反映出的问题 关于概率的定义,重要存在古典概型、几何概型和统计概率三种定义,它们在解决实际问题中起着十分重要的作用,但是一直存在争议,各种定义各有自己的优势和缺陷。古典概率定义要求试验的可能总是有限的、互不相容及等可能性的,几何概率虽然克服了试验结果的有限性,但同样要求某种等可能性,而许多实际问题是不具备这些条件的,所以这两种定义都带有局限性。统计概率虽然没有前面两种定义那种局限性,但却建立在大量重复试验的基础上,况且,试验次数 n 应大到什么程度,频率究竟在什么意义下趋近于概率,没有确切的说明。因此,它在数学上是不严密的 。所以,这三种定义都不能作为概率的一般定义,这就促使人们考虑,作为数学的一个分支,也应像代数、几何一样,通过建立公理化系统给出概率的定义,使其具有一般性。苏联数学家柯尔莫哥洛夫于 1933 年提出了概率的公理化结构,抽取了概率的统计定义、古典定义及几何定义中所共有的性质作为概率的公理,给出概率的公理化定义。概率的公理化定义本身是非常严密的,它只是规定了概率这个概念所必须满足的基本性质,它没有也不可能解决在特定场合下如何定出概率的问题.这一定义的意义在于它为一种普遍而严格的概率理论奠定了基础。 本世纪初,从 20 年代到 30 年代,出现了许多杰出的学者,他们对概率的概念作出了另一种解释。首先是凯恩斯,他认为概率是对一个命题用其他方面的知识作出判断后获得的一种合理的信任程度,对于每一个这种信任程度,不能赋以一个数值,只能和其他的信任程度进行比较,给出一个程度上的秩序,有的强,有的弱。他的说法和看法,把概率和人的主观的信念发生了联系,引出了后来的 " 主观学派 " 。 从以上的定义可以看出,那些可以用于计算概率的往往是那些不太严格的定义,而利用这些得到的值可能是不可靠的,比如通过统计(频率)定义得到的统计得到的概率值本身都是随机的,而比较一个的公理化的定义却无法得到概率赋值,而主观概率则更不能确定概率值,相反,这里概率可能是不确定的。 我们认为,概率本身就可能是随机变量,即概率是不确定的,这样就可以对这些争论有一个合理的解释,统计概率本身不可靠,在不知道真正概率的情况下,我们只能认为真实概率是一个随机变量,这个随机变量集中分布在统计概率附近,而由于概率本身无法确定,所以主观概率的解释也可以看成一定程度上是合理的。 2 概率的多重不确定性 概率值是来表示一种随机不确定性的参数,但是它本身也可能具有不确定性,但是,显然我们的概率论没有考虑这个问题,否则概率论的许多公式将是无法计算的,或许有人要认定只要将概率的平均值代入公式就可以了,但是我们可以通过例子来发现仅仅知道概率平均值是不够的。举一个例子来说明概率的不确定性:假定产品合格概率是固定值,工厂各个性能、参数指标等均稳定不变,某工厂测试产品 A 的合格概率,测试了 10 件,合格 5 件,其合格率可以认为是 50% ,同样,另外一件产品 B ,测试了 100000 件,合格率也是 50% (为什么取百分之五十是有原因的),在没有更多的信息的情况下,我们当然可以权宜地认为产品合格概率的平均值为 0.5 ,但是,显然我们会觉得产品 B 的合格概率 0.5 更加可靠,更加接近于真实值,其分量更重,而这里可以看出一种表征其分量的参数是欠缺的。我们在无法确定其真实概率的时候,不得不采用权宜的、不可靠、不完全的可以计算的、可获取的或者是可以一定程度上代替的概率。实际上在许多时候我们无法获得概率,即使我们有一些公式来计算概率,但是这些概率公式的计算又依赖于其他的概率,而真实概率值的获取在许多时候是不可能的。 现实中大量的信息是不可靠的,依靠这些信息获得的概率自然也不可靠。这意味着真实的概率可能大于、小于或者等于这个值,是一个以这一值为中心分布的随机变量。当然其分布本身也可以是多样化的,这意味着这其中的参数是随机变量(或者更加复杂的变量)。当然绝对可靠,绝对正确只不过是不可靠概率的一种极端而已。显然我们希望得到可靠的概率,即使不可靠,当我们不得不权宜地采用不可靠的概率的时候,也希望知道到底是多么的可靠,多么大的程度上可以决定真实的概率。信息在传递、存储和处理的过程中都会可能出现错误,且有时候需要对信息重新表达,信息的转换表达中带来的不可靠,比如模糊化处理,把精确信息变成模糊的,或者添油加醋,这些当然也会对相应的概率产生影响 。 现实中的数可能是无理数,因此很多时候我们都不得不进行四舍五入,这些会导致计算概率值的参数是不可靠的,或者概率值本身被四舍五入,那么,在我们仅仅知道四舍五入的结果的时候,真实的概率值依然是一个随机变量。 当然现实中还有各种因素会引入这种概率的随机性。现实中不可靠的信息要比绝对可靠的多,因此一种概率理论如果仅仅考虑绝对可靠的情形,就会存在局限性。 实际上条件概率许多时候是不可知的,而且可能是随机变量或者更加复杂的变量。目前的概率论中,没有考虑到条件是多种多样的,比如一般在指定一个条件 B 的情况下会给出事件 A 的条件概率值 P(A|B) ,但是有时候条件概率值 P(A|B) 往往是未知的,而且可能还是随机变量,而不是我们想象中的确定的值。一旦条件概率是未知的时候,我们解决多个条件下的概率问题就无能为力了,比如已知 P(B) ,但是 P(A|B) 未知,则可能无法求解 P(AB) 。 条件本身也是多样化的,它不一定是某个事件发生,我们可以理解为一种制约,一种约束或者前提。它可以是一个表达式,包括不等式、上限下限,还可以是实验结果、定理、规律、知识、常识、语言的翻译转换方法、语法、编码的方式、对问题的估计、信息的可靠性等,特别是当涉及到语义的时候,编码方式、语法、定义,这些往往是公认的、基础性的,隐含的条件,由于它们的公认性,所以具有隐蔽性,往往不以为是一种条件。 既然概率值本身可能具有随机不确定性,那么进一步表征这些概率值随机不确定的参数,比如概率值等,就依然可能是随机变量,如此递推下去,需要的参数可能是无限的,概率的随机不确定性也可能是无限重的。现实中不确定的事件往往比确定的多,随机变量比常数多。因此概率可能是多重随机不确定的,好比导数也有自己的导数,多阶导数等。但是我们这里说的随机不确定性可能只是其中的一种不确定性,可能还有更多类型的不确定性存在,这会使得问题更加复杂。 概率论是为了解决现实问题,但是现实中普遍存在的,一般化的问题都不能表达,只能说明其模型不是普适的,而是受限的,这种制约来源于数学问题的表达和数学模型本身。 3 集合的不确定性 在概率论的模型中,除了概率值的不确定性外,集合本身也可能具有不确定性,比如集合中的元素可能是不确定的,集合中元素的个数也可能不确定。比如我们考虑某国总统选举的概率分布,假如在候选人还不确定的情况下,问题就更加复杂,有时候可能根据规定,可能候选人的个数也是不确定的。固然我们可以认为针对的对象是一个无所不包的集合,这个集合的元素是无限制的,所有的可能都容纳,那些不可能的元素的概率当作 0 处理就可以了,但是一般情况下,我们面对的集合元素是有限的,抛弃那些不可能的元素,有限元素方便处理,所以要集合的不确定性也是值得考虑的。只是集合大多数情况是确定的,并没有引起人们的关注。集合的划分是根据现实需要的,从不同的角度划分问题可以得到不同的集合,比如学生可以根据专业、年级和性别来划分,现实中人们也会针对不同的情况进行不同划分,从而形成不同的集合。当然模糊集、粗糙集也是传统集合不确定的一种表现。 如果把问题延伸到模型之外,我们可以看出更多的不确定性,比如集合的模型中的元素可能指的是一些对象,这些对象照样可能是不确定的,比如一些代词、名词在有时候就是有不同指代,或者有歧义的,语义本身就有复杂性,比如有时候可能说反话。这意味着我们要用概率论解决现实问题,将会有更多的不确定性重重叠加起来。我们可以考虑对问题的简化,但是这种多重的不确定性并不是任何时候都可以完全简化为单一的不确定性问题。 4 概率的相对性 概率的存在总是依赖于一些条件的,即使是先验的概率,也是根据某些条件得出来的,否则概率值怎么知道,而且怎么知道可能有哪些结果(即集合中有哪些元素),如果我们对事物一无所知,可能连集合中元素的个数都不知道。 但是当前概率论中,把先验概率和后验概率绝然分开。实际上,这种先后都是相对的。比如先验概率也是在某种情况下才能得出的,有一定的已知条件,否则概率的来源就没有基础,当然已知先验概率的分布本身也可以看成是一种条件,这个条件可以表述为:已知各种可能值的先验概率分布分别是多少。此外,还存在多个条件的情况,这样的情况下,它们的先后关系是可以互换的。假如我们对一个事件一无所知,那么它有几种可能的取值都不知道,别说这些取值各自对应的概率了,可见,我们得出的先验概率也是基于已知的条件的,先验概率也是一种条件概率。认识到概率是相对于相应的各种形式的条件的性质有助于在分析中有意识地、仔细地去认定每一个存在的条件,将不同的条件区分开,而不是混为一谈,从而能够有效区分相应的各种概率。实际上有时候由于条件的隐蔽性,往往不能充分认识到许多条件的存在。 可能一个事件有许多的条件,概率是随着已知条件的增加而进化的,概率值是相对于我们的已知条件的,当然条件越完善,概率就越加完备,更加可靠。波普尔和达尔文都有进化的思想,概率也是根据条件来进化的。已知条件越多,概率就越可靠。另外,好比人对事件的了解往往是从未知到已知的,对某事发生的概率的了解大多数情况下也是不确定到确定的。比如抛硬币的概率,如果对于当时的情况不了解,根据硬币的基本对称性,我们可以认为正反概率都是 0.5 ,但是如果知道了抛硬币中的所有决定因素,则其正反是确定的,在抛硬币的过程中,所有的作用力、初始的速度和位置、地板的情况等因素将可以决定硬币的正反,当然可能我们的已知的条件有限,尚不能知道所有的决定性因素,这样的条件下其概率可能也可以得出一个概率。大多数情况下,我们知道的条件都是不完备的,在这些条件下概率可能是随机变量(如上面实验的例子),也可能是固定的值。假如我们不能得到更加完备的条件,但是要去求完备条件下的概率,则此时不能不权宜地依靠条件不完备的情况下得出的概率,此时的概率至少会增加一重随机不确定性,则此时的概率可能是多重随机、双重随机、或者是随机变量。对事件的了解从不确定到最后确定,是因为已知的条件发生了改变,概率随着条件发生了改变。认识到这种逐步进化的相对性,有助于我们更加深入理解并且应用概率论,认识到从未知到已知,从不确定到确定的改变本身也是一种概率的演化。现实中,我们往往知道事件的片面的条件,所以得到的概率也是片面的,相对于我们的不完备的已知条件而言的。 为了更加明确地说明问题,我们考虑在某些条件共同发生的情况下,确定某一事件 m 的概率,这些条件可能与 m 的概率有关,也可能无关,我们可以选择所有的有关的条件,我们假设其概率可以由 n 个有关的条件 c 1 , c 2 , … , c n 来决定,概率可以表示为 P(m) = f ( c 1 , c 2 , … , c n ) 当然实际的情况更加复杂,而且可能呈现多种表现形式,比如,有些条件并不能确定概率的值,而可以通过这些条件得出其概率呈现某一概率分布,即得到的概率不是固定的值,而是随机变量。比如, 仅仅知道抽样检查实验得出的概率,我们以此为条件,则只可能得出理论上的概率是一个以实验得出的概率分布为中心的一个随机的分布,特别是在实验是不可靠的时候。为了方便, 我们暂且用上面的这个很简单的函数式来表达,从而说明概率论中的某些问题。 当我们对某些条件 c 1 , c 2 , … , c n 中的某些不了解的时候,此时概率 P(m) 本身由于未知数的存在,而并不固定,所以可以认为是变量,我们知道的条件越多, P(m) 的变动范围就越小,得出的概率就越是可靠。 我们也可以看看现实中的一些例子,学生选课希望选择好的老师,如果 学生不知道教师的情况,可能他们会根据姓名来选课,如果他们知道职称等信息,会根据这些信息来综合判断,如果他们直接很清楚地了解这个老师,就不会根据前面的信息,而是根据这种最可靠、直接的信息来判断取舍。同样,假如不知道论文的内容或者无法对论文做出判断,可能我们就会根据论文发表的杂志,论文的作者等这些边缘的信息来判断论文质量,这些都是不得已的一种做法。同样,有时候有些事件本身是确定的,但是我们已知条件有限,不能确定其结果,只能权宜地根据已知的有限条件做出一个该条件下的概率判断。在先验概率和后验概率同时存在的情况下,我们会选择后验概率,因为它面对更加细致、完备的条件,假如知道了更多的条件,我们又会转而选择条件更多的那个后验概率。昨天某地是否下雨,是确定事件,但是,假如我们不知道更多的信息,只是知道每年这一天历史下雨的概率,那么我们可能只有采用这个概率,但是,如果知道了昨天是否下雨(而且这个信息真实),我们就会选择这个确定的结果(注意到确定的结果可以被不确定的结果包容)。在不能得到最正确的结果的时候,我们总是尽量得到相对而言最完备、最可信的结果,实际上这些结果并不是我们所需要的真正结果,但是,相对之下,我们采用这个结果最接近我们需要的结果。 实际上,我们往往是介于完全的已知和完全的未知之间,只是对问题有相对的了解,当然其概率也是相对的,但是到底什么是完全未知?从来没有考虑过完全未知的情况,那种完全不知道会出现什么结果(即集合也是未知的)的情形,这种问题是无法描述的。只有比较了现实概率论与这种完全未知的差别,就可以看出其中蕴含一定的前提。 5 概率的复杂性 我们总是习惯于将概率归结为某种简单的模型,比如高斯分布,泊松分布之类的,以为概率分布存在某种必然的规律性(比如概率分布必然是中间密度大,两边小),或者是把概率当做是一个简单的值,而实际上概率值可能是一个比随机变量更加复杂的变量。现实中,我们完全可以制造一些“变态”规则来使得事件的概率发生不正常的变化,比如让工人在前期的产品做的合格率高的时候,更加认真地做,而当产品的合格率低的时候,更加不负责任,从而产品的整体的合格概率会有一种变态的分布。现实中,也有一种经济现象称为买贵现象,就是价格越高,人们购买的概率却越高。这些也反应大千世界无奇不有,这种奇怪也是体现了一种现实现象的自由度和无拘束性,这当然也是对于概率分布不确定性的一种说明。这说明,我们要用最少的自以为是的约束条件,这样将会让概率论的世界更加多样化,更加不确定。要表达这种多样性,避免只表达大多数的常规现象,而不能表达少数意外、离奇的现象,那么就需要更多的参数,这样才能表征更多的状态。 我们也可以通过股市的例子来看待概率的复杂性:关于股市涨跌的概率具有多方面的复杂性。第一,假如有人根据股市的现在状况,包括股民的心态,总结出了股市的动态概率的规律,一旦有人了解到此规律,并且充分利用此规律来炒股的时候,股市的规律将会变化,比如如果大家只是简单从众,可能股市涨的时候就更涨,跌的时候更跌,一旦到跌的时候,就很惨,但是如果通过研究发现股市物极必反的规律,大家就会规避,在涨到一定程度就收手,这样股市的规律就会改变了,从而相应的概率就会改变。第二,还是从股市来说,如果大家都是不了解其他股民的决策,特别是以后的决策,可能就会分析股市的涨跌,如此可以得出股市的一个涨跌概率,但是如果了解其他股民未来的决策,就会根据相应的决策来决定自己的最优决策,从而此时的股市涨跌概率将会改变。第三,由于股市的变化是取决于众多不确定性因素,包括股民和上市公司的运作情况,而且这些情况互相影响和作用,股市的涨跌概率也是一个多重不确定的量。 除了我们通常提到的随机变量,可能会存在更加复杂的变量,这种变量受到的约束更少,像上面提到的多重随机变量就是。这种可能作为概率值,或者是表达不确定性的一种参量,这也会增加问题的复杂性。 6 结 语 概率是用来描述随机现象的,但是概率本身也可能是随机变量,概率论中蕴含着许多的前提条件,有些虽然没有明确写出来,但是不知不觉会提醒在其理论中,而且人们也很难发现其存在,这是概率论容易陷入局限的一个原因。一种模型的建立往往需要对问题进行有意无意的简化,特别需要注意的是有些简化是人们无法察觉到的,这些简化往往限制了对问题的自由表达。要解除这些局限,就是要把现实中的事物的特性更加自由地用一种数学模型来表达,以上我们提到,概率值本身可能具有随机不确定性,甚至多重不确定性,乃至无穷重的不确定性,而且集合本身也有不确定性,这些问题叠加起来,将会异常复杂,甚至于对这个问题都无法有限的模型来表达。本文只是抛砖引玉,指出了概率蕴含着的多重不确定性。当然要发展概率论,不能依靠一种完全自由的模型,我们需要同时考虑对问题的简化和理论对于现实的忠实程度,对问题进行简化,这样才方便建模、建立理论和简化公式,对问题保留其真实存在的自由度,则可以更加普适于现实问题,满足不同的需求,更加准确和完备。对于基于可靠度的研究,笔者建议考虑其双重不确定性,可能是一种兼顾方便性和忠实度的好选择。对于这一问题的研究将有助于人工智能、信息融合和可靠性理论的发展。本文的研究也启示我们,当我们用很简单、规范、形式化的数学方法来表示、描述和解决问题的时候,可能会“砍去”问题的许多自由度,或者对问题进行“五花大绑”,限制了它的适用范围,从而使得活生生、复杂的现实问题成为刻板、简化的问题,而且有时候往往很难被发现,不仅仅是变量和概率值,还包括模型、理论、采用的运算等其他更加复杂的对象,都可能有多重的不确定性。可见我们既要看到简化问题带来的便利,但是绝对不能忽视和忘记它带来的局限性。 Kolmogorov A N, Grundbegriffe der Wahrsche — inlichkeitsrechnung , Berlin: Springer — Verlag, 1933 Xiong Daguo, The natural axiom system of probability theory- Mathematical model of the random universe . Singapore : World Scientific Publishing Co . , 2003 T. Bayes, "An Essay towards solving a Problem in the Doctrine of Chances ", Philosophical Transactions of the Royal Society of London, 53. 1763 Laplace P. S. Théorie analytique des probabilités , 3rd ed. Paris, 1886 Yong WANG, Huadeng WANG, Xiliang TANG, On the Reliability of Information , 2009 Chinese Control and Decision Conference (CCDC 2009), IEEE Press, 17-19 June 2009:871-874
量子不可克隆定理的商榷 1982年,Wootters和Zurek在英国著名的杂志Nature上发表了一篇短文,题目为单个量子不可能被克隆。后来称这一性质为量子不可克隆定理(quantum no-cloning theorem)。这一篇论文在发表后很长一段时间内并未引起足够的重视,随着量子信息技术飞速发展,量子不可能被克隆这一性质得到很大的青睐,它被用来进行保密通信有不可代替的优势,因为通过其它方式存储和传输的信息很容易被复制和读取,量子不可克隆定理及量子的不确定性却能避免这些弊端。同时,它也为量子计算机的应用和量子信息的读取设置了一道障碍,当然这一障碍是可以逾越的。虽然量子不可定理有其坚实的理论基础,但由于量子不可克隆定理的正确与否有着重大的意义、量子力学本身的复杂性以及未知领域的存在,本文班门弄斧地提出肤浅的质疑,旨在抛砖引玉地引导大家进行就这些问题进行深入的探讨。 2.量子不可克隆定理的证明 量子不可克隆定理是根据量子态的叠加原理推导出的。Wootters和Zurek的论证简述如下:设二态体系的态空间的两个正交归一基矢记为|0〉和|1〉。采用 Panli表象, |0〉 = , |1〉= 按照量子态叠加原理,这个体系的任何一态|〉都可以表示成|0〉和|1〉的线性叠加,即 |〉= a |0〉 + b |1〉 , | a | 2 +| b | 2 =1 设复制(放大)装置的初态为|A〉。量子态的完全精确复制过程可以表达如下: | A 〉|〉| A 〉|〉|〉 |A 〉是复制后复制装置所处的状态,它可以依赖于,也可以不依赖于被复制的量子态 | 〉。设 |0〉以及与它正交的|1〉可以被这个装置完全精确复制,即 | A 〉|0〉| A 0 〉|0〉|0〉 | A 〉|1〉| A 1 〉|1〉|1〉 对体系的任何一个状态|〉能否被这个装置完全精确复制呢?回答是否定的。理由如下:由 | 〉= a |0〉 + b |1〉,有| A 〉|〉= a | A 〉|0〉 + b | A 〉|1〉 按| A 〉|0〉| A 0 〉|0〉|0〉及| A 〉|1〉| A 1 〉|1〉|1〉有 | A 〉|〉a| A 0 〉|0〉|0〉 + b| A 1 〉|1〉|1〉 设|A 0 〉 | A 1 〉,则上式所示复制出来的体系处于混合态,绝不可能是要复制的纯态 | 〉|〉(不计及归一化问题),因为 |〉|〉= ( a |0 + b |1)( a |0 + b |1)= a 2 |0〉|0〉 +2 ab |0〉|1〉 + b 2 |1〉|1〉 如|A 0 〉=|A 1 〉,则|A〉|〉|A 0 〉|0〉|0〉 + b | A 1 〉|1〉|1〉所示复制出来的体系处于下列纯态|0〉|0〉 + | 1〉|1〉,是一个纠缠态,它也决不可能是 a 2 |0〉|0〉 +2 ab |0〉|1〉 + b 2 |1〉|1〉所表示的状态。因此,如果一个量子复制机能精确复制态|0〉和|1〉,则它不可能复制两态的叠加态|〉= a |0〉 + b |1〉,由此得出量子不可克隆定理 。 3.量子不可克隆定理在应用中的利弊 由于量子态不可克隆的性质,以量子态来表示信息的量子计算机不得不采用特别的方法进行信息读取,也需要采用特别的方法进行纠错。给量子计算机的实现带来了困难。在不远的将来,量子计算机将会从现在的实验阶段走向应用。量子计算机的最重要优点体现在量子并行计算上,特别突出的是经典计算机只能进行指数算法的问题,量子计算机有可能用多项式算法来完成。由于量子算法揉进量子力学的许多特性,如相干叠加性、并行性、纠缠性、测量坍缩等等,它们为计算效率的提高带来极大的帮助。1994年Shor等人提出了一种大数因子分解的量子多项式算法 。Shor量子算法的核心是利用数论中的一些定理,将大数因子分解转化为求某个函数的周期。在量子计算机中Shor算法的每一步骤都是可以通过多项式算法来完成。所以,在量子计算机中Shor算法是有效的算法。Grover量子算法是解决一类遍历搜索问题的量子算法。它可以用来破解通用的56位的数据加密标准(DES),只需2 28 2.6810 8 步,而经典算法约需2 55 3.610 16 步。即使假定量子计算机与经典计算机都具有每秒计算十亿次的速度,经典计算需11年,而Grover算法只需3秒钟。如果量子计算机能实现,世界上许多密码体制将受到严重威胁。与量子计算机对密码体制的威胁形成鲜明对比的是,量子不可克隆定理这一性质可以用来进行信息的保密传输 。量子不可克隆定理不仅在量子信息技术中扮演着非常重要的角色,而且还对物理学特别是量子力学有深远的影响。 4.对量子不可克隆定理的质疑 在文献 中,对于量子是否可以克隆,以及是否可以利用量子克隆进行超光速通信的问题产生了争论。从理论上而言,当一个特定频率的光子在通过所有不同的(纵轴)方向的激光器(无数个激光器串联)时,无论它的偏振方向如何,总会在相应方向的激光器中产生受激辐射,从而被复制。虽然实际情况下,由于自发辐射产生的噪声干扰而导致克隆不准确,但是这并不能完全保证这一不成功的克隆的量子与被克隆的量子态之间是完全无关的,这种相关性如果用来进行超光速通信,虽然不能进行成功的通信,从而明显地颠倒因果,但是会导致因果之间存在相关性,这种相关性则可能说明具有相关性的因果可能被颠倒。可见想通过噪声干扰而说明量子力学与相对论不对立并不具有很强说服力。鉴于量子力学本身的复杂性以及量子不可克隆定理在理论实践中的重大意义,在此本人以门缝之见提出几点质疑。⑴量子不可克隆定理的简单证明未必能排除一切克隆的可能性。众所周知,证明一个定理错误很容易,只需举一个反例足够;证明一个定理正确却困难,需要考虑到一切可能的情况,必须将每一种情况充分讨论到,不可能的情况也要有排除理由的说明,特别是在量子力学存在未知的领域以及它本身非常复杂难于理解的情况下。⑵量子不可克隆定理的证明中,许多地方没有详细论证。如为什么不能复制2 ab |0〉|1〉这一部分(这正是一个纠缠态)?为什么克隆过程不能是一种综合的过程?为什么|0〉|0〉和|1〉|1〉这两部分要分别克隆?虽然乍一看似乎是这样,但科学发展史特别是量子力学的发展告诉我们,许多曾经被认为正确理论似是而非,如相对论之前的时空观,定域性的观点,我们必须在正确坚固的基础上构筑科学的大厦。科学的大厦往往建立在一定的未被证明而且也难于证明但是却很容易为世人承认的基础之上,如公理、公设、假定等等。以人的克隆为例子(虽然人的克隆并非达到量子态的完全一致)来说明问题,在对人的生物结构未明了之前,我们很难相信,克隆人是可能的。因为如果解剖人体来测定人体的组成,在一部分未完全测定时,其它部分就已经因为人的死亡而变化(这与不确定性关系非常相似),即使将人的每一个细胞或每一个器官都复制好,我们仍然无法将它们进行恰如其分的组合使之变成一个完整、有生命活力的人(这与量子不可克隆定理的证明也很相似)。但是当初我们万万没有想到的是仅仅用一个人的单个细胞,就可以克隆人。并且对被克隆的人没有很大的伤害(只需一个细胞)。⑶我们没有完全了解量子(光子、电子等等)产生的原理,量子是否存在更加微观的属性和结构?是否量子也存在象基因一样的组成成分?如果存在,可能会利用这些进行克隆。⑷受激辐射的条件之一是激励光子必须具有与介质相应的频率,这恰好使激励光子的频率与激发产生光子的频率一致。类似这种受激辐射中的强迫振动选择性的选择方式是否也会体现在其它粒子的复制过程中即激励粒子自动选择相应的条件产生相同量子态的粒子,但是不改变自己的量子态从而实现量子态的克隆。激励粒子也可能会在对自身不改变或改变可以忽略的情况下,创造产生具有相同的量子态的粒子的条件。⑸光子(电磁波)通过偏振片时,以cos 2 几率通过,并且偏振方向随偏振片设置方向发生改变,是否在其它粒子的复制过程中存在类似的筛选机制,使不同量子态的粒子的量子态坍塌到与被克隆粒子相同的量子态,抑或使复制机自动调整到以被复制量子态为本征态(| )= a |0)+ b |1)中 a =0或 b = 0 的情形)的状态然后进行复制,而被克隆粒子自身不改变或改变可以忽略。其实通过偏振片的过程中,光子怎样改变偏振态,现今的量子力学还无法回答 ,所以我们很难排除其它类似筛选、从动或同化机制的存在性。常言道,屋脊上的葫芦两边滚。假如一个物体在光滑的球体的顶上,刚好平衡,在理想情况下,只要有任意一个方向的哪怕是再微不足道的微扰,也会使它进入一种相应的运动状态。比如,另一个物体从它旁边飞过,也会使物体向相同方向运动。⑹量子测量理论中存在很多根本的问题没有解决,包括什么样的物理过程只能算是相互作用?什么样的物理过程才算是量子测量 ?而且测量中的状态的坍缩过程是一个及其深邃的、未被了解的过程。量子不可克隆定理的证明中并没有排除所有利用不改变量子态的相互作用进行间接测量或者更加微观的测量(且不造成量子态的测量坍缩)的可能性。⑺量子力学中的不确定性,从最初被认为是对微观客体的观测,必然给它带来不可控制的动量、能量干扰 ,到现在被认为的被观测物与仪器的纠缠作用,都认为是测量的干扰。但是人类的认识是从宏观到微观逐步深入的,比如对粒子的认识了解,粒子是否可以继续分解为更小的粒子,什么是最基本的粒子,我们的认识中最基本的粒子是从分子到原子到中子(质子)到夸克。当有更加微观的认识后,测量过程中产生的动量、能量干扰可能不会改变量子态,只要在对量子态不改变的情况下能进行量子态的测量,就可以克隆。⑻在受激辐射中,只有特定偏振方向、特定频率的入射光子才能产生使介质产生受激辐射,产生相同频率、偏振方向、相位、传播方向的光子,而对于其它的光子不会产生受激辐射。不考虑自发辐射,从理论上而言,当一个特定频率的光子在通过所有不同的(纵轴)方向的激光器(无数个激光器串联)时,无论它的偏振方向如何,总会在相应方向的激光器中产生受激辐射,从而被复制。实际情况下,由于自发辐射产生的噪声干扰而不可行 ,但是我们不能排除在对更加微观的性质了解后,有排开自发辐射的光子或者抑制自发辐射的可能性。受激辐射的这种选择性也从某一方面反映了在不改变自身量子态的情况下量子有可能对外界产生一定的作用,而这些作用恰恰反映了量子态,而这一性质有可能用来成功测量量子态。 当然,本文并没有证明量子态的可克隆性,仅仅是提出肤浅的质疑。希望专家和学者共同来完善和探讨该定量的证明。让我们以约瑟夫朱伯特的名言来共勉:争论一个问题而没能解决它,比解决了一个问题而没有争论它要好! 5.结束语 量子态能否克隆有着不可估量的意义,如果量子不可克隆定理正确,它将在经受质疑的考验之后更加受到青睐,大展异能。事物往往有难思难解的相似之处,并且也深深体现在自然科学和社会科学发展的方方面面。人有基因,微观粒子难道没有基因吗?生活中存在同化和从动效应,经典物理学中也有同频共振现象。量子世界中难道就没有类似的现象吗?至少我们没有理由否定这一点。并非笔者要牵强、武断地采用比较的方式来提出基因等等假定,而是在与经典物理学和其它现象相违背的同时,量子力学中的许多现象包括波粒二象性、不确定性关系以及它们附带的方方面面的细节性的问题似乎又与现实生活中的现象异常绝妙的相似,这一点笔者将在《喻解量子力学》中进一步说明,并提出新的假说。同时尼尔斯波尔的互补原理可以表述为:量子系统具有同样真实、但相互排斥的性质 。这一点也说明我们不能采用一种思路、孤立的观点来说明一切问题,特别是在量子力学中。当然也不能排除笔者已经陷入了一种误区,愿大家就此畅所欲言地探讨。对量子不可克隆定理的质疑将会引来更深的问题,再度引发量子力学、相对论与哲学等等领域的争执。但是,争执最终是好事,许多相关的理论本来存在疑点。笔者今后将会进一步讨论。无论量子态是否可以克隆,都利于加速理论的完善。同时需要指出的是即使量子不可克隆定理错误,也决不意味着量子密码学要进入密码学的历史博物馆,因为还有一类基于纠缠态的量子密码学实现方案。以不可克隆定理和不确定性关系为基础的量子密码学实现方案也可以进行改进后从新获得安全。并且只要克隆量子态的方法还没有实现,运用量子密码学进行保密通信都是安全的,不会存在时效的问题。如果量子态能成功克隆将给信息技术带来许多方面的进步,甚至可以利用单个量子态传输许多位比特的信息,同时会对物理学产生重大的影响,因此我们不能为一时的理论认识止住研究的步伐。 参考文献 1.张永德.量子力学 ,北京:科学出版社,2002 2.John R.Gribbin著. SchrodingerKittens and the Search for RealityIn the Search of SchrodingerCat: The Starting-World of Quantum Physics Explained ,ArtsLicensing International,Inc 1998 3. P. W. Shor. Polynomial-time algorithms for prime factorization and discrete logarithms on a quantum computer. SIAM J. Comput., 26:1484-1509, 1997. 4. Justin Mullins.Making Unbreakable Code . IEEE Spectrum. May 2002,40-45 5. W. K. Wootters and W. H. Zurek.Nature 299 (1982) 802. 6.赵凯华,罗蔚茵著.量子物理 ,北京:高等教育出版社,2001 7. Asher Peres. How the No-Cloning Theorem Got its Name ,quant- ph/ 0205076 , 2002 8.曾谨言著.量子力学(第三版) ,北京:科学出版社,2000