科学网

 找回密码
  注册
科学网 标签 计算方法 相关日志

tag 标签: 计算方法

相关日志

统计力学、物质结构类最新论文题录
zhpd55 2020-6-29 08:37
统计力学、物质结构类最新论文题录 诸平 统计力学、物质结构( 82-XX Statistical mechanics, structure of matter )类与数学相关的论文,在 MSC2010 分类标准中是82-XX,详细分类如下: 82-XX Statistical mechanics, structure of matter 82-00 General reference works (handbooks, dictionaries, bibliographies, etc.) pertaining to statistical mechanics 82-01 Introductory exposition (textbooks, tutorial papers, etc.) pertaining to statistical mechanics 82-02 Research exposition (monographs, survey articles) pertaining to statistical mechanics 82-03 History of statistical mechanics 82-04 Software, source code, etc. for problems pertaining to statistical mechanics 82-05 Experimental work for problems pertaining to statistical mechanics 82-06 Proceedings, conferences, collections, etc. pertaining to statistical mechanics 82-08 Computational methods 82Bxx Equilibrium statistical mechanics 82Cxx Time-dependent statistical mechanics (dynamic and nonequilibrium) 82Dxx Applications of statistical mechanics to specific types of physical systems 但是,在 MSC2020 分类当中,变化最大的就是82-08 计算方法( 82-08 Computational methods)类,将其调整为3位数分类82Mxx类( 82Mxx Computational methods),其中包括11个5位数分类( 5-digit classification )。 MSC2020 82-XX分类如下,与MSC2010分类相比较,少了原来的82-08计算方法,多了下面3个分类号 82-10 Mathematical modeling or simulation for problems pertaining to statistical mechanics 82-11 Research data for problems pertaining to statistical mechanics 82Mxx Basic methods in statistical mechanics 调整后82-XX分类内容如下,这也是最新版的“数学主题分类”标准( MSC2020 ) 82-XX Statistical mechanics, structure of matter 82-00 General reference works (handbooks, dictionaries, bibliographies, etc.) pertaining to statistical mechanics 82-01 Introductory exposition (textbooks, tutorial papers, etc.) pertaining to statistical mechanics 82-02 Research exposition (monographs, survey articles) pertaining to statistical mechanics 82-03 History of statistical mechanics 82-04 Software, source code, etc. for problems pertaining to statistical mechanics 82-05 Experimental work for problems pertaining to statistical mechanics 82-06 Proceedings, conferences, collections, etc. pertaining to statistical mechanics 82-10 Mathematical modeling or simulation for problems pertaining to statistical mechanics 82-11 Research data for problems pertaining to statistical mechanics 82Bxx Equilibrium statistical mechanics 82Cxx Time-dependent statistical mechanics (dynamic and nonequilibrium) 82Dxx Applications of statistical mechanics to specific types of physical systems 82Mxx Basic methods in statistical mechanics 新增加的82Mxx包括 82M20 82M60 82M15 82M36 82M99 82M12 82M10 82M30 82M22 82M37 82M31 详细分类如下 82Mxx Basic methods in statistical mechanics 82M10 Finite element, Galerkin and related methods applied to problems in statistical mechanics 82M12 Finite volume methods applied to problems in statistical mechanics 82M15 Boundary element methods applied to problems in statistical mechanics 82M20 Finite difference methods applied to problems in statistical mechanics 82M22 Spectral, collocation and related (meshless) methods applied to problems in statistical mechanics 82M30 Variational methods applied to problems in statistical mechanics 82M31 Monte Carlo methods applied to problems in statistical mechanics 82M36 Computational density functional analysis in statistical mechanics 82M37 Computational molecular dynamics in statistical mechanics 82M60 Stochastic analysis in statistical mechanics 82M99 None of the above, but in this section 下面就是 MathSciNet 数据库 2020年6月份收录的与 82-XX 相关的最新论文题录(36条),仅供参考。 MR4076084 Chen, Linxiao ; Turunen, Joonas Critical Ising model on random triangulations of the disk: enumeration and local limits. Comm. Math. Phys. 374 (2020), no. 3, 1577–1643. MR4076077 Ott, Sébastien Sharp asymptotics for the truncated two-point function of the Ising model with a positive field. Comm. Math. Phys. 374 (2020), no. 3, 1361–1387. MR4075267 Dorlas, T. C. ; Rebenko, A. L. ; Savoie, B. Correlation of clusters: partially truncated correlation functions and their decay. J. Math. Phys. 61 (2020), no. 3, 033303, 28 pp. MR4073214 Łapiński, Tomasz M. Approximations of the sum of states by Laplace's method for a system of particles with a finite number of energy levels and application to limit theorems. Math. Phys. Anal. Geom. 23 (2020), no. 1, Paper No. 9, 23 pp. MR4073203 Geng, Zhiyuan ; Tong, Jiajun Regularity of minimizers of a tensor-valued variational obstacle problem in three dimensions. Calc. Var. Partial Differential Equations 59 (2020), no. 2, Paper No. 57, 35 pp. MR4072688 Cicalese, Marco ; Gloria, Antoine ; Ruf, Matthias From statistical polymer physics to nonlinear elasticity. Arch. Ration. Mech. Anal. 236 (2020), no. 2, 1127–1215. MR4072185 Tkachov, Pasha Hydrodynamics of a particle model in contact with stochastic reservoirs. J. Math. Phys. 61 (2020), no. 3, 033301, 22 pp. MR4069336 Chodrow, Philip S. ; Mucha, Peter J. Local symmetry and global structure in adaptive voter models. SIAM J. Appl. Math. 80 (2020), no. 1, 620–638. MR4068310 Benjamini, Itai ; Fontes, Luiz Renato ; Hermon, Jonathan ; Machado, Fábio Prates On an epidemic model on finite graphs. Ann. Appl. Probab. 30 (2020), no. 1, 208–258. MR4068246 Bebiano, N. ; da Providência, J. ; da Providência, J. P. Toward non-Hermitian quantum statistical thermodynamics. J. Math. Phys. 61 (2020), no. 2, 022102, 11 pp. MR4066233 Paul, Jithu ; Gendelman, O. V. Kapitza resistance in basic chain models with isolated defects. Phys. Lett. A 384 (2020), no. 10, 126220, 8 pp. MR4066222 Golovinski, P. A. Dynamics of driven Brownian inverted oscillator. Phys. Lett. A 384 (2020), no. 10, 126203, 6 pp. MR4065814 Liu, Li-Min ; Cui, Ying-Ying ; Xu, Jie ; Li, Chao ; Gao, Qing-Hui The non-Markovian property of q -Gaussian process. Comput. Math. Appl. 79 (2020), no. 6, 1802–1812. MR4065611 Chávez, C. Abraham T. ; Curilef, Sergio Tricorn-like structures in an optically injected semiconductor laser. Chaos 30 (2020), no. 2, 023130, 6 pp. MR4065435 Ding, Ounan ; Shinar, Tamar ; Schroeder, Craig Affine particle in cell method for MAC grids and fluid simulation. J. Comput. Phys. 408 (2020), 109311, 29 pp. MR4065358 Boudjemaa, Abdelaali ; Keltoum, Redaouia Effects of weak disorder on two-dimensional bilayered dipolar Bose-Einstein condensates. Chaos Solitons Fractals 131 (2020), 109543, 6 pp. MR4065310 dos Santos, Maike A. F. Mittag-Leffler functions in superstatistics. Chaos Solitons Fractals 131 (2020), 109484, 6 pp. MR4065306 Luo, Xiang Solitons, breathers and rogue waves for the three-component Gross-Pitaevskii equations in the spinor Bose-Einstein condensates. Chaos Solitons Fractals 131 (2020), 109479, 8 pp. MR4065268 Liu, Yifei ; Liu, Yingkai ; Prodan, Emil Braiding flux-tubes in topological quantum and classical lattice models from class-D. Ann. Physics 414 (2020), 168089, 23 pp. MR4064873 Nussinov, Z. Macroscopic length correlations in non-equilibrium systems and their possible realizations. Nuclear Phys. B 953 (2020), 114948, 91 pp. MR4064822 Gromov, E. M. ; Malomed, B. A. Interplay of the pseudo-Raman term and trapping potentials in the nonlinear Schrödinger equation. Commun. Nonlinear Sci. Numer. Simul. 85 (2020), 105220, 11 pp. MR4064820 Chen, Junbo ; Zeng, Jianhua One-dimensional localized modes of spin-orbit-coupled Bose-Einstein condensates with spatially periodic modulated atom-atom interactions: nonlinear lattices. Commun. Nonlinear Sci. Numer. Simul. 85 (2020), 105217, 11 pp. MR4064819 Bai, Feng ; Han, Daozhi ; He, Xiaoming ; Yang, Xiaofeng Deformation and coalescence of ferrodroplets in Rosensweig model using the phase field and modified level set approaches under uniform magnetic fields. Commun. Nonlinear Sci. Numer. Simul. 85 (2020), 105213, 23 pp. MR4064398 Joshi, Abhishek ; Majumdar, Pinaki A classical fluctuation theory of the superfluid, Mott, and normal phases of correlated bosons. Eur. Phys. J. B 93 (2020), no. 2, Paper No. 33, 15 pp. MR4064396 Zakharov, Mikhail Y. ; Demidov, Denis ; Shepelyansky, Dima L. Thermoelectric properties of Wigner crystal in two-dimensional periodic potential. Eur. Phys. J. B 93 (2020), no. 2, Paper No. 31, 9 pp. MR4064394 Azizi, Farshad ; Rezania, Hamed Spin transport properties of anisotropic Heisenberg antiferromagnet on honeycomb lattice in the presence of magnetic field. Eur. Phys. J. B 93 (2020), no. 2, Paper No. 29, 11 pp. MR4064393 Gupta, Deepak ; Maritan, Amos Thermodynamic uncertainty relations in a linear system. Eur. Phys. J. B 93 (2020), no. 2, Paper No. 28, 8 pp. MR4064390 Zhang, Chao ; Rieger, Heiko Phase diagrams of the disordered Bose-Hubbard model with cavity-mediated long-range and nearest-neighbor interactions. Eur. Phys. J. B 93 (2020), no. 2, Paper No. 25, 7 pp. MR4064214 Vroylandt, Hadrien ; Proesmans, Karel ; Gingrich, Todd R. Isometric uncertainty relations. J. Stat. Phys. 178 (2020), no. 4, 1039–1053. MR4064209 Méndez, A. R. ; García-Perciante, A. L. ; Chacón-Acosta, G. Thermal dissipation in two dimensional relativistic Fermi gases with a relaxation time model. J. Stat. Phys. 178 (2020), no. 4, 936–953. MR4064207 Benoist, T. ; Panati, A. ; Pautrat, Y. Heat conservation and fluctuations between quantum reservoirs in the two-time measurement picture. J. Stat. Phys. 178 (2020), no. 4, 893–925. MR4062992 Okuyama, Kazumi Replica symmetry breaking in random matrix model: a toy model of wormhole networks. Phys. Lett. B 803 (2020), 135280, 4 pp. MR4062465 Hilfiker, Lorenz ; Runkel, Ingo Existence and uniqueness of solutions to Y -systems and TBA equations. Ann. Henri Poincaré 21 (2020), no. 3, 941–991. MR4062463 Garrod, Barnaby ; Tribe, Roger ; Zaboronski, Oleg Examples of interacting particle systems on Z as Pfaffian point processes: coalescing-branching random walks and annihilating random walks with immigration. Ann. Henri Poincaré 21 (2020), no. 3, 885–908. MR4065527 Accardi, Luigi ; Guerrero-Poblete, Fernando Quantum Markov semigroups of low density limit: the generic case. Open Syst. Inf. Dyn. 26 (2019), no. 4, 1950021, 30 pp. MR4062009 Ebert, Dietmar ; Blaschke, David Thermodynamics of a generalized graphene-motivated (2 +1 ) D Gross-Neveu model beyond the mean field within the Beth-Uhlenbeck approach. PTEP. Prog. Theor. Exp. Phys. 2019, no. 12, 123I01, 30 pp.
个人分类: 数学研究|2266 次阅读|0 个评论
数值逼近Python程序
cambaluc 2019-10-17 20:15
插值,三次样条,拟合一锅烩: #interpolate_fit ,kangjian20191016 import numpy as np from scipy.interpolate import spline from scipy.interpolate import interp1d import matplotlib.pyplot as plt x=np.array( ) y=np.array( ) xx=np.linspace(0,20,80) f1=interp1d(x,y) f2=interp1d(x,y,kind='quadratic') f3=interp1d(x,y,kind='cubic') f,ax=plt.subplots(2,2) ax .plot(x,y,'o',xx,f1(xx),'.') ax .plot(x,y,'o',xx,f2(xx),'-') ax .plot(x,y,'o',xx,f3(xx),'-') sp=spline(x,y,xx) ax .plot(x,y,'o',xx,sp,'.') #plt.savefig('fit1.png',dpi=400,bbox_inches='tight') plt.show() plt.scatter(x,y,label='点') poly1= np.polyfit(x, y, deg = 1) plt.plot(xx, np.polyval(poly1, xx),'.',label='1次') poly2= np.polyfit(x, y, deg = 2) plt.plot(xx, np.polyval(poly2, xx),'.',label='2次') poly3= np.polyfit(x, y, deg = 3) fun=np.poly1d(poly3)##poly1d plt.plot(xx, fun(xx),color='r',label='3次') plt.legend(loc='best') #plt.savefig('fit2.png',dpi=400,bbox_inches='tight') plt.show() 最佳平方逼近,按原理 # -*- coding: utf-8 -*- Created on Thu Oct 17 11:11:00 2019 @author: kangjian import numpy as np import matplotlib.pyplot as plt x=np.array( ) y=np.array( ) def fi0(x): return x*0+1 def fi1(x): return x def fi2(x): return np.sin(x) G=np.matrix(( , )) b=np.matrix(( , )) a=np.linalg.solve(G,b) print(a) xx=np.linspace(1,6,100) plt.scatter(x,y) fun=a *fi0(xx)+a *fi1(xx) plt.plot(xx, fun,'.',color='r') G=np.matrix(( , , )) b=np.matrix(( , , )) a=np.linalg.solve(G,b) print( ,a ,a ]) fun2=a *fi0(xx)+a *fi1(xx)+a *fi2(xx) plt.plot(xx, fun2,'.',color='b') #plt.savefig('fit3.png',dpi=400,bbox_inches='tight') plt.show() 同样的数据,直接调函数 import numpy as np import matplotlib.pyplot as plt x=np.array( ) y=np.array( ) xx=np.linspace(1,6,100) plt.scatter(x,y) mypoly= np.polyfit(x, y, 1) plt.plot(xx, np.polyval(mypoly, xx),'.',color='r') mypoly2= np.polyfit(x, y, 2) plt.plot(xx, np.polyval(mypoly2, xx),'.',color='g') mypoly3= np.polyfit(x, y,3) fun=np.poly1d(mypoly3)#函数形式 plt.plot(xx,fun(xx),'.',color='b') #print(mypoly) plt.savefig('fit4.png',dpi=400,bbox_inches='tight') plt.show()
个人分类: Python|0 个评论
数值逼近C程序
热度 1 cambaluc 2018-1-19 17:44
C 语言中数组、指针、函数都是初学者不易掌握和应用的内容,数值分析中的函数逼近问题,也是较抽象的内容,这些内容对理工科学生来说都是应该必学必会的。 用 C 语言编写数值分析中的算法,即有利于学生巩固计算机语言及数值分析知识,也有利于学生提高分析解决问题的能力,从而深入、形象地理解这两门课程内容,掌握算法的精髓。 本文重点介绍了用 C 语言编写曲线拟合的最小二乘法程序,其中用到了“函数指针数组”。这个程序能使学生更好地理解基函数、最佳平方逼近、法方程等概念,同时程序中也涉及到线性方程组求解、文件读写、数组参数传递、绘图等。 最后也给出对同一组数据进行分段线性插值、拉格朗日插值、三次样条插值、三角插值等的图像,这样有利于比较各种数值逼近方法,促进对知识的掌握及对算法综合运用。 函数的最佳平方逼近及曲线拟合的最小二乘法原理在此不多阐述,简单来说就是由一类基函数的线性组合来逼近某一函数,或者说在简单的基函数张成的函数空间中找一函数,在最佳平方意义上逼近所研究函数。其原理在几何上也有直观的意义,即等价于“垂线段最短”,如图: 这也是求解“法方程”这一词的意义吧,法方程可由“多元函数求极值必要条件”导出,解超定线性方程组 Ax=b 也是这原理,可归结为解法方程 A’Ax=A’b 。 程序中定义了几个基函数,为了程序的通用性,定义了“函数指针数组”, 即: double (*pF )(double x)={fi0,fi1,fi2}; 这是我写这篇博文要强调的,这里定义的 pF 是一个“函数指针数组”, fi0,fi1… 是已定义的基函数。 pF 和 优先级高,首先说明 pF 是个数组,加 * 说明是“指针数组”,括号后又有 (double x) 说明是指向函数的,这函数该有一个 double 型的参数 ( 不写 x 也可 ) ,函数的返回类型也是 double 型。 以下是程序,有点长,“一肩担尽古今愁”,这是期末复习时演示的一个程序,可以复习练习很多内容。 (也没写太多的注释,如真需要可另解释) #include stdafx.h #include windows.h #include conio.h #include stdlib.h #include math.h #include malloc.h #define PI 3.1415926535 typedef struct{ double R; double I; }COMPLEX; int LUp(double *A,double *x,double *b,intn) { inti,r,k; double s; for(i=1;in;i++) A =A /A ; for(r=1;rn;r++) { for(i=r;in;i++) { s=0; for(k=0;kr;k++) s+=A *A ; A =A -s; } for(i=r+1;in;i++) { s=0; for(k=0;kr;k++) s+=A *A ; A =(A -s)/A ; } s=0; for(k=0;k=r-1;k++) s+=A *b ; b =b -s; } x =b /A ; for(i=n-2;i=0;i--) {s=0; for(k=i+1;kn;k++) s+=A *x ; x =(b -s)/A ; } return0; } void zhuiganfa(int N,double a ,double c ,double X ; double *y=new double ; int i; bt =c /b ; for(i=1;i=N-2;i++) bt =c /(b -a *bt ); y =f /b ; for(i=1;i=N-1;i++) y =(f -a *y )/(b -a *bt ); X =y ; for(i=N-2;i=0;i--) X =y -bt *X ; delete ,doubley ; double *b=new double ; double *c=new double ; double *d=new double ; double *h=new double ; double *M=new double ; for(j=0;j=n-2;j++) h =x -x ; for(j=1;j=n-2;j++) a =(h )/(h + h ); a =1; for(j=0;jn;j++) b =2; for(j=1;j=n-2;j++) c =(h )/(h +h ); c =1; for(j=1;j=n-2;j++) { tf1= (y -y )/(h ); tf2= (y -y )/(h ); d =6*( tf1 - tf2 )/( h + h ); } d =6*((y -y )/(h ) -bj0 )/(h ); d =6*(bjn-(y -y )/(h ))/(h ); zhuiganfa(n,a,b, c,d,M); for(j=0;j=n-2;j++) {if(xx=x xxx ) {S=M *(x -xx)*(x -xx)*(x -xx)/(6* (h ) ) +M *(xx-x )*(xx-x )*(xx-x ) / (6* (h ) ) +( y - M * (h )*(h ) /6 ) * ((x -xx) /(h ) ) +( y - M * (h )*(h ) /6 ) * ( (xx-x ) /(h ) ); } } delete ,doubley xx=x ) {yy=y *(x -xx)/(x -x )+y *(xx-x )/(x -x ); break; } } return yy; } double lagrange(double x ,intn,double xx) { double yy=0,Lk; int j,k; for(k=0;kn;k++){ Lk=1; for(j=0;jn;j++){ if(j!=k)Lk*=(xx-x )/(x -x ); } yy+=y *Lk; } return yy; } int readdata(double x ) { FILE *fp; if((fp=fopen(1228101331.txt,r))==NULL) {printf(cannot open file\\n); exit(0) ;} int i=0; while(!feof(fp)) { fscanf(fp,%lf,%lf\\n,x ,y ); i++; } fclose(fp); return i; } int drawfunction(double a,double b,doubleya,double yb,double (*f)(double ),char *win,int red) {//a,b 为 x 的区间 ,ya,yb 为估计的 y 的区间 getch(); HWND hWnd=FindWindow(NULL,win); HDC hDC=GetDC(hWnd); int i,n=800,iX,iY; double wx0=50,wx1=600,wy0=50,wy1=500; double x,y; for(i=0;in;i++){ x=a+i*(b-a)/n; y=f(a+i*(b-a)/n); iX=(int)(wx0+ (x-a)* (wx1-wx0)/(b-a) ); iY=600-(int)(wy0+(y-ya)*(wy1-wy0)/(yb-ya) ); SetPixel(hDC,iX,iY,RGB(red,0,255) ); } getch(); return 0; } double mySpline(double t) { int N=16,n; double *x=new double ; double *y=new double ; double bj0=3.0,bjn=-0.1; n=readdata(x,y); if(tx ||tx ) return 0; else { bj0=(y -y )/(x -x ); bjn=(y -y )/(x -x ); return spline(n,x, y, bj0, bjn ,t); } } double myLagrange_line(double t) { int N=16,n; double *x=new double ; double *y=new double ; n=readdata(x,y); if(tx ||tx ) return 0; else return lagrange_line(x, y,n,t); } double mylagrange(double t) { int N=16,n; double *x=new double ; double *y=new double ; n=readdata(x,y); if(tx ||tx ) return 0; else return lagrange(x, y,n,t); } double fi0(double t){ return 1;} double fi1(double t){ return t;} double fi2(double t){ return t*t;} double myLS_1p(double t) { int N=16,n; double *x=new double ; double *y=new double ; n=readdata(x,y); int p=2; double (*pF )(double t); pF =fi0;// 指向基函数 pF =fi1; doubleG ={0},b ={0}; doublea ; inti,r,c; for(i=0;in;i++) { for(r=0;rp;r++) { for(c=0;cp;c++) G +=pF (x )*pF (x ); b +=pF (x )*y ; } } LUp(G ,a,b,p); doubles=0; for(i=0;ip;i++) { s+=a *pF (t); } returns; } double myLS_2p(double t) { int N=16,n; double *x=new double ; double *y=new double ; n=readdata(x,y); int p=3; double (*pF )(double x)={fi0,fi1,fi2}; doubleG ={0},b ={0}; doublea ; inti,r,c; for(i=0;in;i++) { for(r=0;rp;r++) { for(c=0;cp;c++) G +=pF (x )*pF (x ); b +=pF (x )*y ; } } LUp(G ,a,b,p); doubles=0; for(i=0;ip;i++) { s+=a *pF (t); } returns; } double f0(double t){ return 1;} double f1(double t){ return cos(t);} double f2(double t){ return sin(t);} double f3(double t){ return cos(2*t);} double f4(double t){ return sin(2*t);} double f5(double t){ return cos(3*t);} double f6(double t){ return sin(3*t);} double f7(double t){ return cos(4*t);} double myLS_sincos(double t) { int N=16,n; double *x=new double ; double *y=new double ; n=readdata(x,y); int p=8; double (*pF )(double x); pF =f0; pF =f1; pF =f2; pF =f3; pF =f4; pF =f5; pF =f6; pF =f7; doubleG ={0},b ={0}; doublea ; inti,r,c; for(i=0;in;i++) { for(r=0;rp;r++) { for(c=0;cp;c++) G +=pF (x )*pF (x ); b +=pF (x )*y ; } } LUp(G ,a,b,p); doubles=0; for(i=0;ip;i++) { s+=a *pF (t); } returns; } ////fft COMPLEX add(COMPLEX a,COMPLEX b) { COMPLEX c; c.R=a.R+b.R; c.I=a.I+b.I; return c; } COMPLEX sub(COMPLEX a,COMPLEX b) { COMPLEX c; c.R=a.R-b.R; c.I=a.I-b.I; return c; } COMPLEX mul(COMPLEX a,COMPLEX b) { COMPLEX c; c.R=a.R*b.R-a.I*b.I; c.I=a.R*b.I+b.R*a.I; return c; } int nx(int k,int p) { int q,t=0; for(q=0;qp;q++) if((1q)k) t+=1(p-q-1); returnt; } void kj_FFT(COMPLEX *T,COMPLEX *F,int p) { intN,q,k,r,j,i,t; COMPLEX *A1,*A2, *W; double a; N=1p; A1=(COMPLEX *)malloc(sizeof(COMPLEX)*N); A2=(COMPLEX *)malloc(sizeof(COMPLEX)*N); W=(COMPLEX *)malloc(sizeof(COMPLEX)*N/2); for(i=0;iN;i++) A1 =T ; for(i=0;iN/2;i++) { a=-i*2*PI/N; W .R=cos(a); W .I=sin(a); } for(q=0;qp;q++) {for(k=0;k1q;k++) { r=1(p-q-1); for(j=0;jr;j++) {t=k*( 1(p-q) ); A2 =add(A1 , mul(A1 ,W ) ); A2 =sub(A1 , mul(A1 ,W ) ); } } for(i=0;iN;i++) A1 =A2 ; } for(i=0;iN;i++) { F .R=A2 .R/N; F .I=A2 .I/N; } } double myFFTsincos(double t) { int N=16,n,p=4,j,k; double *x=new double ; double *y=new double ; n=readdata(x,y); COMPLEX *pT,*pF; pT=(COMPLEX *)malloc(sizeof(COMPLEX)*n); pF=(COMPLEX *)malloc(sizeof(COMPLEX)*n); for(j=0;jn;j++) { pT .R=y ; pT .I=0.; } kj_FFT(pT,pF,p); for(k=0;k=n/2;k++) { pF .R=pF .R*2; pF .I=pF .I*2; } if(tx ||tx ) return 0; else { double s,tt; tt=2*PI*(t-x )/(x -x ); s=pF .R/2; for(j=1;j=n/2-1;j++) {s+=pF .R*cos(j*tt)-pF .I*sin(j*tt); } s=s+1/2*pF .R*cos(n/2*tt); return s; } } int main(int argc, char* argv ,0); drawfunction(xa,xb,ya,yb,myLagrange_line,argv ,50); drawfunction(xa,xb,ya,yb,myLS_1p,argv ,150); drawfunction(xa,xb,ya,yb,myLS_2p,argv ,200); drawfunction(xa,xb,ya,yb,myLS_sincos,argv ,250); drawfunction(xa,xb,ya,yb,myFFTsincos,argv ,0); return 0; } 下图是两组数据的运行结果。
个人分类: 算法|2837 次阅读|2 个评论
跨尺度问题的处理方法
热度 3 等离子体科学 2017-10-3 07:38
国庆中秋佳节快乐! 节前写过一篇,意犹未尽。再续: 前几天说到:多尺度问题研究常常采用特征尺度近似方法,对不同尺度范围内的问题分别处理;但是这种方法在处理跨尺度问题的时候就显得无能为力。 等离子体物理中的双流体模型算得上处理跨尺度问题的一个好办法。尽管是流体描述,但是同时包括了电子的时间快尺度(空间小尺度)和离子的时间慢尺度(空间大尺度)物理过程,而且可以涵盖带电粒子回旋半径尺度的最低阶近似(及回旋半径的平方项修正)。但是正因为同时有电子的快尺度和离子的慢尺度,所以在做数值模拟时会遇到所谓“刚性问题”——即往往电子的运动图像已经面目全非了,离子还慢吞吞地没有响应 —— 以致需要大量计算时间;而且在这个过程中,为了展示离子的响应,很可能电子运动已经积累的大量的计算误差;而采用更精确的算法可能更进一步耗费机时。 解决这一问题,人们在利用电子和离子的质量比这一小量(10 -3 )作为参数展开,在这一质量比趋于零的近似下得到霍尔磁流体(Hall MHD)和电子磁流体(Electron MHD, or EMHD)两种近似模型。前者设离子质量有限、直接令电子质量趋于零,从而忽略了电子动力学;后者则假设电子质量有限,令离子质量趋于无穷大,集中研究电子动力学。更进一步的近似则是假设宏观尺度上没有电荷分离、电子和离子一起运动。这就是我们熟知的磁流体模型(Magnetohydrodynamics, or MHD)。人们一般认为这一模型完全是宏观、慢尺度的描述。但是值得指出的是:这一模型隐含了带电粒子回旋半径效应的“零阶量”——“抗磁漂移”效应。 当然,即使应用上述更加简化的模型,在处理具体问题的时候,仍然会遇到跨尺度问题:比如人们近几年特别关注的低模数的磁流体模数和高模数的等离子体湍流(比如磁流体(MHD)湍流、流体描述的离子温度梯度模(ITG)湍流等)之间的相互作用(尽管两者都可以用流体、甚至磁流体模型描述)。 解决上述问题,常用的方法之一就是 “多尺度展开”。如果只考虑少数特征尺度(比如2-3个),而且这些尺度相差很大,容易区分,我们可以利用“渐进展开”(AsymptoticExpansion)方法,比如常用的“WKB近似”(即几何光学近似、或者量子力学中的名称:准经典近似);或者“边界层”(Boundary Layer)展开方法(如果两种不同的尺度分别在不同的空间区域占主导地位)。但是如果模式很多,而且有一些模式的尺度相近,则需要进行更普遍意义上的 “多模展开”(就是有人提到的所谓“多尺度叠加”),即同时考虑几个、几十个、甚至上百个跨越不同尺度的运动模式(Fourier分量),在特定的初始、边界条件下计算它们的时空演化。这种方法很直接,但这些模式的选择人为性比较强。虽然在选择时经过物理分析,但毕竟不是自洽的。对研究物理机制有重要的参考价值,但对解释具体的物理过程和实验现象就有些“力不从心”。进一步的作法是选择一种尺度的模式,而让其它尺度的模式自洽产生演化,再来看它们之间的多尺度相互作用过程。上周在华中科大和浙江大学分别召开的两个学术会议上,研究输运过程的工作大多是采取这种方法:以研究MHD为主的团队多在MHD code里加上几个有代表性的微观湍流模式,研究其与自洽演化的大尺度、低模数MHD模数(特别是各种撕裂模)之间的相互作用;而以微观湍流研究为主的团队则在微观粒子模拟code里选择性地加上一两个特定的大尺度MHD模式,研究它们之间的跨尺度相互作用。 最终的解决方案还是要在第一性原理的水平上研究跨尺度的物理问题。以粒子模拟为主的GTC团队(前面提到的Science上的文章就是用GTC code做的)提出的目标就是研发带撕裂模磁岛自洽演化过程的GTC code。但是这又回到前面的所谓“刚性”问题。如何在物理模型和计算方法两方面双管齐下予以解决,还是巨大的挑战。
个人分类: 学海无涯|17822 次阅读|6 个评论
展示一篇对"利用气温计算山区裸地地表温度的新方法"的审稿意见
waterlilyqd 2017-4-19 17:55
投到Journal of Mountain Science 的文章利用气温计算山区裸地地表温度的新方法(New methods for calculating bare land surface temperature over mountainous terrain) 在第一轮审稿时共收到三份审稿意见, 三份意见均较为详细,所有审稿意见加在一起有四页多,意稿人对这种简单的新方法均表现出浓厚的兴趣并给予了充分的肯定,同时提出了很多具体的建议以便作者进一步修改和完善。三位审稿人分别来位于意大利的欧洲研究院(Academia Europaea)高山研究所, 意大利那不勒斯第二大学,西班牙国家研究委员会比利牛斯生态研究所。 在这里贴出这三份审稿意见的目的是希望国内的学者能够从中学习到一些撰写审稿意见的方法, 同时, 给从事相关研究的国内学者提供一些合作交流的线索。 第一位审稿人先对文章进行了总体评价,然后针对文章各章节给出相应评价和具体意见,这样的审稿意见让作者更容易理解,在修改时也更容易操作。 Reviewer 1 Accademia Europea, Institute for Alpine Environments The manuscript is well written. However, it proposes a rather simple method compared with the major literature on the field. The method could be useful in data-poor regions. I would have suggested reject in a major journal with very high IF, but I think good works, even if made with a few data and simple approaches, deserve a publication in a good journal as JMS. General comments : The article proposes a new methodology to improve the estimation of land surface temperature (LST) over mountainous terrain, on the basis of topographic information and air temperature. The proposed method is very simple and based on few, easily available data. Performances are relatively poor, compared to other, more complex, methods. Nevertheless, the method improves significantly results, compared to an approach based only on air temperature. The method could be useful in data-poor regions. The paper is very well written and results are well supported by observations. However, there are several aspects in the methodology that can be improved. I understand that the Authors want to keep the method simple and with little data requirements (only T air observations), but several improvements are possible that could, at least, be mentioned as possible future developments in the Discussion. In particular: •Only bare soil is considered. However, as acknowledged, vegetation strongly influences LST. How vegetation can be considered in the method? •A better validation of the method could be given by remote sensing data. Why do not validate the model also against such a data? •Effect of long wave radiation and could cover. Simple methods are available to infer long wave radiation to further improve the method. I think the paper is in line with the aims and targets of JMS. To conclude, I suggest a moderate revision for the paper. Specific comments: Introduction Introduction is well written: I suggest underlining the importance of LST estimation in mountain regions for processes as permafrost. I suggest also mentioning the possibility of estimating LST by proximal sensing (thermal cameras). Site and data Here I have a major methodological observation. Did you measure LST just below the soil or at the soil surface? In the last case, how has been the instrument sheltered from the Sun? Incorrect solar sheltering and simply the fact that the instrument is made in a different material with respect to the soil, can alter observation of several K. Please explain better the experimental setup. Methodology If a temperature lapse rate of -6.5 C/100 m is always assumed, large errors in Ta estimation are possible. In fact, over long time scales this assumption is safe, but locally and at the instantaneous time scale, lapse rate could change a lot (i.e. morning thermal inversion, etc …) In the methods, the diurnal Ta excursion is used. The method performs also worse for cloudy days. This could be because the effects of incoming long wave radiation from the clouds are not take in account. Way do not consider simple parametrizations as the one of Brutsaert (1975) and following modifications for clouds? Brutsaert, W. (1975). On a Derivable Formula for Long-Wave Radiation from Clear Skies. Water Resour. Res., 11(5), 742–744. Validation Given the simplicity of the method, it works relatively well, even below pefromances of more complex methods. A better validation of the method could be given by thermal cameras observations or by MODIS (500 m resolution) LANDSAT LST (60 m resolution) observations. The latter are available for free. Why do not validate the model also against such a data Reviewer 2 Seconda Università di Napoli, Dipartimento di Ingegneria Civile, Design, Edilizia e Ambiente The paper proposes a simple method to calculate bare soil surface temperature from air temperature measurements. The topic is of interest for the readership of JMS, as soil surface temperature affects several processes occurring at soil surface, such as soil-atmosphere energy and water exchange, snow melt etc. The manuscript is clearly organized, but the English language must be improved with the help of a native speaker (for instance, there is continuously skipping from present tense to past tense, that should be homogenized throughout the manuscript). Although the proposed method could be useful for practical applications, the presentation of the results does not allow the reader to judge if the drawn conclusions are actually supported by the data. In particular, after describing the proposed mathematical relationships allowing calculation of soil temperature from air temperature, solar elevation and land slope and aspect angles, the authors make their discussion by comparing the obtained results only with the naive assumption of considering soil surface temperature equal to air temperature, and conclude that their model is closer to actual measured soil temperature. I have several concerns about this line of evaluating model performance: - I wonder if this kind of comparison is enough to draw the conclusion that equations (1) and (2) are suitable for estimating LST. The authors should provide more information about the errors of the model, e.g. at what time of the day, and in what part of the year, the discrepancies between model and measurements are maximum? - Would it be possible to introduce the effect of cloud cover to further improve the performance of the equation? - To what extent the errors still present in the modeled LST affect the estimates of water and energy exchanges at soil surface? - Although the authors state that other existing approaches for estimating soil surface temperature do not provide data at the required spatial resolution, some comparison with the performance of other models should be made. - The presented data refer to high altitude sites, and the authors, in their introduction, mention permafrost dynamics as one of the possible fields of application of the method; nonetheless, there is no mention to insulation snow effect on the relationship between air temperature and soil temperature (see Wang et al., 2016, for a recent review of existing models). Given all these issues, me recommendation is that the manuscript is not acceptable in its present form, and major revisions are needed before re-evaluating it for possible publication in JMS. References Wang W, et al., 2016 Evaluation of air–soil temperature relationships simulated by land surface models during winter across the permafrost region, The Cryosphere, 10: 1721–173 Reviewer 3 Spanish Research council, CSIC, Pyrenean Institute of Ecology Dear Editor, The manuscript deals with a research that is rather simple, but may result useful for other researchers and, hence, to be of interest for JSM. Below I indicate a short number of comments that may facilitate the lecture of the manuscript and also some questions that authors should consider before being accepted the manuscript. Comments to the Author The manuscript New methods for calculating bare land surface temperature over mountainous terrain test two equation to obtain bare land suface temperature in mountain areas. Analyses are rather simple and the results are depicted very briefly. In general, I think that this topic may be of interest for different field of research in mountain areas (ecology, erosion, etc) and hence of interest for Journal of Mountain Science. Below I indicate a number of comments that authors should address and/or clarify in a revised version: 1- In the abstract all acronyms should be introduced with the full name for better understanding. 2- Figure captions should be reworked to be self-explanatory. In its current form they do not result very informative if you do not read the full manuscript. 3- The section Validation includes the full results. I would move the first paragraph to methods, and the rest to a results section. 4- An important question is that authors are correlating two series (observed and simulated data) with a very strong seasonality, that always will lead to spuriously increase the correlation values. I think that error estimators should be provided to series with the seasonal signal removed, or alternatively present the error estimators for each month, removing in this way the seasonal cycle. 5- In relation with comment 4, I think it would be of interest to show if the equations work better or worse in different times of the year, so providing (and discussing) error estimators for each month would be of interest. 6- It would be of interest stress the RMSE as a percentage of average Temperature to have an idea which % of error are associated to both equations ( a standardized RMSE). 6- What about snowpack? Were the study sites covered by snow? How did it affect the analysis? 7- Perhaps, it would be good to discuss how these equations may work on bare rock instead of bare soils. Probably, it will be necessary to use completely different parameters as differences between air temperature and surface will be much larger.
个人分类: 科技写作|3463 次阅读|0 个评论
大脑皮层的神经编码理论与类脑计算方法(六)
wangwd301 2017-1-28 12:09
3. 神经信号采样与符号翻译理论 大脑和神经系统的神经信号是一个完全可恢复的采样过程,这过程取决于感受野和投射野的自相似性和多层次性,感受野和投射野的自相似性和多层次性是由于神经元的竞争学习引起的侧向抑制和近邻学习引起的纵向分层的结果。神经信号的可恢复性采样是神经计算和表达的根本保证。上述的皮层采样定理表明了,神经系统能够通过处理实现符号和信号的等价表达。 为了感知物体和事件,大脑必须构筑一个显式表示的多层次的符号翻译系统。符号翻译意味着神经元或神经元组的感受野 (RF) 和投射野 (PF) ,感受野表明了符号翻译的信息来源,而根据神经采样理论可知投射野保证信息无损传输和存储。符号翻译理论下面两个特点:第一,显式表示意味着可以数学表达的图形和背景等;第二,多层次意味着生物学上的多级层次-等级描述假设,心理学上的多极层次-格式塔理论;第三,相似性意味着相似信息可以被大脑皮层中近邻的神经元或神经元组表达 , 这是竞争和近邻学习结果。 感受野是选择性机制的神经计算的结果,该计算结果具有信息采样可恢复的多测度数学显微镜效应,投射野是捆绑性机制的神经表达的结果,该表达结果具有特征捆绑可重组的动态性弱闭环控制效益。感受野和投射野是以直接利用为目的的神经计算,如行为、思考、注意、知晓、记忆等为目的。如果说选择性计算和捆绑性表达是大脑皮层编码的主处理器,那么构建协同选择与捆绑处理的协处理器是实现大脑皮层高级功能的关键理论。
个人分类: 类脑计算|2709 次阅读|0 个评论
大脑皮层的神经编码理论与类脑计算方法(五)
wangwd301 2017-1-23 17:45
  2. 神经计算和表达原理 神经元和神经元组既是计算的基本单元又是表达的基本单元,这是因为神经元膜电位低于放电阈值时能够被传输的缘故。神经元振荡 ( 即持续尖峰发电 ) 是它的表达功能的体现,而神经元膜电位的传输是它的计算功能的体现。神经元能够同时执行计算和表达的功能。神经元的放电频率是其表达结果,放电后的膜电位是其计算结果。神经元组起到信号增强和容错作用。 神经系统和大脑皮层振荡的第一层意思指,个体神经元在连续时间尺度上的持续发电,它既可能是自发的又可能是激发的,自发振荡决定于其内在噪声和皮层噪声,激发振荡取决于其表征参数;振荡另一层意思指,群体神经元在连续皮层拓扑空间上的持续的放电局域场,局域场是神经元组(集合)的发电积分。 神经系统和大脑皮层相干振荡的第一层意思指,个体神经元在离散时间尺度上的持续发电,这种发电方式只能是激发的;群体神经元在离散皮层拓扑空间上的发电局域场。振荡是皮层时间编码方式,相干振荡是皮层空间编码方式。在神经系统和大脑皮层的神经元网络中的振荡和相干振荡活动是一个极其有用的信息编码机制,它们能够用于修饰或说明一个知觉对象或详细描述数据集内的规律。 神经元组就是具有相同感受野特性、相同的投射野特性和相同时间相关放电方式神经元群体 。神经元组形成首先取决于基因控制的大脑皮层整体的先天性发育和分化,然后归功于竞争和近邻学习产生的大脑皮层局部的经验性强化和和削弱,同时神经元组的联接的结构和功能的动态过程是竞争和近邻学习结果。
个人分类: 类脑计算|3363 次阅读|0 个评论
大脑皮层的神经编码理论与类脑计算方法(四)
wangwd301 2017-1-22 11:46
三、类脑计算模型框架 我们根据上述的神经编码理论构建类脑计算的新基本框架: 1. 神经元组与网络联结机制 神经振荡与相干振荡的数学模型中的神经元表征参数 取决于神经元类型、学习和它在皮层中的生理环境,如神经活性物质浓度和类型等。在我们采用的数学模型中这些参数包括膜电位时间常数、门限时间常数、 突触后电位峰值、 突触后电位峰值位置、 突触后电位时间常数、 兴奋性恢复时间常数、 突触恢复时间常数,这些参数是表征了神经元及其神经元组的计算机制,以及轴突时延常数、突触时延常数 、静息突触强度和 动作突触强度,这些参数表征了神经网络的连接机制。神经元组通常具有相同的 膜电位时间常数、门限时间常数、突触后电位峰值、 突触后电位峰值位置、 突触后电位时间常数、 兴奋性恢复时间常数、 突触恢复时间常数。神经网络通常由神经元组之间通过具有相同的轴突时延常数、突触时延常数 、静息突触强度和 动作突触强度的连接构成。 大脑皮层的神经元本身就是一种关联性记忆和选择性接受装置。关联性记忆表现为,神经元的短时突触前强化和小泡释放增强依赖于状态相关和时间相关的结果。这不同于传统的通过中间神经元产生敏感刺激的观点。大脑皮层的神经元发放和接收信号必须是通过噪声增强的机制。大脑皮层的不同类型的神经元产生不同类型的噪声以增强其所接收的信号。这种噪声增强在时间编码上表现为神经元的个体发放和接收的信号伴随着随机振荡;在空间编码上表现为神经元的群体发放和接收的局部场信号伴随着随机振荡。如果神经系统失去这种噪声增强机制它都将是器质性的病变。通常, 静息突触强度和 动作突触强度遵循着 一定的规律,即神经元在皮层拓扑空间上靠得越近,它们之间 静息突触强度越高;神经元在皮层拓扑空间上靠得越远,它们之间 动作突触强度越高。因此,静息突触强度主要用于功能柱内和脑区内的联结,动作突触强度主要用于功能柱之间和脑区之间的联结。 构建类脑计算模型首先根据有规律的连接形成相同神经元组,神经元组具有完成特定感受野计算功能的功能柱。然后神经元组以投射野方式连接成更为复杂网络,所形成的复杂网路内部和之间,通过相干振荡的通信方式,进行信号整合、信息表达和行为执行(三位一体)。
个人分类: 类脑计算|3620 次阅读|0 个评论
大脑皮层的神经编码理论与类脑计算方法(三)
wangwd301 2017-1-21 08:21
3. 感受野和神经采样 神经元及其神经元组的振荡和相干振荡完成简单快速的非线性加权运算,形成刺激响应 - 行为反应、模式识别 - 模式选择的一体化计算和表达的基础,竞争和近邻学习实现了皮层资源高效地自组织理论,形成复杂有序感受野与投射野,将数据及其数据流的从无序到有序、从简单到抽象的转变,实现信号采样。可以见得,神经系统与大脑皮层的信号与信息处理保存和修改的是信号采样和处理方法,即修改和保存神经元之间的联结强度,联结强度经过竞争和近邻学习的自组织过程形成的感受野和投射野,确保了外部刺激的数据及其数据流能够被神经系统和大脑精确采样成适合神经系统处理的形式,并被传输到不同层次处理皮层中不断加工和深度利用。 神经系统和大脑皮层的感受野和投射野是皮层表达数据且适合其处理的自然选择的结构,就如同 “ 算盘 ” 适合于十进制数的表达和计算,数字计算机适宜于二进制数的表达和计算,而感受野和投射野适宜于自然信号的表达与计算。感受野和投射野能够把听觉和视觉的自然信号的语音和影像精确地采集下来,并投射到深层进行深度加工和利用并产生响应的行为和心理反应。这种信号采集方式,如同信号与信息处理技术中的神农采样定理,能够把信号原样恢复出来,所不同的是,这种采样方式更加适合神经元细胞和网络的处理和加工。 上述定理表明了,零交叉点能够恢复出原始信号来,而零交叉点检测恰好是神经元最为基本的行为特性,即仅检测输入的刺激电位是否超过或低于诱发电位门限,超出时发放或低于时静息。形成纷繁复杂的感受野是大脑皮层和神经系统精确高效地采集外部刺激信号的神经生理学基础,也是投射到不同层次信息深度加工的要求。关于感受野和投射野的信息采集和加工的数学理论是神经计算基本,就如同,仅研究鸟飞行动力系统,而不研究空气动力学,制造不出真正意义上的飞机的,所以,模仿大脑的计算就必须研究大脑计算数学基础,感受野的信号采样的数学理论就是数学基础的一部分。 基本假设:大脑与神经系统能够通过感受野神经编码通道,精确实时地记录下和完整地还原出外部刺激信号,并传送到投射野逐步进行深度加工,感受野和投射野成为外部刺激信号的符号表达形式。这表明了,大脑皮层确实具备外界信号的精确采样机制,但是未必具有还原信号的机制。这种机制不同于录像机、录音机的还原性的记录机制,即可以通过感觉信息流解析表示出外界信号。这种机制不同于申农 (Shannon) 的采样定理,而是一种适合于神经网络信号和符号处理的信号采样机制。
个人分类: 类脑计算|3551 次阅读|0 个评论
大脑皮层的神经编码理论与类脑计算方法(二)
热度 1 wangwd301 2017-1-16 11:47
2. 竞争和近邻学习 大脑皮层网络联结的竞争学习和近邻学习的神经学机制,是通过神经元之间的侧向抑制实现的竞争学习,通过神经元群体集中发放实现的近邻学习。 竞争学习和近邻学习是人类的大脑联结结构优化演变的自然选择的生物学基础。 大脑皮层能够实时地控制着一个复杂的心理活动和认知行为组合,包括身体和大脑本身。然而,大脑皮层与人工智能系统之间的主要区别在于,在人工智能系统的外界刺激模式、行为反应模式和它们之间的关联条件是人为规定的,而在大脑中它们主要是一些从经验中启发式的自然形成的。这种差异导致了大脑皮层在数据与数据流的表达和计算的数学理论和联结机制方面与人工智能系统有着本质上不同。这种差异保证了 大脑皮层高效地使用有限的神经元资源,最大地发挥其无限的智力潜能,这需要研究长期进化过程形成其大脑皮层神经元组织机制中的数学理论和连接方式。 具体地来说,对大脑来说,自然选择导致了一个强大的趋势,就是高效地利用有限的皮层神经元资源,形成了大脑的皮层内倾向于计算 - 表达的一体化和皮层 - 下皮层的分层化的架构,这种架构使得复杂数据流能够分阶段处理,同时在不同阶段处理能够实现从经验学习中获得刺激 - 反应模式映射关系的计算 - 表达统一,即感觉刺激模式的定义、检测、识别等计算与行为响应模式的传输、控制、执行等表达是完整的统一体。该统一体具备自然选择的优势 , 它能够利用更少的资源 ( 如神经元、连接纤维和突触等 ) 不断地从经验中学习,并建立认知行为的外界刺激模式 - 行为反应模式 , 同时在不损害之前学到的行为执行的同时学习新的行为。 大脑皮层的 皮层间皮层 - 下皮层分层 和皮层内计算 - 表达一体的架构有利于种群代际进化遗传性和物种个体后天进化适应性修改将物种在自然选择过程中学习获得的生存机能保存下来。所谓皮层间的皮层 - 下皮层分层架构是指,几种相近神经元之间紧密且有规律地相互联接构成一个皮层结构,这层结构中仅有一层神经元连接到其它另一层去,如视网膜就是一个广义皮层,它们内部的几层神经细胞有规律地紧密联接,然后通过神经节细胞经外膝体联结到视觉皮层。这种架构是由遗传决定的,而后天是不能改变的,所谓皮层内计算 - 表达一体架构是指,在皮层内的神经元细胞完成各类外界刺激模式的认知计算的同时执行相应行为表达的神经反应模式,即形成神经元组振荡和相干振荡的模式。这种架构也是由遗传决定的,但是可以通过后天的竞争学习和近邻学习重新组织,改变其联结强度。 基本假设:自然选择是 进化遵循的基本法则,物种进化如此,神经系统和大脑的演变也是如此。竞争学习和近邻学习是大脑 高效地利用有限的皮层神经元资源进化 的自然选择进化法则的具体表现形式。只有通过竞争和近邻学习,神经元之间相互联接强度,才能实现从无序到有序的演变,这个过程就是自组织和自学习的过程。竞争和近邻学习实现的自组织结果就是,形成了纷繁复杂的感受野和投射野。
个人分类: 类脑计算|4278 次阅读|1 个评论
大脑皮层的神经编码理论与类脑计算方法(一)
热度 1 wangwd301 2017-1-14 15:42
从数学形式上,建立神经生理学和行为心理学之间的活动模式映射的对应关系,是神经科学、行为科学和认知科学等交叉学科领域的科学家始终致力解决重大科学问题,也是大脑皮层的神经编码机制研究的核心,还是实现类脑计算的基础。基于神经振荡和相干振荡模型、竞争和近邻学习算法、神经信号采样定理的皮层神经工作机制数学建模,本文提出了脑科学的三个基本假说,建立了一套大脑皮层编码的理论框架,该理论能够将神经生理学现象与活动模式 ( 如皮层放电、细胞联结、皮层 - 次皮层联结、振动、同步振动、感受野、功能柱等现象与活动模式 ) 和行为心理学现象与活动模式 ( 如听觉、触觉、触觉、知觉、本能、记忆、回忆、认知、动作等现象与活动模式 ) 有机地联系起来。在此基础上,提出了一种实现类脑计算框架。 关键词 :神经元 神经元组 振荡 相干振荡 竞争 近邻 学习 感受野 投射野 神经采样 神经编码 一、引言 神经元具有快速地响应、简单地加权非线性运算、精确地表达外界刺激模式,并将外界刺激响应传送其它神经元或机体的其它部分,做出行为心理反应的基本功能,它是大脑和神经系统的基本构筑单元。神经元既有结构和功能的动态特性,又有时间和空间的动态特性,它们之间的通信是通过其具有可塑性的突触耦合实现的,这使它们成为一个有机的整体。神经元的简单的有序的编排构成了完美的复杂的大脑。因此,神经元与神经元组及其相互作用机制的建模,对于建立大脑皮层编码的理论框架、研究大脑及其功能和发展智能机器,都具有重要意义。 传统的神经编码理论建立的生物学机制包括四个方面: (1) 神经元的行为 。神经元具有两种不同的状态,即抑制与兴奋。神经元的膜电位可以出现抑制后的反冲,这意味着神经元具有刺激不响应期。神经元放电期间膜电位阈值具有自适应性。 (2) 突触的行为 。触突对神经电信号进行空间整合和时间整合,即联结加权整合。触突联结的强度具有可塑性。突触具有多种联结方式,如电的,化学的,单向的,双向的,连锁的,兴奋的,抑制的等。突触还具有延时特性和疲劳特性。 (3) 神经元网络的行为 。神经网络是由大量神经元通过更多突触彼此相互连接而成非线性网络,具有非线性系统的广泛特性,如容错性、自组织等。 (4) 其它的生物学证据也受到传统的神经编码理论的重视,如感受野、功能柱、等级描述假说 (Hubel Wiesel , 1965) 等 。在现有的神经建模理论中,几乎很少有理论利用了后面的神经元及其网络基本特征。 传统的神经编码理论主要研究神经系统和大脑的: (1) 学习、记忆、联想、存储、计算、容错等能力, (2) 鲁棒性、自适应、自组织等机制, (3) 非线性,非局域性,非常定性等特性。因此,传统的神经编码理论主要涉及现代人工神经网络技术,现有理论已经非常之多,如 McCulloch-Pitts 神经元模型(简称 MP 模型)、感知器与多层感知器、 Hopfield 网络、自适应谐振理论、自组织理论、并行分布式处理 (PDP) 理论、深度学习网络【】等。传统的神经编码理论应用场合主要集中在信号与信息处理、分布式存储和并行计算、分布式控制和智能控制、模式识别与人工智能、专家系统与机器人等领域。 但是,这些理论存在一些致命弱点: (1) 祖母细胞的存在, (2) 不能与行为联系起来, (3) 循环论的困惑。 神经编码理论的新趋势主要体现在新发现的生物学证据的引入,如脑区间神经通讯是动态的双向交换 (Edelman 1978, 1989) ;皮层中的脑区之间存在着回路 (Fellman Van Essen, 1991) ;脑区中神经元之间存在着密集和迂回的互联 (Kisvarday Eysel, 1992) ,其中一些迂回互联解剖上以发散方式投射 (Zeki Shipp, 1988) ;皮层中高层脑区神经元直接驱动低层脑区神经元 (Mignard Malpei, 1991) ;神经元和神经元组的振荡及其之间的同步振荡的存在 (Jagadeesh et al 1992, Gray Singer 1989, Kreiter Singer 1992, Eckhorn, et al. 1988, Gray et al. 1989, Eckhon et al., 1988; Nelson et al.1992, Eckhon et al.1988, Nelson et al., 1992) ,通常同步振荡的频率和相位范围 40 - 60Hz 和 +/-3ms(Gray et al. 1992) ;神经元组的边界和感受野具有动态特性;等等。 目前,神经编码理论的发展方向是研究大脑的知觉、意识、注意、认知、心理活动等及其相应行为。业已出现的理论、假说和模型包括: (1) 生态心理学的直接知觉不变性和不变性知觉调谐 (Gibson, 1966, 1979) 的理论; (2) 神经达尔文主义的神经元组选择理论 (Edelman, 1978) ; (3) 皮层振荡和同步振荡假说 (Crick Koch, 1990, 1991,1994, 1995, 1996) ,其中心论断是意识可能产生于大脑皮层的某些振荡,这些振荡在神经元每秒放电 40 次便成为同步振荡; (4) 局部场电位方程 (Wilson Cowan, 1972, Schuster Wagner 1989) ; (5) 个体神经元时间相关模型 (Abels 1991, Bernader et al.1991) ; (6) 返折标测 (Reentrant Mapping) 模型 (Spons Edelman 1989, 1991,1994) ;等等。这些体现新的发展趋势的理论仍然存在的一些问题: (1) 不够合理地描述神经元的电生理行为; (2) 不能模仿单个神经元的振荡行为; (3) 不能考虑时间整合问题; (4) 不能很好地将生理学和心理学有机地联系起来。 根据神经振荡和相干振荡模型、神经信号采样定理、竞争和近邻学习算法,本文建立了一套合理的生物的神经编码理论框架。 二、神经编码理论 在论述类脑计算框架之前,我们首先介绍合理的生物神经系统的数学模型和基本理论概念,它们包括神经振荡和相干振荡、近邻和竞争学习和神经系统采样的数学理论和模 型 ,这些模型是复杂的模式表达的核心,也是神经计算和认知计算的基础 。这对理解文中的皮层编码理论框架非常重要。 1. 振荡和相干振荡 所谓的神经振荡和相干振荡是指,神经元同步放电形成神经元组局部振荡,不同皮层区域的神经元组之间相干振荡,前者是神经元同步放电,实现了刺激信息和执行信息的时间编码和频率编码,即不同时刻产生不同频率的神经信号,并被传输到不同脑区或人体的其它部分;后者是不同脑区的神经元组之间同步振荡,实现了刺激信息和执行信息的空间编码和通信编码,同一时刻不同脑区同时产生的神经活动同步和关联,并被联合执行相同的任务。 大脑皮层是如何能够执行这样的振荡和相干振荡,在数学模型上应具备怎样的特征呢,数学原理和物理学机制在下面我们给以建模和仿真。 一个好的合理的神经元及其网络的数学建模,基本具备三方面的特征:其一,能够通过大量的线性和非线性的基本加权计算联结成复杂网络;其二,能够与外界的其它系统相互作用,如感觉系统和运动系统,准确地表示感觉输入模式,并将计算结果转化为执行动作的行为输出模式;其三,无论是输入模式,还是输出模式都是脉冲放电的方式,且运行速度快速。鉴于此,我们在文献中建立了一个合理神经元及其网络模型,该模型具有振荡和相干振荡的特点,它更为合理和与实际的生物神经系统接近。 基本假设:大脑皮层的振荡和相干振荡是计算和表达的输入、输出和通信(三位一体)的方式,振荡是特征提取的计算 , 相干振荡是模式选择的表达,振荡和相干振荡的发放率变化供后处理。这就是说,感觉信号刺激引起神经元组振荡及其相关振荡就是对感觉信号的计算和表达所产生心理活动和认知行为的选择性结果。
个人分类: 类脑计算|3883 次阅读|1 个评论
中美关于尼泊尔地震震级的差异需要另类解读吗?
bjglacier 2015-4-26 17:06
如果我没记错的话,中国地震局报道的震级是面波震级,而美国地质调查局用的矩震级。 对地震大小的表述存在多种方式,如里氏震级、面波震级、体波震级和矩震级等。由于不同计算方法所依据的数据和前提假设是不同的,存在差异也就是不可避免的。另外,即便是同一种方法,由于不同机构所能获取的台站分布情况差异和数据质量的不同,结果也会存在差别。 科学网的网友理应是以从事科学研究或者对科学有兴趣的人员为主,虽然不一定都是这方面的专家,但是基本的专业习惯和思路应该都是相似的。但是,还是有那么多人喜欢另类解读。这在某种程度上,说明一些网友的思维方式需要调整。关注这个问题的朋友可以继续看看相关的专业文献再发言。
3629 次阅读|0 个评论
用R进行聚类分析时R2的简便计算方法
leymus 2015-2-20 15:00
R在进行聚类分析时,没提供R^2。网上有人提供了自己编制的代码。觉得还应该有更简洁的计算方法,我于是借鉴了kmeans函数的帮助,写了下面三行代码计算R2。使用了scale() 和 by() 两个函数,大大减少了代码量。这两个函数都在base包里,不需要额外加载包。 使用时需要注意一点: 只保留分类变量列,把名字列去掉。 tss.cal-function(x) sum(scale(x,scale=F)^2)#总平方和 ess.cal-function(x,clst) sum(by(x,INDICES=clst,FUN=tss.cal))#总组内平方和,或者“误差平方和”。 rsq.cal-function(x,clst) (tss.cal(x)-ess.cal(x,clst))/tss.cal(x) #R2; clst是聚类向量,即 聚类结果 。 下面提供一个案例: #-------------------------------------------------------------- #下面读入案例数据集 poverty-read.table(text=Birth Death InfantDeath Country 24.7 5.7 30.8 Albania 12.5 11.9 14.4 Bulgaria 13.4 11.7 11.3 Czechoslovakia 12 12.4 7.6 Former_E._Germany 11.6 13.4 14.8 Hungary 14.3 10.2 16 Poland 13.6 10.7 26.9 Romania 14 9 20.2 Yugoslavia 17.7 10 23 USSR 15.2 9.5 13.1 Byelorussia_SSR 13.4 11.6 13 Ukrainian_SSR 20.7 8.4 25.7 Argentina 46.6 18 111 Bolivia 28.6 7.9 63 Brazil 23.4 5.8 17.1 Chile 27.4 6.1 40 Columbia 32.9 7.4 63 Ecuador 28.3 7.3 56 Guyana 34.8 6.6 42 Paraguay 32.9 8.3 109.9 Peru 18 9.6 21.9 Uruguay 27.5 4.4 23.3 Venezuela 29 23.2 43 Mexico 12 10.6 7.9 Belgium 13.2 10.1 5.8 Finland 12.4 11.9 7.5 Denmark 13.6 9.4 7.4 France 11.4 11.2 7.4 Germany 10.1 9.2 11 Greece 15.1 9.1 7.5 Ireland 9.7 9.1 8.8 Italy 13.2 8.6 7.1 Netherlands 14.3 10.7 7.8 Norway 11.9 9.5 13.1 Portugal 10.7 8.2 8.1 Spain 14.5 11.1 5.6 Sweden 12.5 9.5 7.1 Switzerland 13.6 11.5 8.4 U.K. 14.9 7.4 8 Austria 9.9 6.7 4.5 Japan 14.5 7.3 7.2 Canada 16.7 8.1 9.1 U.S.A. 40.4 18.7 181.6 Afghanistan 28.4 3.8 16 Bahrain 42.5 11.5 108.1 Iran 42.6 7.8 69 Iraq 22.3 6.3 9.7 Israel 38.9 6.4 44 Jordan 26.8 2.2 15.6 Kuwait 31.7 8.7 48 Lebanon 45.6 7.8 40 Oman 42.1 7.6 71 Saudi_Arabia 29.2 8.4 76 Turkey 22.8 3.8 26 United_Arab_Emirates 42.2 15.5 119 Bangladesh 41.4 16.6 130 Cambodia 21.2 6.7 32 China 11.7 4.9 6.1 Hong_Kong 30.5 10.2 91 India 28.6 9.4 75 Indonesia 23.5 18.1 25 Korea 31.6 5.6 24 Malaysia 36.1 8.8 68 Mongolia 39.6 14.8 128 Nepal 30.3 8.1 107.7 Pakistan 33.2 7.7 45 Philippines 17.8 5.2 7.5 Singapore 21.3 6.2 19.4 Sri_Lanka 22.3 7.7 28 Thailand 31.8 9.5 64 Vietnam 35.5 8.3 74 Algeria 47.2 20.2 137 Angola 48.5 11.6 67 Botswana 46.1 14.6 73 Congo 38.8 9.5 49.4 Egypt 48.6 20.7 137 Ethiopia 39.4 16.8 103 Gabon 47.4 21.4 143 Gambia 44.4 13.1 90 Ghana 47 11.3 72 Kenya 44 9.4 82 Libya 48.3 25 130 Malawi 35.5 9.8 82 Morocco 45 18.5 141 Mozambique 44 12.1 135 Namibia 48.5 15.6 105 Nigeria 48.2 23.4 154 Sierra_Leone 50.1 20.2 132 Somalia 32.1 9.9 72 South_Africa 44.6 15.8 108 Sudan 46.8 12.5 118 Swaziland 31.1 7.3 52 Tunisia 52.2 15.6 103 Uganda 50.5 14 106 Tanzania 45.6 14.2 83 Zaire 51.1 13.7 80 Zambia 41.7 10.3 66 Zimbabwe, header=T) #下面三行是计算平方和和R2的函数 tss.cal-function(x) sum(scale(x,scale=F)^2) ess.cal-function(x,clst) sum(by(x,INDICES=clst,FUN=tss.cal)) rsq.cal-function(x,clst) (tss.cal(x)-ess.cal(x,clst))/tss.cal(x) poverty-poverty #把名称列去掉! rsq-vector(numeric,14)#建立存储R2结果的向量,长度是14,看聚类成2到15个类时R2的值 res-hclust(dist(poverty),method=ward.D)#进行分层聚类。这里只是以分层聚类hclust为例,当然可以换成别的聚类方法。 for(ii in 2:15){ clst-cutree(res,ii)#clst是聚类向量,即聚类的结果。 rsq -rsq.cal(poverty,clst) #调用刚才建立的函数,计算R2 } #下面看一下不同聚类数下R2变化 cluster.rslt-data.frame(nclust=2:15,rsq=rsq) plot(rsq~nclust,cluster.rslt,type=b)#看来三个世界的说法有聚类分析的支持
个人分类: R使用|6786 次阅读|0 个评论
[转载]核级阀门强度计算方法的研究
chvacuum 2013-11-1 21:23
  介绍了采用经验公式和有限元仿真分析的计算方法,并对某核一级 闸阀 进行了强度计算。对比分析了两种方法得出的计算结果,验证了仿真分析计算结果的准确性。 1、概述   在核级阀门的设计计算中,需要遵守ASME、RCCM等法规。ASME ⅢNB分卷提供了详细的核级阀门的强度计算公式,如果按照全部公式(NB-3500) 进行计算并且计算合格,其阀门的设计结果是可以被接受的。随着计算机技术的发展,使用有限元应力分析的方法对阀门强度进行计算成为一种新的计算方法。本文以某核一级闸阀为例,分别使用两种计算方法进行计算,同时对计算结果进行对比分析。 2、仿真分析   将闸阀全部零件进行立体建模,并确定每个零件的密度以得到阀门的精确质量。在进行应力分析时,如果在阀体的一端施加固定约束,而端部应力得不到有效释放,将在阀体端面位置产生应力奇异,最大应力可达2000MPa,这显然与现实情况相违背。根据相关经验及规定,可以在阀体进口处增加一过渡管(过渡管长度为入口管径的2~5倍),在过渡管入口施加固定约束,使应力奇异发生在管道入口。而评价分析结论时,只考核阀门的受力情况,忽略过渡管入口上出现的误导结论。这样可以真实模拟阀体的受力情况,得出相对准确的应力分析值。在ASME 法规中,着重关注阀门承压边界的受力情况。因此,只取阀体、阀盖和过渡管组成的装配体为研究对象( 图1)。在阀体右侧的中腔与支管交界位置,真空技术网(http://www.chvacuum.com/)根据经验划分出3条阀体的应力评定线。同时将模型转化到ANSYSWorkbench软件中。 图1 建立阀门应力分析模型   在ANSYS软件中,对阀体、阀盖、过渡管赋予材料属性,对支架、过渡头和执行机构等省略掉的零件以一个有质量的点代替,并选择阀体与阀盖相接触的表面作为支撑质量点位置的平面。分别选取过渡管与阀体、阀体与阀盖相接触的表面为零件间的接触面,选择约束类型为bonded绑定约束。对模型进行网格划分处理,同时进行网格收敛性验证。设定热应力分析参数,选择过渡管、阀体和阀盖中与介质相接触的表面设定设计温度,选择阀体的外表面确定对流换热系数。 原文阅读: http://www.chvacuum.com/valve/zhafa/104434.html
个人分类: 真空|2269 次阅读|0 个评论
[转载]磁散场计算方法
wenxintang 2013-9-28 05:17
http://www.southampton.ac.uk/~rpb/thesis/node1.html vortex domain stray field nature05240.pdf nnano.2013.180.pdf formula JApplPhys_97_074504.pdf magnetic field calculation formula http://www.netdenizen.com/emagnet/index.htm from a rectange condutor wire http://www.ntmdt.com/spm-basics/view/magnetic-field-rectangular-wire
个人分类: 磁性材料知识|1 次阅读|0 个评论
感觉建立起荒漠生物容量的科学计算方法有很大意义。
热度 3 mountainwind1 2013-5-5 12:10
查资料时经常看到沙漠乱种东西的,草也种灌木也种甚至树也种,种的时候还不带科学性地瞎种,劳民伤财,实际上疯子我一直在寻找荒漠生物容量的准确测算方法,也算有些进展,例如风蚀与蒸发控制用的环境材料等一部分有点苗头了,所以很不爽地方政府这种行为。 荒漠绿化是一个系统科学,考虑的成分极多,这与水体修复一个道理,简单的绿化和修复是简单,但也不能乱种树木灌木啊!这简直就和湖泊治理里乱种水草一个道理!100元估计有90元丢水里去了! 桑斯威特湿润指数AI来划分干旱区。AI=P/Ep,P为年平均降水量,Ep为年平均可能蒸发量。可能蒸发量是在给定的气候条件下,有充足的水分供应满足地面植物最大生长时,土壤水分以水汽形式失去的最大可能的数量,通常采用经验数据拟合的办法计算。实际计算中,因采用的经验公式不同,界线数值略有差异。根据湿润指数划分干湿气候区如下:AI<0.05为极端干旱区,AI=0.05~0.20为干旱区,AI=0.21~0.50为半干旱区,AI=0.51~0.65为亚湿润干旱区,AI>0.65为湿润区。Cooke (1993年)等人划分的干湿气候区如下:AI<0.03的为极端干旱区,AI=0.03~0.20的为干旱区,AI=0.20~0.50的为半干旱区,AI=0.50~0.75为亚湿润区 彭曼(H.L. Penman)公式考虑了气温、日照百分率、平均水汽压(或平均相对湿度)、平均风速等。。。。。。。。。 这些都半定量的,不能用来准确计算实际操作的需要啊?
3471 次阅读|14 个评论
[转载]Phonon计算方法的选用
热度 1 xiaoqiugood 2013-3-30 05:21
转自: http://i.eol.cn/blog_read.php?topicid=693401 有三个方法: Linear Response Theory Frozen Phonon method Finite Displacement method Linear response 方法(或者称为 density perturbation functional theory , DFPT ),直接计算出原子的移动而导致 的势场变化,再进一步构造出动力学矩阵。这种方法在计算谱时, Born effective charge (对极性的材料)和声子谱都能计算出。 现在很流行, CASTEP ,Quantum-Expresso,Abinit等等都在用,后面两个原理差不多; Linear Response 优点: 晶体晶胞没有大小限制,即使用包含一个原子的Primitive cell,计算得到的Dynamical Matrix也是很准确的,主要原理:Hellmann-Feymann theorem and Perturbation theory, 原子施加很小的位移,计算波函数, 电子 密度对位移的响应函数,主要方法见Gonze1997年的两个PRB文章。计算速度一般,特别是采用Normal Conserving PPs的时候,单原子晶胞RAM占用量在3-4G之间,CASTEP里面只支持NCPP的Linear response 计算,USPPs不支持。 另外一个是Finite displacement (直接的方法): 构造超原胞,把原子移动一下,计算原胞中所有原子所受的力(这个根据体系的周期性,要多移动几个原子),然后根据这个力构造力常数矩阵。 而且一般情况下对 LO-TO 的 split 不能计算出(只有在计算了 Born effective charge 之后, 进一步考虑了 non-analyticity term ,才能计算出)。phonon, phonony等就是结合vasp或者其他计算软件如wien2k等计算声子谱的。 Finite displacement 优点: RAM占用量和计算量在Cell一样的情况下,可节约2倍的RAM和CPU时间,但这个方法最大的缺点是需要生成一个Supercell 来获得比较可靠的力常数,虽然鉴于力常数是短程 作用 ,在最邻近原子以外衰减很快,但所需要的Supercell大小也很大,一般截止半径大小是4A以上,对于金属这个半径可能会小一下,因为金属的电子Coulomb屏蔽很显著,但对于其他的晶体结构,以及晶体结构较复杂的体系,这种方法自动生成的Cell一般都包含100原子以上,基本上没有人能采用单机计算Phonon, 如BCC, Ba元素,Primitive cell只包含一个原子, %BLOCK LATTICE_CART -2.445170154155672 2.445170154155674 2.445170154155673 2.445170154155672 -2.445170154155673 2.445170154155673 2.445170154155672 2.445170154155672 -2.445170154155672 %ENDBLOCK LATTICE_CART %BLOCK POSITIONS_FRAC Ba 0.0000000000000000 0.0000000000000000 0.0000000000000000 在采用有限位移方法计算 声子 时晶胞是: %BLOCK PHONON_SUPERCELL_MATRIX 2 0 0 0 2 0 0 0 2 即2*2*2的supercell,里面包含8个Ba原子,采用AMD Dual Core,2G RAM,计算需要2h左右即可完成。 另外一个最大的优点是可以用Ultra soft Pseudo potentials, 这个可以极大的节约时间,减小kinetic energy curoff数值。 Finite Displacement方法只计算Brillouin Zone G点的Normal Modes,其他k点的Dynamical Matrix利用Fourier Transofrmation得到,C(k)=Sum C(R)*Exp(-ikR),只要Cell足够大,可以获得和Linear Response 一样可靠的Dynamical Matrix。 Linear Response计算有带隙的晶体最好,也是最省事的方法,但计算金属,采用Finite element方法最好,Linear response对金属体系基本上失效的。 可能原因: Perturbation theory本身对于金属不成立(金属能隙太小); Fermi 面Smearing方法本身对计算力常数不利;(目前有几个常用的Smeaing方法,Gaussan函数,或者有限 温度 下的Fermi Dirac函数) 后者基本上可以排除,采用Linear response,同事采用NCPP+fix occupation的方法计算得到的Phonon和NCPP+ Smearing方法是一样子的,因此可以推断是Linear Response theory对metal不适用,CASTEP小组在其网页上也指出Lnear Response theory对Magnetic和Metal不适用。因此CASTEP不支持金属体系NCPP+Linear Response计算,也是有原因的。 采用Quantum-Expresso计算PHONON,可以完全得到与CASTEP一致的结论,即Linear Response不适用于金属体系 。 下面给出Na的例子,有实验数据,势函数计算 结果 ,NCPP+ Linear response,USPP+Finite element 结果 ,可以看到Linear response精度连势函数都不如,数值完全是错误的 声子计算的几种方法: 转自: http://emuch.net/html/200802/723527.html Practical schemes for phonon calculations (见castep说明) A good review of the existing schemes can be found in Baroni et al. (2001). The theoretical study of phonon properties has to rely on one of the three available methods for determining the force constants matrix: analytical calculations, supercell calculations or linear response calculations. The analytical approach is only viable when the energy model is sufficiently simple to allow a direct evaluation of the second derivatives of the energy with respect to atomic displacements (e.g., empirical pair potential models). Therefore, it is unsuitable for first principles calculations. Further alternatives such as extracting vibrational properties from molecular dynamics runs (Arias et al. 1992) are less transparent and noticeably more expensive. The supercell method involves perturbing the positions of the atoms slightly and calculating the reaction forces (Ackland et al. 1997). It is necessary to use supercells of the original cell when interatomic interaction in the system is long ranged. The main advantage of this method (and of the closely related frozen phonon technique) is that there is no need for a new formalism; any total energy scheme like CASTEP can be used to evaluate the forces at a number of carefully selected distorted configurations. The original frozen phonon scheme requires a displacement with the given wave vector and has been successfully used since the early 1980s (Yin and Cohen 1982, Ho et al. 1984). The force constants matrix evaluation in this formalism has been used to calculate interplanar force constants (Wei and Chou 1994) and thus phonon dispersion along high symmetry directions. More recent applications are based on the full reconstruction of the force constants matrix (Ackland et al. 1997, Parlinski et al. 1997, and references in Baroni et al. 2001). Linear response calculations seek to evaluate the dynamical matrix directly for a set of q vectors. The starting point of the linear response approach is evaluation of the second-order change in the total energy induced by atomic displacements. The main advantage of the scheme is that there is no need to artificially increase the cell size in order to accommodate small values of the q vectors, as in the frozen phonon method, or to overcome the long range interaction problem (force constants matrix from supercell calculations). A more detailed description of the linear response method can be found in Baroni et al. 2001. The CASTEP implementation is described in the Linear Response topic. 第一性原理计算声子方法及常见程序: 一,直接法: 直接法,或称frozen-phonon方法,是通过在优化后的平衡结构中引入原子位移,计算作用在原子上的Hellmann-Feynman力,进而由动力学矩阵算出声子色散曲线。用该方法计算声子色散曲线最早开始于80年代初。由于计算简便,不需要特别编写的计算程序,很多小组都采用直接法计算材料性质。直接法的缺陷在于它要求声子波矢与原胞边界(super size)正交,或者原胞足够大使得Hellmann-Feynman力在原胞外可以忽略不计。这使得对于复杂系统,如对称性高的晶体、合金、超晶格等材料需要采用超原胞。超原胞的采用使计算量急剧增加,极大的限制了该方法的使用。这种方法不能很好的预言LO-TO splitting,只有在计算了Born effective charge和dielectric constant之后,进一步考虑了 non-analyticity term,才能计算出;但Direct Method本身并不能给出Born effective charge和dielectric constant.所以这也是它的一个缺陷.目前,vasp+phonon用的就是这种方法. vasp+phonon(或者PHON或者fropho) VASP能计算声子谱的都是采用一种直接的方法:构造超原胞,把原子移动一下,计算原胞中所有原子所受的力(这个根据体系的周期性,要多移动几个原子),然后根据这个力构造力常数矩阵。 1,PHONON Software by Krzysztof PARLINSKI Phonon is a software (see list of Publications) for calculating phonon dispersion curves, and phonon density spectra of crystals, crystals with defects, surfaces, adsorbed atoms on surfaces, etc. from either a set of force constants, or from a set of Hellmann-Feynman forces calculated within an ab initio program (not included). One can use VASP, Wien2k, MedeA of Materials Design , Siesta, or other ab initio code which is able to optimize a supercell and calculate the Hellmann-Feynman forces. Phonon builds a crystal structure, using one of the 230 crystallographic space groups, finds the force constant from the Hellmann-Feynman forces, builds the dynamical matrix, diagonalizes it, and calculates the phonon dispersion relations, and their intensities. Phonon finds the polarization vectors, and the irreducible representations (Gamma point) of phonon modes, and calculates the total and partial phonon density of states. It plots the internal energy, free energy, entropy, heat capacity and tensor of mean square displacements (Debey-Waller factor). Phonon finds the dynamical structure factor for the coherent inelastic neutron scattering and the incoherent doubly differential scattering cross section for a single crystal and polycrystal. For polar cystals the LO/TO mode splitting can be included. Homepage: http://wolf.ifj.edu.pl/phonon/index.html 2,PHON A program to calculate phonons using the small displacement method This program calculates force constant matrices and phonon frequencies in crystals. From the frequencies it also calculates various thermodynamic quantities, like Helmholtz free energy, entropy, specific heat and internal energy of the harmonic crystal. The procedure similar to the one described in Ref. , i.e. is based on the small displacement method. It needs a code capable to calculate forces on the atoms of the crystal. Homepage: http://chianti.geol.ucl.ac.uk/~dario/ E-mail: d.alfe@ucl.ac.uk Telephone: +44 (0)20 7679 2361 Fax: +44 (0)20 7679 5166 3,fropho is the open source implementation of the frozen phonon method. Function: Phonon band structure Phonon DOS (Vibrational spectra) Thermal properties Mulliken notation assignment of vibration mode fropho is the frozen phonon analyzer mainly for first principles (ab initio) calculation. Periodic boundary condition is assumed. fropho gives good combinations with VASP code or another codes which can derive Hellmann-Feynman forces. Homepage: http://fropho.sourceforge.net/ Download: http://sourceforge.net ... oup_id=161614 Contact: atz.togo@gmail.com Authour: Atsushi Togo 二,DFPT方法: 1987年,Baroni、Giannozzi和Testa提出了一种新的晶格动力学性质计算方法--微扰密度泛函方法(Density Function Perturbation Theory)。DFPT通过计算系统能量对外场微扰的响应来求出晶格动力学性质。该方法最大的优势在于它不限定微扰的波矢与原胞边界(super size)正交,不需要超原胞也可以对任意波矢求解。因此可以应用到复杂材料性质的计算上。此外,能量对外场微扰的响应不仅可以推导出声子的晶体性质,还能求出弹性系数、声子展宽、拉曼散射截面等性质,这种方法本身就能算出Born effective charge dielectric constant,可以很好的预言LO-TO splitting甚至Kohn anomalies。这些优势使 得DFPT一经提出就被广泛应用到了半导体、金属和合金、超导体等材料的计算上。 比较常用的程序是pwscf和abinit,castep等采用的是一种linear response theory 的方法(或者称为 density perturbation functional theory,DFPT),直接计算出原子的移动而导致 的势场变化,再进一步构造出动力学矩阵。
个人分类: 声子谱计算|6632 次阅读|1 个评论
[转载]化探-异常下限-计算方法大全及详解
热度 1 rcao318 2013-3-15 12:53
化探 - 异常下限 - 计算方法大全及详解 谭亲平 地球化学研究所 目录 1. 传统方法,均值加标准差 ... 1 2. 直方图解法 ... 2 3. 概率格纸图解法 . 3 4. 多重分形法。 ... 6 5. 85% 累计频率法。 ... 7 小结 ... 8 传统方法,均值加标准差 在 excel 中用过函数,求均值,求标准差,先对数据中的极大 / 极小值进行剔除,大于 / 小于三倍标准差的剔除掉,直到无剔除点。然后用均值加 2 倍标准差求异常下限。 图, D 列中的函数, E 列中的结果。图一中的化探数据的异常下限 114.86. 。 直方图解法 图 2 首先,做频率直方图,(图 1 的数据是某化探区数据)含量频率分布图上呈现双峰曲线,左边是背景部分,右边是异常部分,双峰间谷底处( 0.7 )为异常下限。求真值得 5. 所以,异常下限位 5 。 图 2 另一个化探区的数据,是单峰曲线,在频率极大值的 0.6 倍处画一条平行直线,与曲线一侧相交,其横坐标长度即为σ。用 Ca=Co+2* σ =0.16+2*0.665=1.49 ,求得为真值为 31 。 概率格纸图解法 . 图 3 , 图 3 是概率格纸。发现纵坐标(累计频率)是不均匀的。把样本值小于或等于某个样本 n i 的数据频率累加,即得到小于或等于 n i 的累积频率。概率格纸用 excel 能轻松的做出来。制造方法如下。 图 4. 图 4 显示了概率格纸的制造过程。原理就是把标准正态分布曲线投影到纵坐标上。首先确定纵坐标数值,如 B 列, 0.1 、 1 、 5 、 10 、 20 、 30 、 40 、 50 、 60 、 70 、 80 、 90 、 95 、 99 、 99.9. 。如果想要纵坐标线密一点,也可以插入更多的数。然后在 C 列中用 NORMSINV 函数,求对应频率的分位数(如果把标准正态分布,正着放,分位数就是横坐标)。这时的原点( 0 )在 50% 处,我们想要原点在 0 处,那么把 C 列的数统一加 -03.090232 ( C5 ), --- (处理化探数据的时候,加的也是相同的数)。即输入公式 ”D5” =C5-$C$5… 。 E 列为 x 值,根据实际化探数据,设定最大和最小值。我们这里随便设为 0 、 25 。然后画,“带直线的散点图”,一条线作为一组数,共 15 组。 添加 15 次。即可。然后设置每一条线的“数据系列格式”,数据标记选项为“无”,线条为“黑色”,线粗为“ 1 磅”。 然后把纵坐标删掉,在图表中人为添加每条线纵坐标标签: 。加上一条线的标签后,通过复制,粘贴,可快速完成,改好数值,调整位置即为图 3. 。 现在就是应用了 将图 1 中的化探数据,应用如下。横坐标的间隔为 0.1. 。求累计频率。 将图 1 中的化探数据,用概率格纸求解如下。 图 5 发现是有两条斜率不等的直线所综合形成的曲线。与图 1 中的双峰曲线一致。左边的直线反映背景,右边的曲线反映异常。应用多重母体分解法,以 拐点为界,左侧背景占 60% ,右侧异常占 40% 。将换算成单一背景母体的累计频率 = 背景部分每个点的累计概率 *100/60 。异常母体累计频率 = (异常部分每个点的累计频率 -60 ) *100/40. 。再分别绘图,如上图。因此背景部分累计频率 97.7 处的横坐标即为异常下限( 0.76 )真值为 5.6 。发现和直方图解法求得的相近。 多重分形法。 多重分形法将背景与矿化异常的形成认为是两个相互独立的过程,它们分别满足不同的幂指数分布。。目前利用分形技术进行地球化学异常下限确定的方法主要有(含量 ) 周长法、(含量 ) 面积法、(含量 ) 距离法、(含量 ) 频数法等 , (含量 ) 求和法,这里采用(含量 ) 求和法进行讲解。 设分形求和模型 :N(C i )=kC i -D(i0) ,式中 C i 为元素含量,又称特征尺度, k 为比例常数( k0 ), D 为一般分维数, N(C i ) 为当元素含量为 C i 时所有大于等于 C i 的元素含量的和数。分形求和模型两边分别取对数得到一元线性回归模型 :logN(C i )=-Dlog(C i )+log(C i ) ,用最小二乘法求出斜率 D 的估计量,即为分维数,其散点大致分布在两段直线上,采用分段拟合分别求出两段线性方程,两段直线的交点为背景与异常的分界点,即异常下限值。 图 6 图1中的化探数据在图6中,异常下限为 1.6 ( 40 )。 85% 累计频率法。 把样本值小于或等于某个样本 n i 的数据频率累加,即得到小于或等于 n i 的累积频率。一般使用累积频率 85% 时的样本值作为异常下限。 累计频率求解方法如下 , 假如有一组数据, 0.1 、 0.2 、 0.3 、 0.4 ……。将他们排序, 1 、 2 、 3 、 4 、……,将各自的序号除总数,如 0.05=1/20… 选中 0.85 时的样品值为异常下限。用此方法求得图1中的化探数据异常下限为 33.5. 。 小结 表 — 图 1 中化探数据异常下限 传统法(均值加标准差) 114.86 直方图解法 5 概率格纸法 5.6 多重分形法 40 85% 累计频率法 33.5 发现,不同的方法求的结果相差很大。其中,绘制的异常图中,多重分形法,和 85% 累计频率法比较符合实际
个人分类: 勘探地质|1578 次阅读|1 个评论
[转载]《每日邮报》2012年8月报道:有99%把握确定太阳附近存在暗物质
baolintan 2013-2-18 13:07
最新研究表明,太阳极有可能被暗物质包围 早在20世纪30年代,瑞士天文学家弗里茨·兹维基(Fritz Zwicky)就提出了暗物质的概念,他认为星系团之间充满了神秘的暗物质。几乎在同一时间,来自荷兰的科学家简·奥尔特(Jan Oort)发现靠近太阳附近的物质密度几乎是普通星系或星系团的两倍,从而解释了恒星和气体在宇宙中单独存在的现象。在接下来的几十年间,天文学家逐渐发展出暗物质的理论模型以及结构形成,来解释宇宙中的星系团和星系的行为,但是太阳附近究竟是否存在暗物质依然是一个谜。   据英国《每日邮报》2012年8月报道,来自苏黎世大学、苏黎世联邦理工学院以及英国莱斯特大学的天文学家们进行了一项最新研究,现在他们有99%的把握确定太阳被暗物质包围。对太阳系暗物质密度进行准确测量计算是至关重要的,他们发明了一种新的暗物质计算方法,并将其应用于靠近太阳的数千颗K型主序星速度与位置计算上,获得了关于太阳附近存在暗物质的线索。他们对计算结果非常有信心,可以99%确认在太阳附近存在暗物质。 一直以来,实验物理学家们都希望能捕捉到暗物质粒子,比如意大利巨石峰国家实验室进行的XENON100实验、美国的低温暗物质搜寻实验计划(CDMSII)等都在殚精竭虑地搜寻暗物质粒子。
2262 次阅读|0 个评论
[转载]CASTEP中计算磁矩
stonezhj 2013-1-10 07:41
转贴(来自西交大论坛): 在CASTEP计算完毕输出文件output-files中如果体系采用了自旋极化计算方法,一般有下面结果输出: 2* Integrated Spin Density = 0.934374E-01 2*Integrated |Spin Density| = 0.104526 Final energy, E? ? = -14786.05701927??eV Final free energy (E-TS) = -14786.10608945??eV (energies not corrected for finite basis set) NB est. 0K energy (E-0.5TS) = -14786.08155436??eV 注意到红色字体部分,2× Integrated Spin Density表示自旋极化DOS积分结果,也就是自旋up和down通道积分后然后加到一起; 2*Integrated |Spin Density|表示自旋极化DOS绝对值积分相加;2表示自旋磁矩g因子。通过这个参数可以初步判断结构的磁性: After the last SCF iteration CASTEP prints out total spin (number of unpaired electrons) and also integrated |spin|. If the two numbers are very close and are very small, then the system is paramagnetic. If they are close and finite, the system is ferromagnetic. If integrated |spin| is finite, but integrated spin itself is close to zero - system is antiferromagnetic. Finally, if both numbers are finite, and the difference between them is also finite, you have a ferrimagnetic. 2* Integrated Spin Density = 0.934374E-01 2*Integrated |Spin Density| = 0.104526 这个不就是very small and finite的情况,0.0934, 0.104;这个体系就是Paramagnetic! 其他可能出现的铁磁性,亚铁磁性,反铁磁性都可以按照上面积分的定义来考虑。 Ferromagnetic情况,绝对值的DOS积分显然是Up spin 电子和down spin电子磁矩的和,Finite;DOS积分直接代数相加,就是晶胞中的净剩磁矩,在铁磁性材料里面还是Finite,当然一般材料磁矩平均到每个原子上面最大也就是6-7Bohr,因此是个Finite value。 Antiferromagnetic情况下,绝对值的积分是2×Up spin了,但积分数值代数和是接近0的,因此是very small 第一组:2*Integrated Spin Density =??1.00034 2*Integrated |Spin Density| =??2.85159 第二组:2*Integrated Spin Density = -0.216329E-07 2*Integrated |Spin Density| = 0.320014E-05 那么请大家帮忙看一下这个能说明什么啊? 新手求助 这是我在一个体系中去掉一个空位出现的情况 Spin density=DOS(spin up)-DOS (Spin down) 2意义表示电子自旋磁矩前面的g因子; Integrated Spin Density 表示DOS(spin up)-DOS (Spin down)积分后面积的矢量和,或者说沿特定方向的净自旋极化电子数目,如1.00034 就是说spin up有这么多净自旋极化电子多出来; Integrated |Spin Density|意义很简单了,表示所有通道中净自旋极化电子数目,是上面DOS(spin up)-DOS (Spin down)曲线绝对值的积分了; 因此在DOS(spin up)-DOS (Spin down)曲线中: N(up)-N(down)=1.0034 N(up)+N(down)=2.85159 这个应该是FM情况; 同理对于第二组:2*Integrated Spin Density = -0.216329E-07 2*Integrated |Spin Density| = 0.320014E-05 应该是Paramagnetic情况!
0 个评论
[转载]油藏数值模拟的现状
ichange 2012-12-31 17:10
本文行家: 急躁彭三爷 油藏数值模拟是应用数值计算方法研究油气藏中多相流体渗流规律的技术,它应用数学模型重现实际的油藏动态,通过流体力学的方法重现油田开发的实际过程 。它的基本原理是把生产/注入动态作为确定值,通过调整模型的不确定因素使计算的确定值(生产动态)与实际吻合 。其数学模型,是通过一组方程组,在一定假设条件下,描述油藏真实的物理过程 。它充分考虑了油藏构造形态、断层位置、油砂体分布、油藏孔隙度、渗透率、饱和度和流体PVT性质的变化等因素。 数值模拟技术以1954年Aronofsky和Jenkins的径向气流模拟为开始标志。近年来,随着计算机、应用数学和油藏工程学科的不断发展的发展,油藏数值模拟可视化软件应运而生,且日新月异。模拟软件中地质模型的建立脱离了原来的填卡式输入,而是基于交互式的人机界面输入,甚至更加直观的图形编辑输入,使得地质模型的建立更加简单化和人性化。三维可视化软件充分利用计算机的作图和计算功能,将油气田的静动态参数处理、数值模拟以及结果的分析过程全部置于方便易懂、操作简单的图形界面下,将抽象繁杂的数据形象化。油藏工程师只需面对仿真的三维油藏,就可方便地干预和分析仿真模拟地全过程,从而极大地提高油藏模拟工作的效率和准确性,减轻了劳动强度 。 油藏数值模拟方法因而也得到不断的改进和广泛应用,通过数值模拟可以搞清油藏中流体的流动规律、驱油机理及剩余油的空间分布;研究合理的开发方案,选择最佳的开采参数,以最少的投资,最科学的开采方式而获得最高采收率及最大经济效益。 本文将简要介绍油藏数值模拟技术的应用、发展现状、发展趋势等问题。 1数值模拟的应用 1.1剩余储量分析 历史拟合的最终目标是获得剩余储量的定量分布。明确了剩余储量的分布,就可以提出近期目标和长远目标。剩余储量分布一般有三类,即低含水成片富集区、高含水成片富集区及零星富集区。低含水成片富集区是上产的近期目标,而高含水富集区是长远调整的主要对象。因此,高含水富集区通过提高水淹程度及驱油效率可达到稳产的目的。零星富集区虽然初产效果可能好,但是单井控制储量低,稳产时间短,开发效果差,应作为层系调整兼顾的对象 。 1.2井网调整与优化 在剩余油潜力分析的基础上,按不同井排距、不同注水方式组合出不同的井网调整方案进行开发指标预测。分析井网系统调整对剩余油分布变化的影响,总结能够最大程度挖掘剩余油潜力的合理布井方式。应用油藏工程方法计算采收率、水驱控制程度与注采井距、注水方式等参数之间的关系,结合经济评价,确定合理井距技术界限。分析注采井距、注水方式对采油速度、含水上升率、递减率等开发指标的影响。按照不同原油价格和利率,对各种调整方案进行经济评价,结合开发效果,分不同油层沉积特点确定出最佳的调整与优化方案 。 1.3判断水淹状况 油层的水淹状况是开展调整挖潜的基础。历史拟合确定的地质模型可以分析历年的水淹程度、油水运动状况。在较粗的全油田模型中,看似水淹程度很高、平面波及系数较大的层,在进一步细化为层内韵律段的情况下,会发现正韵律油层虽然平面波及系数很高,但仅在高渗透段水淹严重,其顶部低渗透段波及效率仍很低;反韵律油层的情形则相反。 1.4注水利用率分析 对于边底水能量较弱的油藏,为了保持旺盛的生产能力,注水保持地层压力是维持高产稳产的有效途径。油藏进入高含水期后,水井与油井的比例达到1:2~1:1。油井见水后,水淹带的流动阻力减小,容易形成水流通道。历史拟合后得出的注入水利用率分布图可以表示流经地层中某一点的注入水有多少起到了驱油作用。据此可以有效控制注入水通道上的注入强度,加强有效部位的注水强度,提高注入水的利用率。 1.5方案预测研究 进行方案动态预测是油藏数值模拟的最终目的,所有前期工作包括建模、生产历史拟合及剩余油分析都要落实到下一步开发措施上,开发措施的效果都要通过方案指标的预测实现。虽然最后提交给现场实施的方案只有一个,但是方案动态预测的工作量很大,最后提交的方案都是多个方案进行优化后的推荐方案 。 方案优化过程中经常使用的手段是油藏参数敏感性研究。在油藏描述不确定,而历史拟合又无法解决时,就要做敏感性研究来寻找合理的油藏参数。对于边水驱动的油藏,开采初期构造高部位的油水拟相对渗透率和井函数就无法通过历史拟合得到评价。这种情况下,就可以对油水拟相对渗透率和井函数进行敏感性分析,提前评估边水推进对开发井位部署、水驱波及面积、油藏稳产期等的影响。 方案预测的常规参数包括油藏的宏观指标及单井限制条件。宏观指标包括注采比、采油速度、液量等。单井限制条件包括液量、油量、水量、时效、井底压力、经济极限产量、经济极限含水率等。方案预测结果的可靠性随时间加长而变差。 2数值模拟的发展现状 2.1并行算法 并行算法是一些可同时执行的进程的集合,这些进程互相作用和协调动作从而达到给定问题的求解 。并行算法首先需合理地划分模块,其次要保证对各模块的正确计算,再次为各模块间通讯安排合理的结构,最后保证各模块计算的综合效果并行机及并行软件的开发和应用将极大地提高运算速度,以满足网格节点不断增多的油藏数值模型。 在并行计算机上使用并行数值解法是提高求解偏微分方程的计算速度,缩短计算时间的一个重要途径。在共享内存的并行机上把一个按向量处理的通用油藏模拟器改写成并行处理是容易的,但硬件扩充难;分布内存并行机编程较共享式并行机困难,但硬件扩充容易,关键是搞好超大型线形代数方程组求解的并行化。并行部分包括输入输出、节点物性、构造矩阵、节点流动及井筒等 。 2.2网格技术 为了模拟各种复杂的油藏、砂体边界或断层渗透率在垂向或水平方向的各向异性,以及近井地区的高速、高压力梯度的渗流状态,近年来在国外普遍发展了各种类型的局部网格加密及灵巧的网格技术。这种系统大体可以分为二类 :一类称控制体积有限元网格(CVFE),这是将油藏按一定规则剖分为若干个三角形以后,把三角形的中心和各边的中点连接起来所形成的网格。另一类则称垂直等分线排比网格(PEBI),其剖分方法是将油藏分成若干三角形后,使三角形各边的垂直等分线相交而形成网格。 这些方法在处理复杂几何形状油藏及进行局部网格加密时简单而一致。在多相流情况下,参照某一给定的几何准则时该方法是单调的,这保证了其稳定性和收敛性。这两种方法都能以直观的控制体积的概念出发并且采用一致的上游权而推导得出这些方法对网格的方向不敏感,在某些情况下比九点差分格式的效果好。 2.3计算机辅助历史拟合技术 斯伦贝谢公司的Eclipse数模软件最新推出计算机辅助历史拟合模块(Simopt)。运用均方差、Hessian矩阵、相关性矩阵、协方差矩阵对结果进行分析以确定敏感参数 ;引入梯度带分析技术对地质模型进行优化;在进行常规历史拟合后,应用置信度限制(规定需优化的参数及参数的可调范围),通过线性预测分析,实现计算机辅助调整参数,减少模拟次数。 2.4网格粗化技术 对于一些油藏参数(如孔隙度、深度、饱和度等),采用体积加权平均法;对于与流体有关的参数(如渗透率等)就不能用简单的加权平均计算得出而要基于流动计算再进行粗化。流动算法相对精确,首先解出沿压力降方向的总流量,然后再解相同的流动方程,从而解出等效渗透率 。 在垂向分层合并计算中,把相同性质的油砂体(按相同的物性、储量类型)的网格单元合并在一起使油藏的数值模拟的网格系统反映出地质沉积特点 。网格合并可以按不同井组、区块进行合并计算,为井组模型和分区模拟提供数据模型。模拟还可以按不均匀网格,考虑水平方向非均质性及储量分布程度因素等进行内插计算,提供不均匀网格模型。 2.5动态地质建模 壳牌公司的Kortekass概括了当前世界上关于油藏地质建模的经验,提出的建立动态、集成化油藏模型的新概念和技术方法 。它强调把动态资料以至数值模拟技术等应用于油藏建模,从而使所建立的地质模型更加符合油藏的实际情况,并且要随着油田开发中资料的增多和新资料的获得而不断更新。这种新方法包括一系列获得和运用各种所需资料的技术和方法,包括地质、地质统计、地震、测井岩心和流体分析、试井、驱替特征以及网格的细分和粗化,拟函数的应用等 ,但关键是使所建立的地质模型更加符合油藏的实际情况,而且还可以加快建模的过程。 2.6分阶段模拟 对开发历史较长、地下储层物性和原油物性发生较大变化的油藏,把随开发时间变化的地质静态模型划分为多个不同开发阶段的地质模型。阶段划分的方法可根据重大开发方案调整的时期(如加密井网、调整注采系统)划分 ;也可根据开发阶段(如产量上升阶段、稳产阶段、产量下降阶)划分。 常规的油藏数值模拟是从一个油藏(区块)投入开发时开始模拟,一直拟合到目前状况,再进行方案预测优选 。我国许多老油田已进入了高含水或特高含水期。由于开发历史长、综合调整次数多,地下岩石和流体的物性发生了较大的变化,这给常规模拟工作带来了极大的困难。一方面是历史拟合所需要的机时非常多,另一方面是常规模拟无法考虑流体和岩石随时间的变化 ,模拟结果的可信度会大大降低。分阶段模拟就是一种解决上述问题的行之有效的方法。分阶段模拟可将一个长期开发的油藏,按照一定原则划分成几个模拟阶段。 2.7动态跟踪模拟 油田开发是一个长期过程,储层物性和原油物性随开发期的不同以及油水井措施发生变化。根据开发期及措施类型制定数值模拟的时间步长,在油水井见效初期采用较小的时间步长,进入见效稳定期后以较大的时间步长,将分析周期由常规的以年计算提高到以月或天计算。对方案实施后的效果、生产状况等再进行跟踪模拟 ,并提出新的方案。如此反复研究,使人们对油藏的构造、物性、油水状况及生产动态的认识更趋合理。 2.8三维动态显示 数值模拟结果的可视化程度高,人机交互性能强。可三维动画显示油藏中流体的流动规律,再现油藏的开发历史及剩余油的空间分布,并可任意旋转、平移、缩放、光照,多重照相、透视和透明处理 ;灵活的剖面切割功能,任意参数的区间显示,用户可按自己的爱好定义或修改颜色和注释。 3发展趋势 3.1模拟向精细化方向发展 3.1.1精细建模技术 以前所使用的一般为矩形和径向等规则网格,很难描述断层及储层尖灭,一般要沿网格进行修改。由于受计算机的限制,网格步长常常为100m左右。精细数模为了充分地反映油藏微构造、非均质、储层参数的变化等特征,平面上网格步长细到20~50m ,纵向上细到沉积时间单元,并且采用一些新的网格技术。 特高含水期油藏开发层系多、历史长、井况变化大。精细模拟要充分反映其各项调整措施及频繁的补孔换层,时间阶段缩短到三个月至半年,个别模型可缩短到一个月,充分考虑工艺措施 。 3.1.2精细历史拟合技术 常规历史拟合是全过程计算完成后整理数据,作图检查其结果的正确性 。拟合跟踪技术是以图形方式把历史拟合过程一步步地显示出来,拟合效果不理想时随时中断,调整参数后继续拟合,可节约时间、缩短拟合周期。 可视化作为一种后处理手段,可把模拟结果作为可操作的二维、三维彩色图形,进行横切、纵切、过井切、按网格方向切,操作性极强。一目了然地反映油藏内部属性。油田开发过程是一个动态过程,各时间段的参数场是变化的,可视化技术能够动态地反映不同时间的参数场变化,使开发过程中的矛盾得到充分暴露 。对于方案实施可再现不同的开发方式的效果,可很好地指导方案的实施及优化。 3.2模拟应用大型化和整体化 大规模全油藏整体模拟是油藏模拟发展的必然趋势,也是目前模拟技术发展的重点。稠油油藏的模拟一般是井组或区块模拟,委内瑞拉Orinoco稠油油藏实现了全油藏整体模拟,在模拟过程中使用了泡沫油特性及控制体积有限元方法(CVFE),历史拟合及方案预测与实际投产效果相吻合 。模拟技术向着模拟与地面管网一体化模拟方向发展。气藏管网模拟器与油藏模拟器、油藏管网模拟器与油藏模拟器一体化是油藏经营管理的必要条件和发展方向 。 3.3勘探开发一体化 勘探开发一体化越来越受到关注。油气勘探开发的各个环节中计算机应用技术的突飞猛进,带动了勘探开发工作向着多学科综合集成方向发展,改变了以往以单项专业为主的顺序化工作方式。各学科间的信息交换、数据共享、成果可视和知识继承遵照统一的标准进行综合集成 :通过岩心声波测量建立油藏参数与地震响应间的关系;利用油藏数值模拟技术预测压力和含水饱和度的变化、生成不同观测数据的合成地震记录;开发地震包括了四维地震和地震反演技术,通过井的约束以及和油藏数模技术的结合,将进一步减少多解性的困扰并大幅度提高分辨率,从而扩展开发地震的实际应用范围,特别对比较复杂的砂泥岩薄互层也能够加以应用这些技术的发展,将大大加深对井间储层非均质特征及油藏剩余油分布状况的认识
个人分类: 数值计算与模拟|4 次阅读|0 个评论
DFT方法是否是从头算方法?
热度 2 dwd0826 2012-12-6 21:07
从头算(ab initio)的理论基础是Hartree-Fock(HF)方法 ,即以非相对论近似和Born-Oppenheimer近似为前提的方法。 在HF计算中,电子波函数和它的能量通过自洽场(SCF)方法得到 ,体系的电子总能量通过调节一组基函数(单粒子基)的系数的方法使之达到最小化,这组基函数的线性组合构成了该体系的电子波函数的分子轨道。 对于DFT,尽管有人称它为半从头算方法,但实际上仍应看成是一种正规的从头算方法,但是它具有类似于半经验计算方法的经济性,即可以节省时间。DFT方法从理论上对电子相关性做了很好考虑, 特别适用于含有过渡金属的元素的分子体系 。DFT方法中确实包含有一种经验的成分,有时某些函数只对某类分子体系特别有效,对另外的分子体系可能无能无力,因此要寻找能够具有更大的普适性的新函数F 是一个重要的课题。 说来说去,HK 定理虽然证明了电子密度是能量的唯一泛函,但是现在所有的DFT方法are still in the HF scheme,所以DFT还是ab initio. 从化学家的角度讲,ab initio 是指HF方法.HF和DFT都是从第一原理出发的,即在B-O近似,单电子近似及相对论近似的前提下.求解的过程是通过自洽场方法分别对HF和KS方程进行求解,但两种方法的基本思想出发点是不同的,HF是通过求解体系的波函数获得体系的其它性质,而 DFT是通过电荷密度获得体系的其它性质,而不借助波函数. 另外HF方程和KS方程的意义是有很大区别的. 虽然"DFT是通过电荷密度获得体系的其它性质,而不借助波函数.另外HF方程和KS方程的意义是有很大区别的. "但是DFT思想的实现仍然不能摆脱单电子近似的框架 但是DFT思想的实现仍然不能摆脱单电子近似的框架. 这句话是对DFT的误解, 在DFT中根本不存在什么单电子近似 ,只是对动能泛函同无相互作用体系动能做对应处理。这个和HF中的单电子近似有本质区别。HF中为了减小单电子近似引起的误差,可以通过引入多行列式波函数方法,但在DFT中从原理上根本是不能这样做,只能通过找到更精确的泛函来解决。 关于DFT确实还有些争论,比如算不算ab initio的啊,在谈到它的时候就需要更小心一点 两种说法都有。 一般在分子的计算中,如果同时做了几种DFT和几种Post-HF(特别是较高级别的,例如MP4, CCSDT)计算,一般都说ab initio and DFT,这个时候倾向于强调两者的精度不同和方法不同。如果是以各种Post-HF为主,加上少量的DFT计算,也可以笼统地说ab initio。 在周期结构的能带计算中,因为目前一般都用DFT ,所以说ab initio也行,说DFT也行,大家都知道这是DFT。 由于现在Kohn-Sham方程的密度泛函理论形式上 没有脱离单行列式和单电子近似理论框架 ,从这种意义上讲, 密度泛函理论不能直接处理电子多重态结构问题 。因而,除一些简单情况(如单-三重态分裂)外,不能普遍用于电子多重态结构的研究,这是密度泛函理论的重要缺陷之一,不解决这个问题,密度泛函理论方法的应用范围受到很大限制。因此,在密度泛函理论框架决处理电子多重态结构的问题是发展密度泛函理论方法的重要方面,很受量子化学家的重视. 人们在用密度泛函理论处理 多重态分裂问题 中针对不同的问题有不同的方法,但各自都有优缺点,没有统一的方法,发表的文章一般只介绍其所用方法的优点,而避开缺点.但DFT的计算量小确实是它的优势,特别是对于大分子体系及磁性材料,半导体材料等性质的研究,所以人们对用DFT计算比较感兴趣.
11933 次阅读|2 个评论
[转载]美利用电子成像技术分析石墨烯 通过掺杂改变性能满足特定需求
crossludo 2012-11-17 17:04
美利用电子成像技术分析石墨烯 通过掺杂改变性能满足特定需求 华盛顿11月15日电 美国能源部橡树岭国家实验室的科学家15日表示,利用实验室的电子显微镜获得的前所未有的石墨烯内单独原子的图像,人们有望全面解开该材料的应用潜能, 满足从发动机燃烧室到电子消费品的需求 。 人们首次获得石墨烯晶体是在2004年。石墨烯为二维(单层原子)结构,硬度超过钻石,强度赛过钢材,且具有电性能和热性能。通过了解石墨烯材料原子结构和 键配位 ,科学家有望提出优化石墨烯的途径,让其更好地适用于特殊的应用。 在新出版的《物理评论快报》上,橡树岭国家实验室和范德比尔大学两机构科学家组成的研究小组发表文章说,他们利用 消色差扫描透射电子显微镜对石墨烯中硅杂质的原子和电子结构进行了研究 。 橡树岭国家实验室研究人员胡安-卡洛斯·艾德罗布表示,他们利用新的实验和计算方法来揭示石墨烯中 单个杂质的键合 特征。比如,他们能区分石墨烯中非碳原子是二维还是三维键合。事实上,自20世纪30年代人们推断出键配位后,这是科学家首次将其视觉化表现出来。 通过研究石墨烯的原子和电子结构以及了解其掺杂物质,科学家能够更好地预测何种掺杂能够提高材料的性能,细微地改变石墨烯的化学组成能够为不同的应用量身定做合适的石墨烯材料。例如,通过增加不同的元素,可以让石墨烯取代汽车中的铂催化转化器,也可让其改善电子器件的功能等。 由于石墨烯具有导热、导电和 光学透明 能力,因此它有潜力替代人们日常用的电子产品中内部元件材料。 铟 是储存量十分有限的元素,它因透明传导性而广泛地用于电子产品(电视、计算机、手机等)的显示器上,人们期望能用更廉价和更丰富的石墨烯来替代铟。
个人分类: 趣味科技|1303 次阅读|1 个评论
蒙特卡洛方法
yunyue 2012-10-27 11:30
首先,蒙特卡洛方法是一种数值计算方法,其次,它的理论基础是概率论和数理统计 下面先看两个例子,都是转来的哈: 1、在广场上画一个边长一米的正方形,在正方形内部随意用粉笔画一个不规则的形状,呃,能帮我算算这个不规则图形的面积么?蒙特卡洛 (Monte Carlo) 方法便是解决这个问题的巧妙方法 : 随机向该正方形内扔 N ( N 是一个很大的自然数)个黄豆,随后数数有多少个黄豆在这个不规则几何形状内部,比如说有 M 个。那么,这个奇怪形状的面积便近似于 M/N , N 越大,算出来的值便越精确。 2、蒲丰投针: 1777年法国科学家 蒲丰 提出的一种计算 圆周率 的方法——随机投针法,即著名的蒲丰投针问题。   这一方法的步骤是:   1) 取一张白纸,在上面画上许多条间距为d的平行线。   2) 取一根长度为l(ld) 的针,随机地向画有平行直线的纸上掷n次,观察针与直线相交的次数,记为m   3)计算针与直线相交的概率p. 由概率学知 p=m/n; 同时,他也证明了 p=2l/(πd) π为圆周率 那么,通过这个投针实验,就可以计算出圆周率的近似值。当增加实验次数时,近似值越精确。 、、、、、、 由以上的两个例子,蒙特卡洛计算方法的本质是:通过做随机试验的方式,用不确定的值来逼近确定的值。为什么要这样?因为现实中,有些确实的值,我们很难或无法得到。 那么不确定的值是怎么来的呢?做随机实验,可以得到某事件发生的概率,而这个概率,和某确定值有联系。 目前,这个随机实验可以在计算机上模拟进行,这样允许做次数非常高的模拟。 下面就引用一下比较标准的定义吧,理解了上面的知识,就不难理解这个定义了: Monte Carlo方法的基本思想是 首先 建立一个概率模型,使所求问题的解正好是该模型的参数或其他有关的特征量. 然后 通过模拟一统计试验, 即多次随机抽样试验 (确定 m和 n) ,得到实验结果,统计出某事件发生的百分比.只要试验次数很大,该百分比便近似于事件发生的概率.这实际上就是概率的统计定义. 最后, 利用建立的概率模型,求出要估计的参数.蒙特卡洛方法属于试验数学的一个分支.(或另一种说法,根据概率模型和对其抽样后,需要确定一个随机变量,做为所求解的估计量。) 注:关于第二步的模拟实验,模拟实验其实是随机抽样,和现实实验是不一样的,既然由计算机完成,本质就是计算了。关于随机抽样,也就是计算出一系列值,做为实验的结果;而这些值,来自服从某一分布的随机变量。 为什么需要一系列值呢?因为第一步得出的是概率模型,而概率一般由频率来示,而数学期望是样本均值来表示,频率和样本均值都是由实验结果的数值计算得到的。 有一种方法是直接抽样法,前提是得到均匀分布U(0,1)的一个值,之后通过公式 计算得到来自任意分布的一个值。了解了这个,上面就好理解了。 1、20世纪的十大算法 http://blog.sciencenet.cn/u/huguanhu 2 . 百度蒲丰投针
10440 次阅读|0 个评论
系统医学,分析与综合渗透
benlion 2012-10-23 08:05
回到结构论的观点,结构论认为宇宙万物皆系统,系统皆有物质、能量和信息 3 要素,研究系统的方法和思维有符号论、实在论,方法有理论、实验和分析、综合。系统生物学的方法是理论与实验结合、分析与综合渗透,这个概念是 2003 年国际上才形成共识的系统理论和实验与计算方法结合的生物系统研究。 大学时代,读到摩尔的《伦理学原理》对原子论或还原论观点的论述非常精辟,是否同于 莱布尼 兹 的单子论? 就是说伦理学研究一定要分析到一个不可再分析的基点,这个最基本概念才是伦理学的出发点;因此,我引申到在结构论里是基元的概念,化学的出发点是原子,生物学的出发点是基因,物理学的基元是微观粒子等。 化学和代数的英文源自阿拉伯文,墨家的光学和小孔成像实验、声学等经阿拉伯传入欧洲,对实验方法和光的波动学说建立做出贡献。波粒二像性和波尔的互补原理等,又是原子论与整体论的关系体现,粒子之下进入场和弦等就走向微观与宇观一体化,系统的整体论走向一个极端就是作为系统的原子整体;因此,只有分析与整合之间的内在构成关系及其动态才是系统概念,系统的结构及其转换成为系统论研究的范畴,从而得出结构整合、调适稳态和分层建构 3 规律。 系统医学研究也就必须是建立在实验、分析与理论、综合方法上,及其交替;所以,实验医学、分子医学是系统医学发展的基础,系统科学、数学理论是系统医学发展的方法。 续,系统医学 – 回忆录( http://blog.sciencenet.cn/blog-286952-624743.html )。
个人分类: 百家|2308 次阅读|0 个评论
WINNER COST函数解析
fengjian1000 2012-10-16 18:42
成本分布原理: 投资者一般对股票平均成本感兴趣,移动平均MA、指数平滑移动平均EMA等算法都是计算股票平均成本的算法,但是这些算法没有考虑到成交量对平均成本的影响,例如,假设最近一段时间某股票在10-20元间波动,其平均价MA为15元,但观察其成交量发现在20元附近成交量巨大,而在10元附近成交量稀少,我们认为其平均成本显然应该比15元更高才合理,为此我们可以引入换手率移动平均概念;以当天的换手率作为平滑因子计算指数平滑移动平均,用公式来表示为: Y:=(1-A)*Y’+A*C A表示换手率,C表示收盘价,Y和Y’分别表示今日平均价和昨日平均价。 加权平均的计算方法是:Zax,其中x为待统计数值,a为x占总量的比例,当日的平均成本Y可以表示为两个部分,当日买入的和以前买入的,当日买入的成本为收盘价C,以前买入的成本为Y’,而当日买入的占总流通盘的比例为换手率A,而以前买入的则占1-A,因此今日的加权平均成本为(1-A)*Y’+A*C,因此,用这个公式更能反映股票的真实成本。 但现在还有两个问题需要解决,其一使用收盘价不能真实表示当日成本,其二是不能了解整个成本的分布情况,即我们只知道平均成本是多少,不知道整个持仓的成本分布情况,而这个分布情况有时是非常有用的。例如某股票的所有持仓成本均为10元,而另一个股票则由50%以5元买入,50%以15元买入,这两只股票均价都是10元,但其表现必然有很大差别。 移动成本分布 移动成本分布就是为解决以上问题提出来的,它将平均成本概念从一条平均线扩展为一个分布图,表示当前所有持仓量的成本分布情况,用等间距的水平线表示分布情况,水平线的垂直位置表示成本所处价位,长度表示相对比例,其中最长的线条占满显示区,其余按照相同比例显示。 成本分布的算法与前面以换手率作为平滑因子计算指数平滑移动平均的基本原理是一样的,主要差别就在于它计算的不是一个而是一组数值,即当日成本不是收盘价,而是从最低价到最高价之间的一组数据。 成本分布算法是基于以下假设计算的: a)每天的成本平均地分布在最低价到最高价之间,画成移动成本图就是一个最低价到最高价的矩形,这个矩形我们称为当日成本; b)每天的换手是等概率发生的,即不论买入时机如何,对于股票持有者不管是套牢还是获利,当日抛出的概率是相同的。 成本分布画法: a)上市每一天的成本分布图就是当日成本,即最低价到最高价间的一个矩形。 b)其后每一天的成本分布图满足Y=(1-A)*Y’+A*B,A表示当日换手,B表示当日成本,Y、Y’分别表示当日和上一日的成本分布,注意,此处BYY’均表示一个分布情况,而不是一个数值。 COST(N) 表示当日N%获利盘的价格是多少,即有N%的持仓成本在该价格以下,其余(100-N)%的持仓成本在该价格以上,是套牢盘 限制:仅在日线分析周期有效 参数:N:常量,取值范围0-100 例:COST函数根据获利盘和套牢盘的比例得出其分界线,我们可以由此得到90%的成本集中在COST(5)-COST(95)之间,而70%的成本集中在COST(15)-COST(85)之间;COST(50)表示平均成本,因此COST(95)-COST(5)/COST(50)就表示90%成本分布于平均成本附近的某个范围之内,该数值描述了成本分布的密集程度。 WINNER(A) 获利盘比例:表示以A价格卖出时获利盘比例是多少,返回0,1表示10%获利盘。 限制:A:常量或变量 例:WINNER(10.5)表示10.5元价格的获利盘比例 WINNER(CLOSE)表示以当前收市价卖出获利盘的比例 WINNER与COST是正好相反的两个函数,前者由价格求获利盘比例,而后者由获利盘比例求得价格,灵活应用这两个函数,可以定量地进行成本分析计算。 筹码分布选股 成本分布通过一种数学模式尽可能地接近和模拟市场的事实的购筹码的分布结构,虽然做不到“知道所有人的底牌”,但是做得到“了解大部分的其他人手中的牌” 当日收盘价的获利盘的比重? 含义解释为在本周期收盘价之下的获利筹码的比例是多少?这样计算的原因在于通过具体的数值分析求得更加明确的权市场的成本构成状况。 COST(CLOSE): 同样原理有: COST(OPEN); COST(HIGH); COST(MA(CLOSE,5)); 当日90%的成本获利的价位? 在此价位之下的90%的筹码在不计入交易费用的前提下都已经实现了帐面上的盈利。 WINNER(90); 同理: WINNER(10); WINNER(50); 单峰密集形态 两种密集形式:单峰高位密集、但逢低位密集,这两种密集形式分别代表了不同的基本含义。当发生在相对的高位的时候,几率较大的后市行情是下跌即将来到,而低位则刚刚相反。 条件选股之一:单峰密集 股价一直在一段区域内上下振幅不大的波动,在狭窄的区间内发生了大量的换手,并且延续了相当的一段时间,在业界有许多种的称呼,或者其他较为形象的描述,例如,长期的横盘整理,时间换空间等等,该形态被视为一种主力以低成本吸筹,以耐心换取筹码的典型手法,但是一直缺乏一种定量的描述方法,而移动成本分布的模型的建立为简单解决这个问题带来了契机,COST和WINNER函数则真实地实现了统计意义上的解决手段。 我们要找出70%的筹码集中在很小的区域内(一个容易进行横向的对比的区间内),也就是分布集中度较高的区域。 在两个假设的前提下,按照以下的方法做: 先找出85%的筹码获利的价格线: A1:=COST(85); 找出15%的筹码获利的价格线: A2:=COST(15); 70%的获利空间为: A3:=A1-A2; 85%和15%的获利价格区间的中价为: A4:=(A1+A2)/2; 表达式改为百分比的形式并进行界定,让70%的筹码分布在它们中价的10%的范围内: A3/A4*10010; 分布集中度: (COST(85)-COST(15))/(COST(85)+COST(15))/20.1 因为在原来的假设前提下,每一天的筹码分布都是不断的累加和迭算,期间的计算量相当巨大,这就是我们之所以采用以上的简单计算方法的原因了。因为细心的用户一定会想到,筹码绝对不会像我们所说的那样简单地集中分布在85-15的区间内,但是一定是近似的分布在这个区间内,因为它们的分布符合正态分布的原理。 条件选股之二:低位的单峰密集 即对单峰密集加入低位的概念。我们有许多的方式进行低位的条件限定,我们可以通过对历史上的最高点进行对比或者其它的指标公式的引用,或者采用的参照对象是一段时间内的高点,以下将使用最后一种方式来完成这一步工作。 建立低位的模型: “在过去一段长时间的交易周期内,采用250天,85%和15%的获利价格区间的中价的价位在其波动范围的下半部位,也即是低于250天振幅的50%”。 B1:=HHV(HIGH,250); B2:=LLV(LOW,250); B3:=B1-B2; (A4-B2)最终的低位单峰密集的公式组为: A1:=COST(85); A2:=COST(15); A3:=A1-A2; A4:(A1+A2)/2; A5:=A3/A4*10010; B1:=HHV(HIGH,250); B2:=LLV(LOW,250); B3:=B1-B2; B4:=(A4-B2)A5 AND B4 其中的周期250和集中度10%,我们都可以设为参数调整,选到最佳的周期和分布集中度。 条件选股三:跌破市场成本的反弹: 当一段下降的趋势形成之后,随着成交不断的发生在低位、更低位,从而整个股票的重心不断的下移,但是并不是所有的重心下移都是一样的,如果从市场的交投情况来看,成交量明显缩小的、换手率偏低的个股,它的重心就下降得很慢,甚至于出现减速、平走的情况。我们目前已经可以证明,在所有的“V”字反转当中,60%-70%或者更高的比率都会出现上述的情况。(当使用不同的数据测试的时候,有不同的结果) 首先,图中有一条指标线,该技术指标是为了我们更好的观察这种现象而编制的成本线指标,用以作为一个辅助性指标: B:COST(50); 指标线B是连接日线周期上所有的50%筹码获利的价格的一条连线,我们也可以将它称为市场的绝对平均成本线。 显而易见,在下图当中由于超跌所引起的反弹在市场平均价格线的衬托下,技术形态的特征十分容易寻找,当CLOSE背离B线达到一定程度的时候,就进入到了技术上的超跌反弹区域。它和传统的RSI等等指标的最大不同,也是其根本不同,统计的对象一个是单纯的价格,一个是累加了成交量变化的价格均线。 在以下的举例当中,我们进行了一些测量,反弹点距B线的差距当时已经达到了15%的比例。 所以有以下公式: 超跌反弹选股:量化模型为:当收盘价与绝对平均成本线的距离的百分比低于-15%,为一个超卖区间,可以考虑买入;反之,如果高于15%,为一个超买区间,应该考虑回避风险。 买入条件: A1:=COST(50); CROSS(A1,-15); 卖出条件: A1:=COST(50); CROSS(15,A1) 自编公式实现Winner函数 CC := DYNAINFO(7); { 今日收盘 } ww := IF(LCC, 0, IF(HCC, 1, (CC-L+0.01)/(H-L+0.01))); { 每日获利盘 } Winner: DMA(ww, VOL/CAPITAL)*100; { 获利盘 } =========================================================================== 换手获利成本主图 CB:DMA(((2*C+H+L)/4+(2*H+L+C)/4+(2*L+C+H)/4)/3*90,HSL/90)/90,COLORRED,CIRCLEDOT; 长底:CB*0.618,COLORWHITE; 中底:CB*0.809,COLORGREEN ; 警示:CB*1.191,COLORLIBLUE; 脱离:CB*1.382,COLORMAGENTA; EMA((2*C+H+L)/4,240)COLORBLUE; IF(EMA((2*C+H+L)/4,240)REF(EMA((2*C+H+L)/4,240),1),EMA((2*C+H+L)/4,240),DRAWNULL)COLORYELLOW,CIRCLEDOT; ---------------------------------------------------------------------------------------------------- 获利盘附图 主力底仓:COST(9),COLORWHITE,LINETHICK2; 建仓:COST(21),COLORYELLOW,LINETHICK2; 平衡:COST(36),COLORMAGENTA,LINETHICK2; 中位:COST(67),COLORGREEN,LINETHICK2; 拉高:COST(84),COLORGRAY,LINETHICK2; 高位:COST(94),COLORBLUE,LINETHICK2; STICKLINE(C=O,C,O,8,0),COLORRED; STICKLINE(C=O,H,L,0,0),COLORRED; STICKLINE(C=O,C,O,8,0),COLORGREEN; STICKLINE(C=O,H,L,0,0),COLORGREEN;
个人分类: Stock|1 次阅读|0 个评论
微博:科研工作随想
hmaoi 2012-10-10 20:15
有十几天没有写博客了。一直忙于写一篇论文。由于问题的复杂性,无法用解析方法获得显式解,只能借助于模拟和近似计算方法。一个令人头痛的问题是计算机性能不够好,运算速度不够快,算一个数据需要将近4个小时,如果需要计算数百个数据,就需要很长的时间。本指望自科基金资助,今年又落空了,准备下决心自己掏钱买一台高性能的计算机,以解燃眉之急。
1917 次阅读|0 个评论
生物信息学,可以安于非主流,而且应该庆幸非主流
热度 3 DNAgene 2012-9-19 23:42
看到大家讨论生物信息学, 上海·裸奔的生物信息学 、 生物信息学不需要裸奔 。我也是在这里混饭的,也号称是做生物信息学的,也来凑个热闹。 我赞同把生物信息学分为偏向方法技术和偏向生物学问题两类。我们国内两类人基本上都号称是做生物信息学的,研究生招生一般也都叫生物信息学。国际上,从学术期刊看,叫bioinformatics的期刊偏向方法和技术,叫computational biology的期刊偏向生物学问题。但国内,你招研究生如果改叫计算生物学专业,就要经过申报、备案等一系列繁琐手续,还要招致专业划分过细的批评,所以包括我在内的很多做computational biology的人,都打着bioinformatics的旗号招生。从这一点看,bioinformatics并没有被边缘化。 薛宇说偏向计算方法技术不是主流,可能是我自己计算生物学问题也没做好的缘故,我也没看出来computational biology主流了。我有点阿Q精神,拿出来跟大家分享一下。 也许,在一些人眼里,computational biology比bioinformatics主流,但computational biology(如进化)与做实验的biomedicine相比,那不也是偏门的很,远离主流。 为什么要主流?主流领域容易发表高级别期刊论文(如前几年的miRNA研究),风光。主流领域还容易申请到经费,充实。无论computational biology还是bioinformatics,既难风光,又不可能充实。心灰意冷便有了洗洗睡的想法。 但反过来说,我们这个广义的生物信息学(包括computational biology和bioinformatics),也用不着那么多经费。有几台电脑就够了。我们没必要跟别人比“充实”,我们有点阳光就灿烂,有点经费就充实。他们那些生物医学的主流领域,维持充实的压力也很大。 再说一下风光,做生物信息学可能确实难得风光。但不风光才能静下心来,才能踏实做学问,才可能十年磨一亮剑。 把阿Q精神再放大一些: 生物信息学家,不仅可以安于非主流,而且应该庆幸非主流,不要洗洗睡吧,而是没事偷着乐吧 。 有人可能说,别美,你的剑还没磨出来,工作先没了。这一点准备选择专业的同学们可以放心,生物信息学还是很养人的,据我观察,各个单位做生物信息的,至少是比上不足比下有余,维持工作岗位难度不太大。
6363 次阅读|9 个评论
[转载]第一性原理的计算方法及常用软件介绍
dwd0826 2012-9-7 15:38
Code Name Basis Set Potentials Web Site Plane Wave Pseudopotential Codes ABINIT Plane wave Pseudo, PAW www.abinit.org CASTEP Plane wave Pseudo www.tcm.phy.cam.ac.uk/castep/ CPMD Plane wave Pseudo www.cpmd.org/ Dacapo Plane wave Pseudo www.camp.dtu.dk/campos/Dacapo/ FHImd Plane wave Pseudo www.fhi-berlin.mpg.de/th/fhimd/ PWscf Plane wave Pseudo www.pwscf.org/ VASP Plane wave Pseudo,PAW cms.mpi.univie.ac.at/vasp Pseudopotential Codes with Other Basis Sets Quickstep Gaussian+plane wave Pseudo cp2k.berlios.de/quickstep.html SIESTA Local/numerical Pseudo www.uam.es/departamentos/ciencias/fismateriac/siesta/ all-electron codes CRYSTAL Local all-electron www.crystal.unit.it FPLO Local all-electron www.ifw-dresden.de/agtheo/FPLO/ Gaussian 03 Local all-electron www.gaussian.com ADF Local all-electron www.scm.com DMol3 LAPW/numerical all-electron people.web.psi.ch/delley/dmol3.html FLAIR LAPW all-electron www.uwm.edu/~weinert/flair.html QMD-FLAPW LAPW all-electron flapw.com WIEN2K LAPW all-electron www.wien2k.at
6998 次阅读|0 个评论
【新书快讯】《数值计算方法理论与典型例题选讲》
热度 2 sciencepressnj 2012-8-10 17:03
【新书快讯】《数值计算方法理论与典型例题选讲》
【内容简介】 本书是为理工科大学本科课程 “ 数值分析 ” 和 “ 计算方法 ” 编写的教材与课外自学指导两用书 , 主要内容包括引言、插值法、线性方程组的直接解法与迭代法、方程求根、数据拟合与函数逼近、数值积分与数值微分、常微分方程数值解法、矩阵特征值与特征向量的计算 . 此外 , 为了兼顾学生能力的培养和考试技能的提高 , 并帮助其合理掌握学习重点 , 本书附录包括上机实习、理工科专业 “ 计算方法 ” 模拟题 6 套、数学专业 “ 数值分析 ” 模拟题 2 套和数学专业硕士研究生入学考试 “ 数值分析 ” 模拟题 2 套 , 并附有答案 . 【读者对象】 本书可作为理工科大学数学及相关专业本科和研究生 “( 数值 ) 计算方法 ” 课程的教材 , 也可供从事科学与工程计算的科技工作者参考 . 【作者简介】 蒋勇 , 南京信息工程大学教授、博导,数学与统计学院院长,获江苏省优秀教学成果一等奖等多项奖励,霍英东教育基金项目获得者,江苏省 333 工程入选专家、江苏省优秀青年骨干教师等获得者,国家专利 4 项。曾主持和参加国家自然科学基金项目各 2 项,主持多项国际合作项目、江苏省项目,在国内外主编、独著正式出版著作、论文集、教材十多部。
个人分类: 新书快讯——数理化生类|3205 次阅读|3 个评论
[转载]科学家利用计算方法揭示化学反应设计催化剂
crossludo 2012-7-12 14:00
科学家利用计算方法揭示化学反应设计催化剂 1928年,奥托·迪尔斯和库尔特·阿尔德两位化学家首次证明了 二烯合成 这个能够合成众多高分子、生物碱和类固醇的极具重要性的化学反应,也就是著名的 迪尔斯—阿尔德反应 。多年来,这项标志性的反应得到了广泛应用,并成为人们研究有机化学机理的工具。鉴于此项研究成果对社会的贡献,迪尔斯和阿尔德在1950年荣获了诺贝尔化学奖。然而,尽管迪尔斯—阿尔德反应意义重大,但是长期以来此反应过程中的具体情况却鲜为人知。 如今,美国加州大学洛杉矶分校有机化学教授肯德尔·霍克和同事表示,通过研究,他们掌握了迪尔斯—阿尔德反应发生的细节。相关的研究文章日前发表在美国《国家科学院学报》网站上,并将在下期杂志上登出。 用短片再现化学反应微观细节 霍克本人还是加州大学洛杉矶分校加利福尼亚纳米系统研究所的成员。他表示,迪尔斯—阿尔德反应是最重要的合成反应,为了解反应发生的细节,他和同事仔细地分析调查了此反应的分子动力学。 基于自己的研究,霍克和同事制作出许多模拟分子组合和反应的视频短片。霍克表示,模拟短片的意图在于帮助人们认识迪尔斯—阿尔德反应是如何进行的。这些短片并非只是简单地介绍从A物质变为B物质,以及从B物质到C物质,而是真实地展示了化学反应中化学键如何形成以及原子如何运动并结合起来。采用当今运算功能强大的计算机,可以对化学反应机制展开过去无法实现的精确分析。这花费了大量的计算时间,但是最终的结果是前所未有地观察到了反应的详细情况。 不过,霍克并非唯一制作迪尔斯—阿尔德反应短片的人,加州大学洛杉矶分校尼尔·格里格教授的有机化学课堂上的学生曾制作了有关该反应的有趣的配乐视频系列片。 如果在一个迪尔斯—阿尔德反应过程中形成了两个化学键,那么它们是在同一时间形成的还是一前一后形成的?围绕这个问题,有机化学家争论了多年。霍克说,他们发现在最简单的迪尔斯—阿尔德环加成反应中,两个化学键形成的平均时差约为5飞秒,对此他们认为这两个化学键为同时形成。 霍克是全球研究成果高产的化学家和全球著名的物理有机化学家。他在接受美国《国家科学院学报》访谈时表示,他和同事研究了众多不同的反应类型,并掌握了化学反应依照其自然方式发生的多种规律。 借助计算方法设计化学反应催化剂 霍克是借助技术运算和模拟来研究有机化学和推断化学反应性的先行者,他领导的研究小组预言的许多新现象最后都为实验所证实。此外,他在帮助人们了解酶如何有选择性地催化化学反应方面也做出了重要贡献。 2008年,霍克的研究小组利用计算机方法开创了 “设计酶”,并推断出能够催化非自然反应的蛋白质结构 ,这是计算化学和蛋白质工程领域的重要里程碑。霍克表示,设计酶有望通过让致病生物制剂失活而用于防御生物战,也能帮助人们开发更有效的药物。 在介绍其从事的推断催化特殊化学反应酶结构的研究时,霍克说,其理念是为化学反应设计催化剂。无论是为研发关键药物或者实验产品,这都是十分重要的。 设计蛋白质和酶相当困难 ,但是人们能够获得成功。 霍克和同事认为,利用计算方法能够更好地了解化学基本反应,同时设计蛋白质和酶来催化化学反应。目前,他们正利用计算方法预测催化剂,这些催化剂能够催化那些在工业和疾病治疗方面具有重要应用的反应。霍克表示,如果一切工作正常进行,那么计算机设计和分子生物学的结合能够为任何反应找到所需的催化剂。他还表示,虽然他们经历了重重困难才了解到表面现象,但未来在理论和计算能力方面的发展有望让他们的工作更为容易。 “我们的工作涉及理论和计算,但是却与现实密切相关。”霍克说,“我们首先试图了解正在发生什么,然后再试图推测实验者所能够进行的试验。我们研究的目标是利用计算方法在蛋白质内进行组合,以引发所希望发生的化学反应。”
个人分类: 仿生科技|1512 次阅读|0 个评论
[转载]美药管局13年来首次批准减肥药上市
xuxiaxx 2012-6-30 15:10
美国食品和药物管理局27日批准商品名为Belviq的减肥药上市,这是该局1999年以来首次批准新减肥药上市。   这种药物的主要成分是绿卡色林盐酸盐,适用于身体质量指数(BMI)超过27的成年超重或 肥胖 者,且他们至少患高血压、Ⅱ型糖尿病和高胆固醇等与超重相关疾病中的一种。服药者须同时节食并锻炼才有望获得较理想的减肥效果。   身体质量指数是国际上衡量人体胖瘦程度以及是否健康的一个常用指标,其计算方法是体重(千克)除以身高(米)的平方,超过25为 超重 ,30以上则属肥胖。   这种药物能够激活服用者大脑内的5-羟色胺2C受体,帮助他们在进食较少的情况下就产生吃饱的感觉,从而起到减肥作用。其安全性和有效性在近8000名超重或肥胖者参与的3项临床试验中得到验证。   在这些试验中,所有参与者均减少日常热量摄入并辅以锻炼,部分参与者服药,另一部分则服用安慰剂。一年后的数据显示, 服药者 体重减轻约6%,服用安慰剂者体重减少2%至3%。试验还显示,其副作用主要有头痛、疲劳、口干等,糖尿病患者还容易引起低血糖。   这种药物由瑞士阿雷纳制药公司生产。药管局药品评估和研究中心主任珍妮特·伍德科克当天说,肥胖是一个重要公共卫生关切,这种药物获得批准为美国肥胖者和超重者提供了一种新的治疗选择。   美国疾病控制和预防中心上月发布预测报告称,按发展趋势,到2030年美国肥胖人口的比例将由目前的约三分之一上升至42%。 来源: http://news.xinhuanet.com/health/2012-06/28/c_123342740.htm
1386 次阅读|0 个评论
[转载]关于分子中原子电负性与电荷
chnfirst 2012-6-13 16:16
ttp://emuch.net/bbs/viewthread.php?tid=1594771 关于分子中原子电负性与电荷 ★ ★ ★ ★ ★ ★ ★ ★ ★ ★ lei0736(金币 +10 ,VIP +0 ):鼓励高水平原创作品 10-13 09:04 一、分子中原子的净电荷问题 多少年来,人们总是想探讨分子中原子的性质,特别是分子中原子的净电荷,提出了各种计算方法,并进行了不断地改进,然而至今都还不能令人满意。 实际上,量化计算输出的Mulliken atomic charges常常是不可用的。 其净电荷有时与实验的预期相差太远,甚至相反,许多净电荷异常到不可思议的地步,使人们对量化计算出的电荷失去信心,以致认为电荷这个东西本来就没什么实质的物理意义,不可靠,对电荷不能过于认真,从而不愿用电荷、谈电荷,以致对网上讨论电荷的帖子也经常不置一顾。 这种对分子中原子电荷把握不住的状态,与计算量子化学的发展不平衡有关。 量化计算程序以gaussian为代表,它在量化计算方法方面真是日益完善、面面俱到、应有尽有、方便易行。然而在具体的量化应用方面却不那么细致、合用,不敢恭维。量化应用方面的应用数据输出,从几十年前的半经验计算程序的早年开始,集居数分析、净电荷、键序,至今还是照搬,并没有什么根本性的改进和突破。然而这里的问题很多,使得人们不敢相信电荷,特别是净电荷。 这在计算量子化学发展的历程中,应是必由之路,当然必须首先解决计算方法的方方面面问题,而且这样的问题还在层出不穷,吸引了众多的计算精英去解决、发展它。相比之下,量化应用的基础研究反倒相形见拙了,出身数学、物理的计算精英们也未必来作量化应用。 这样一来,新走进量化的人们,便面对、接受这样一个现实:高度精细发展的计算与相形见拙的应用(如净电荷)。甚至形成一种思想定势,认定电荷是离谱不可信的,在这方面的努力是白费劲。对电荷的信任已经如此不堪,更不用说电荷密度差了。由此甚至追溯到基组,认为基组也不过是计算需要的一个数学取值、自洽过程,不必去追究它的实际意义,不再去联想杂化,基组那么多很难去作直观的联想了。 在量化计算结果输出中,MO和能量是最根本和原始的,可信的。实际上在分子中,电子才是最能动最活跃的因素,电子密度,正是从波函数的平方来,是波函数的物理意义。它也是量化计算最基本、原生态的可信分子信息。 也许我们现在还不能得到分中原子电荷的较合理、合用的确切数据,但实验已经证明分中原子电荷的量值是定量客观存在的。 如在核磁共振NMR中,原子核电子云的分布状况和附近化学键称为该原子核的化学环境,由于化学环境影响导致的核磁共振信号频率位置的变化就是该原子核的化学位移。虽然这化学位移是核的,但它却主要是由于原子核外电子云屏蔽的影响,化学位移既是恒定的、可以精确实验定量的,也反过来表明核外电子云的量值也必是精确存在的,不是任意的不可捉摸的。(由于NMR是从原子外部探测原子核的,是核外电子的总合在起作用,反而恰好回避了区分各种电子的问题。) gaussian不是也在计算NMR吗?并且可以与实验值相比较!可见gaussian对原子周围电荷的计算基本上是可信、可用的。 问题出在那里? 实践经验使我们逐渐认识到Mulliken atomic charges的根本缺点在于: 1、人为地均分了重叠密度,对象体积大小相差很大的原子(如Cl与H)之间成键,误差很大。 2、分子有σ、π、pi(孤对电子)、δ等各层轨道,分别有自己的电子流动,流动方向也不尽相同。Mulliken atomic charges将各种电荷笼统地归结在一个原子上,头发胡子一把抓,自然就出了问题,使精确的量化计算在电荷问题上处于目前这种尴尬境地。 可以确定的是,分子中电子的聚集、流动,还是完全按照我们对原子电负性的认识的。只是在分子中,原子σ、π、pi电负性不是一成不变的、而是发生了变化的,我们要考察、把握这种变化。 真能对σ、π、pi、δ等各种电子分别进行考察甚至在量进行核算吗?下面我们将逐步举例探讨、分析这个问题。 二、分子中原子或基团电负性的推算 在前帖 曾经认为:在MO理论,电负性χ是原子AO或分子MO能级ε的负值。 在分子中,电负性大的原子得到部分电子、电子对核的屏蔽增强,使得电负性降低,能级升高,电负性小的原子失去部分电子、屏蔽减弱,使得电负性升高,能级降低,从而达到电负性均衡、能级均衡,不再有电子流动。 电负性不同的原子或基团A、B之间成键时,会发生部分电荷q转移,致使原有电负性χ变成分子中的χ*,根据文献 一般认为: χ* =(1+q)χ (也即:ε* =(1+q) ε) (1) 根据电负性均衡原理 ,成键双方的电负性是相等的: (1+qA)χA=(1+qB)χB (2) χB=(1+qA)χA /(1+qB) (3) 于是,如果设某一个原子的电负性已确定,并设定它为基准原子,如H,让它去与各种原子或基团成键,并进行量化计算,由H上的净电荷q,就可以据(3)式计算各种原子或基团的电负性。这时,H就象一个基团电负性的测量器。 如例如HF分子,如果A是H,它的Pauling电负性 值通常认定为2.1,gaussian 03计算得到的转移电荷量是0.302,则算出F的电负性为3.9,基本与公认值相符。但是由Muuliken集居数分析得到的q并不总是这么好用,因为它均分电子的重叠部分并不总是那么合理,这种推算方法并不具有普遍意义,这里只是在举例表明一种数量级而已。为了方便地求得可资比较的电负性相对大小的序列参考值,半经验量化计算如CNDO,它只考虑价电子、忽略微分重叠、AO单一、净电荷明确,还是可以用的。 文献 认为电负性均衡原理,是分子中一个健两边的原子或基团的电负性是均衡的、相等的。并由此提出了一个推算基团电负性的公式,作为对这种见解的验证。即对分子R-H,经过量子化学程序计算,由H上的净电荷q的大小,推算-R的基团电负性。当时用CNDO/2计算出的各种基团电负性,通常与公认的文献值符合得很好。但是也有少量分子,计算出来H的净电荷q的大小,出现异常情况,如在CH2O、HCOOH中,CNDO/2计算出的来与C相连的H的净电荷q竟为负值:CH2O中,H的净电荷为-0.01126。-CHO、-COOH的基团电负性竟比H还小,与实际的化学经验相反,这显然不合理。 ...... "关于分子中原子电负性与电荷"全文word文稿: http://d.namipan.com/d/3a1de9228 ... 14c5e74a52c00260200 http://d.namipan.com/d/3a1de92284c3369f5f0d82ca2d43014c5e74a52c00260200 lei0736(金币 +2 ,VIP +0 ):谢谢补充 10-13 14:27 是得好好学习学习了,对于电负性,在学化学时就没弄明白。一个分子中,电子的偏向除了与原子之间的电负性差别有关外,还与成键电子的提供有关(尽管搞计算的准备否认键的概念)。最典型的是分子CO,虽然O的电负性比C的要大,但测定结果显示C原子好象带点负电,因此,羰基配合物的配位原子不是O,而是C。 这回得好好跟LZ学学新概念了。 http://emuch.net/bbs/viewthread.php?tid=3788632 《zhou2009文集》 《序》 Zhou2009 加盟小木虫量子化学论坛快三年了,写了一些帖子,现在重读这些帖子,作了点语句修改,还新写了几帖,集成《Zhou2009文集》,并写此《序》。在序中对这段经历和想法写得较多,是写给新来的量化人看的。 我并不是科班出身的量化人,原本是作有机、高分子合成的,合成中常常需要考察分子的结构与性能的关系,于是用量化程序算题、思考。加上在研究所时,所里安排我给研究生班上量子化学课、物理有机课,便学习了这方面的基础知识。后来我下海了,专门合成产品、市场营销。当我从海里超脱出来时,我选择了量子化学作为我的爱好,因为我喜欢想问题。 当我由以前多年算半经验量子化学程序作应用,转向昔日曾认为高不可攀的gaussian 时,下载了几本手册,在小木虫论坛注册,开始学用gaussian 了。首先将小木虫论坛从头到尾扫了一遍,得到了基础知识,他人的求助不也是我可能会遇到的问题吗? 在我以往用量化程序算题,考察分子的结构与性能的关系时,深感如今的量子化学计算,会输出大量的数据,特别是MO中众多的基组、系数。面对这成千上万的信息数据,人们常会感到茫然、不得要领,有时只好不去看它,可惜了这最有用的第一手原生态信息!必须将这些数据图形化,便于我们识别、应用、交流。 人们对一目了然的图形感知比较敏感,些微的差异就会发现。特别是作电子密度差Δρ图时,一眼就能看出电子密度发生的鲜明变化,而仅从成千上万数据根本无从看起。 成千上万的精确的电子密度ρ值以及据此作成Δρ,一旦作成图像,似乎又失去了数值的精确性,在更高的层次上变成定性的图形了,但这次定性却将隐藏在这成千上万数字之上新的质通过图象表达出来,这有助于我们认识、揭示量化计算的成千上万数字所反映的化学本质。 面对图形,我们好像看见化学实体了。 所以当我从海里爬上岸开始学用Gaussian量化程序时,当我在考虑如何学用量化图形时,彷徨在大家已经熟知的Gaussview、Molden等外时,幸运地见到了Sobereva博士刚发表不久的GsGrid,自然是如获至宝,立即用它来算电子密度差Δρ并作图、作应用。 那时涉及的面一下很宽,什么都不那么懂,几乎寸步难行!当然只好自己反复试探、摸索,实在没辙了就问Sobereva博士,而一问她,总是迎刃而解,至今给她已经发了近百封电子邮件了,从而走通了Gaussian-Gsgrid-Sigmaplot的路。当然随着Multiwfn的发表、不断更新,它集量化数据处理运用之大成,这个路现在已经是Gaussian-Multiwfn-Gaussview-Sigmaplot了! 开始学用量化图形过程的实录,后来都写在《量子化学图形显示》(操作手册1.00版)中了。因为当时也有一些和我一样的同路人,也会遇到同样的问题,便匆忙写出了。现在看来人们也许会感到奇怪:一份量子化学图形显示操作手册,竟没有一幅插图,竟没有提到用Gaussview!实际情况是我那时还不会往文中作插图,不会在小木虫上贴图。我起初作量化图时,当时完全不会用Gaussview。当然后来这些都渐渐会了一些。因为现在还常有人要参考它,特别是在有了Multiwfn,情况已经发生了极大的变化,现正改编这份手册为新的2.0版。 我是个自由人,没有课题、出论文的压力,“量化应用基础研究”也是我自命的、自认的。所以我的工作可以自由地即时贴出来。 于是我便单刀直入,主要攻量化图形及其应用,以量化图形作为可视观察方法,来考察一些量化应用的基础问题,因为我也深感量化应用的基础研究还作得不够。 这样便算了一些小分子,用图形(特别是电子密度差Δρ)来试着考察一些量化应用的基础问题,除了在论坛上跟帖外,还形成了一组帖子。 正象我在关于二聚水氢键帖子中说的:“如其说是研究了一下氢键,不如说是意在试一下量化图形如何应用。”这一组帖子大体都是这样的,在于试着用量化图形。 当然,也必须有新的视角、概念和想法,人云亦云有什么意思!且试着说一说传统、正统量化较少涉及的内容。 本《文集》所收的帖子,都是用量化图形特别是电子密度差Δρ来试作应用的,事先并没有什么定见,结论都是从量化图形看出来的。 问题围绕着一个中心:电荷。或者说是电子密度。 说起电荷,要多说一说,电荷有多种范畴、概念、层次。 第一个层次是物理有机的形式电荷,它概括了分子中由于原子参与成键的轨道电负性不同,电子会发生转移这种事实,把电荷归结到具体的原子之上,认为吸电子的原子会形成正整数价,用-1、-2来标示。这种形式电荷过于将问题简化、绝对化,不能精确、真实地反映客观化学存在,会产生误导,弊大于利。这方面的分析见yjcmwgk“小议形式电荷对量化初学者的误导”:ttp://emuch.net/bbs/viewthread.php?tid=2456809fpage=3。 第二个层次是有了量子化学计算之后,分子中的电荷分布可以由各种精度的方法计算出来。分子中的电荷分为原子上布居的和原子之间重叠布居的。这是由量子化学的基本原理:ρ=Ψ*Ψ,一平方,就产生了一系列原子之间的重叠布居。这时,为了方便应用,还是按照认识的惯性,将电荷划归给原子,最简单的方法是由原子双方均分重叠布居,最著名的是Mulliken布居分析。但长期的应用实践中发现它经常出现不符合实验预期的结果,后来出现了大量的改进方法,较为人们接受的是NBO布居分析。然而电荷问题并没有真正解决。到底电荷的问题在哪里?于是写了几个相关的帖子。 第三个层次是量子化学所得到的电子密度,这是另一种计算方式和表达,是在分子的空间取格点,求每一个格点的电子密度ρ,得到电子密度ρ的空间格点文件。这里没有了难分难解的重叠密度问题,电子密度ρ就是在一定布局的原子核外的一个空间分布,它可以是整个分子的,也可以是某一个或某几个MO的。而且还可以将电子密度ρ乘以它所在的体积微元得到几率,将分子存在的整个空间或部分空间的几率加和起来,就得到这种空间的电荷数值。当作电子密度差Δρ时,还可以分别对正值和负值进行加和,甚至对某一个选定的局部空间加和,从而得到分子中电荷的净变化的确切数值。本系列帖就采用这种方式。 为什么一直抓住电荷不放呢?一方面因为电荷问题在量化上弄得比较混乱、被边缘化了,另一方面它确实越作越有深度、一直可以开拓下去。 记得在研究所时,有一年业务处长带队走访中科院的兄弟院所,回来告诉我说人们都建议作老题目!作老题目,这题目必是已经有一定高度的,经过实践考验的,又不会是尽善尽美的,继续作下去必然会更加提高、更加深入。课题切忌浅尝即止,企图广种薄收。 这个文集的帖子,加了编号列在一个子目录中,编号代表拟稿的时间顺序,是为了这些帖子在目录中能保持固定的顺序,以便查找,并自然而然地带入到文集中了。有些编号是空缺的,这是由于当时已经列了题、动了笔,但后来时过境迁、见异思迁尚没有写出来。 如今量子化学计算已经达到惊人的高度了,但从实际的化学应用看仍然处于成长阶段。我常见到处于量化成长烦恼和年轻量化人自身成长烦恼的帖子,很是感慨,便总想多作些量化应用基础工作,为他们服务。 当然,这些帖子都不是文章,这是将量化图形用于研究问题的即时随笔。好在这只是一组帖子、随笔,即时贴出,不用受杂志的斧砍。只是即时提供给大家一种初步的印象、原生态的想法,以活跃思路。 真正把这些问题研究完成的,不必是我,不会是我,期待他人… 本文集包含: 00序 01作为基础的概念 02共价键与分子中原子电负性 03关于分子中原子电负性与电荷 04从量子化学图形解读二聚水氢键 05 Pauling电负性的本质 08关于电子密度差Δρ 09电子密度ρ和密度差Δρ 11关于Ψ(MO)的归一问题 12从量子化学图形解读CH2O电子结构 13电子密度差Δρ深入计算的一例:HCl 14极性键电子密度差Δρ的解析 15原子电负性与其诱导电荷 17分子中电荷计算的深入探讨 18关于HF、H2O的电荷计算 20关于电荷计算的第二组分子 22电荷是客观存在的吗 23原子电负性与其σ诱导电荷相关线的探讨 26关于镁-卟吩的量化计算及图形解析 28一些关于电子密度ρ的基本想法 30分子片ρ计算的一个值得注意的问题 31关于电子密度差种种 32从量子化学图形解读分子间π-π相互作用 33关于分子间范德华作用的随想 37量子化学图形显示(2.0版) 39关于电负性均恒原理 40《关于电负性均恒原理》
个人分类: 理论|0 个评论
博士论文的精华在哪?巨人的肩膀不让你站。
热度 3 cynankai 2012-6-13 13:55
本着某项技术的求学心态,看了该领域成功博士的毕业论文,之所以说成功,该博士的研究成果已经形成了产品,有国家专利的,所以更多了点神秘。结果论文实在不敢恭维,都是无关痛痒的东西,至于关键技术,哪怕是研究方法,筛选方法,计算方法只字未提,真够保密的。全文就像打广告,光说怎么怎么好,怎么评价这么好的东西。让后来者学都无处寻。写论文不过是糊弄局,没影的东西全副武装往上写,真正的好东西放进去对于作者来说是种损失。真的吗?阻碍科技发展有罪@!
个人分类: 工程可研|4590 次阅读|3 个评论
参加第10届全国工程计算方法(边界元)会议的感想
热度 1 xiaojy 2012-5-29 20:10
5月25日至28日在湖南大学召开。 这是我第三次参加国内的边界元会议,与很多同行的专家、教授成了朋友,见了也倍感亲切。同时,每次参会,也都能认识许多新朋友。我总喜欢说一句话,“希望以后多交流,多向您学习”,这是一句真心话,希望和大家相互讨论、学习,把我国的边界元研究水平提高上去。 关于我们大家的研究,总的感觉是:效仿洋人的多,原创的少;工程应用的多,基础研究的少。当然,我这里说的基础,是指边界元方法上的研究。一个可能的原因是,大家多数做力学,数学功底有限。但是,有一些基本的问题,还是应该对其数学原因和机理有一定的认识和探讨,不应该把所有的问题都推给数学家。我们既然是做边界元法的,就不该仅仅会用这个方法解决一些工程问题,而应该也会对方法本身做一些研究。
5011 次阅读|2 个评论
1970年图灵奖得主--詹姆斯·威尔金森
热度 2 shanbowei 2012-4-29 07:56
1970年图灵奖得主--詹姆斯·威尔金森
威尔金森在授课 大家知道,计算机的应用有两大领域:数值应用领域和非数值应用领域。所谓数值应用,是指解各种方程和函数,求得它们的数值解,处理对象是数值数据;所谓非数值应用,主要指大家熟悉的数据管理和数据处理,其他如过程控制、定理证明、推理等也属这一类,处理对象是非数值数据。早期的计算机由于尚未解决字母、字符的表示和没有大容量的存储器,只能用于科学与工程计算。非数值应用是在20世纪50年代中期发明了字符发生器(Character Generator)和磁盘存储器以后才逐渐发展起来的。在数值应用方面,计算机实际上只能做最简单的加、减、乘、除等四则运算,而不能直接解比如微分方程或求各种复杂函数;遇到它们,要先由数学家利用各种数学变换方法把它们转变为一系列算术运算,这叫“数值分析”或“计算方法”。由于20世纪五六十年代计算机以数值应用为主,因此1970年的图灵奖授予了一位在发展数值分析技术和方法方面做出了杰出贡献的数学家就不足为奇了,他就是英国皇家学会院士、著名的数值分析专家詹姆斯·威尔金森(James Hardy Wilkinson, 1919-1986)。但令人惊奇的是,这位数学家在建造由图灵设计的ACE计算机中心中竟然扮演了举足轻重甚至最关键的角色。 威尔金森 1919年9月27日生于英国肯特郡的斯特洛特(Strood,Kent)。他的初等教育阶段是在位于伦敦东郊的罗切斯特的一所由著名的数学家约瑟夫·威廉姆松爵士(Joseph Williamson)创办的数学学校中度过的。然后在剑桥最负盛名的“三一学院”(Trinity College)接受了严格的教育,成绩出众,16岁时获得三一学院的最高荣誉-Trinity Major Scholarship,并因此免试进入剑桥大学。1939年威尔金森获得一等荣誉奖章从剑桥毕业时年方19.由于第二次世界大战,他毕业后进入剑桥数学实验室的军械研究所(Armament Research Department)工作,研究与解决有关弹道方面的问题,开始对计算数学发生兴趣。也是在那里,他遇到了他未来的终生伴侣、也在剑桥获得过一等荣誉奖章的女数学家维婀(H.N.Ware),他们于1945年结婚。 战后,他进入英国最著名的学术机构之一国家物理实验室NPL的数学部,一半时间在台式计算机处工作,一半时间协助图灵设计计算机ACE。需要指出的是,在图灵离开NPL,由威尔金森接手负责该项目后,威尔金森总结了前阶段设计与实施ACE的经验教训,果断的采取了两项措施,一是与工程小组加强联系、交流、沟通、合作,改变过去那种隔绝甚至对峙的局面,二是决定放弃原先过于庞大的计划和过于庞大的规模,改搞试验性的ACE,也就是Pilot ACE。当图灵离开NPL时,他设计的ACE已经是“第八版”,但是水银延迟线存储器就要用200根延迟线。威尔金森实事求是的估计了延迟线加工上的困难和它工作的不可靠性,决定将Pilot ACE退回到ACE“第五版”的基础上,把延迟线减少到32根,把整个机器的设计目标降到能用高斯消去法解8~10个联立线性方程。幸运的是,这时,原先负责工程的托马斯也离开了NPL,接替他的是老资格的无线电工程师考尔勃洛克(F.M.ColeBrook),他虽然对脉冲技术并不熟悉,却擅长项目组织,主动邀请威尔金森在内的4个高级设计师以半固定的方式参加电子小组的工作,从而进一步密切了双方的关系。同时新调来的电子学小组的技术负责人纽曼(E. Newman)是大战时参加过H2S机载雷达系统工作的专家,同威尔金森相处得也很好。这样,工程进展明显加快,1950年5月10日,Pilot ACE第一次正式试运行成功,1050年11月,NPL举行了隆重的“开放日”(Open Day),邀请新闻界和一批知名的VIP参观ACE,ACE成功的表演了三个程序:由参观者任意给出一个6位数,机器判定它是否是素数,如果不是素数,给出其一个因子;由参观者任意说出0-9999年终任意一个日期,由机器给出这天是星期几;由机器跟踪光线通过一组棱镜后的偏振光。ACE计算机研制成功后,由EEC公司(English Electric Company)批量生产了约30太,其商业名称为DEUCE。DEUCE和剑桥大学研制的EDSAC计算机一起,使20世纪50年代的英国计算机技术处于世界领先水平,能和美国平起平坐。第一台Pilot ACE现在在伦敦的肯辛顿科学博物馆保存、展览。1984年7月13日,在滑铁卢大学举行的一次国际学术会议期间,威尔金森接受了BYTE杂志安排的一次采访,详细会议了ACE计算机诞生的过程。有兴趣的读者可以参阅该刊1985年2月,177~194页,“一台计算机的诞生”(The birth of a computer) 当然,作为一名数学家,威尔金森的主要贡献还是在数值分析方面,尤其是在数值线性代数方面。1960年,他提出“向后误差分析法”(backward error analysis),成为数学误差理论中最基本的方法之一。向后误差分析是一种先验性估计,下面我们对它做一些简单介绍。 假设结果x由已知量(原始数据或先前已算出的量)a 1 ,a 2 ,a 3 ,...,a n 经过基本算术运算确定,写成: x=f(a 1 ,a 2 ,a 3 ,...,a n ) 由于计算中产生舍入误差(rounding error),实际算出的值a与准确值x不同。向后误差分析法把舍入误差与导出a的已知量a 1 ,a 2 ,a 3 ,...,a n 的某种摄动(即微小误差)联系起来,即对某个a i 引入摄动量e i ,使得由于浮点运算得到等式: a=f(a 1 + e 1 ,a 2 + e 2 ,a 3 + e 3 ,...,a n + e n ) 再推出这些的e i 的界(e i 不是唯一的,且无须求出e i 的具体值),然后再利用摄动理论(perturbation theory)估计最后舍入误差|x-a|的界。 向后误差分析是威尔金森20世纪60年代初在研究矩阵计算的误差时做了系统分析而提出的,目前是计算机上各种数值计算最常用的误差分析手段。 20世纪60年代,威尔金森在NPL组织开发了一个用以测试系统浮点运算能力的基准程序(Benchmark)叫Whetstone。Whetstone规模不大,对存储器容量要求较小,主要使用高速缓冲存储器,适用于评估小型的科学、工程应用系统。Whetstone除了可以测试机器的硬件性能外,还可以用来评估系统数学程序集,语言编译器及其处理效率,其测试结果用KWIPS或MWIPS表示,1976年Whetstone被用作英国的官方测试标准公布,已有Fortran、Pascal等多种版本,常被用作工作站的测试程序。 1976年,威尔金森积极参与并推动成立了一个非盈利性的名为NAG的公司(Numerical Algorithms Group Ltd.)以开发和推动数值分析和统计分析的软件包,吸引了世界上许多大学和政府研究机构的专家共同合作。NAG已经为68种型号的计算机配备了Fortran库,Ada、Pascal、C的通用数学库也已上市。NAG推出的Mark 15版数学库中已包括用户可调用的程序模块1045个,是同类数学库中规模最大也最先进的一个,威尔金森在其中发挥了重要的作用。此外,在由美国阿贡实验室NATS小组于1972年开发的EISPACK软件包计划中,威尔金森也曾积极参与并贡献过力量,目前它是计算矩阵特征值最常用的数学库。 威尔金森出版的几部数学专著,如《代数处理中的舍入误差》(Rounding errors in algebraic processes, Prentice-Hall, 1964),《代数特征值问题》(The Algebraic Eigenvalue Problem, Clarendon Pr., 1965.中译本,石宗慈译,科学出版社出版),《自动计算手册卷2:线性代数》(Handbook for Automatic Computation, Vol.2, Linear Algebra, Springer, 1971, 与C. Reinsch合著),都在学术界有很大的影响,被视为经典和必读参考书。 威尔金森从1946年进入NPL到1980年正式退休,为NPL服务长达34年,其间曾长期担任NPL的学术长官,并被命名为“有特殊贡献的首席科学长官”(Special Merit Chief Scientific Officer),这在英国的行政机构中是一个极高而极少被授予的荣誉称号。这除了由于其个人在学术上的造诣和贡献外,还由于他在NPL营造了一个浓厚而民主的学术空气,能使有才华的年青人脱颖而出,敢于创新。在很长的时间里,NPL都是欧洲乃至全世界最有创新精神的研究所之一,也是水平最高的研究机构之一。例如,20世纪60年代在开展计算机联网技术的研究中,NPL的数据网络计划(Data Network Project)中就率先采用了“包交换技术”(packet-switching),成为当今包括Internet在内的所有各种类型的计算机网络信息传输的技术基础。把“报文分组”通俗而形象的叫做“包”就是NPL当时的自动化部的年青主任戴维斯(D.W.Davies)的创造。 威尔金森除了获得图灵奖之外,还有许多荣誉与奖励。1963年剑桥大学授予他名誉博士学位;1969年他当选英国皇家学会院士;1970年工业和应用数学会(SIAM)授予他冯·诺依曼奖;1987年他获得美国数学会的Chauvenet奖。著名的美国阿贡国家实验室曾聘威尔金森为荣誉高级研究员并两次向他授奖。 威尔金森在接受图灵奖时发表了题为“一个数值分析家的若干意见”(Some Comments from a numerical analyst)的演说,刊载于Journal of ACM,1971年4月,137~147页,也可见《前20年的ACM图灵奖演说集》(ACM Turing Award Lectures--The first 20 Years: 1966--1985, ACM Pr.),243~256页。 威尔金森1980年退休后担任斯坦福大学客座教授,1986年10月5日在英国坦丁顿的家中不幸病逝,享年67岁。 延伸阅读--http://amturing.acm.org/award_winners/wilkinson_0671216.cfm
5348 次阅读|2 个评论
第II类曲面积分
zjmjz 2012-4-20 22:59
第II类曲面积分 背景: 向量场 A =(P(x,y,z),Q(x,y,z),R(x,y,z))在曲面上的通量问题 定义: 给出光滑曲面上连续函数P(x,y,z),Q(x,y,z),R(x,y,z),有积分方法得和式极限,从而得到关于坐标的曲面积分表达式 计算: 利用的面积微元投影法计算。 口诀: 一投,二代,三定向 NOTE: 1 有向曲面的侧的判断(单侧、双侧曲面) 2 根据坐标将曲面积分转化为重积分 3 注意选择曲面投影的方式 4 利用质心公式、积分对称性 5 转换投影法简化积分(只需投影一次即可)
个人分类: 教学札记|3888 次阅读|0 个评论
蒙特卡罗算法
热度 2 huangyanxin356 2012-4-16 18:44
蒙特·卡罗方法(Monte Carlo method),也称统计模拟方法,是二十世纪四十年代中期由于科学技术的发展和电子计算机的发明,而被提出的一种以概率统计理论为指导的一类非常重要的数值计算方法。是指使用随机数(或更常见的伪随机数)来解决很多计算问题的方法。蒙特·卡罗方法的名字来源于摩纳哥的一个城市蒙地卡罗,该城市以赌博业闻名,而蒙特·卡罗方法正是以概率为基础的方法。   基本背景:  1946年,美国拉斯阿莫斯国家实验室的三位科学家John von Neumann,Stan Ulam 和 Nick Metropolis共同发明,被称为蒙特卡洛方法。它的具体定义是:在广场上画一个边长一米的正方形,在正方形内部随意用粉笔画一个不规则的形状,现在要计算这个不规则图形的面积,怎么计算列?蒙特卡洛(Monte Carlo)方法告诉我们,均匀的向该正方形内撒N(N 是一个很大的自然数)个黄豆,随后数数有多少个黄豆在这个不规则几何形状内部,比如说有M个,那么,这个奇怪形状的面积便近似于M/N,N越大,算出来的值便越精确。在这里我们要假定豆子都在一个平面上,相互之间没有重叠。 蒙特卡洛方法可用于近似计算圆周率:让计算机每次随机生成两个0到1之间的数,看这两个实数是否在单位圆内。生成一系列随机点,统计单位圆内的点数与总点数,(圆面积和正方形面积之比为PI:4,PI为圆周率),当随机点取得越多(但即使取10的9次方个随机点时,其结果也仅在前4位与圆周率吻合)时,其结果越接近于圆周率。 
个人分类: 技术类|274 次阅读|2 个评论
[转载]<转载>dBm转换为W的计算方法
QIQIZHU 2012-4-13 13:24
传导抗干扰测试中6db衰减器是不可缺少的测试仪器之一,今天对它的作用终于有了大概的了解。读到一篇很实用的dBm与W的转换计算方法,转载一下。 dBm转换为W的计算方法 dBm 转换为 W 的口算方法 dBm 是一个表示功率绝对值的值(也可以认为是以 1mW 功率为基准的一个比值),计算公式为: 10log (功率值 /1mw )。 这里将 dBm 转换为 W 的口算规律是要先记住 “ 1 个基准 ” 和 “ 2 个原则 ” :   “ 1 个基准 ” : 30dBm = 1W   “ 2 个原则 ” : #?    1) + 3dBm ,功率乘 2 倍;- 3dBm ,功率乘 1/2   举例: 33dBm = 30dBm+3dBm = 1W × 2=2W       27dBm = 30dBm - 3dBm = 1W × 1/2=0.5W    2) + 10dBm ,功率乘 10 倍;- 10dBm ,功率乘 1/10 #\    举例: 40dBm = 30dBm+10dBm = 1W × 10=10W d       20dBm = 30dBm - 10dBm = 1W × 0.1=0.1W   以上可以简单的记作: 30 是基准,等于 1W 整,互换不算难,口算可完成。加 3 乘以 2 ,加 10 乘以 10 ;减 3 除以 2 ,减 10 除以 10 。 几乎所有整数的 dBm 都可用以上的 “ 1 个基准 ” 和 “ 2 个原则 ” 转换为 W 。 例 1 : 44dBm=?W #o      44dBm =30dBm+10dBm+10dBm - 3dBm - 3dBm =1W × 10 × 10 × 1/2 × 1/2 =25W #m 例 2 : 32dBm=?W 32dBm=30dBm+3dBm+3dBm+3dBm+3dBm - 10dBm =1W × 2 × 2 × 2 × 2 × 0.1 w =1.6W D   计算技巧: +1dBm 和 +2dBm 的计算技巧 +1dBm =+10dBm - 3dBm - 3dBm - 3dBm {     =X × 10 × 1/2 × 1/2 × 1/2 =X × 1.25 8i7`:^(];_    +2dBm= - 10dBm+3dBm+3dBm+3dBm+3dBm =X × 0.1 × 2 × 2 × 2 × 2 =X × 1.6   在计算中,有时候也可以根据上面的规律变换为- 1dBm 和- 2dBm ,达到快速口速的目的,即: - 1dBm = - 10dBm+3dBm+3dBm+3dBm     =X × 0.1 × 2 × 2 × 2 H     =X × 0.8 - 2dBm = - 3dBm+1dBm     =X × 1/2 × 1.25 =X × 0.625 例 3 : 51dBm=30dBm+10dBm+10dBm+1dBm       =1W × 10 × 10 × 1.25 ,`       =125W 例 4 : 38dBm=30dBm+10dBm - 2dBm       =1W × 10 × 0.625       =6.25W 另: dBw 与 W 的换算 dBw 与 dBm 一样, dBw 是一个表示功率绝对值的单位(也可以认为是以 1W 功率为基准的一个比值 ),计算公式为: 10log (功率值 /1w )。    dBw 与 dBm 之间的换算关系为: 0 dBw = 10log1 W = 10log1000 mw = 30 dBm.   如果功率 P 为 1W ,折算为 dBw 后为 0dBw 。 总之, dB , dBi, dBd, dBc 是两个量之间的比值,表示两个量间的相对大小,而 dBm 、 dBw 则是表示功率绝对大小的值。在 dB , dBm , dBw 计算中,要注意基本概念,用一个 dBm (或 dBw )减另外一个 dBm ( dBw )时,得到的结果是 dB ,如: 30dBm - 0dBm = 30dB 。 !K3O0j2w(B(S6k(L3X%o   一般来讲,在工程中, dBm 和 dBm (或 dBw 和 dBw )之间只有加减,没有乘除。而用得最多的是减法: dBm 减 dBm 实际上是两个功率相除,信号功率和噪声功率相除就是信噪比( SNR )。 dBm 加 dBm 实际上是两个功率相 . dB 、 dBm 、 dBu 、 dBv 和 dBV dB dB 的计算公式: dB=10lg(P/Pr) (P- 实际功率测量值 Pr- 参考功率值 ) 当电阻值不变时,由 P=E^2/R(P- 功率, E- 电压, R- 电阻 ) 得到: dB=20lg(E/Er)(E- 实际测量电压值, Er- 参考电压值 ) 可知:功率增加一倍增益提高 3dB, 电压增加一倍增益提高 6dB. dBm 0dBm 表示标准功率为 1 毫瓦,电压通过 600 欧姆电阻所产生的 0 参考值。由 P=E^2/R 可得: 0dBm=0.7746V. dBm 的计算公式为: dBm=20lg(E/Er)-10lg(R/Rr) (Er-0.7746V Rr-600 欧姆 R=Rr ) dBm 通常用于功率匹配系统(即信号源输出阻抗等于负载输入阻抗,以达到最大输出功率的系统,也称阻抗匹配系统)。 dBu 和 dBv 在电压匹配系统中(即信号源输出阻抗远远小于负载输入阻抗,通常输出阻抗小于 100 欧姆,输入阻抗大于 10K 欧姆,以达到最大输出电压的系统),由于信号源输出阻抗只有负载输入阻抗的几百分之一, dBm 已不具有实用性。 在电压匹配系统中,信号电平以 dBu 表示。 dBu 的计算公式为: dBu=20lg(E/Er) (E- 电压 Er-0.7746V) dBu 在概念上与阻抗没有关系,标准操作电平 (SOL) 为 +4dBu.dBu 也写作 dBv. dBV dBV 的计算公式为 : dBV=20lg(E/Er) (E- 电压 Er-1V). 可知 1dBV=2.2dBu
4144 次阅读|0 个评论
第 I 型曲线积分
zjmjz 2012-4-10 19:51
第I型曲线积分 背景 :密度非均匀的曲线构件质量问题 思路 :积分思想 分割—近似—求和—取极限 定义 :数学角度给出问题的抽象定义 性质 :类比定积分、二重积分、三重积分的性质理解; NOTE: 1 第一型曲线积分存在的充分条件 函数f(x,y)在光滑曲线L上连续; 2 积分限的确定及上限与下限关系; 3 曲线积分的计算方法 利用弧微分顺利的将其转化为定积分计算; 4 注意选择适合的表达形式和在该形式下的弧微分; 5 注意利用质心公式简化计算。 6 结论
个人分类: 教学札记|4459 次阅读|0 个评论
[转载]各地“总理房价”
dongyanqing 2012-3-18 12:04
“总理房价”计算公式 2011年当地城市人均可支配收入×家庭平均人口×合理房价收入比/90平方米 各地“总理房价”一览 南京 4293元/平方米 北京 4387元/平方米 上海 4831元/平方米 广州 4573元/平方米 深圳 4867元/平方米 苏州 4409元/平方米 无锡 4218元/平方米 杭州 4493元/平方米 大连 3240元/平方米 南京“总理房价”不到5000元/m2 去年南京住宅成交均价为1.12万元/m2 这个“总理房价”的微博最初是从一名叫“国房部”的网友处发出的,在很短的时间内就引来网友疯狂转载和评论。之后,不少房产网站也将这个房价标准编 入首页文章中予以讨论。这位网友的计算方法是:全年城市居民人均可支配收入×家庭构成人口(按2个人计算)×合理的房价收入比/90㎡(小户型分界线), 如此得出所谓合理的“总理房价”。 按照去年南京统计局发布的城市居民人均可支配收入32200元来计算,南京“总理房价”应该为32200元×2×6/90平方米=4293.3元 /平方米。这比南京目前平均房价低了至少一倍以上,比城中、河西等地区房价则低了4倍,几乎快到六七年前的水平。而来自南京市住建委相关部门的统计数据显 示,2011年南京市住宅交易平均价为1.12万元/平方米。 此外,一线城市北京、上海、广州和深圳的房价分别是4387元/平方米、4831元/平方米、4573元/平方米和4867元/平方米。其他江苏城 市中,无锡为4218.4元/平方米,常州为3977.4元/平方米。这样来看,由于南京的人均可支配收入与这些城市相差不大,因此跟几个一线城市房价都 差不了多少。 网友看过后大多“莞尔一笑” “这个房价确实让人兴奋,但只是美好的愿望” 看到这个合理的“总理房价”,不少网友表示:这个房价确实合理,但只是美好的愿望吧。“只要4000多元?这个房价绝对合理!”,网友“那只熊上的 树H_H”说道。“mogwai说”则表示,要是跌到4000块,砸锅卖铁也要买几套。也有的网友比较现实,表示这个价格确实能让很多人兴奋,但也会让很 多人惆怅,而惆怅的自然是今年经常引起“维权”事件的老业主。 在大多数网友以一种娱乐的心态评论过这条微博后,有网友开始较真起来。“都市绕指柔”评论道,“你所指的相适应,比例是多少呢?”据记者了解,房价 收入比系指一个国家或城市的平均房价与每户居民的平均收入之比,是制定住房政策的重要依据之一。世界银行在衡量一个国家的住房消费水平时,认为房价收入比 在3倍至6倍之间较为适当。而目前这种“总理房价”的计算方法就是以最高的6倍为计算依据,即一个家庭6年里不吃不喝的税后净收入。 “总理房价”普遍过低,这让一些网友试图采取更加合理的方法来计算。有网友表示,6年收入买套房我是不敢想了,10年能达到就心满意足了。本地房产 论坛三六五网也以这个条件计算得出南京更加靠谱的“总理房价”为7100多元/平方米。不少网友认为,这个价格还算有些意义,因为目前南京江北板块许多楼 盘就卖这个价位,而仙林湖、奥南等板块房价也高得不多。 已经被开发商用到促销上 杭州一开发商喊出“总理的价格,城西的底线” 总理房价”诞生不久,在网友们还沉浸在娱乐和幻想之中时,已经有开发商将这一网络热词打上了广告来吸引眼球。 记者昨日在微博上发现,杭州的一家开发商在广告中打出“总理的价格,城西的底线,15678元/平方米起售……”的醒目词语。而据记者了解,该楼盘 此前在售的房源均价在22500元/平方米,最低房源价格也有19980元/平方米,而此次新推房源均价只有16000多元/平方米。有网友表 示,6000元/平方米的降价幅度,也算应了总理的号召,广告中打上“总理的价格”虽有玩噱头炒作之嫌,也算没有虚言。 业内人士: 希望是好的,提法不严谨 对于这样一则引起热议的“总理房价”,南京一位研究房地产市场多年的学者表示,相信多数网友都是娱乐视之,这样的算法显然不够严谨。首先如果以人均 可支配收入为基准来计算,那么家庭人数不应该一律按照2人来计算。更严谨的算法应该是按照户均人口。按照去年5月份南京人口普查发布的数据,目前南京市户 均人口比例应该为2.77,这样套入公式计算,南京的合理房价应该是5946.3元/平方米。 但即使这样算还是不够严谨。这位学者表示,因为房价收入比3-6倍这个提法,主要依据的是美国和部分西方发达国家的数据。由于各国的国情不尽相同, 因而3-6倍并不一定适用于世界上所有的国家,特别是中国这样一个人口密度较大的发展中大国。至于目前中国合理的房价收入比究竟应该是多少,权威部门并没 有一个具体的方向性目标。总理提出这样一个说法,应该是表达一种调控房价的决心,希望房地产可以稳定发展,不断缩小过高的房价收入比。娱乐也好,希望也 罢,“总理房价”的出现多少还是寄托出老百姓对房价回归合理的一种期盼,以及对中央坚持严厉房地产调控政策的一种支持。
个人分类: 杂谈|1926 次阅读|0 个评论
LS计算
gosci 2012-2-10 10:38
个人分类: 水土保持|25 次阅读|0 个评论
[转载]gambit网格质量判断-转载
jiangfan2008 2012-2-2 08:54
具体内容可以参考Gambit Documentation中的Quality Type Definitions章节。 判断网格质量的方面有: Area单元面积,适用于2D单元,较为基本的单元质量特征。 Aspect Ratio长宽比,不同的网格单元有不同的计算方法,等于1是最好的单元,如正三角形,正四边形,正四面体,正六面体等;一般情况下不要超过5:1. Diagonal Ratio对角线之比,仅适用于四边形和六面体单元,默认是大于或等于1的,该值越高,说明单元越不规则,最好等于1,也就是正四边形或正六面体。 Edge Ratio长边与最短边长度之比,大于或等于1,最好等于1,解释同上。 EquiAngle Skew通过单元夹角计算的歪斜度,在0到1之间,0为质量最好,1为质量最差。最好是要控制在0到0.4之间。 EquiSize Skew通过单元大小计算的歪斜度,在0到1之间,0为质量最好,1为质量最差。2D质量好的单元该值最好在0.1以内,3D单元在0.4以内。 MidAngle Skew通过单元边中点连线夹角计算的歪斜度,仅适用于四边形和六面体单元,在0到1之间,0为质量最好,1为质量最差。 Size Change相邻单元大小之比,仅适用于3D单元,最好控制在2以内。 Stretch伸展度。通过单元的对角线长度与边长计算出来的,仅适用于四边形和六面体单元,在0到1之间,0为质量最好,1为质量最差。 Taper锥度。仅适用于四边形和六面体单元,在0到1之间,0为质量最好,1为质量最差。 Volume单元体积,仅适用于3D单元,划分网格时应避免出现负体积。 Warpage翘曲。仅适用于四边形和六面体单元,在0到1之间,0为质量最好,1为质量最差。 以上只是针对Gambit帮助文件的简单归纳,不同的软件有不同的评价单元质量的指标,使用时最好仔细阅读帮助文件。 另外,在Fluent中的窗口键入:grid quality 然后回车,Fluent能检查网格的质量,主要有以下三个指标: 1.Maxium cell squish: 如果该值等于1,表示得到了很坏的单元; 2.Maxium cell skewness: 该值在0到1之间,0表示最好,1表示最坏; 3.Maxium 'aspect-ratio': 1表示最好。
2908 次阅读|0 个评论
[转载]密度泛函
chnfirst 2012-1-10 16:51
http://baike.baidu.com/view/948996.htm 传统的分子性质计算基于每个单电子运动的描写,使得计算本身在数学上非常复杂。沃尔特•库恩指出,知道分布在空间任意一点上的平均电子数已经足够了,没有必要考虑每一个单电子的运动行为。这一思想带来了一种十分简便的计算方法——密度泛函理论。方法上的简化使大分子系统的研究成为可能. http://struchem.nankai.edu.cn/kejian/2011Chap5.pdf 密度泛函 采用 泛函(以函数为变量的函数) 对Shrdinger方程进行求解,由于密度泛函包涵了电子相关,它的计算结果要比HF方法好,计算速度也快。DFT方法是当今最为常用的量子化学方法之一。DFT含有半经验的成分,但由于其精度较高,因此也常将其与从头算等同.
个人分类: 理论|0 个评论
[转载]CCSD = Coupled-cluster single-and double
chnfirst 2012-1-6 17:16
CCSD = Coupled-cluster single-and double http://emuch.net/html/200911/1690349.html CCSD(T)来说,其实CCSD就是单双重耦合簇方法(其中的T代表了三重态以微绕的形式考虑到其中)。 http://book.kongfz.com/19206/133952143/ 量子化学中的计算方法【库位:2号】 书籍作者:陈飞武 图书出版社:科学出版社 图书品相:九五品 库 存 量:5 本 图书售价: 16.00 元 图书原价:40.00元 出版时间: 2008 开本:不详 页数:208 页 装订:平装 ISBN:9787030219794 图书详细描述: 版次:第1版 基本信息 书名:量子化学中的计算方法 原价:40.00元 作者:陈飞武 出版社:科学出版社 出版日期:2008年6月1日 ISBN:9787030219794 字数: 页码:208 版次:第1版 装帧:平装 开本: 商品重量:322 g 编辑推荐 《量子化学中的计算方法》由科学出版社出版。 内容提要 《量子化学中的计算方法》主要介绍量子化学的基本原理和相应的计算方法。全书共8章。具体内容包括数学预备知识,量子力学导论,Hartree-Fock方程及自洽场计算,单电子和双电子积分计算,组态相互作用计算,微扰理论,耦合簇理论和约化密度矩阵理论。《量子化学中的计算方法》可作为高等院校化学系物理化学专业、量子化学专业或其他相关专业研究生和大学高年级学生的教科书,也可供相关领域的科研人员阅读参考。 目录 前言第1章 数学预备知识1.1 矢量1.2 矩阵1.3 各种常用矩阵1.4 行列式的计算1.5 矢量的正交化1.6 线性变换1.7 变分法参考文献第2章 量子力学导论2.1 原子和分子体系的schrodinger方程2.2 波函数2.3 哈密顿矩阵元的计算2.4 角动量和自旋参考文献第3章 Hartree-Fock方程及自洽场计算3.1 Hartree-Fock方程3.2 Hartree-Fock方程的性质3.3 闭壳层体系3.4 开壳层体系3.5 自洽场迭代计算3.6 大小一致性和氢分子的离解参考文献第4章 单电子和双电子积分计算4.1 GaUSS基函数的单电子积分4.2 Gauss基函数的双电子积分参考文献第5章 组态相互作用计算5.1 二次量子化5.2 组态波函数5.3 Davidson对角化方法5.4 组态相互作用的大小一致性5.5 多组态自洽场方法参考文献第6章 微扰理论6.1 单参考态微扰理论6.2 多参考态微扰理论6.3 单参考态微扰理论的应用6.4 多参考态微扰理论的应用参考文献第7章 耦合簇理论7.1 独立电子对近似7.2  双重耦合簇理论 7.3 一般耦合簇理论参考文献第8章 约化密度矩阵理论8.1 约化密度矩阵简介8.2 约化密度矩阵8.3 约化密度矩阵的二次量子化8.4 简缩Schrodinger方程参考文献
个人分类: 理论|0 个评论
数值计算方法 (冯康等翻译).pdf
热度 2 dingpengwang 2011-12-31 02:54
http://ishare.iask.sina.com.cn/f/5584955.html?retcode=0 这是数值计算最好的一本书,由冯康等翻译,很值得一读。我还有英文原著以及几种计算机语言的源代码。
29 次阅读|5 个评论
[转载]影响因子计算方法
tongtiantian 2011-12-23 20:12
影响因子是以年为单位进行计算的。 以1992年的某一期刊影响因子为例,IF(Impact Factor)(1992年) = A / B   其中,   A = 该期刊1990年至1991年所有文章在1992年中被引用的次数;   B = 该期刊1990年至1991年所有文章数。
个人分类: 期刊出版|3245 次阅读|0 个评论
Dayhoff替换矩阵的计算方法
friendpine 2011-11-23 22:43
首先,蛋白序列数据的选择很重要,因为需要统计数据集中发生的aa替换,而这依赖于祖先状态的重建,后者在序列差异较大时不够准确,因此作者这里用到的序列之间的aa差异不超过15%; 然后,对来自同一个家族的序列建进化树,得到祖先序列,从而可以统计aa之间的替换次数。把数据集中来自不同家族统计得到的aa之间的替换次数进行累加。 然后,计算每种aa的可变性,即对于上面构建的进化树上的所有分支上的两两序列,计算aa出现的次数,以及aa突变的次数,累加起来,得到aa的可变性。 最后,计算aa之间的突变概率。Mij=lamda*mj*Aij/sum(Aij) ,Mij表示在经过一个PAM之后j突变为i的概率,lamda为常数,mj为为j的可变性。 如果需要计算经过多个PAM,比如PAM250,则对这个矩阵进行250次乘方,得到经过250个PAM之后aa之间的替换矩阵。 用上面得到的Mij除以aa出现的频率,得到了用概率表示的替换矩阵。
个人分类: 生物信息学与计算生物学|0 个评论
[转载]确定染色体同源片段的统计与计算方法及其在水稻和拟南芥基因组中
syfox 2011-11-13 18:16
作者: 王希胤 学科专业: 生物学(生物信息学) 授予学位: 博士 学位授予单位: 北京大学 北京大学 导师姓名: 罗静初 郝柏林 学位年度: 2005 确定染色体同源片段是基因组学研究的一个重要方面,有助于揭示基因组在历史上发生的多种多样的进化事件,如DNA复制、染色体重排、基因丢失等。研究发现,谷物之间、哺乳动物之间、分属不同种的酵母之间都存在大规模的染色体同源片段;物种内部也常发现由于大规模基因组复制而形成的同源片段;约80%的拟南芥基因组处于复制区,分析表明,拟南芥的进化过程中,至少发生了一次或三次多倍化事件。 水稻基因组中也发现了许多大的复制片段,但对于这些复制片段的规模、复制事件的性质和发生时间,存在很大分歧。基于粳稻基因组草图数据分析,Goff等推测四千到五千万年前发生了一次多倍化事件。而VandePeer等发现仅15%基因位于复制区,而且大部分与水稻2号染色体相关,因此认为水稻在历史上只有一、两条染色体发生了复制,从而有一个非整倍体祖先,并推断相应非整倍化事件发生在七千万年前;尽管后来他们找到了较多复制片段,但依然维持已有结论。几乎在同时而且同样基于粳稻基因组数据,Paterson等利用不同方法发现61.9%水稻基因位于复制区,远多于VandePeer等的发现;他们认为这可能源于约七千万年前一次多倍化事件。 这种争议主要在于是多倍化还是非整倍化,也就是复制发生的规模,这可能是由于采用的方法不同造成的。实际上,大规模复制之后,由于大量染色体重排、基因丢失、基因插入等,使染色体片段间同源关系变得面目全非,从现存的遗迹识别同源性并相当困难。目前,已有多种推断染色体间同源关系的方法,或基于遗传图谱、或基于序列比较、或基于基因共群性(synteny)、或基于基因共线性(colinearity),等等。基于共线性的方法有很多优点,由于考虑了基因顺序和密度,所确定的同源片段较为可靠,而且运算效率较高。VandePeer等发展了名为ADHoRe的共线性方法,并用于水稻基因组分析。然而,现有共线性方法有一些缺陷,最大问题在于参数选择基于经验,没有深入合理的理论分析。例如,相邻同源基因对之间的距离是一个重要参数,经验方法难以取定一个合适的值,而把不适当的值用于寻找同源区域,会使结果严重地偏离实际情况。 本文发展了一个新的基于共线性的确定同源片段方法,其主要特点是:合理的统计推断、较强的适应性、计算的高效性。该方法的参数选择,尤其是相邻同源基因对距离确定,依据基因组特点做了合理的理论分析,对推断的同源区显著性也做了深入的统计学检验。本文开发了一个新的动态规划算法并编写了程序 ColinearScan实现这个共线性方法。 利用ColinearScan分析370Mb水稻籼稻亚种基因组序列,发现337个复制片段涉及全部12条染色体的76%水稻基因位于这些复制区。基于上述结果,以及对共线性基因系统发育学分析,本文推断在七千万年前,水稻祖先发生了一次全基因组复制,即多倍化事件。本文支持Paterson等的结论,而与VandePeer等的结论不一致。根据分析,我们认为VandePeer等所得结论与Paterson和本文研究结果不一致的原因在于不适当的参数选择以及过于严格的线性回归分析方法。解决这个分歧的意义在于,确定了一次发生于主要的谷物,如玉米、小麦、大麦、高粱、谷子、甘蔗等,分化之前的多倍化事件,这个多倍化影响了这些人类赖以生存的主要作物的基因组结构。本文研究结果得到了Paterson和VandePeer小组的高度评价,后者在发表于 NewPhytologist的评述文章中,承认其分析存在问题,并重做了水稻基因组分析,得到了和笔者的工作相近的结果(见附录)。 基于水稻基因组复制图样和水稻与高粱的比较基因组图谱,本文重构了两个物种的染色体结构进化图谱,推断谷物的共同祖先在多倍化发生之前有6条染色体。这对研究谷物染色体进化有重要意义。 另外,本文还确定了拟南芥基因组中的复制片段,发现约82.6%的拟南芥基因组处于复制区,而且这些复制区常常是多拷贝的。按照这个发现,本文支持拟南芥基因组曾经发生三次多倍化的可能性。本文还全面分析和确定了水稻和拟南芥之间的染色体同源片段,这些具有共线性基因的同源片段覆盖水稻和拟南芥基因组的 61.25%和87.35%;然而,几乎所有这些片段长度都小3Mb,所以很难建构单、双子中植物之间可用于基因定位信息共享的比较遗传图谱。 已测序的植物基因组:Sequenced plant genomes 2010-09-01 16:27:14 |分类: 生物信息分析 |标签: 基因组 | 字号 大 中 小 订阅 一直想找到这样的一个网站,可以把目前已经测序的植物基因组信息做个收集和整理。看来,天下有心人真不少,终于还是让我找到组织了。唯一遗憾的是,这样的网站还是一如既往的由咱中国以外的科学家们在做收集和维护,算是点点遗憾。以下是网址,感兴趣的同学可以去看看! This site attempts to track all plant genomes with published sequences, and at least some of the genomes currently in the process of being sequenced. Genomes are divided into four states: Published: A complete genome sequence is available, and anyone can publish papers on it without restriction. Unpublished: The complete sequence (or a substantially complete sequence) is available, but whole genome analysis cannot be published until the group that sequenced the genome publishes their own paper describing it. These restrictions are outlines by the Fort Lauderdale Convention . Incomplete: A partial assembly is available, but sequencing and/or assembly and/or gene annotation is ongoing. Unreleased: Genome sequencing has at least begun, but no data has been made publicly available. http://synteny.cnr.berkeley.edu/wiki/index.php/Sequenced_plant_genomes
3990 次阅读|0 个评论
[转载]转载:matlab聚类
Sunteresa 2011-11-4 14:37
学习中。。。 不知道WEKA中是否有这样灵活的接口函数。。。 ----------------------------------------------- 转载一: MATLAB 提供了两种方法进行聚类分析: 1 、利用 clusterdata 函数对数据样本进行一次聚类,这个方法简洁方便,其特点是使用范围较窄,不能由用户根据自身需要来设定参数,更改距离计算方法; 2 、分步聚类:( 1 )用 pdist 函数计算变量之间的距离,找到数据集合中两辆变量之间的相似性和非相似性;( 2 )用 linkage 函数定义变量之间的连接;( 3 )用 cophenetic 函数评价聚类信息;( 4 )用 cluster 函数进行聚类。 下边详细介绍两种方法: 1 、一次聚类 Clusterdata 函数可以视为 pdist 、 linkage 与 cluster 的综合,一般比较简单。 【 clusterdata 函数: 调用格式: T=clusterdata(X,cutoff) 等价于Y=pdist(X,’euclid’); Z=linkage(Y,’single’); T=cluster(Z,cutoff) 】 2 、分步聚类 ( 1 )求出变量之间的相似性 用 pdist 函数计算出相似矩阵,有多种方法可以求距离,若此前数据还未无量纲化,则可用 zscore 函数对其标准化 【 pdist 函数: 调用格式: Y=pdist(X,’metric’) 说明: X 是 M*N 矩阵,为由 M 个样本组成,每个样本有 N 个字段的数据集 metirc 取值为:’ euclidean’ :欧氏距离(默认) ‘seuclidean’ :标准化欧氏距离; ‘mahalanobis’ :马氏距离 … 】 pdist 生成一个 M*(M-1)/2 个元素的行向量,分别表示 M 个样本两两间的距离。这样可以缩小保存空间,不过,对于读者来说却是不好操作,因此,若想简单直观的表示,可以用 squareform 函数将其转化为方阵,其中 x(i,j) 表示第 i 个样本与第 j 个样本之的距离,对角线均为 0. ( 2 )用 linkage 函数来产生聚类树 【 linkage 函数: 调用格式: Z=linkage(Y,’method’) 说明: Y 为 pdist 函数返回的 M*(M-1)/2 个元素的行向量, method 可取值: ‘single’ :最短距离法(默认); ’complete’ :最长距离法; ‘average’ :未加权平均距离法; ’weighted’: 加权平均法 ‘centroid’ : 质心距离法; ‘median’ :加权质心距离法; ‘ward’ :内平方距离法(最小方差算法) 】 返回的 Z 为一个 (M-1)*3 的矩阵,其中前两列为索引标识,表示哪两个序号的样本可以聚为同一类,第三列为这两个样本之间的距离。另外,除了 M 个样本以外,对于每次新产生的类,依次用 M+1 、 M+2 、 … 来标识。 为了表示 Z 矩阵,我们可以用更直观的聚类数来展示, 方法为: dendrogram(Z), 产生的聚类数是一个 n 型树,最下边表示样本,然后一级一级往上聚类,最终成为最顶端的一类。纵轴高度代表距离列。 另外,还可以设置聚类数最下端的样本数,默认为 30 ,可以根据修改 dendrogram(Z,n) 参数 n 来实现, 1nM 。 dendrogram(Z,0) 则表 n=M 的情况,显示所有叶节点。 ( 3 )用 cophenetic 函数评价聚类信息 【 cophenet 函数: 调用格式: c=cophenetic(Z,Y) 说明:利用 pdist 函数生成的 Y 和 linkage 函数生成的 Z 计算 cophenet 相关系数。】 cophene 检验一定算法下产生的二叉聚类树和实际情况的相符程度 , 就是检测二叉聚类树中各元素间的距离和 pdist 计算产生的实际的距离之间有多大的相关性,另外也可以用 inconsistent 表示量化某个层次的聚类上的节点间的差异性。 ( 4 )最后,用 cluster 进行聚类,返回聚类列。 转载二: Matlab 提供了两种方法进行聚类分析。 一种是利用 clusterdata 函数对样本数据进行一次聚类,其缺点为可供用户选择的面较窄,不能更改距离的计算方法; 另一种是分步聚类:( 1 )找到数据集合中变量两两之间的相似性和非相似性,用 pdist 函数计算变量之间的距离;( 2 )用 linkage 函数定义变量之间的连接;( 3 )用 cophenetic 函数评价聚类信息;( 4 )用 cluster 函数创建聚类。 1 . Matlab 中相关函数介绍 1.1 pdist 函数 调用格式: Y=pdist(X,’metric’) 说明:用 ‘metric’ 指定的方法计算 X 数据矩阵中对象之间的距离。 ’ X :一个 m × n 的矩阵,它是由 m 个对象组成的数据集,每个对象的大小为 n 。 metric’ 取值如下: ‘euclidean’ :欧氏距离(默认); ‘seuclidean’ :标准化欧氏距离; ‘mahalanobis’ :马氏距离; ‘cityblock’ :布洛克距离; ‘minkowski’ :明可夫斯基距离; ‘cosine’ : ‘correlation’ : ‘hamming’ : ‘jaccard’ : ‘chebychev’ : Chebychev 距离。 1.2 squareform 函数 调用格式: Z=squareform(Y,..) 说明: 强制将距离矩阵从上三角形式转化为方阵形式,或从方阵形式转化为上三角形式。 1.3 linkage 函数 调用格式: Z=linkage(Y,’method’) 说 明:用‘ method ’参数指定的算法计算系统聚类树。 Y : pdist 函数返回的距离向量; method :可取值如下: ‘single’ :最短距离法(默认); ‘complete’ :最长距离法; ‘ average ’:未加权平均距离法; ‘ weighted ’: 加权平均法; ‘centroid’ :质心距离法; ‘median’ :加权质心距离法; ‘ward’ :内平方距离法(最小方差算法) 返回: Z 为一个包含聚类树信息的( m-1 )× 3 的矩阵。 1.4 dendrogram 函数 调用格式: =dendrogram(Z,p , …) 说明:生成只有顶部 p 个节点的冰柱图(谱系图)。 1.5 cophenet 函数 调用格式: c=cophenetic(Z,Y) 说明:利用 pdist 函数生成的 Y 和 linkage 函数生成的 Z 计算 cophenet 相关系数。 1.6 cluster 函数 调用格式: T=cluster(Z,…) 说明:根据 linkage 函数的输出 Z 创建分类。 1.7 clusterdata 函数 调用格式: T=clusterdata(X,…) 说明:根据数据创建分类。 T=clusterdata(X,cutoff) 与下面的一组命令等价: Y=pdist(X,’euclid’); Z=linkage(Y,’single’); T=cluster(Z,cutoff); 2. Matlab 程序 2.1 一次聚类法 X= ; T=clusterdata(X,0.9) 2.2 分步聚类 Step1 寻找变量之间的相似性 用 pdist 函数计算相似矩阵,有多种方法可以计算距离,进行计算之前最好先将数据用 zscore 函数进行标准化。 X2=zscore(X); % 标准化数据 Y2=pdist(X2); % 计算距离 Step2 定义变量之间的连接 Z2=linkage(Y2); Step3 评价聚类信息 C2=cophenet(Z2,Y2); //0.94698 Step4 创建聚类,并作出谱系图 T=cluster(Z2,6); H=dendrogram(Z2);
个人分类: image process|4253 次阅读|0 个评论
[转载]多孔泡沫金属比表面积的计算方法
热度 1 hewu 2011-11-4 13:38
多孔金属(泡沫金属)是一类性能优异而应用广泛的工程材料,其很多应用(如消音降噪、热量交换、反应催化、电化学过程以及人工骨骼生物组织内生长等场合)的性能都依赖孔隙表面的结构形态和多孔体的比表面积.目前测试多孔材料比表面积的主要方法有气体吸附法(BET法)、流体透过法和压汞法等,理论计算则限于已知多孔体孔隙尺寸和孔棱尺寸(或孔壁厚度)的情况,而孔棱尺寸(或孔壁厚度)问题只有在特别简单的条件下才能解决.在测试方法中,气体吸附法可测量的比表面积量级可以很小;透过法测量流体透过多孔体的阻力来测算比表面积,流体可以是液体或气体,其中气体的测量范围较宽.透过法的测量范围大于气体吸附法, 其测量上限可以远高于气体吸附法,但测量下限亦大于气体吸附法;压汞法利用孔道的毛细作用来测定多孔体的开孔比表面积,需要假定孔隙是孔道截面均匀的理想圆柱形。在一些场合,方法、设备和材料取样等方面的限制给测量带来不便,有时则根本不可能进行.因此,根据孔率和孔径等易知易测或可测指标来计算比表面积,是一项具有重要实际意义的工作.本文首次提出一个通过孔率和孔径这两个指标来估算泡沫金属比表面积的方法. 全文下载 http://www.metalfoams.net/wp-content/uploads/2011/05/Calculation-method-for-the-specific-surface-area-of-porous-metals.pdf
3570 次阅读|1 个评论
第10 届全国工程计算方法学术会议——通知
xiaojy 2011-10-31 09:24
第10 届全国工程计算方法学术会议暨Global Chinese Workshop on Computational Methods in Engineering 将于2012 年5 月18-21 日在湖南长沙(湖南大学)召开。 会议主题主要包括(但不局限于)工程中边界元、无网格、有限元等数值方法的新发展(详细通知见附件)。 会前将评选第2 届杜庆华工程计算方法奖(章程和实施细节另外公布),会上还将分别评选35 岁以下青年研究人员和在读研究生的优秀论文。部分英文论文将经审稿后在EI收录的澳大利亚机械工程学报专刊发表(详情另行通知)。 准备参加此次会议的作者请将相关的学术论文的题目与作者联系方式尽快用电子邮件发给会议主席(姚振汉 教授,demyzh@mail.tsinghua.edu.cn )和秘书长(张见明教授, zhangjm@hnu.edu.cn )。每篇文章的两页详细摘要将印刷摘要集,请于2012 年3 月10 日之前用电子邮件同时发给姚振汉和张见明。论文全文收入论文集光盘,请于2012 年4 月10 日前用电子邮件同时发给姚振汉和张见明。
个人分类: 未分类|4726 次阅读|0 个评论
重心和场概念在社会学中的应用
yanghualei 2011-10-20 08:24
以前一直以为一个区域的经济重心,就是此区域经济发展水平最好的地方。因为不同对重心的定义,引致不同的计算方法,这两天慢慢的感觉,如果按照质心的计算方法,至少这样计算是科学的,好像不是这样的。 即经济重心倾向靠近经济发展水平比较高的地方,但并不是就在经济发展水平最高的地方,甚至此区域的经济重心就不在此区域内,这是有违反直觉的 。 为什么要寻找经济重心的,这是有一定的原因的,一般物理学家甚至是经济学家都喜欢从复杂的运动中寻求简单和熟悉的现象和法则。 重心就是一个好像所有外在对这个区域的交互力都集中在这一点,其最能反映这个区域所受的外力和这个区域的运动状态。 前天和一物理院同学交流,谈论以前做的一篇有关集体行为和个体行为之间的作用的文章,我 用引力公式描述集体行为对个体行为影响力的大小。并用引力和场理论解释集体行为的涌现,并用第一宇宙速度和第二宇宙速度解释观望行为和趋奇行为 ,其很感兴趣,其说用场的概念研究行为是很好的视角,因为场是一个好的抽象,又符合东方人的思维。
个人分类: 交叉科学|2979 次阅读|0 个评论
[转载]过渡态、反应路径的计算方法及相关问题
ywmucn 2011-9-26 10:06
转自: http://www.mdbbs.org/thread-17170-1-4.html Sobereva Department of Chemistry, University of Science and Technology Beijing, Beijing 100083, China 前言:本文主要介绍过渡态、反应路径的计算方法,并 讨论 相关问题。由于这类算法极多,可以互相组合,限于精力不可能面面俱到展开,所以只介绍常用,或者实用价值有限但有启发性的方法。文中图片来自相关 文献 ,做了一定修改。由于本文作为帖子发布,文中无法插入复杂公式,故文中尽量将公式转化为文字描述并加以解释,这样必然不如公式形式严谨,而且过于复杂的公式只能略过,但我想这样做的好处是更易把握方法的梗概,有兴趣可以进一步阅读原文了解细节。对于Gaussian中可以实现的方法,文中对其在Gaussian中的使用进行了一些讨论,希望能纠正一些网上流传的误区。虽然绝大多数人不专门 研究 计算方法,其中很多方法也不会用到,但多了解一下对开阔思路是很有好处的。 文中指的“反应”包括构象变化、异构化、单 分子 反应等任何涉及到过渡态的变化过程。“反应物”与“产物”泛指这些过程的初态和末态。“优化”若未注明,包括优化至极小点和优化至过渡态。势能面是高维的,但为了直观以及表述方便,文中一般用二维势能面 模型 来讨论,应推广至高维情况。限于纯文本格式,向量、矩阵无法加粗表示,但容易自行判断。 目录: 1.过渡态 2.过渡态搜索算法 2.1 基于初猜 结构 的算法 2.1.1 牛顿-拉弗森法(Newton-Raphson,NR)与准牛顿法(quasi-Newton,QN) 2.1.2 AH方法(augmented Hessian) 2.1.2.1 RFO法(Rational Function Optimization,有理 函数 优化) 2.1.2.2 P-RFO法(Partitioned-RFO) 2.1.2.3 QA法(Quadratic Approximation,二次逼近) 2.1.2.4 TRIM法(trust-region image minimization,置信区域镜像最小化) 2.1.2.5 在 高斯 中的常见问题 2.1.3 GDIIS法(Geometry Direct Inversion in the Iterative Subspace) 2.1.4 梯度模优化(gradient norm minimization) 2.1.5 Dimer方法 2.2 基于反应物与产物结构的算法 2.2.1 同步转变方法(synchronous transit,ST) 2.2.2 STQN方法(Combined Synchronous Transit and Quasi-Newton Methods) 2.2.3 赝坐标法(pseudo reaction coordinate) 2.2.4 DHS方法(Dewar-Healy-Stewart,亦称Saddle方法)与LTP方法(Line-Then-Plane) 2.2.5 Ridge方法 2.2.6 Step-and-Slide方法 2.2.7 Müller-Brown方法 2.2.8 CI-NEB、ANEBA方法 2.3 基于反应物结构的算法 2.3.1 最缓上升法(least steep ascent,shallowest ascent) 2.3.2 本征向量/本征值跟踪法(eigenvector/eigenvalue following,EF。也称mode walking/mode following/Walking up valleys) 2.3.3 ARTn(activation-relaxation technique nouveau) 2.3.4 梯度极值法(Gradient extremal,GE) 2.3.5 约化梯度跟踪(reduced gradient following,RGF) 2.3.6 等势面搜索法(Isopotenial Searching) 2.3.7 球形优化(Sphere optimization) 2.4 全势能面扫描 3.过渡态相关问题 3.1 无过渡态的反应途径(barrierless reaction pathways) 3.2 Hammond-Leffler假设 3.2 对称性问题 3.3 溶剂效应 3.4 计算过渡态的建议流程 4.内禀反应坐标(intrinsic reaction coordinate,IRC) 5.IRC算法 5.1 最陡下降法(Steepest descent) 5.2 IMK方法(Ishida-Morokuma-Kormornicki) 5.3 Müller-Brown方法 5.4 GS(Gonzalez-Schlegel)方法 6.chain-of-states方法 6.1 Drag method方法 6.2 PEB方法(plain elastic band) 6.3 Elber-Karplus方法 6.4 SPW方法(Self-Penalty Walk) 6.5 LUP方法(Locally Updated planes) 6.6 NEB方法(Nudged Elastic Band) 6.7 DNEB方法(Double Nudged Elastic Band) 6.8 String方法 6.9 Simplified String方法 6.10 寻找过渡态的chain-of-state方法 6.10.1 CI-NEB方法 6.10.2 ANEBA方法(adaptive nudged elastic band approach) 6.11 chain-of-states方法的一些特点 6.12 高斯中opt关键字的path=M方法 6.13 CPK方法(Conjugate Peak Refinement) 1.过渡态 过渡态结构指的是势能面上反应路径上的 能量 最高点,它通过最小能量路径(minimum energy path,MEP)连接着反应物和产物的结构(如果是多步反应的机理,则这里所指反应物或产物包括中间体)。对于多分子之间的反应,更确切来讲过渡态结构连接的是它们由无穷远接近后因为范德华力和静电力形成的复合物结构,以及反应完毕但尚未无限远离时的复合物结构。确定过渡态有助于了解反应机理,以及通过势垒高度计算反应速率。一般来讲,势垒小于21kcal/mol就可以在室温下发生。 在势能面上,过渡态结构的能量对坐标的一阶导数为0,只有在反应坐标方向上曲率(对坐标二阶导数)为负,而其它方向上皆为正,是能量面上的一阶鞍点。过渡态结构的能量二阶导数矩阵(Hessian矩阵)的本征值仅有一个负值,这个负值也就是过渡态拥有唯一虚频的来源。若将分子振动简化成谐振子模型,这个负值便是频率公式中的力常数,开根号后即得虚数。 分子构象转变、 化学 反应过程中往往都有过渡态的存在,即这个过程在势能面上的运动往往都会经历满足上述条件的一点。化学反应的过渡态更确切应当成为“反应过渡态”。需要注意的是化学反应未必都经历过渡态结构。 由于过渡态结构存在 时间 极短,所以很难通过实验方法获得,直到飞秒脉冲激光光谱的出现才使检验反应机理为可能。 计算化学 方法在目前是预测过渡态的最有力武器,尽管计算上仍有一些困难,比如其附近势能面相对于平衡结构更为平坦得多、低水平方法难以准确描述、难以预测过渡态结构、缺乏绝对可靠的方法(如优化到能量极小点可用的最陡下降法)等。 搜索过渡态的算法一般结合从头算、DFT方法,在半经验、或者小基组条件下,难以像描述平衡结构一样正确描述过渡态结构,使得计算尺度受到了限制。结合分子 力场 可以描述构象变化的过渡态,但不适用描述反应过渡态,因为大部分分子力场的势函数不允许分子拓扑结构的改变,虽然也有一些力场如ReaxFF可以支持,有的力场还有对应的过渡态 原子 类型,但目前来看适用面仍然较窄,而且不够精确,尽管更为快速。 注:严格来说,“过渡结构”是指势能面上反应路径上的能量最高点,而“过渡态”是指自由能面上反应路径上的能量最高点,由于自由能变主要贡献自势能部分,所以多数情况二者结构近似一致。但随着 温度 升高,往往熵变的贡献导致自由能面与势能面形状发生明显偏离,从而导致过渡结构与过渡态明显偏离,两个词就不能混用了。但本文不涉及相关问题,故文中过渡态、过渡结构一律指势能面上反应路径上的能量最高点。 2.过渡态搜索算法 2.1 基于初猜结构的算法 2.1.1 牛顿-拉弗森法(Newton-Raphson,NR)与准牛顿法(quasi-Newton,QN) NR法是寻找函数一阶导数为0(驻点)位置的方法。通过对能量函数的泰勒级数的二阶近似展开,然后使用稳态条件dE/dr=0,可导出步进公式:下一步的坐标向量 = 当前坐标向量 - 能量一阶导数向量 * Hessian矩阵的逆矩阵。在势能面上以NR法最终找到的 结果 是与初猜位置Hessian矩阵本征值正负号一致、离初猜结构最近的驻点,由于能量极小点、过渡态和高阶鞍点的能量一阶导数皆为0,故都可以用NR法寻找。 对于纯二次形函数NR法仅需一步即可找到正确位置,而势能面远比之复杂,所以需要反复走步直至收敛。也因为势能面这个特点,为了改进优化,实际应用中NR法一般还结合线搜索步(line search),对于优化至极小点,就是找当前点与NR法算出来的下一点的连线上的能量极小点作为实际下一步结构;若优化至过渡态,且连线方向主要指向过渡态,则找的是连线上能量极大点,若主要指向其它方向则找连线的能量极小点,若指向二者程度均等则一般不做线搜索。由于精确的线搜索很花时间,所以一般只是在连线的当前位置附近计算几个点的能量,以高阶多项式拟和后取其最小/最大点。 NR法每一步需要计算Hessian矩阵并且求其逆,所以十分昂贵。QN法与NR法的走步原理一样,但Hessian矩阵最初是用低级或经验方法猜出来的,每一步优化中通过当前及前一步的梯度和坐标对Hessian矩阵逆矩阵逐渐修正。由于只需计算一阶导数,即便Hessian矩阵不准确造成所需收敛步数增加,但一般仍比NR法 速度 快得多。QN法泛指基于此原理的一类方法,常用的是BFGS(Broyden Fletcher Goldfarb Shanno),此法对Hessian的修正保持其对称性和正定性,最适合几何优化,但显然不能用于找过渡态。还有DFP(Davidon-Fletcher-Powell),MS(Murtagh-Sargent,亦称symmetric rank 1,SR1),PSB(Powell-symmetric-Broyden)。也有混合方法,如Bofill法是PSB和MS法对Hessian修正量的权重线性组合,比二者独立使用更优,权重系数通过位移、梯度改变量和当前Hessian计算得到,它对Hessian的修正不强制正定,很适宜搜索过渡态。 将NR步进公式放到Hessian本征向量空间下其意义更为明显(此时Hessian为对角矩阵),可看出在每个方向上的位移就是这个方向势能的负梯度除以对应的本征值,比如在i方向上的位移可写为ΔX(i)=-g(i)/h(i),在受力越大、越平坦的方向位移越大。每一步实际位移就是这些方向上位移的矢量和。对于寻找过渡态,因为虚频方向对应Hessian本征值为负,使位移为受力相反方向,所以NR法在过渡态附近每一步都是使虚频方向能量升高,而在其它正交的方向朝着能量降低的方向位移,通过这个原理步进到过渡态。若有n个虚频,则NR法就在n个方向升高能量而其它方向降低能量找到n阶鞍点。 由于NR法的这个特点,为找到正确类型的驻点,初猜结构必须在目标结构的二次区域(quadratic region)内。所谓的二次区域,是指驻点附近保持Hessian矩阵本征值符号不变的区域,它的形状可以用多变量的二次函数近似描述,例如二维势能面情况下这样的区域可以用F(x,y)=A*x^2+B*y^2+C*x+D*y+E*x*y来近似描述。对于能量极小点,就是指初猜点在目标结构附近Hessian矩阵为正定矩阵的范围;对于找过渡态,就需要初猜点在它附近含有且仅含有一个负本征值的范围内。并且这个范围内不能有其它同类驻点比目标结构距离初猜结构更近。NR法方便之处是只需要提供一个初猜结构即可,但是由于过渡态二次区域很小(相对于能量极小点来讲),复杂反应过渡态又不容易估计,故对使用者的直觉和经验有一定要求,即便是老手,也往往需要反复尝试。 NR法对初猜结构比较敏感,离过渡态越近所需收敛步数越少,成功机率越高。模版法可以帮助给出合理的初猜,也就是如果已经知道其它机理相同的反应的过渡态结构,可以保持反应位点部分的结构不变而替换周围的原子,使之变成自己要研究的化合物反应的初猜结构。 2.1.2 AH方法(Augmented Hessian) AH方法并不是独立的寻找过渡态的方法,而是通过修改原始Hessian矩阵来调整NR法步进的长度和方向的一种方法。在NR法的步进公式中加入了一个移位 参数 λ,式子变为ΔX(i,λ)=-g(i)/(h(i)-λ),NR法相当于λ等于0时的特例。λ控制着每步步进距离,它与h(i)的相对大小也控制着这个坐标上的步进方向。根据设定λ方法的不同,常见的有RFO、P-RFO和QA/TRIM。这些方法每一步也使用QN方法来快速地更新Hessian。 下面提及的置信半径R(Trust radius)是指二阶泰勒级数展开这种近似的合理的区域,可以在优化过程中固定也可以动态改变,比如下一步位置的实际能量与使用二阶泰勒级数展开预测的能量符合较好则加大R,反之减小。优化的每一步移动距离不应超过R,否则可能进入二阶泰勒级数展开近似的失效区域,NR法在势能面平坦的时候容易超过这个范围,应调整λ避免。 2.1.2.1 RFO法(Rational Function Optimization,有理函数优化) 对能量函数根据有理近似展开,而不是NR法的二阶泰勒级数近似展开,可推得与AH方法形式相同的步进公式。确定其中λ的公式是λ=∑( g(i)^2/(h(i)-λ) ),g(i)和h(i)代表此方向的梯度和本征值,加和是对所有本征向量方向加和。通过迭代方法会解出N+1个λ(N代表势能面维数),将λ按大小排列,则有λ(i)≤h(i)≤λ(i+1)。故选其中最小的λ可使各个方向位移公式的(h(i)-λ)项皆为正,保证每步位移都向着极小点。选其中大于m个Hessian本征值的λ,将会在本征值最低的m个方向上沿其上的受力反方向位移提升能量,在其余N-m个方向上降低能量,由此确保优化到m阶鞍点,若m为1即用来找过渡态。所以用了这个方法寻找指定类型驻点不再像NR法对初猜位置Hessian本征值符号有要求,而是直接通过选择λ来设定向着何种鞍点位移。如果每步步长度超过了R,则乘以一个小于1的因子来减小步长。值得一提的是,λ与势能面维数N的平方根近似成正比,随着 体系 尺度的增大,RFO的λ对NR法的二次近似就会趋现“校正过度”情况,产生大小不一致问题,可使用SIRFO(Size independent RFO)方法解决,即AH走步公式中的λ改为λ/N^0.5。 2.1.2.2 P-RFO法(Partitioned-RFO) 专用于优化过渡态,效率比RFO更高。RFO对所有方向的步进都使用同一个λ,而在P-RFO中在指向过渡态的方向使用独立计算的λ(TS),λ(TS)=g(TS)^2/(h(TS)-λ(TS)),应选这个一元二次方程的最大的解,可保证在这个方向上升高能量。其余方向λ的确定和RFO的公式一样,加和就不再包含指向过渡态的方向,并且选最小的λ解以使这些方向能量降低。这里所谓指向过渡态的方向一般是指最低本征值的方向,在上述RFO方法m为1时也是如此假设(限于其形式RFO也只能用这最低模式),但有时会是其它的非最低的模式,P-RFO也可以将这样的模式作为指向过渡态的模式,见后文EF方法的讨论。 2.1.2.3 QA法(Quadratic Approximation,二次逼近) 确定λ的公式是(ΔX(i))^2=∑( -g(i)/(h(i)-λ) )^2=R^2,也就是说每一步移动的距离恰好是置信半径,这样步进速度较快。若优化到过渡态,计算λ公式的加和中指向过渡态本征向量的那一项的λ改为-λ,即ΔX(TS)=-g(TS)/(h(TS)+λ)。 2.1.2.4 TRIM法(trust-region image minimization,置信区域镜像最小化) 这个方法假设Hessian本征值最小的方向的梯度和曲率符号与原本相反,而其它方向不变。经过这样的变化后原来的过渡态位置就成为了能量极小点(过渡态的image),这样就可以通过优化到极小点而得到过渡态。将TRIM的假设g(TS)'=-g(TS),h(TS)'=-h(TS)代入AH方法的步进公式ΔX(i,λ)=-g(i)/(h(i)-λ),再使分子分母同乘以-1,可知在过渡态方向上的步进公式与其它方向区别仅在于反转了λ的符号。又由于TRIM也是通过调整λ使步进长度等于为置信半径,所以在公式的形式上与QA法找过渡态的公式完全一致,QA与TRIM可互为同义词。 通过如上调整AH方法引入的λ可使NR法的步进更有效率、更稳定,还可以通过它改变步进公式在不同方向上的分母项符号,使优化过渡态的初猜点不限于过渡态的二次区域。可直接指定沿某个振动模式升高能量来找过渡态,即便当前点这个方向的Hessian本征值可能是正值,例如从极小点开始跟踪至过渡态,见后文的EF方法。 2.1.2.5 在高斯中的常见问题 高斯中opt=ts是使用Berny算法来找过渡态,需要提供一个初猜结构。Berny默认的走步的方法是RFO/P-RFO(分别对于优化至极小值/鞍点),若加了Newton选项,则走步基于NR法。每一步对Hessian矩阵的更新方法以UpdateMethod选项指定,寻找极小点时默认用BFGS,找过渡态时默认用Bofill。Berny算法还包括一些细节步骤在内,比如投影掉被冻结的变量、更新置信半径、设定了线搜索过程中几种方案等等,详见手册opt关键字。 使用了每步修正Hessian的准牛顿法后,初猜的Hessian矩阵质量明显影响结构收敛速度,它的不准确容易导致搜索过渡态失败(在高斯中默认使用价键力场得到Hessian)。这种情况需要昂贵的calcfc关键字以当前方法水平计算最初的Hessian矩阵,若使用的方法在 程序 中支持解析二阶导数,速度会较好。或者用readfc来读取包含了Hessian矩阵信息的chk 文件 ,可以先使用低水平方法进行简正振动分析得到chk文件,再将之读入作为Hessian矩阵初猜,能够节约时间,但前提是此势能面对方法等级不敏感(一般如此)。使用了更准确的初猜后不仅可以增加找到过渡态的成功机率,还有助于在更短的优化步数内达到收敛标准。若使用calcall,则每一点都重新准确计算Hession,会更为可靠,但极为昂贵。 高斯中berny方法寻找过渡态默认每步会检查Hessian矩阵的本征值是否仅有一个为负,如果不符,就会提示“a wrong sign eigenvalue in hessian matrix”,经常一开始就报错,原因是初猜结构不符合这个条件,即便这个初猜通过berny方法最终能够正确优化到过渡态,这时应加noeigentest选项避免本征值符号的检查,不符合要求也继续优化,但因此可能收敛到其它类型驻点。有时这种情况由初猜的Hessian不准导致,可用calcfc解决。如果搜索的过渡态出现多个负本征值,可根据适当的虚频(高斯中以负数频率表示)振动方向调整结构以降低能量,直至剩下一个虚频,再重新优化。 高斯中默认的置信半径为0.3 bohr,若优化中步长(RFO/P-RFO步)超过就会 输出 “Maximum step size ( 0.300) exceeded in Quadratic search”和“Step size scaled by xxx”,即乘以xxx调小步长至置信半径内。也可以使用iop(1/8=k)将置信半径改为k*0.01 bohr(1 bohr=0.5292埃),调大后往往可以显著减少收敛步数,很适合势能面平坦的大体系。注意并不是每一步的步长都固定为k*0.01 bohr,若没超过置信半径则步长并不因此改变。寻找极小点时默认为允许动态改变置信半径,此时iop(1/8)设的就是最初的置信半径,对于寻找过渡态默认为关闭此功能(相当于用了NoTrustUpdate),可以使用trustupdate关键字来打开这个功能。 2.1.3 GDIIS法(Geometry Direct Inversion in the Iterative Subspace) GDIIS与DIIS原理一致,但用于几何优化,这个方法趋于收敛到离初始位置最近的驻点,包括过渡态。下一步坐标X(new)=X"-H'g",H'代表当前步的Hessian逆矩阵,可见公式形式与NR法是一致的,但是X"与g"不再指当前步的坐标和梯度,而是由之前走过的点的坐标X(k)和梯度g(k)插值得到的,X"=∑c(k)X(k),g"=∑c(k)g(k),代入上式即X(new)=∑c(i)(X(i)-H'g(i)),其中∑是对之前全部走过的点加和。系数c(k)通过使误差向量r的模最小化得到,r=∑c(k)e(k),并以∑c(k)=1为限制条件。e(k)常见有两种定义,一种是e(k)=-H'g(k),另一种更常用,是e(k)=g(k),可看出GDIIS利用的是已经搜索过的子空间中坐标与梯度的相关性,目的是估出梯度(即误差向量)的模尽可能小的坐标,这一点与后述的梯度模方法相似。 此方法缺点是由于势能面复杂,步进中容易被拉到已经过的势能面的其它驻点而不能到达指定类型驻点,还容易走到类似肩膀形状的拐点,梯度虽小却不为0,由于不能达到收敛标准而反复在此处震荡。另外随优化步数增加,误差向量数目逐渐加大,会逐渐出现的误差向量之间的线性相关,导致伪收敛和数值不稳定问题。在改进的方法中将GDIIS与更可靠的RFO方法结合,比较二者的步进方向和长度,并检验GDIIS中的组合系数c,根据一定规则来决定每一步对之前走过的点的保留方式,必要时全部舍去而重新开始GDIIS。Gaussian中用的这种改进的GDIIS方法解决了上述问题同时提高了效率,速度等于或优于RFO方法,尤其是以低水平对势能面平坦的大体系优化时更为突出。GDIIS计算量小,对Hessian矩阵很不敏感,可以在优化中不更新,也可以用QN法更新来改善性能。此方法自Gaussian98起就是默认的半经验优化算法,其它方法下也可以用OPT的gdiis关键词打开。 2.1.4 梯度模优化(gradient norm minimization) 势能面上的驻点,包括能量极小点、过渡态和高阶鞍点的势能梯度都为0,所以在相应于势能面的梯度模面上进行优化找到数值为0的点,经过Hessian矩阵本征值符号的检验,就能得到过渡态。这相当于把搜索过渡态问题转化为了能量极小化问题,就有了更可靠的算法可用。(注:梯度模指的是势能梯度在各个维度分量平方和的平方根,即梯度大小的绝对值)。但是寻找数值更小点的优化方法比如最陡下降法只能找到离初始位置最近的极小点,若找到的梯度模面上的极小点数值大于0则是势能面肩膀形拐点,没有什么用处,而这样的点收敛半径往往很大,例如图中在x=2至8的区域内都会收敛到函数拐点,只有提供的初猜结构在x=1和9附近很小的范围内才会收敛到过渡态,收敛半径太小,难以提供合理初猜。梯度模面上还多出一些极大点,如x=1.5处,若使用收敛更快的NR法找极小点还容易收敛到这样没有意义的点上。基于这些原因,梯度模法很少使用。 原函数与它的梯度模曲线。 2.1.5 Dimer方法 Dimer方法是一种高效的定位过渡态的方法。这个方法定义了由两个点R1和R2组成的一个Dimer,能量和所受势能力(由原始的势能面梯度造成受力,下同)分别为E1和E2、F1和F2。两个点间距为2ΔR,ΔR为定值。这两点的中间点为R,其受力F(R)=(F1+F2)/2。Dimer的总能量为E=(E1+E2)/2。这个方法的每一步包括平移Dimer和旋转Dimer两步。 旋转Dimer:保持R1、R2中点位置R不变作为轴,旋转Dimer直到总能量E最小。通过推导可知在旋转过程中,E与R点在dimer方向(R1-R2方向)上的曲率关系C是线性的,即最小化E的过程就是最小化C的过程。所以每一步的Dimer方向都是曲率最小方向,当最终R收敛到过渡态位置时,Dimer就会平行于虚频方向。 平移Dimer:Dimer根据受力F'移动R的位置,结合不同方法有具体步进方式,如quick-win、共轭梯度法。当C0(过渡态或高阶鞍点的二次区域内),F'等于将F(R)平行于Dimer方向力的分量符号反转;当C0(极小点二次区域内),F'等于F(R)平行于Dimer方向力的分量的负值,而没有垂直于Dimer方向的力,促使Dimer尽快离开这个区域。由于Dimer的方向就是曲率最小的方向,在过渡态二次区域内就是指虚频方向,在Dimer方法中F'的定义使这个方向以受力相反方向移动以升高能量,而其它方向顺着受力方向移动来最小化能量,可看出原理上与NR法相似。费时的计算Hessian矩阵最小本征值以确定提升能量方向的过程被旋转Dimer这一步代替了,仅需要计算一阶导数。Dimer法对初始位置要求很宽松,并不需要在过渡态二次区域内,若在极小点二次区域内就类似于后述的EF方法沿着最小振动模式爬坡。如果在高阶鞍点二次区域内,只在曲率最负的虚频方向沿着受力反向移动,在其它虚频方向上仍最小化能量,而不会像NR法收敛到高阶鞍点。 右侧为Dimer法在Müller-Brown模型势上面搜索两个过渡态过程中Dimer走的路径。 势能面上往往有许多鞍点,Dimer方法还可以做鞍点搜索。通过分子 动力学 方法给予Dimer一定动能,使之能够在势能面上广阔的区域内运动,根据一定标准提取 轨迹 中的一些点作为初猜,再执行标准Dimer方法就可以得到许多不同的鞍点。Dimer方法很适合双处理器并行,两个点的受力分别由两个处理器负责,速度可增加将近一倍。 2.2基于反应物与产物结构的算法 2.2.1 同步转变方法(synchronous transit,ST) 提供合理的初猜结构往往不易,ST方法可以只根据反应物和产物结构自动得到过渡态结构。“同步转变”这个名字强调的是反应路径上所有坐标一起变化,这是相对于后面提到的赝坐标法来说的(即只变化指定的坐标,尽管其它坐标优化后坐标也会变化)。 ST分为两种模型,最简单的就是LST模型(Linear synchronous transit,线性同步转变),这个方法假设反应过程中,反应物结构的每个坐标都是同步、线性地变化到产物结构。如果反应物、产物的坐标分别以向量A、B表示,则反应过程中的结构坐标可表示为(1-x)*A+x*B,x由0逐渐变到1代表反应进度。注意LST并不是指反应中原子在真实空间上以直线运动,只有笛卡尔坐标下的LST才是如此,在内坐标下的LST,原子在真实空间中一般以弧线运动。以LST的假设,反应路径在其所用坐标下的势能面图上可描述为一条直线,LST给出的过渡态就是这条直线上能量最高点(图3的点1)。LST的问题也很显著,其假设的坐标线性变化多数是错误的,绘制在势能面图上也多数不会是直线,故给出的过渡态也有较大偏差,容易带两个或多个虚频。 比LST更合理的是QST(quadratic synchronous transit,二次同步转变),它假设反应路径在势能面上是一条二次曲线。QST在LST得到的过渡态位置上,对LST直线路径的垂直方向进行线搜索找到能量极小点A(图3的点2)。QST给出的反应路径可以用经过反应物、A、产物的二次曲线来表示,如果这条路径上能量最大点的位置恰为A,则A就是QST方法给出的过渡态;如果不是,则以最大点作为过渡态。若想结果更精确,可以再对这个最大点向垂直于路径的方向优化,再次得到A并检验,反复重复这个步骤,逐步找到能量更低、更准确的过渡态。 QST方法在计算能力较低的年代曾是简单快速的获得过渡态和反应路径的方法,然而如今看来其结果是相当粗糙的,已极少单独使用,可以将其得到的过渡态作为AH法的初猜。 LST与QST方法示意图 2.2.2 STQN方法(Combined Synchronous Transit and Quasi-Newton Methods) STQN是ST与QN方法的结合(更准确地说是与EF法的结合)。但不要简单认为是按顺序独立执行这两步,即认为“先利用反应物和产物结构以ST方法得到粗糙过渡态,再以之作为初猜用QN法精确寻找过渡态”是错误的。STQN方法大意是:使结构从低能量的反应物出发,以ST路径在当前位置切线为引导,沿着LST或QST假设的反应路径行进(爬坡步),目的是使结构到达假设路径的能量最高处附近(真实过渡态二次区域附近)。当符合一定判据时就转换为QN法寻找精确过渡态位置(EF步)。下面介绍具体步骤。 先说明后面用到的切线的定义:STQN当中的LST路径与前面ST部分介绍的LST路径无异,都是直线,切线T在优化中是不变的,就是反应物R指向产物P的单位向量。STQN方法中的QST路径定义与ST方法介绍的不同,走的不是二次曲线而是圆形的一段弧,如图4所示。这个圆弧经过R、P以及优化中的当前步位置X,切线就是圆在X处的单位切线向量,圆弧和切线在每一步都是变化的。虽然QST路径比LST更为合理,但对于QSTN方法,QST路径在收敛速度和成功机率上的优势并不显著。 STQN对QST路径的定义 STQN每一步执行内容如下:(1)首先重新计算或用QN法更新Hessian。(2)按上述方法计算当前位置处的切线。(3)决定这一步是爬坡步还是EF步。如果是优化的第前两步,则一定认为是爬坡步,因为此时离过渡态区域还较远,应当先爬坡。如果是第3、4步,则估算出在切线方向的位移,超过一定标准就是爬坡步,否则说明爬得差不多了就进入EF步找过渡态。如果是第5步之后,一般已离过渡态区域较近,故一定认为是EF步。(4)如果是爬坡步,则在切线方向上移动(将切线方向作为EF方法所跟踪的振动方向来计算位移大小)。如果是EF步,首先计算Hessian各个本征向量的与切线重叠情况,如果有重叠大于0.8的本征向量,则以EF法跟踪本征值最大的本征向量来移动,相当于继续向上爬。如果没有大于0.8的,就跟踪最小本征值的本征向量移动来寻找过渡态。(5)步长长度若大于标准则调小,默认0.3 bohr。(6)根据预置受力、位移标准判断是否已收敛,收敛则结束循环。 注意,ST方法中具体包含LST和QST两种方法,STQN也用到了LST和QST两种反应路径的假设。高斯中的LST方法指的是ST中的LST方法,而QST2/3指的是利用QST路径假设的STQN方法,它们原理上截然不同,不要混淆。高斯中的QST2只需输入反应物和产物结构,通过几何方法估出STQN的初始步结构X。QST3需额外输入猜测的过渡态,它直接作为X,一般比QST2效果更好。对于经验不足的用户,用STQN方法往往比只提供过渡态初猜的方法更为适合。注意产物和反应物应当使用同样方法同样基组进行优化,如果是多分子比如A+B=C+D这样的反应,应当优化A和B/C和D的复合物作为输入的产物/产物,而不是单独优化A、B然后拼到一起,因为形成范德华复合物后孤立的分子会有一定构象改变,能量也低于它们孤立状态的加和。 2.2.3 赝坐标法(pseudo reaction coordinate) 也称为坐标驱动法(Coordinate Driving)。这个方法在高斯中就是柔性扫描(Relaxed Scan),即扫描一个变量,但每一步对其它变量自动进行优化,每一步得到的结构就是在这个变量为一定值情况下的最优结构。赝坐标法扫描的是反应物转变到产物过程中的关键坐标,比如扫描化学键断裂/生成反应中的键长。扫描的结果就是近似的IRC,可以再将能量最高点作为初猜找过渡态,或者用更小的步长再次扫描能量最高点附近找更精确的过渡态结构。这个找过渡态方法实际上用的是能量极小化优化过程,由于这样的算法比寻找过渡态的算法更为稳健,所以赝坐标法是颇可靠的,其它方法失败时可考虑这种方法。 这个方法缺点是费时间,而且不适合通向过渡态路径中反应区域涉及多个坐标变化的反应过程,因为自定义扫描的内容很难全面、准确考虑到这些坐标变量的变化,结果难以说明问题,没有考虑进去的关键变量容易产生滞后效应(hysteresis effect)。比如乙烷由交叉构象变化到另一个交叉构象,需要经历重叠构象的过渡态,会涉及到三个HCCH二面角同时由60度变化到0度,如果用赝坐标法只扫描其中一个HCCH由60度变到0度,则每一步其它两个HCCH角一定会大于这个扫描的二面角,与实际不符。这是因为这两个角越小,分子的能量越高,每一步自动优化的时候它们更倾向于保持在大角度。最终到达过渡态时,所扫描的二面角到达了0度,另外两个二面角却大于0度,说明它们的运动比实际的过程滞后了。由于滞后效应,从反应物和产物两个方向扫描同相同的坐标,得到的路径也不同。上述简单的反应此方法滞后效应尚且严重,对于复杂变化,这种效应导致的问题更难以预测。故此方法确定的IRC、过渡态不可靠,只建议对简单的反应使用这种方法,扫描变量的选择注意避免滞后效应。 在高斯中此方法可以使用opt=modredundant或Opt=Z-matrix结合分子结构部分标记的扫描变量来实现。例如使用opt=modredundant并在分子结构末尾写上A 3 2 1 S 10 1.000000来指定3 2 1原子组成的角度进行柔性扫描,共10步,每步1.0度。如果不熟悉,也可以很方便地在GaussView里的冗余坐标编辑器里面添加要柔性扫描的变量。 如果只执行常规的某个变量的扫描,比如高斯中的scan来找能量最高点作为初猜结构,对于简单体系可行,但对于复杂体系,这样忽略了此变量的变化导致分子其它部分结构的驰豫,如此得到的能量最高点作为过渡态初猜很不可靠,因为势能中掺入了不合理的结构造成的能量升高,使势能曲线形状改变。 2.2.4 DHS方法(Dewar-Healy-Stewart,亦称Saddle方法)与LTP方法(Line-Then-Plane) DHS方法中第一步将反应和产物分别作为A点和B点,确定哪个点能量低,比如A比B低,就把A点的结构向B点稍微做调整(~5%)得到A',然后限制变量空间中A'与B的距离不变(即在超球面上)对A'进行优化得到A''。将A''与B当作下一步的起始点A与B,重复上述方法。这样反复进行迭代,若以序号n代表第n次得到的A''或B'',会依次得到例如A''(1)、A''(2)、B''(1)、A''(3)......直到A与B十分接近时才停止迭代,此位置就是过渡态。将得到的全部A''(n)按序号n依次连接,B''(n)也按序号依次连接,再将序号最大的A''(n)与B''(n)连接,得到的就是近似的IRC。LTP与DHS方法基本一致,不同的是每步是在垂直于A'与B连线的超平面上优化。DHS方法虽然可以很快地走到过渡态附近的位置,但是越往后每步的AB距离缩近也越少,故并不能有效率地贴近过渡态。然而每步的在连线上调整的距离不可过大,否则可能造成一侧的点跨过过渡态势垒跑到另一侧得到错误结果。 DHS方法示意图 2.2.5 Ridge方法 第一步时将反应物、产物作为A点和B点,在其LST的路径上找到能量最大点C,然后在AC与BC直线上相距C为s的位置上分别设一点A'和B',将A'与B'分别沿着此处势能面负梯度优化p距离,将得到的A''与B''作为下一步的A和B。反复进行这个步骤,收敛后C的位置就是过渡态位置。s和p是计算过程中动态调节的参数,对结果影响较大,它们应当随C逐渐接近过渡态而减小,可设若当前步的C能量高于上一步的C,则减小p至原先一半;若s与p的比值大于某个数值,s也减半。Ridge方法的缺点是接近过渡态时效率较低,可以当C进入过渡态二次区域后改用QN法来加快收敛。也可以结合DIIS法,速度比原先有一半以上的提升,效率有时还高于基于二阶导数的方法,而且在某些势能面非常平坦的体系比二阶导数方法更可靠。 Ridge方法示意图 2.2.6 Step-and-Slide方法 使产物和反应物的结构同时顺着LST描述的路径相对移动(step步),直到它们的能量都等于某个预先设定的能量,然后让这两个结构在它们当前所在的势能等值面上滑动(slide步),使二者结构在坐标空间中的距离最小。重复上述step和slide步骤,最终当两个结构碰上,这个位置就是过渡态。 Step and Slide方法示意图 2.2.7 Müller-Brown方法 见下文IRC算法相应部分 2.2.8 CI-NEB、ANEBA方法 见下文“寻找过渡态的chain-of-state方法”相应部分 2.3 基于反应物结构的算法 2.3.1 最缓上升法(least steep ascent,shallowest ascent) 由反应物结构到达过渡态结构的过程是沿着势能面最容易行进的路径进行的(不考虑动力学问题),这个途径一般比其它方向要缓和,所以由反应物结构开始,沿着势能面最缓的方向逐渐往上爬,往往可以沿着MEP到达过渡态。但要注意这条路径时常与从过渡态沿最陡下降路径所走出的MEP并不一致,因此原理上此法不能保证一定能到达过渡态。图8描述的是LEPS势结合谐振势的势能面,最缓上升法所走的黑色粗曲线严重不符合实际MEP(黑点所示路径),而且曲线是中断的。此法也可能走到与此平衡结构相连的其它过渡态,而非预期的过渡态。还容易因为步长问题导致走到中途时跑到另外一条错误路径上,虽然设小步长能得到解决,但是需要花费更长时间。因为种种问题,这个方法使用较少。 势能面上最缓上升法所走的路径(黑色粗曲线) 2.3.2 本征向量/本征值跟踪法(eigenvector/eigenvalue following,EF。也称mode walking/mode following/Walking up valleys) 由于平衡结构越过势垒发生反应的能量主要来自分子某振动模式提供的动能,考虑这一点,由平衡结构沿着此振动矢量方向步进,能够找到过渡态,经历的路径就是反应路径。这种方法需要首先对平衡结构进行振动分析,由用户最初指定一个可能指向过渡态的振动模式。因为平衡态通向过渡态路径势能面平缓,曲率(可视为振子力常数)一般小于其它方向,故一般跟踪频率最低的振动模式(高斯中默认)。每走一步后重新计算Hessian矩阵的本征值和本征向量,如果跟踪的是本征值最低的模式,仍取本征值最小的本征向量继续跟踪;如果跟踪的是其它振动模式,就取与上一步所跟踪的向量重叠最大的向量继续跟踪。重复执行,直到符合收敛标准为止。 如果一个结构涉及到多个过渡态,则跟踪不同的本征向量有可能得到不同的过渡态,即便所跟踪的不是最低模式,当接近过渡态后也会成为最低的模式。此方法也可以直接由过渡态初猜结构开始跟踪,或者说EF方法是一种不需要初猜在过渡态二次区域内的寻找过渡态的方法。由稳定结构通过EF方法跟踪至过渡态相对与直接给出初猜显然更为费时,但对于不能预测过渡态结构的情况下往往是有用的。LMOD法搜索构象也是基于这一原理,不断地根据低频振动方向越过构象转变的过渡态到达新的构象。 最初的EF方法只是简单地沿所跟踪的振动模式移动来升高能量。高斯中opt=(EF,TS)方法还使结构同时在其余方向上沿能量更低的方向移动,其实它用的就已介绍的P-RFO法,所跟踪的模式用独立计算的λ的最大解,其它的模式使用相同的另外计算的λ的最小解。由于Berny方法寻找过渡态已经包含了P-RFO步,所以EF方法实际上也已经包含在内了,除非要用到跟踪特定模式等功能时才有使用的必要。 2.3.3 ARTn(activation-relaxation technique nouveau) 此方法主要用于研究无序材料的在能量面上由极小点穿过过渡态到达其它极小点的过程,解决由于势垒高而难以用MD和MC方法研究的问题。方法分两步,(1)将初始结构由极小点位置激活并收敛到过渡态(activation步),(2)由过渡态通过常规的能量极小化算法寻找极小点(relaxation步)。(1)中的每一步中在任意方向上移动结构,然后在垂直于走过的路径方向的超平面上做能量极小化,反复执行,直到Hessian矩阵出现一个负本征值为止。之后进入收敛至鞍点的步骤,在最小本征值的方向上沿受力反方向移动,其余方向根据受力移动,最终将找到一阶鞍点。由于大体系Hessian矩阵本征值求解困难,此方法中使用Lanczos算法快速求解最低本征值和本征向量。ART法可以获得与初始极小点相连的许多过渡态。 2.3.4 梯度极值法(Gradient extremal,GE) 梯度极值路径连接的是每一个等值线(高维情况为超曲面)上的梯度的模|g|为极大或极小值的点(相对于同一等值线上的其它点的梯度模来说)。因为势能面的每一点的梯度垂直于此点等值线的切线,故梯度模极值点的位置相当于垂直于等值线方向上等值线间隔比处在相同等值线上相邻的点更远或更近。|g|的极值与g^2一致,设势能函数为f,限制所在等值线能量为k,通过拉格朗日乘子法求g^2的极值▽ =0,可知梯度极值点的梯度方向等于此点Hessian矩阵某一本征向量。由于势能面上每个驻点必有一条或多条梯度极值路径通过而互相构成网络(但任意驻点间不一定有梯度极值路径直接相连),所以 系统 地跟踪梯度极值路径是一种获得势能面上全部驻点的方法,目前已有几种跟踪算法,然而即便对于简单体系,梯度极值路径数目也极多,尤其是包含对称性情况下。由极小点跟踪梯度极值路径也能够用于寻找过渡态,但极小点未必与过渡态通过梯度极值路径直连,且此方法并不能控制要寻找哪类驻点,故为了寻找过渡态可能需要从多个其它驻点跟踪多个梯度极值路径,计算量很大,所以单纯为了寻找过渡态而使用这种方法不切实际。 梯度极值路径示意图 2.3.5 约化梯度跟踪(reduced gradient following,RGF) 这个方法同梯度极值法一样可以得到包括过渡态、极小点在内的各种驻点。设势能面为N维,此方法将跟踪N条路径,其中第i条(i=1,2,3...N)路径只有在第i维上梯度不为0,而其它N-1个维度上皆为0,故称为约化梯度。这样的路径交汇的位置,就是所有维度上梯度皆为0的位置,即驻点。例如简单的二维情况E(x,y)=x^3+y^3-6xy,跟踪的RGF方程就是Ex(x,y)=3x^2-6y=0和Ey(x,y)=3y^2-6x=0,前者仅y方向梯度不为0,后者仅x方向梯度不为0,相交得到的驻点为一个一阶鞍点和一个极小点。也可以使用原始坐标组合的正交坐标系,例如跟踪仅x+y和仅x-y方向上梯度不为0的两条路径。 x^3+y^3-6xy面上约化梯度路径示意图 跟踪约化梯度的步进算法是第m点的坐标x(m+1)=x(m)+StL*x'(m)/|x'(m)|。StL是步长,x'(m)/|x'(m)|代表路径切线方向单位向量。x'可以通过H'x'=0方程以QR分解法获得,其中H'与Hessian矩阵唯一不同的是,若当前跟踪的是仅第k维梯度不为0的约化梯度路径,则H'没有Hessian矩阵的第k行。一般起始步由某驻点开始,此步准确计算Hessian,步进过程中Hessian可用前述的DFP方法修正。每步检验所跟踪方向上的朝向下一个驻点的牛顿步步长,若小于标准则停止,并且再精确计算一次Hessian以确认此驻点是什么类型。每次走步的结果如果在数值上与“仅某维度上梯度为0”条件符合较好,可以动态增加步长,类似AH法的置信半径概念,如果相差较大,则调用校正步(后期方法将校正步合并入步进步,改善了效率和稳定性)。 这个方法计算量也很大,而且也无法指定要搜索的驻点的类型,所以不适合独立用作寻找过渡态。 2.3.6 等势面搜索法(Isopotenial Searching) 如果将反应物位置附近的势能面比做一个湖,这个方法可以看作逐渐往湖里面灌水,由于过渡态能量比周围地方更低,所以随着水位(势能)逐渐升高,水最先流出来的地方就是过渡态。继续灌水,随着水位继续升高,还可以找到其它能量更高的过渡态。 具体实现的方法是:首先最小化反应物的能量E0,在反应物位置附近 设置 一些测试点,可以随机也可以根据经验设定,作为“水位”来检测是否已到达过渡态能量。然后设定目标能量E(target),一般高于E0几百KJ/mol。计算那些测试点的能量和势能梯度,检查其能量与E(target)的差的绝对值,若大于10KJ/mol,即没达到目标水位,就让它们沿着梯度方向行进以提升能量,之后再次检查是否符合条件,直到小于10KJ/mol,即已到达目标水位,就对这些点进行人工的检查,包括结构、成键分析等,考察在E(target)时是否已经达到或超过了过渡态的能量。如果找到了过渡态,就调整这些点的位置继续找别的过渡态;如果未找到,就提高E(target)并且调测试点整位置以增大找到过渡态的概率,然后再沿着梯度方向提升测试点的能量并进行接下来的检测,反复如此。 上述提到的“调整点的位置”有很多算法,但主要都是使那些测试点在垂直于梯度,即在等值面上移动。因为测试点无法密集覆盖整个等势面,受计算能力制约其数目有限的,很难有哪个点随着E(target)的提升而移动后恰好落在过渡态的位置。直到E(target)提升到有测试点可判断为过渡态时,其能量一般已高出实际过渡态很多。所以使用此方法得到的过渡态能量与初始点位置和调整点位置的算法都有很大关系,一般都显著偏高,甚至不能找到过渡态,可尝试以不同初始位置和调整算法重新执行以改善结果。等势面搜索法适合在只有反应物结构而难以预测过渡态和产物结构的情况下寻找过渡态,例如预测质谱中分子的可能裂解的方式,有时还可能找到全新未曾考虑到的反应机理。但是此方法的结果很粗糙,而且计算量极大,尤其是大分子的高维势能面,有限的测试点很容易漏掉许多重要过渡态。 2.3.7 球形优化(Sphere optimization) 在几何参数的变量空间上,以反应物或产物为中心,在不断增加半径的超球面上做能量最小化。将相邻球面上得到的能量极小点相连接,就得到一条由反应物或产物为起点的低能量的路径,可做为IRC(未必正确,考虑图8的势能面),并由此找到过渡态。如果每个球面上可以找到多个极小点,则连接后有可能得到多条反应路径。此法若以坐标驱动法为类比,此方法就是对几何参数空间中反应物或产物结构代表的点的距离进行柔性扫描。 球形优化示意图 2.4 全势能面扫描 当一切方法都不能找到过渡态,全势能面扫描是最终途径。由于扫描得到的势能面格点是离散的,可通过插值提高格点密度以增加精度。得到势能面后,就可以通过一些算法找到过渡态,例如用这些点拟合出解析表达式,然后用标准微分方法找过渡态。但全势能面扫描极为昂贵,内坐标下需要计算X^(3N-6)次(X代表每个变量扫描步数),只限于反应中仅涉及几个自由度的势能面扫描,往往不得不考虑更低级的方法如半经验或者分子力学,变量稍多的体系则完全不能实现。全势能面扫描的结果还提供了过渡态位置以外结构的信息,例如可以用于研究反应路径、用于构象搜索等。 3.过渡态相关问题 3.1 无过渡态的反应途径(barrierless reaction pathways) 并非所有反应途径都需要越过势垒,这类反应在很低的温度下就能发生,盲目找它们的过渡态是徒劳的。常见的包括自由基结合,比如甲基自由基结合为乙烷;自由基向烯烃加成,比如甲基自由基向乙烯加成成为丙基自由基;气相离子向中性分子加成,比如叔碳阳离子向丙烯加成。等等。 3.2 Hammond-Leffler假设 过渡态在结构上一般会偏向反应物或者产物结构一边。Hammond-Leffler假设对预测过渡态结构往哪个方向偏是很有用的,意思是反应过程中,如果两个结构的能量差异不大,则它们的构型差异也不大。由此可知对于放热反应,因为过渡态能量与反应物差异小,与产物差异大,故过渡态结构更偏向反应物,相反,吸热反应的过渡态结构更偏向产物。所以初猜过渡态结构应考虑这一问题。 3.2 对称性问题 如果已经明确地知道过渡态是什么对称性,而且对称性高于平衡态对称性,且可以确信在这个高对称性下过渡态是能量最低点,则可以强行限制到这个对称性之后进行几何优化,几何优化算法比寻找过渡态算法方法更可靠。比如F+CH3F--FCH3+F这个SN2反应,过渡态就是伞形翻转的一刻,恰为高对称性的D3h点群,而反应路径上的其它结构对称性都比它低,所以在D3h点群条件下优化,得到的能量最低点就是过渡态。 如果过渡态对称性不确定,则找过渡态计算的时候不宜设任何对称性,否则若默认保持了平衡态下的对称性,得到的此对称下的过渡态并不是真正的过渡态,容易得到二阶或高阶鞍点。 3.3 溶剂效应 计算凝聚态条件下过渡态的性质,必须考虑溶剂效应,它明显改变了势能面。一般对过渡态的结构影响较小,但对能量影响很大。有时溶剂效应也会改变反应途径,或产生气相条件下没有的势垒。溶剂条件下,上述寻找过渡态的方法依然适用。应注意涉及到与溶剂产生氢键等强 相互作用 的情况,隐式溶剂模型是不适合的,需要用显式溶剂考察它对过渡态的影响,即在输入文件中明确表达出溶剂分子。 3.4 计算过渡态的建议流程 直接用高水平方法计算过渡态往往比较花时间,可以使用逐渐提高方法等级的方法加速这一过程,一般建议是: 1 执行低水平的计算找过渡态,如半经验。 2 将第1步得到的过渡态作为初猜,用高级别的方法找过渡态。 3 在相同水平下对上一步找到的过渡态做振动分析,检验是否仅有一个虚频,以及观看其振动模式的动画来考察振动方向是否连接反应物与产物结构。有必要时可以做IRC进一步检验。 4 为获得更精确的过渡态能量,可使用更高等级方法比如含电子相关的方法计算能量。 4.内禀反应坐标(intrinsic reaction coordinate,IRC) MEP指的是势能面上,由一个点到达另一个点的能量最低的路径,满足最小作用原理。若质量权重坐标下的MEP连接的是反应物、过渡结构和产物,则称为IRC。所谓质权坐标在笛卡儿坐标下即r(i,x)=sqrt(m(i))*R(i,x),m(i)为i原子质量,R(i,x)为i原子原始x方向坐标,同样有r(i,y)、r(i,z)。IRC描述了原子核运动速度为无限小时,质权坐标下由过渡态沿着势能负梯度方向行进的路径(最陡下降路径),其中每一点的负梯度方向就是此处核的运动方向,在垂直于路径方向上是能量极小点。注意质量权重和非权重坐标下的路径是不一样的。 IRC可看作0K时的实际在化学反应中原子核所走的路径,温度较低时IRC也是一个很好的近似。但是当温度较高,即核动能较大时,实际反应路径将明显偏离IRC,而趋于沿最短路径变化,即便经历的是势能面上能量较高的的路径,这时就需要以动力学计算的平均轨迹来表征反应路径。 5.IRC算法 5.1 最陡下降法(Steepest descent) 最简单的获得IRC的方法就是固定步长的最陡下降法,由过渡态位置开始,每步沿着当前梯度方向行进一定距离直到反应物/产物位置,也称Euler法。由于最陡下降法及下文的IMK、GS等方法第一步需要梯度,而过渡态位置梯度为0,所以第一步移动的方向沿着虚频方向。最陡下降方法与IRC的本质相符,但是此法实际得到的路径是一条在真实IRC附近反复震荡的曲折路径,而非应有的平滑路径,对IRC描述不够精确。虽然可以通过更小的步长得以一定程度的解决,但是太花时间,对于复杂的反应机理,需要更多的点。也可以通过RK4(四阶Runga-Kutta)来走步,比上面的方法更稳定、准确,但每步要需要算四个梯度,比较费时。 5.2 IMK方法(Ishida-Morokuma-Kormornicki) 它是最陡下降法的改进,解决其震荡问题。首先计算起始点X(k)的梯度g(k),获得辅助点X'(k+1)=X(k)-g(k)*s,其中s为可调参数。然后计算此点梯度g'(k+1),在g(k)与-g'(k+1)方向的平分线上(红线所示)进行线搜索,所得能量最小点即为X(k+1),之后再将X(k+1)作为上述步骤的X(k)重复进行。整个过程类似先做最陡下降法,然后做校正。此方法仍然需要相对较小的步长,获得较精确IRC所需计算的点数较多。 IMK方法示意图 Schmidt,Gordon,Dupuis改进了IMK的三个细节,使之更有效率、更稳定。(1)将X'(k+1)的确定方式改为了X(k)-g(k)/|g(k)|*s,即每一步在负梯度方向上行进固定的s距离,与梯度大小不再有关。(2)线搜索步只需在平分线上额外计算一个点的能量即可,这个点和X'(k+1)点的能量以及g'(k+1)在此平分线上的投影三个条件作联立方程即可解出曲线方程,减少了计算量。IMK原始方法则需要在平分线上额外计算两个点的能量与X'(k+1)的能量一起拟和曲线方程。(3)第一步在过渡态位置的移动距离Δq如此确定:ΔE=k*(Δq^2)/2,k为虚频对应的力常数,ΔE为降低能量的期望值(一般为0.0005 hartree),这样可避免在虚频很大的鞍点处第一步位移使能量降低过多。 5.3 Müller-Brown方法 这是通过球形限制性优化找IRC的方法。首先将过渡态和能量极小点位置定义为P1和P2,由P1开始步进,当前步结构以Q(n)表示。每一步,在相距Q(n)为r距离的超球面上用simplex法优化获得能量极小点Q'(图中绿点),优化的起始点是Q(n-1)Q(n)与Q(n)P2方向的平分线b上距Q(n)为r距离的位置S(红点)。若Q(n)Q'与Q(n)P2的夹角较小,则Q'可当作是下一步位置Q(n+1)。如此反复,直到符合停止标准,比如下一步能量比当前更高(已走过头了)、与P2距离已很近(如小于1.2r)、或者与P2方向偏离太大(P1与P2点通过此法无法找到IRC)。最终所得到全部结构点依次相连即为近似的IRC,减小步长r值可使结果更贴近实际IRC。基于此方法也可以用于寻找过渡态,先将反应物和产物作为P1和P2,将二者距离的约2/3作为r,由其中一点在P1-P2连线上相距其r位置为初始位置进行球形优化得到O点,在O与P1、O与P2上也如此获得P1'与P2',根据P1、P1'、O、P2'、P2的能量及之间距离信息以一定规则确定其中哪两个点作为下一步的P1和P2,确定新的P1和P2后重复上述步骤,直至P1与P2十分接近,即是过渡态。此方法计算IRC可以步长可设得稍大,第一步不需要费时的Hessian矩阵确定移动方向,缺点是获得的路径曲率容易有问题,对于曲率较大的反应路径需要减小步长。 Müller-Brown方法示意图 5.4 GS(Gonzalez-Schlegel)方法 这是目前很常用,也是Gaussian使用的方法,见图14。首先计算起始点X(k)的梯度,沿其负方向行进s/2距离得到X'(k+1)点作为辅助点。在距X'(k+1)点距离为s/2的超球面上做限制性能量最小化,找到下一个点X(k+1)。因为这个点的负梯度(黑色箭头)在弧方向上分量为0,故垂直于弧,即其梯度方向在X'(k+1)到X(k+1)的直线上。这必然可以得到一段用于描述IRC的圆弧(虚线),它通过X(k)与X(K+1)点,且在此二点处圆弧的切线等于它们的梯度方向,这与IRC的特点一致,这段圆弧可以较好地(实线)。之后再将X(k+1)作为上述步骤的X(k)重复进行。 GS方法对IRC描述得比较精确,在研究反应过程等问题中,由于对中间体结构精度有要求,GS是很好的选择,而且用大步长可以得到与小步长相近的结果,优于IMK、Müller-Brown等方法。若只想得到与过渡态相连的反应物和产物结构,或者粗略验证预期的反应路径,对IRC精度要求不高,使用最陡下降法往往效率更高,尽管GS可以用更大步长,但每步更花时间。 GS方法示意图 除上述外,IRC也可以通过已提及的EF、最缓上升法、球形优化等方法得到,它们的好处是不需要事先知道过渡态的结构。赝坐标法除了简单的反应以外,只能得到近似的IRC,由于结构的较小偏差会带来能量的较大变化,容易引入滞后效应,所以这样得到的势能曲线难以说明问题。 6. chain-of-states方法 这类方法主要好处是只需要提供反应物和产物结构就能得到准确的反应路径和过渡态。首先在二者结构之间以类似LST的方式线性、均匀地插入一批新的结构(使用内坐标更为适宜),一般为5~40个,每个结构就是势能面上的一个点(称为image),并将相邻的点以某种势函数相连,这样它们在势能面上就如同组成了一条链子。对这些点在某些限制条件下优化后,在势能面上的分布描述的就是MEP,能量最高的结构就是近似的过渡态位置。 6.1 Drag method方法 这个方法最简单,并不是严格的chain-of-states方法,因为每个结构点是独立的。插入的结构所代表的点均匀分布在图8所示的短虚线上,也可以在过渡态附近位置增加点的密度。每个点都在垂直于短虚线的超平面上优化,在图中就是指平行于长虚线方向优化。这种方法一般是奏效的,但也很容易失效,图8就是一例,优化后点的分布近似于从产物和反应物用最缓上升法得到的路径(黑色粗曲线),不仅反应路径错误,而且两段不连接,与黑色小点所示的真实MEP相距甚远(黑色点是用下文的NEB方法得到的)。目前基本不使用此方法。 6.2 PEB方法(plain elastic band) 这是下述Chain-of-state方法的基本形式。也是在反应物到产物之间插入一系列结构,共插入P-1个,反应物编号为0,产编号物为P。不同的是优化不是对每个点孤立地优化,而是优化一个函数,每一步所有点一起运动。下文用∑ X(i)符号代表由X(1)开始加和直到X(P)。PEB函数是这样的:S(R(1),R(2)...R(P-1))=∑ V(R(i)) + ∑ ( k/2*(R(i)-R(i-1))^2 )。其中R(i)代表第i个点的势能面上的坐标,V(R(i))是R(i)点的能量,k代表力常数。优化过程中反应物R(0)和产物R(P)结构保持不变,优化此函数相当于对一个N*(P-2)个原子的整体进行优化,N为体系原子数。 优化过程中,式中的第一项目的是让每个点尽量向着能量极小的位置移动。第二项相当于将相邻点之间用自然长度为0、力常数为k的弹簧势连了起来,目的是保持优化中相邻点之间距离均衡,避免过大。当只有第一项的时候,函数优化后结构点都会跑到作为能量极小点的反应物和产物位置上去而无法描述MEP,这时必然会有一对儿相邻结构点距离很大。当第二项出现后,由于此种情况下弹簧势能很高,在优化中不可能出现,从而避免了这个问题。drag method法在图8中失败的例子中,也有一对儿相邻结构点距离太远,所以也不会在PEB方法中出现。简单来说,PEB方法就是保持相邻结构点的间距尽量小的情况下,优化每个结构点位置。可以近似比喻成在势能面的模型上,将一串以弹簧相连的珠子,一边挂在反应物位置,另一边挂在产物位置,拉直之后松手,这串珠子受重力作用在模型上滚动,停下来后其形状可当作MEP,最高的位置近似为过渡态。 但是PEB方法的结果并不能很好描述MEP。图15描述的是常见的A、B、C三原子反应的LEPS势能面,B可与A或C成键,黑色弧线为NEB方法得到的较真实的MEP。左图中,在过渡态附近PEB的结构点没有贴近MEP,得到的过渡态能量过高,称为corner-cutting问题。这是因为每点间的弹簧势使这串珠子僵硬、不易弯曲,由图15右图可见,R(i)朝R(i-1)与R(i+1)方向都会受到弹簧拉力,其合力牵引R(i),使R(i-1)、R(i)、R(i+1)的弧度有减小趋势。如果将弹簧力常数减小以减弱其效果,就会出现图15中间的情况,虽然结构点贴近了MEP,但相邻点间距没有得到保持,过渡态附近解析度很低,错过了真实过渡态,若以能量最高点作为过渡态则能量偏低,这称为sliding-down问题。可见弹簧力常数k的设定对PEB结果有很大影响,为权衡这两个问题只能取折中的k,但结果仍不准确。 LEPS势能面上不同k值的PEB结果 6.3 Elber-Karplus方法 与PEB函数定义相似。第一项定义为1/L*∑ ( V(R(i))*d(i,i-1) ),其中L为链子由0点到P-1点的总长,d(i,i+1)为R(i)与R(i+1)的距离,此项可视为所有插入点总能量除以点数,即插入点的平均能量。第二项为γ*∑ (d(i,i-1)-d)^2,其中d代表相邻点的平均距离,是所有d(i,j)的RMS。此项相当于将弹簧自然长度设为了当前各个弹簧长度的平均值,由γ参数控制d(i,j)在平均值上下允许的波动的范围。此方法最初被用于研究 蛋白质 体系的构象变化。 6.4 SPW方法(Self-Penalty Walk) 在Elber-Karplus方法的基础上增加了第三项互斥项,∑ ∑ U(ij),其中U(ij)=ρ*exp(-d(i,j)/(λ*d)),d定义同上。此项相当于全部点之间的“非键作用能U(ij)”之和,不再仅仅是相邻点之间才有限制势。任何点之间靠近都会造成能量升高,可以避免Elber-Karplus方法中出现的在能量极小点处结构点聚集、路径自身交错的问题,能够使路径充分地展开,确保过渡态区域有充足的采样点。式中ρ和λ都是可调参数来设定权重。此外相对与Elber-Karplus方法还考虑了笛卡儿坐标下投影掉整体运动的问题。 6.5 LUP方法(Locally Updated planes) 特点是优化过程中,只允许每个结构点R(i)在垂直于R(i-1)R(i+1)向量的超平面上运动。由于每步优化后R(i-1)与R(i+1)连线方向也会变化,故每隔一定步数重新计算这些向量,重新确定每个点允许移动的超平面。但是LUP缺点是结构点之间没有以上述弹簧势函数相连来保持间隔,容易造成结构点在路径上分布不均匀,甚至不连续,还可能逐渐收敛至两端的极小点。 6.6 NEB方法(Nudged Elastic Band) NEB方法集合了LUP与PEB方法的优点,其函数形式基于PEB。从PEB方法的讨论可以看出,弹簧势是必须的,它平行于路径切线(R(i)-R(i-1)与R(i+1)-R(i)矢量和的方向)的分量保证结构点均匀分布在MEP上来描述它;但其垂直于路径的分量造成的弊端也很明显,它改变了这个方向的实际的势能面,优化后得到的MEP'就与真实的MEP发生了偏差,造成corner-cutting问题。解决这个问题很简单,在NEB中称为nudge过程,即每个点在平行于路径切线上的受力只等于弹簧力在这个方向分量,每个点在垂直于路径切线方向的受力只等于势能力在此方向上分量。这样弹簧力垂直于路径的分量就被投影掉了,而有用的平行于路径的分量完全保留;势能力在路径方向上的分量也不会再对结构点分布的均匀性产生影响,被保留的它在垂直于路径上的分量将会引导结构点地正确移动。这样优化收敛后结构点就能正确描述真实的MEP,矛盾得到解决。弹簧力常数的设定也比较随意,不会再对结果产生明显影响。但是当平行于路径方向能量变化较快,垂直方向回复力较小的情况,NEB得到的路径容易出现曲折,收敛也较慢,解决这一问题可以引入开关函数,即某点与两个相邻点之间形成的夹角越小,此点就引入更多的弹簧势垂直于路径的分量,使路径不易弯曲而变得光滑,但也会带来一定corner-cutting问题。也可以通过将路径切线定义为每个点指向能量更高的相邻点的方向来解决。 6.7 DNEB方法(Double Nudged Elastic Band) 弹簧势垂直于路径的分量坏处是造成corner-cutting问题,好处是避免路径卷曲。更具体来说,前者是由于它平行于势能梯度方向的那个分量造成的,若只将这个分量投影掉,就可避免corner-cutting问题,而其余分量的力F(DNEB)仍可以避免路径卷曲,这便是DNEB的主要思想。故DNEB与NEB的不同点就是DNEB保留了弹簧势垂直于路径的分量其中的垂直于势能梯度的分量。 DNEB的这个设定却导致结构点不能精确收敛到MEP上。正确的MEP上的点在垂直于路径方向上受势能力一定为0,但是当用了DNEB方法后,若其中某一点处路径是弯曲的,即弹簧力在垂直于路径方向上有分量F',而且此点势能梯度方向不垂直于此点处路径的切线,即F'不会被完全投影掉,F'力的分量F(DNEB)将继续带着这个点移动,也就是说结构点就不在正确的MEP上了。只有当结构点所处路径恰为直线,即F'为0则不会有此问题。为了解决此问题有人将开关函数加入到DNEB,称为swDNEB,当结果越接近收敛,即垂直于路径的势能力越小的时候,F(DNEB)也越小,以免它使结构点偏离正确MEP。一些研究表明DNEB和swDNEB相比NEB在收敛性(结构点受力最大值随步数降低速度)方面并没有明显提升,DNEB难以收敛到较高精度以内,容易一直震荡。 6.8 String方法 与NEB对力的投影定义一致,但点之间没有弹簧势连接,保持点的间距的方法是每步优化后使这些点在路径上平均分布。 6.9 Simplified String方法 String中计算每个点的切线并投影掉势能力平行于路径的分量的过程也去掉了,所有点之间用三次样条插值来表述路径,每一个点根据实际势能力运动后,在路径上重新均匀分布。优化方法最好结合RK4方法。NEB在点数较小的情况下比Simplified String方法能在更短时间内收敛到更高精度,但点数较多情况下则Simplified String更占优势。 6.10 寻找过渡态的chain-of-state方法 除非势能面对称且结构点数目为奇数,否则不会有结构点恰好落在过渡态。以能量最高的点作为过渡态只是近似的,为了更好地描述过渡态,可以增加结构点数,或者增加局部弹簧力常数,使过渡态附近点更密。根据已得到的点的能量,通过插值方法估算能量最高点是另一个办法。近似的过渡态也可以作为QN法的初猜寻找准确的过渡态。 6.10.1 CI-NEB方法 NEB与String等方法都可以结合Climbing Image方法,它专门考虑到了定位过渡态问题。CI-NEB与NEB的关键区别是能量最高的点受力的定义,在CI-NEB中这个点不会受到相邻点的弹簧力,避免位置被拉离过渡态,而且将此点平行于路径方向的势能力分量的符号反转,促使此点沿着路径往能量升高的方向上爬到过渡态。这个方法只需要很少的点,比如包含初、末态总共5个甚至3个点就能准确定位过渡态,是最有效率的寻找过渡态的方法之一。如果还需要精确描述MEP,可以在此过渡态上使用Stepwise descent方法、最陡下降法、RK4等方法沿势能面下坡走出MEP,整个过程比直接使用很多点的NEB方法能在更短时间内得到更准确的MEP。 6.10.2 ANEBA方法(adaptive nudged elastic band approach) 这个方法也是基于NEB,专用来快速寻找过渡态。一般想得到高精度的过渡态区域,NEB的链子上必须包含很多点,耗费计算时间。而ANEBA方法中链子两端的位置不是固定的,而是不断地将它们移动到离过渡态更近的位置,仅用很少几个点的链子就可以达到同样的精度。具体来说,设链子两端的点分别叫A点和B点(对于第一步就是反应物和产物位置),先照常做NEB,收敛至一定精度后(不需要精度太高),改变A和B的位置为链子中能量最高点相邻的两个点,然后再优化并收敛至一定精度,再如此改变A和B的位置,反复经历这一步骤,最终链子上能量最高点就是精确的过渡态。ANEBA相当于不断增加原先NEB链子的过渡态附近的点数,但实际上点数没有变。有研究表明ANEBA比CI-NEB效率更高,如果结合ANEBA与CI(称CI-ANEBA),即先用ANEBA方法经上述步骤移动几次A、B点,使之聚焦到过渡态附近,再用CI-NEB方法,效率可以进一步提高。 ANEBA方法示意图 6.11 chain-of-states方法的一些特点 NEB方法的设定只是决定了每一步结构点实际感受到的势能面是怎么构成的,并没有指定优化方法。NEB可以结合一些常见的优化方法,比如最陡下降法、共轭梯度法、quick-min、FIRE、L-BFGS法等(没有线搜索步的全局L-BFGS法效率一般最高),但只能像前述寻找IRC方法一样得到一条路径。实际上很多情况反应的路径不止一条,尤其是势能面复杂的大分子构象转变过程。当NEB结合构象搜索方法,比如分子动力学、蒙特卡罗等方法时,就可以用于寻找多条反应路径。例如有几条反应路径,彼此间都有一定高度的势垒分隔,如果初始给出的路径在第i条附近,优化后只能收敛到第i条路径,若对每个点使用分子动力学方法,设定一定温度,则这些点有机会凭借动能越过势垒到达另外一条路径k附近,随后逐渐降温减小动能,相当于对它们进行最陡下降法优化,就找到了第k条路径,若如此反复多次,有可能找到更多路径。 这类chain-of-states方法的优点还在于易于实现,算法简单,只有能量和其一阶导数是必须要算的,随着体系尺度增大计算量的增加远比基于Hessian矩阵的方法要小。对于大体系储存Hessian并求逆亦是困难的,在某些情况下Hessian矩阵受计算能力制约只能在低水平方法下得到或者无法获得,chain-of-states方法避免了这个问题,很适合用于分子力学研究 生物 大分子的结构变化路径以及平面波基组下的DFT方法研究固体表面化学反应。此方法也容易并行化,例如可以每个节点负责优化其中一个或几个点,只有计算弹簧力时才需要从另外节点传入相邻结构点坐标,数据通信量小,并行效率高。 6.12 高斯中opt关键字的path=M方法 与chain-of-states方法有一定类似之处,可以在一次计算中获得优化后的过渡态、产物、反应物以及用于描述IRC的中间点结构,总共M个点。此方法须结合QST2或QST3关键字。结合QST2时,除反应物和产物以外剩下的M-2个点在二者冗余内坐标下线性插值产生,结合QST3则是剩下的M-3个点在反应物与过渡态、过渡态与产物之间插值产生。之后迭代的每一步主要分为以下几个步骤:(1)初始输入的反应物、产物通过RFO法向最优构型优化。(2)能量最高的点q(k)(此点在第一步确定)通过EF法向过渡态优化,并设一段圆弧通过q(k-1)、q(k)、q(k+1),此圆弧在q(i)处的切线作为EF方法选择所跟踪的本征向量的引导,类似于STQN步。(3)其余的点执行微迭代步骤(迭代内的迭代),其中包含类似于GS法的球面优化步骤以及调整间距步骤。可参考图14,优化其中任意点q(i)前,首先获得经过q(i-1)、q(i)并与q(i-1)的梯度相切的圆弧或曲线,将其在q(i)处的切线定义为T(i),然后定义一个在q(i)处法线与T(i)平行、经过q(i-1)与q(i)的球面,使q(i)限制在此球面上优化。然后在这些点依次相连的路径上调整这些点的间距至平均,之后重复微迭代直至每一步力和位移都已收敛,或者有任何点位移超过了置信半径。(4)检查力和位移是否都已收敛至标准。这个方法比单独优化反应物、产物、过渡态并计算IRC省时间,而且对于难找的过渡态比STQN法更容易成功。 6.13 CPK方法(Conjugate Peak Refinement) 在某种意义上称为动态的chain-of-states方法。每条链子只含一个可动点,链子数由最初的一条开始不断增加,对MEP的描述也越来越精确。CPK中的第一步类似LST,在连接反应物和产物的直线中找到能量最高点(称为Peak),然后沿着共轭方向优化得到中间点,对中间点与反应物、中间点与产物分别再做上述步骤,先找到最大点再共轭优化,如此反复直到收敛。最后将反应物、产物以及执行CPK过程中所有优化后的点相连,就得到了近似的反应路径。CPK方法所得的反应路径可以经过很多过渡态,很适合寻找一些涉及到复杂结构重排、包含甚至上百个过渡态的构象变化路径,如 蛋白 质局部折叠/去折叠过程。CPK方法缺点是实现起来相对复杂,定位过渡态较为费时。 CPK方法示意图
个人分类: 原理|5544 次阅读|0 个评论
[转载]Phonon计算方法的选用
ywmucn 2011-9-17 23:56
转自: http://i.eol.cn/blog_read.php?topicid=693401 有三个方法: Linear Response Theory Frozen Phonon method Finite Displacement method Linear response 方法(或者称为 density perturbation functional theory , DFPT ),直接计算出原子的移动而导致 的势场变化,再进一步构造出动力学矩阵。这种方法在计算谱时, Born effective charge (对极性的材料)和声子谱都能计算出。 现在很流行, CASTEP ,Quantum-Expresso,Abinit等等都在用,后面两个原理差不多; Linear Response 优点: 晶体晶胞没有大小限制,即使用包含一个原子的Primitive cell,计算得到的Dynamical Matrix也是很准确的,主要原理:Hellmann-Feymann theorem and Perturbation theory, 原子施加很小的位移,计算波函数, 电子 密度对位移的响应函数,主要方法见Gonze1997年的两个PRB文章。计算速度一般,特别是采用Normal Conserving PPs的时候,单原子晶胞RAM占用量在3-4G之间,CASTEP里面只支持NCPP的Linear response 计算,USPPs不支持。 另外一个是Finite displacement (直接的方法): 构造超原胞,把原子移动一下,计算原胞中所有原子所受的力(这个根据体系的周期性,要多移动几个原子),然后根据这个力构造力常数矩阵。 而且一般情况下对 LO-TO 的 split 不能计算出(只有在计算了 Born effective charge 之后, 进一步考虑了 non-analyticity term ,才能计算出)。phonon, phonony等就是结合vasp或者其他计算软件如wien2k等计算声子谱的。 Finite displacement 优点: RAM占用量和计算量在Cell一样的情况下,可节约2倍的RAM和CPU时间,但这个方法最大的缺点是需要生成一个Supercell 来获得比较可靠的力常数,虽然鉴于力常数是短程 作用 ,在最邻近原子以外衰减很快,但所需要的Supercell大小也很大,一般截止半径大小是4A以上,对于金属这个半径可能会小一下,因为金属的电子Coulomb屏蔽很显著,但对于其他的晶体结构,以及晶体结构较复杂的体系,这种方法自动生成的Cell一般都包含100原子以上,基本上没有人能采用单机计算Phonon, 如BCC, Ba元素,Primitive cell只包含一个原子, %BLOCK LATTICE_CART -2.445170154155672 2.445170154155674 2.445170154155673 2.445170154155672 -2.445170154155673 2.445170154155673 2.445170154155672 2.445170154155672 -2.445170154155672 %ENDBLOCK LATTICE_CART %BLOCK POSITIONS_FRAC Ba 0.0000000000000000 0.0000000000000000 0.0000000000000000 在采用有限位移方法计算 声子 时晶胞是: %BLOCK PHONON_SUPERCELL_MATRIX 2 0 0 0 2 0 0 0 2 即2*2*2的supercell,里面包含8个Ba原子,采用AMD Dual Core,2G RAM,计算需要2h左右即可完成。 另外一个最大的优点是可以用Ultra soft Pseudo potentials, 这个可以极大的节约时间,减小kinetic energy curoff数值。 Finite Displacement方法只计算Brillouin Zone G点的Normal Modes,其他k点的Dynamical Matrix利用Fourier Transofrmation得到,C(k)=Sum C(R)*Exp(-ikR),只要Cell足够大,可以获得和Linear Response 一样可靠的Dynamical Matrix。 Linear Response计算有带隙的晶体最好,也是最省事的方法,但计算金属,采用Finite element方法最好,Linear response对金属体系基本上失效的。 可能原因: Perturbation theory本身对于金属不成立(金属能隙太小); Fermi 面Smearing方法本身对计算力常数不利;(目前有几个常用的Smeaing方法,Gaussan函数,或者有限 温度 下的Fermi Dirac函数) 后者基本上可以排除,采用Linear response,同事采用NCPP+fix occupation的方法计算得到的Phonon和NCPP+ Smearing方法是一样子的,因此可以推断是Linear Response theory对metal不适用,CASTEP小组在其网页上也指出Lnear Response theory对Magnetic和Metal不适用。因此CASTEP不支持金属体系NCPP+Linear Response计算,也是有原因的。 采用Quantum-Expresso计算PHONON,可以完全得到与CASTEP一致的结论,即Linear Response不适用于金属体系 。 下面给出Na的例子,有实验数据,势函数计算 结果 ,NCPP+ Linear response,USPP+Finite element 结果 ,可以看到Linear response精度连势函数都不如,数值完全是错误的 声子计算的几种方法: 转自: http://emuch.net/html/200802/723527.html Practical schemes for phonon calculations (见castep说明) A good review of the existing schemes can be found in Baroni et al. (2001). The theoretical study of phonon properties has to rely on one of the three available methods for determining the force constants matrix: analytical calculations, supercell calculations or linear response calculations. The analytical approach is only viable when the energy model is sufficiently simple to allow a direct evaluation of the second derivatives of the energy with respect to atomic displacements (e.g., empirical pair potential models). Therefore, it is unsuitable for first principles calculations. Further alternatives such as extracting vibrational properties from molecular dynamics runs (Arias et al. 1992) are less transparent and noticeably more expensive. The supercell method involves perturbing the positions of the atoms slightly and calculating the reaction forces (Ackland et al. 1997). It is necessary to use supercells of the original cell when interatomic interaction in the system is long ranged. The main advantage of this method (and of the closely related frozen phonon technique) is that there is no need for a new formalism; any total energy scheme like CASTEP can be used to evaluate the forces at a number of carefully selected distorted configurations. The original frozen phonon scheme requires a displacement with the given wave vector and has been successfully used since the early 1980s (Yin and Cohen 1982, Ho et al. 1984). The force constants matrix evaluation in this formalism has been used to calculate interplanar force constants (Wei and Chou 1994) and thus phonon dispersion along high symmetry directions. More recent applications are based on the full reconstruction of the force constants matrix (Ackland et al. 1997, Parlinski et al. 1997, and references in Baroni et al. 2001). Linear response calculations seek to evaluate the dynamical matrix directly for a set of q vectors. The starting point of the linear response approach is evaluation of the second-order change in the total energy induced by atomic displacements. The main advantage of the scheme is that there is no need to artificially increase the cell size in order to accommodate small values of the q vectors, as in the frozen phonon method, or to overcome the long range interaction problem (force constants matrix from supercell calculations). A more detailed description of the linear response method can be found in Baroni et al. 2001. The CASTEP implementation is described in the Linear Response topic. 第一性原理计算声子方法及常见程序: 一,直接法: 直接法,或称frozen-phonon方法,是通过在优化后的平衡结构中引入原子位移,计算作用在原子上的Hellmann-Feynman力,进而由动力学矩阵算出声子色散曲线。用该方法计算声子色散曲线最早开始于80年代初。由于计算简便,不需要特别编写的计算程序,很多小组都采用直接法计算材料性质。直接法的缺陷在于它要求声子波矢与原胞边界(super size)正交,或者原胞足够大使得Hellmann-Feynman力在原胞外可以忽略不计。这使得对于复杂系统,如对称性高的晶体、合金、超晶格等材料需要采用超原胞。超原胞的采用使计算量急剧增加,极大的限制了该方法的使用。这种方法不能很好的预言LO-TO splitting,只有在计算了Born effective charge和dielectric constant之后,进一步考虑了 non-analyticity term,才能计算出;但Direct Method本身并不能给出Born effective charge和dielectric constant.所以这也是它的一个缺陷.目前,vasp+phonon用的就是这种方法. vasp+phonon(或者PHON或者fropho) VASP能计算声子谱的都是采用一种直接的方法:构造超原胞,把原子移动一下,计算原胞中所有原子所受的力(这个根据体系的周期性,要多移动几个原子),然后根据这个力构造力常数矩阵。 1,PHONON Software by Krzysztof PARLINSKI Phonon is a software (see list of Publications) for calculating phonon dispersion curves, and phonon density spectra of crystals, crystals with defects, surfaces, adsorbed atoms on surfaces, etc. from either a set of force constants, or from a set of Hellmann-Feynman forces calculated within an ab initio program (not included). One can use VASP, Wien2k, MedeA of Materials Design , Siesta, or other ab initio code which is able to optimize a supercell and calculate the Hellmann-Feynman forces. Phonon builds a crystal structure, using one of the 230 crystallographic space groups, finds the force constant from the Hellmann-Feynman forces, builds the dynamical matrix, diagonalizes it, and calculates the phonon dispersion relations, and their intensities. Phonon finds the polarization vectors, and the irreducible representations (Gamma point) of phonon modes, and calculates the total and partial phonon density of states. It plots the internal energy, free energy, entropy, heat capacity and tensor of mean square displacements (Debey-Waller factor). Phonon finds the dynamical structure factor for the coherent inelastic neutron scattering and the incoherent doubly differential scattering cross section for a single crystal and polycrystal. For polar cystals the LO/TO mode splitting can be included. Homepage: http://wolf.ifj.edu.pl/phonon/index.html 2,PHON A program to calculate phonons using the small displacement method This program calculates force constant matrices and phonon frequencies in crystals. From the frequencies it also calculates various thermodynamic quantities, like Helmholtz free energy, entropy, specific heat and internal energy of the harmonic crystal. The procedure similar to the one described in Ref. , i.e. is based on the small displacement method. It needs a code capable to calculate forces on the atoms of the crystal. Homepage: http://chianti.geol.ucl.ac.uk/~dario/ E-mail: d.alfe@ucl.ac.uk Telephone: +44 (0)20 7679 2361 Fax: +44 (0)20 7679 5166 3,fropho is the open source implementation of the frozen phonon method. Function: Phonon band structure Phonon DOS (Vibrational spectra) Thermal properties Mulliken notation assignment of vibration mode fropho is the frozen phonon analyzer mainly for first principles (ab initio) calculation. Periodic boundary condition is assumed. fropho gives good combinations with VASP code or another codes which can derive Hellmann-Feynman forces. Homepage: http://fropho.sourceforge.net/ Download: http://sourceforge.net ... oup_id=161614 Contact: atz.togo@gmail.com Authour: Atsushi Togo 二,DFPT方法: 1987年,Baroni、Giannozzi和Testa提出了一种新的晶格动力学性质计算方法--微扰密度泛函方法(Density Function Perturbation Theory)。DFPT通过计算系统能量对外场微扰的响应来求出晶格动力学性质。该方法最大的优势在于它不限定微扰的波矢与原胞边界(super size)正交,不需要超原胞也可以对任意波矢求解。因此可以应用到复杂材料性质的计算上。此外,能量对外场微扰的响应不仅可以推导出声子的晶体性质,还能求出弹性系数、声子展宽、拉曼散射截面等性质,这种方法本身就能算出Born effective charge dielectric constant,可以很好的预言LO-TO splitting甚至Kohn anomalies。这些优势使 得DFPT一经提出就被广泛应用到了半导体、金属和合金、超导体等材料的计算上。 比较常用的程序是pwscf和abinit,castep等采用的是一种linear response theory 的方法(或者称为 density perturbation functional theory,DFPT),直接计算出原子的移动而导致 的势场变化,再进一步构造出动力学矩阵。
个人分类: VASP|5161 次阅读|1 个评论
期刊影响因子的计算
harmonica028 2011-7-18 12:01
用户咨询:期刊《 INTERNATIONAL JOURNAL OF SUSTAINABLE DEVELOPMENT AND WORLD ECOLOGY 》2010年的文章数为68篇,为什么计算影响因子的时候只算了64篇? 用户说还挺急的,等着回复, 手忙脚乱地现查了一通,完全是临时抱佛脚 Web of Knowledge网站上有关于影响因子计算的详细介绍 其实影响因子(Impact Factor)的计算并不涉及当年的文章数,其计算方法为前两年文章在当年的引用次数除以前两年的文章数;涉及到当年文章数的是即年指标(Immediacy Index),计算方法为当年文章在当年被引用的次数除以当年的文章数。用户问题中提到的“68”和“64”,就出现在这个地方。 经检索,2010年该刊文章数确实为68篇。 查68篇文献的类型,发现其中62篇为article,2篇为review,3篇为editorial material,1篇为correction。JCR中“64”对应的是citable items,那么推测editorial material和correction应该就是uncitable的啦
个人分类: 工作笔记|9568 次阅读|0 个评论
[转载]过渡态、反应路径的计算方法及相关问题
cathysmurf 2011-6-20 15:02
过渡态、反应路径的计算方法及相关问题 http://www.mdbbs.org/viewthread.php?tid=17170 PS:本文是我写过的最耗时(24天)、字数最多(两万五千余字)、最辛苦的帖子。 图片较多,不知什么时候图片会都变成红叉,重新贴太麻烦,所以图片全都打包,若看不见图片请 下载 图片包: http://www.brsbox.com/filebox/down/fc/5678ba823274826535f67b0b98ec6fc0 过渡态、反应路径的计算方法及相关问题 Sobereva Department of Chemistry, University of Science and Technology Beijing, Beijing 100083, China 前言:本文主要介绍过渡态、反应路径的计算方法,并 讨论 相关问题。由于这类算法极多,可以互相组合,限于精力不可能面面俱到展开,所以只介绍常用,或者实用价值有限但有启发性的方法。文中图片来自相关 文献 ,做了一定修改。由于本文作为帖子发布,文中无法插入复杂公式,故文中尽量将公式转化为文字描述并加以解释,这样必然不如公式形式严谨,而且过于复杂的公式只能略过,但我想这样做的好处是更易把握方法的梗概,有兴趣可以进一步阅读原文了解细节。对于Gaussian中可以实现的方法,文中对其在Gaussian中的使用进行了一些讨论,希望能纠正一些网上流传的误区。虽然绝大多数人不专门 研究 计算方法,其中很多方法也不会用到,但多了解一下对开阔思路是很有好处的。 文中指的“反应”包括构象变化、异构化、单 分子 反应等任何涉及到过渡态的变化过程。“反应物”与“产物”泛指这些过程的初态和末态。“优化”若未注明,包括优化至极小点和优化至过渡态。势能面是高维的,但为了直观以及表述方便,文中一般用二维势能面 模型 来讨论,应推广至高维情况。限于纯文本格式,向量、矩阵无法加粗表示,但容易自行判断。 目录: 1.过渡态 2.过渡态搜索算法 2.1 基于初猜 结构 的算法 2.1.1 牛顿-拉弗森法(Newton-Raphson,NR)与准牛顿法(quasi-Newton,QN) 2.1.2 AH方法(augmented Hessian) 2.1.2.1 RFO法(Rational Function Optimization,有理 函数 优化) 2.1.2.2 P-RFO法(Partitioned-RFO) 2.1.2.3 QA法(Quadratic Approximation,二次逼近) 2.1.2.4 TRIM法(trust-region image minimization,置信区域镜像最小化) 2.1.2.5 在 高斯 中的常见问题 2.1.3 GDIIS法(Geometry Direct Inversion in the Iterative Subspace) 2.1.4 梯度模优化(gradient norm minimization) 2.1.5 Dimer方法 2.2 基于反应物与产物结构的算法 2.2.1 同步转变方法(synchronous transit,ST) 2.2.2 STQN方法(Combined Synchronous Transit and Quasi-Newton Methods) 2.2.3 赝坐标法(pseudo reaction coordinate) 2.2.4 DHS方法(Dewar-Healy-Stewart,亦称Saddle方法)与LTP方法(Line-Then-Plane) 2.2.5 Ridge方法 2.2.6 Step-and-Slide方法 2.2.7 Müller-Brown方法 2.2.8 CI-NEB、ANEBA方法 2.3 基于反应物结构的算法 2.3.1 最缓上升法(least steep ascent,shallowest ascent) 2.3.2 本征向量/本征值跟踪法(eigenvector/eigenvalue following,EF。也称mode walking/mode following/Walking up valleys) 2.3.3 ARTn(activation-relaxation technique nouveau) 2.3.4 梯度极值法(Gradient extremal,GE) 2.3.5 约化梯度跟踪(reduced gradient following,RGF) 2.3.6 等势面搜索法(Isopotenial Searching) 2.3.7 球形优化(Sphere optimization) 2.4 全势能面扫描 3.过渡态相关问题 3.1 无过渡态的反应途径(barrierless reaction pathways) 3.2 Hammond-Leffler假设 3.2 对称性问题 3.3 溶剂效应 3.4 计算过渡态的建议流程 4.内禀反应坐标(intrinsic reaction coordinate,IRC) 5.IRC算法 5.1 最陡下降法(Steepest descent) 5.2 IMK方法(Ishida-Morokuma-Kormornicki) 5.3 Müller-Brown方法 5.4 GS(Gonzalez-Schlegel)方法 6.chain-of-states方法 6.1 Drag method方法 6.2 PEB方法(plain elastic band) 6.3 Elber-Karplus方法 6.4 SPW方法(Self-Penalty Walk) 6.5 LUP方法(Locally Updated planes) 6.6 NEB方法(Nudged Elastic Band) 6.7 DNEB方法(Double Nudged Elastic Band) 6.8 String方法 6.9 Simplified String方法 6.10 寻找过渡态的chain-of-state方法 6.10.1 CI-NEB方法 6.10.2 ANEBA方法(adaptive nudged elastic band approach) 6.11 chain-of-states方法的一些特点 6.12 高斯中opt关键字的path=M方法 6.13 CPK方法(Conjugate Peak Refinement) http://www.mdbbs.org/viewthread.php?tid=17170
3625 次阅读|0 个评论
议震级-频度经验公式中b值的计算方法
热度 1 qsqhopeiggcas 2011-6-5 04:52
1954 年 , 古登堡 和里克特,首先提出使用震级-频度的经验公式来描述世界各地区地震活动性的差异,这个公式的常用形式(简称 G-R 关系)为: lg N ( M )=ɑ- bM , 式中 N ( M ) 是以震级 M 为中心的小区间 ( M ± △M ) 在一定时期内发生地震的次数; ɑ 和 b 是常数, ɑ 表征在统计时间、区域内的地震活动水平 , b 值表示该地大小地震数的比例关系,大地震数目相对多时, b 值则小, b 值大小和该地区的介质强度以及应力大小有关。古登堡等对全球地震统计得到:在 环太平洋 岛弧地带 , ɑ 和 b 值均高;大陆内部, ɑ 、 b 值较低。 震级与频度关系 lg N = a - bM ,是地震学者研究地震活动性时引用最多的一个经验关系式,而且在地震预报和地震危险性分析中也得到了广泛的应用。在计算 b 值时,根据一定时空范围内的地震目录数据,采用最小二乘法或其它数学统计方法确定。 仔细推敲,以前常用的 b 值计算方法存在如下问题: 1 、 b 值的计算与统计的空间范围有关,选择的空间范围不同,得到的 b 值肯定不同。正确的方法应选择特定孕震区域范围内的地震事件,由于过去无法划分这样的孕震区域,故 b 值计算结果有很大的人为性。 2 、 b 值的计算与统计的时间起点有关,正确的方法应统计在一个特定的孕震区域内、一个孕震周期内的地震事件。由于过去无法确定其时间起点,故 b 值计算结果有很大的人为性。 鉴于 b 值计算结果的不确定性,在用 b 值进行强震预测时应小心从事。
个人分类: 科研随想|11022 次阅读|4 个评论
[转载]GROMACS特性与机群架构
yuanhui80 2011-6-4 12:44
在生物制药与纳米材料研究领域中,分子动力学模拟计算方法有着广泛的应用,其是在原子、分子水平上求解多体问题的重要计算机模拟方法,可以预测纳米尺度上的动力学特性。通过求解所有粒子的运动方程,分子动力学模拟法可以用于模拟与原子运动路径相关的基本过程。在模拟计算应用早期,由于受计算机技术的制约,这些模拟的模型尺寸和时间均受到了限制,模拟研究的范围也有很大的局限。上世纪80年代后,随着计算机技术的飞速发展,这些限制逐渐减少,激发了分子动力学研究的高潮,被广泛的应用于新型材料研制、化学工艺模拟、大分子生物制药等领域,成为微观模拟的一个主流技术。 而在这些应用软件中,GROMACS进行了大量的算法的优化,使其计算功能更强大。例如:在计算矩阵的逆时,算法的内循环会根据你自身系统的特点自动选择由C语言或Fortran来编译。GROMACS中对Altivec loops的计算,无论是在Linux还是Mac OS X.系统上,它都要比其它软件快3-10倍 ,而且GROMACS提高计算速度并不以牺牲计算精度为代价。 GROMACS软件的计算优势使其对运行平台有着独特的需求。首先,GROMACS是计算密集型的程序,浮点运算量很大。在通信网络不是瓶颈的情况下,CPU的利用率比较高,通常可以达到98%以上。但GROMACS程序对内存的要求很小,模拟一个原子数目为12000的系统,需要的内存大概为10MB。其次,GROMACS软件有两种应用方式,即传统MD方式和REMD方式。传统MD方式中,进程之间的通信比较频繁。使用高端的通信网络(Myrinet,Infiniband等)可以提高程序的并行加速比,提高并行计算的效率。REMD方式中,进程之间的通信量很小,使用千兆以太网就完全可以满足通信的要求,不必要使用高端的通信网络。并且,GROMACS软件运行时的输入文件和输出文件都不是很大,对I/O没有特别的要求。 根据GROMACS软件的应用特点,定制化的基于GROMACS软件的高性能集群方案。系统整体包括用于运算的计算节点、负责系统管理和外部接入的管理节点,和连接磁盘阵列提供网络共享文件系统的存储节点等模块。系统中的计算网络将所有节点通过千兆以太网或高端网络进行连接,管理网络配合机群中间件对机群实现统一的管理,用户同时可通过SKVM网络对系统实现远程控制管理。整套系统的节点数量可根据用户具体需求而定,具有较大弹性,面对软件的运行要求,系统节点是X86体系,可支持各种Linux操作系统,采用目前高性能计算机的主流架构,具有良好的普适性。 制定机群方案前对GROMACS软件的运行进行了大量的测试工作,结果显示,GROMACS软件的性能基本上和CPU主频成线性关系。对于用户来说,要使软件合理运行,需要找到一个性价比平衡点。在系统对GROMACS软件进行编译时,只需要指定使用MPI,就可以使用并行的GROMACS程序。但在相同系统环境下,编译器对软件性能也有直接的影响,通过测试,GCC编译器在此类应用中略胜一筹。 通常情况下,一个中等规模的GROMACS应用机群系统采用曙光TC4000A机柜,含有内部网络布线系统、散热系统、供电系统。计算节点采用曙光A610r-F服务器,配备2×Opteron2214双核CPU,4GB DDR2内存,73GB 热插拔SCSI硬盘,集成2个10/100/1000M以太网接口。该款产品做为计算节点可轻松应对软件对内存及I/O负荷的需求,同时该款双路双核产品表现出的优越计算性能可满足软件频繁、复杂的浮点运算需求。 整套系统中的所有运算节点和管理节点都挂接在管理网络中,通过光纤交换机与高端的磁盘阵列柜相连。在系统工作时,所有节点及I/O设备由管理网络进行统一调配,协调运行,极大的提高了运行效率。同时,系统中的所有运算节点通过计算网络相连,计算任务通过计算网络在各节点间进行分配。整套系统中的管理网络和计算网络均为千兆以太网,可轻松满足软件运行的工作带宽,保证网络工作的稳定性和安全性。
3081 次阅读|0 个评论
[转载]如何由某年现价GDP求不变价GDP
热度 1 wss333 2011-5-23 18:14
———————————————————————————— (转载 http://luoqing518.blog.163.com/blog/static/12729827200882795115381/ ) GDP可以分为现价GDP与不变价GDP,真实GDP等于现价GDP除以GDP平减指数,然而在统计年鉴中,并没有直接给出GDP平减指数以及计算方法,下面我们对GDP平减指数的计算方法作以简要介绍: GDP平减指数等于现价GDP除以不变价GDP,若1978年的指数为100,1979年的GDP指数为107.6,是指与1978年相比,按可比价计算,GDP增加了7.6%,1978年的GDP为3624.1,则按不变价计算,1979年的GDP等于3624.1乘以107.6等于3899.53,则1979年的平减指数为现价(1979)4038.2/3899.53=103.56,据此计算,则GDP平减指数及真实GDP如下表: 年份 现价GDP 指数(%) 不变价GDP 平减指数(%) 真实GDP 1978 3624.10 100.00 3624.10 100.00 3624.10 1979 4038.20 107.60 3899.53 103.56 3899.53 1980 4517.80 116.00 4203.96 107.47 4203.96 1981 4862.40 122.10 4425.03 109.88 4425.03 1982 5294.70 133.10 4823.68 109.76 4823.68 1983 5934.50 147.60 5349.17 110.94 5349.17 1984 7171.00 170.00 6160.97 116.39 6160.97 1985 8964.40 192.90 6990.89 128.23 6990.89 1986 10202.20 210.00 7610.61 134.05 7610.61 1987 11962.50 234.30 8491.27 140.88 8491.27 1988 14928.30 260.70 9448.03 158.00 9448.03 1989 16909.20 271.30 9832.18 171.98 9832.18   在一些计算中,一些文章喜换算换成1990年为100的不变价计算真实GDP,此方法其实是假定1990年的指数为100进行计算,例如,1990年的现价GDP=18547.9,1990年的指数为281.7,1996年的指数为544.1,则以1990=100,1996年的价格指数为544.1/281.7*100%=193.1,则1996年不变价的GDP为1854.79*193.1%=35815.99,则1996年平减指数为67884.6/35815.99*100%=185.9,如此计算,可以得到1990=100的GDP平减指数,其计算结果如下表: 年份 现价GDP 1978=100 1990=100 不变价GDP(1990=100) 平减指数 真实GDP 1978 3624.10 100.0 35.5 6584.2740555.04 6584.27 1979 4038.20 107.6 38.2 7084.67887857.00 7084.68 1980 4517.80 116.0 41.2 7637.757898 59.15 7637.76 1981 4862.40 122.1 43.3 8039.398616 60.48 8039.40 1982 5294.70 133.1 47.2 8763.668761 60.42 8763.67 1983 5934.50 147.6 52.4 9718.388498 61.06 9718.39 1984 7171.00 170.0 60.3 11193.26589 64.07 11193.27 1985 8964.40 192.9 68.5 12701.06464 70.58 12701.06 1986 10202.20 210.0 74.5 13826.97551 73.78 13826.98 1987 11962.50 234.3 83.2 15426.9541 77.54 15426.95 1988 14928.30 260.7 92.5 17165.20245 86.97 17165.20 1989 16909.20 271.3 96.3 17863.1355 94.66 17863.14 1990 18547.90 281.7 100.0 18547.9 100.00 18547.90 1991 21617.80 307.6 109.2 20253.22698 106.74 20253.23 1992 26638.10 351.4 124.7 23137.13901 115.13 23137.14 1993 34634.40 398.8 141.6 26258.08491 131.90 26258.08 1994 46759.40 449.3 159.5 29583.14331 158.06 29583.14 1995 58478.10 496.5 176.3 32690.92066 178.88 32690.92 1996 67884.60 544.1 193.1 35825.03511 189.49 35825.04 1997 74462.60 592.2 210.2 38992.07093 190.97 38992.07 1998 78345.20 638.5 226.7 42040.69193 186.36 42040.69 1999 82067.46 684.1 242.8 45042.77333 182.20 45042.77 2000 89468.10 738.8 262.3 48644.61668 183.92 48644.62 2001 97314.80 794.2 281.9 52292.30451 186.10 52292.30 2002 105172.34 860.1 305.3 56631.34111 185.71 56631.34   实际GDP,或者统计局以往公布的实际GDP,或者叫GDP1978不变价,1990不变价,都是有一个比较年份的,有了名义GDP和不变价格计算的GDP指数,你可以计算出以任何一年为标准的不变价格GDP,比如说现在IMF等都已经使用2000或者2005年不变价,目的在于和现在距离比较近,比较起来和现在的当年价不至于有太大的差异~~   至于应用方面,名义GDP基本上都是I(2)的,实际GDP几乎都是I(1)的,所以在时序分析的时候用GDP增长率就平稳了,简单而巧妙的处理~~ —————————————————————————————————— 最后一句没看明白I(2)I(1)是什么意思
13535 次阅读|1 个评论
[转载]MATLAB程序精确法求解反应谱
ChenboBlog 2011-5-22 11:33
引用网址 http://hi.baidu.com/linshibin/blog/item/7ef00789d134dad8fd1f1026.html 1. 反应谱的概念 反应谱是在1932年由M.A.Biot引入的,它是用来描述地面运动及其对结构的效应的一种实用工具。现在,反应谱作为地震工程的核心概念,提供了一种方便的手段概括所有可能的线性单自由度体系对地面运动的某个特定分量的峰值反应。它还提供了一种实用的方法,将结构动力学的知识应用于结构的设计以及建筑规范中侧向力条文的制定。 某个反应量的峰值作为体系的固有振动周期Tn,(或者循环频率fn)那样的相关参数的函数图形,称为该反应量的反应谱。每一个这样的图形针对的是有一个具有固定阻尼比的单自由度体系,多个具有不同阻尼比的这类图形联合起来就能覆盖实际结构中遇到的阻尼值范围。 2. 反应谱的计算 2.1反应谱数值计算方法 计算反应谱的方法有很多,又卷积计算法,傅立叶变换法,线性加速度法,中点加速度法,精确法等。 2.2精确法 本文中采用精确法做计算,该方法是N.C.Nigam和P.C.Jennings于1969年提出的,此法的出发点是把地面运动的加速度记录相邻点间的值用分段线性差值表示,从而获得地面运动的连续表达式。基于方程本身基础上进行,得到的结果全部采用精确的分析方法,没有任何的舍入误差,也不会产生任何的截断误差,所谓精确法就是指在这个意义上式精确的而然。正因为这种方法不会引起数值计算的误差,所以它有较高的精度,只要进行较少的运算就可以达到采用其他方法需要较多次运算才能达到的精度。 “由于在sohu博客上的文章发表后,陆续有问参考文献的邮件,因此将参考文献pdf版放上来供大家学习、参考,请勿用于商业目的。下载链接见 地震动的谱分析入门 http://hi.baidu.com/linshibin/blog/item/3b03ce3482f6aed6a3cc2b15.html 强震观测与分析原理 http://hi.baidu.com/linshibin/blog/item/4a02ad3acd7c692fb8998f01.html ” ResponSespectrumProgram(精确法求解) %%%%%%%%%%%%%%%%%%%%% 反应谱 精确法 程序 Begin With matlab6.5%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% clear % ***********读入地震记录*********** fid = fopen('CHI010.txt'); = fscanf(fid,'%g'); %count 读入的记录的量 Accelerate=9.8*Accelerate'; %单位统一为 m和s time=0:0.005:(count-1)*0.005; %单位 s % ***********精确法计算各反应*********** %初始化各储存向量 Displace=zeros(1,count); %相对位移 Velocity=zeros(1,count); %相对速度 AbsAcce=zeros(1,count); %绝对加速度 % ***********A,B矩阵*********** DampA= ; %三个阻尼比 TA=0.0:0.05:6; %TA=0.000001:0.02:6; %结构周期 Dt=0.005; %地震记录的步长 %记录计算得到的反应,MDis为某阻尼时最大相对位移,MVel为某阻尼 %时最大相对速度,MAcc某阻尼时最大绝对加速度,用于画图 MDis=zeros(3,length(TA)); MVel=zeros(3,length(TA)); MAcc=zeros(3,length(TA)); j=1; %在下一个循环中控制不同的阻尼比 for Damp= t=1; %在下一个循环中控制不同的结构自振周期 for T=0.0:0.05:6 Frcy=2*pi/T ; %结构自振频率 DamFrcy=Frcy*sqrt(1-Damp*Damp); %计算公式化简 e_t=exp(-Damp*Frcy*Dt); s=sin(DamFrcy*Dt); c=cos(DamFrcy*Dt); A=zeros(2,2); A(1,1)=e_t*(s*Damp/sqrt(1-Damp*Damp)+c); A(1,2)=e_t*s/DamFrcy; A(2,1)=-Frcy*e_t*s/sqrt(1-Damp*Damp); A(2,2)=e_t*(-s*Damp/sqrt(1-Damp*Damp)+c); d_f=(2*Damp^2-1)/(Frcy^2*Dt); %计算公式化简 d_3t=Damp/(Frcy^3*Dt); B=zeros(2,2); B(1,1)=e_t*((d_f+Damp/Frcy)*s/DamFrcy+(2*d_3t+1/Frcy^2)*c)-2*d_3t; B(1,2)=-e_t*(d_f*s/DamFrcy+2*d_3t*c)-1/Frcy^2+2*d_3t; B(2,1)=e_t*((d_f+Damp/Frcy)*(c-Damp/sqrt(1-Damp^2)*s)-(2*d_3t+1/Frcy^2)*(DamFrcy*s+Damp*Frcy*c))+1/(Frcy^2*Dt); B(2,2)=e_t*(1/(Frcy^2*Dt)*c+s*Damp/(Frcy*DamFrcy*Dt))-1/(Frcy^2*Dt); for i=1:(count-1) %根据地震记录,计算不同的反应 Displace(i+1)=A(1,1)*Displace(i)+A(1,2)*Velocity(i)+B(1,1)*Accelerate(i)+B(1,2)*Accelerate(i+1); Velocity(i+1)=A(2,1)*Displace(i)+A(2,2)*Velocity(i)+B(2,1)*Accelerate(i)+B(2,2)*Accelerate(i+1); AbsAcce(i+1)=-2*Damp*Frcy*Velocity(i+1)-Frcy^2*Displace(i+1); end MDis(j,t)=max(abs(Displace)); MVel(j,t)=max(abs(Velocity)); if T==0.0 MAcc(j,t)=max(abs(Accelerate)); else MAcc(j,t)=max(abs(AbsAcce)); end Displace=zeros(1,count);%初始化各储存向量,避免下次不同周期计算时引用到前一个周期的结果 Velocity=zeros(1,count); AbsAcce=zeros(1,count); t=t+1; end j=j+1; end % ***********PLOT*********** close all figure %绘制地震记录图 plot(time(:),Accelerate(:)) title('PEER STRONG MOTION DATABASE RECORD--CHI010') xlabel('time(s)') ylabel('acceleration(g)') grid figure %绘制位移反应谱 plot(TA,MDis(1,:),'-.b',TA,MDis(2,:),'-r',TA,MDis(3,:),':k') title('Displacement') xlabel('Tn(s)') ylabel('Displacement(m)') legend('ζ=0','ζ=0.05','ζ=0.1') grid figure %绘制速度反应谱 plot(TA,MVel(1,:),'-.b',TA,MVel(2,:),'-r',TA,MVel(3,:),':k') title('Velocity') xlabel('Tn(s)') ylabel('velocity(m/s)') legend('ζ=0','ζ=0.05','ζ=0.1') grid figure %绘制绝对加速度反应谱 plot(TA,MAcc(1,:),'-.b',TA,MAcc(2,:),'-r',TA,MAcc(3,:),':k') title('Absolute Acceleration') xlabel('Tn(s)') ylabel('absolute acceleration(m/s^2)') legend('ζ=0','ζ=0.05','ζ=0.1') grid figure %绘制标准加速度反应谱 M=max(abs(Accelerate)); %地震记录最大值 plot(TA,MAcc(1,:)/M,'-.b',TA,MAcc(2,:)/M,'-r',TA,MAcc(3,:)/M,':k') title('Normalized Absolute Acceleration') xlabel('Tn(s)') ylabel('Normalized absolute acceleration') legend('ζ=0','ζ=0.05','ζ=0.1') grid %%%%%%%%%%%%%%%%%%%%% End With matlab6.5%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
5284 次阅读|0 个评论
[转载]情侣的生日关系,太准了!
热度 1 zjzhang 2011-5-19 23:17
[转载]情侣的生日关系,太准了!
计算方法:例如: 女是11月"9"日生,男是10月"24"日生,则我们的差距是24-9=15个站。 或者 女生是20日生日,男生是1号生日,则我们差距是20-1=19个站。结果见图片哦。
个人分类: 文学|2106 次阅读|1 个评论
数值计算方法程序库
thomaschoo2011 2011-5-10 00:31
发信人: cangqiong (落叶乔木), 信区: NumComp 标 题: 数值计算方法程序库 发信站: BBS 水木清华站 (Tue Jan 8 12:58:31 2002) 摘录自彭桓武、徐锡申《数理物理基础》P391,不知道有人发过没有。 13.6 数值计算方法程序库 关于数值计算方法,包括本书(第4,13章以及其他处)讨论过的, 以及大量未提及的,目前大都有现成的标准的数值计算方法程序库可以 调用,甚至可以从互联网上下载,没有必要自己编程序。 文献《计算物理》(R.H. Landau, M.J.Paez,Computational Physics, Problem Solving with Computer, Wiley and Sons,New York,1997;$$15.8 15.9,15.12-15.14)有专门的一章介绍如何应用科学程序库和万维网来 获取所需的程序。 一些可资用的标准科学和数学库包括: LAPACK:线性代数程序包 SLATEC:综合数学和统计程序包 NETLIB:免费数学程序库的万维网衍生库 IMSL:国际数学与统计程序库 ESSL:工程与科学子程序库(IBM) DXML:高级数学程序库(DEC) NAG:数值算法组(UK Labs) BLAS:基本线性代数子程序(积木) 其内容涵盖有: 线性代数演算 矩阵运算 线性方程组的解 本征系统分析 插值、拟和 微分方程 根、零点和极值 随机数演算 统计函数 数值求积 该书并介绍了获取适用子程序的信息($$15.8,15.9),最后三节 ($$15.12-15.14)还列出了LAPACK,Netlib 和SLATEC的简短目录。 希望对大家有用 发信人: hansom (胖胖熊), 信区: NumComp 标 题: ..一些独立的程序库.. (转载) 发信站: BBS 水木清华站 (Wed Oct 18 21:56:56 2000) 【 以下文字转载自 New_board 讨论区 】 【 原文由 L41 所发表 】 一些独立的程序库 ----转自 http://www.math.psu.edu/dna/num_methods.html ADIFOR automatic differentiation of Fortran codes ALFPACK Legendre functions of first kind ARPACK large scale eigenvalue problems Aztec an iterative sparse linear solver package BLAS basic linear algebra subprograms CERNLIB CERN Program Library CMLIB NIST core math library DAEPAK differential algebraic equations DASPK* solution of systems of alg./diff. eqns (BDF/Krylov method, CM/F90/MPI) EDA exploratory data analysis EISPACK eigenvalues and eigenvectors FISHPAK FFT, separable elliptic pdes FLIB CHARPAK character/string manipulation GEOMPAK geometrical transformations RANPAK random number generation TIMPAK system date manipulation GSLIB GSLIB: Geostatistical Software Library and User's Guide" by C.V. Deutsch and A.G. Journel Oxford Univ. Press, New York, 1992 Harwell-Boeing sparse matrices (also Matrix Market) HPFlibrary HPF library in F90 HSL Harwell Subroutine Library INTLIB interval arithmetic IMSL Visual Numerics, Inc. ITPACK sparse matrices, iterative methods LAIPE parallel direct solvers (linear equations) LANCELOT large-scale optimization problems LAPACK linear algebra on shared memory machines LINALG some nonstandard solvers for linear algebra LINPACK linear algebra MPFUN a portable multiprecision package MINPACK nonlinear problems MINPACK-2 nonlinear problems MINUIT nonlinear problems Mtask parallel programming language (Windows NT/95) MUDPACK multigrid, linear elliptic PDEs NCARM NCAR's local math libraries Numerical Methods FORTRAN Programs, software supplement for Numerical Methods for Mathematics, Science Eng. by John Mathews Numerical Recipes also ftp and gopher (So is it buggy or not?) ODEPACK LSODE ODEs stiff/nonstiff, explicit/implicit methods ODE software of J. Cash PIM Parallel Iterative Solvers RANLIB random number generation (C, FORTRAN) ScaLAPACK MIMD version of LAPACK SCILIB a portable FORTRAN emulation of CRAY SCILIB SLATEC common mathematical library SLEIGN2 Sturm-Liouville problems SPARSKIT sparse matrices SPBLAS NIST Sparse BLAS SPHEREPACK spherical harmonics SPECFUN special functions STARPAC statistical data analysis TENSOR nonlinear problems (tensor methods) TLCPACK regridding (1-4D orthogonal grids) Templates iterative solution of linear systems (html book) TOMS algorithms from Comm. of the ACM UMFPACK sparse linear problems with iterative refinement
2919 次阅读|0 个评论
如何计算战略坐标
zilu85 2010-4-16 11:04
:我们以一篇公开发表的论文中的矩阵作为例子,说明战略坐标的计算方法。数据来自于邱均平 等 关于共被引分析方法的再认识和再思考 情报学报 2008 27(1):69 74 数字是二者同被引次数,仅作为说明计算方法用,结果不具有实际意义。 此处对角线的数据是邱老师原文中按照共现最大次数+1计算的。 王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 王崇德 230.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 l 邱均平 229.00 230.00 l12 l7 9.00 24.00 l 6.00 lO 7.00 l 2.00 罗式胜 72.00 l12 l13 l5 2.00 lO 2.00 9.00 2.00 2.00 l O 蒋国华 20.00 l7 l5 3l 26.00 30.00 O l O O O O 赵红洲 7.00 9.00 2.00 26.00 27.00 3.00 l O l O O O 梁立明 6.00 24.00 lO 30.00 3.00 3l O O O O O O 张琪玉 7.00 l 2.00 O l O l48 30.00 40.00 9.00 l47 l9 赖茂生 6.00 6.00 9.00 l O O 30.00 32.00 3l l7 l7 9.00 陈光祚 5.00 lO 2.00 O l O 40.00 3l 4l 27.00 l4 l7 曾民族 3.00 7.00 2.00 O O O 9.00 l7 27.00 28.00 3.00 5.00 侯汉清 3.00 l l O O O l47 l7 l4 3.00 148.00 7.00 焦玉英 l 2.00 O O O O l9 9.00 l7 5.00 7.00 20.00 在下面的矩阵中做了修改,对角线上的数据用共现总次数代替了。 王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 王崇德 359.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 1.00 邱均平 229.00 418.00 112.00 17.00 9.00 24.00 1.00 6.00 10.00 7.00 1.00 2.00 罗式胜 72.00 112.00 227.00 15.00 2.00 10.00 2.00 9.00 2.00 2.00 1.00 0.00 蒋国华 20.00 17.00 15.00 108.00 26.00 30.00 0.00 1.00 0.00 0.00 0.00 0.00 赵红洲 7.00 9.00 2.00 26.00 49.00 3.00 1.00 0.00 1.00 0.00 0.00 0.00 梁立明 6.00 24.00 10.00 30.00 3.00 73.00 0.00 0.00 0.00 0.00 0.00 0.00 张琪玉 7.00 1.00 2.00 0.00 1.00 0.00 256.00 30.00 40.00 9.00 147.00 19.00 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 126.00 31.00 17.00 17.00 9.00 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 31.00 147.00 27.00 14.00 17.00 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 17.00 27.00 73.00 3.00 5.00 侯汉清 3.00 1.00 1.00 0.00 0.00 0.00 147.00 17.00 14.00 3.00 193.00 7.00 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 9.00 17.00 5.00 7.00 60.00 总计 359.00 418.00 227.00 108.00 49.00 73.00 256.00 126.00 147.00 73.00 193.00 60.00 聚类分析 SPSS classify Hierarchical cluster method: count chi-square furthest plot: dendrogram 结果如下: 根据聚类分析结果 标志每个对象的组别,见下图的最右边一列。 王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 聚类分组 1 王崇德 359.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 1.00 D 2 邱均平 229.00 418.00 112.00 17.00 9.00 24.00 1.00 6.00 10.00 7.00 1.00 2.00 D 3 罗式胜 72.00 112.00 227.00 15.00 2.00 10.00 2.00 9.00 2.00 2.00 1.00 0.00 D 4 蒋国华 20.00 17.00 15.00 108.00 26.00 30.00 0.00 1.00 0.00 0.00 0.00 0.00 C 5 赵红洲 7.00 9.00 2.00 26.00 49.00 3.00 1.00 0.00 1.00 0.00 0.00 0.00 C 6 梁立明 6.00 24.00 10.00 30.00 3.00 73.00 0.00 0.00 0.00 0.00 0.00 0.00 C 7 张琪玉 7.00 1.00 2.00 0.00 1.00 0.00 256.00 30.00 40.00 9.00 147.00 19.00 A 8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 126.00 31.00 17.00 17.00 9.00 B 9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 31.00 147.00 27.00 14.00 17.00 B 10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 17.00 27.00 73.00 3.00 5.00 B 11 侯汉清 3.00 1.00 1.00 0.00 0.00 0.00 147.00 17.00 14.00 3.00 193.00 7.00 A 12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 9.00 17.00 5.00 7.00 60.00 B 在excel中,按照聚类分组排序各行,如下图: 王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 赖茂生 陈光祚 曾民族 侯汉清 焦玉英 聚类分组 7 张琪玉 7.00 1.00 2.00 0.00 1.00 0.00 256.00 30.00 40.00 9.00 147.00 19.00 A 11 侯汉清 3.00 1.00 1.00 0.00 0.00 0.00 147.00 17.00 14.00 3.00 193.00 7.00 A 8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 126.00 31.00 17.00 17.00 9.00 B 9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 31.00 147.00 27.00 14.00 17.00 B 10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 17.00 27.00 73.00 3.00 5.00 B 12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 9.00 17.00 5.00 7.00 60.00 B 4 蒋国华 20.00 17.00 15.00 108.00 26.00 30.00 0.00 1.00 0.00 0.00 0.00 0.00 C 5 赵红洲 7.00 9.00 2.00 26.00 49.00 3.00 1.00 0.00 1.00 0.00 0.00 0.00 C 6 梁立明 6.00 24.00 10.00 30.00 3.00 73.00 0.00 0.00 0.00 0.00 0.00 0.00 C 1 王崇德 359.00 229.00 72.00 20.00 7.00 6.00 7.00 6.00 5.00 3.00 3.00 1.00 D 2 邱均平 229.00 418.00 112.00 17.00 9.00 24.00 1.00 6.00 10.00 7.00 1.00 2.00 D 3 罗式胜 72.00 112.00 227.00 15.00 2.00 10.00 2.00 9.00 2.00 2.00 1.00 0.00 D 如果计算B组的密度,则只保留同组的(赖茂生,陈光祚,曾民族),删除其他各列: 赖茂生 陈光祚 曾民族 焦玉英 合计: 8 赖茂生 0.00 31.00 17.00 9.00 57.00 9 陈光祚 31.00 0.00 27.00 17.00 75.00 10 曾民族 17.00 27.00 0.00 5.00 49.00 12 焦玉英 9.00 17.00 5.00 0.00 31.00 把对角线的数字替换为0,求每一行的和(上图中的最右一列)。然后求这些和的均值,此处为53. 王崇德 邱均平 罗式胜 蒋国华 赵红洲 梁立明 张琪玉 侯汉清 合计 8 赖茂生 6.00 6.00 9.00 0.00 0.00 0.00 30.00 17.00 68.00 9 陈光祚 5.00 10.00 2.00 0.00 1.00 0.00 40.00 14.00 72.00 10 曾民族 3.00 7.00 2.00 0.00 0.00 0.00 9.00 3.00 24.00 12 焦玉英 1.00 2.00 0.00 0.00 0.00 0.00 19.00 7.00 29.00 均值 48.25 如果求B组的向心度,则删除同组的列,然后求每一行的和,这些和的均值就是B组的向心度,此处是48.25。 如此,求出每一组的向心度和密度,求各组的向心度和密度的均值,以此作为坐标的原点 A B C D 均值M(坐标的原点) 密度 53 向心度 48.25 具体坐标值: A的坐标 B的坐标 C的坐标 D的坐标 密度 A-密度均值 B-密度均值 向心度 A-向心度均值 B-向心度均值 最后的结果是这样的: 战略坐标用于共词分析,这里的数据则是同被引的数据,所以其对战略坐标的解释还需要慎重。下面的解释权当做戏说: 密度最高的是王崇德和邱均平,文献计量学,内部联系密切;但是向心度低,与其他研究题目不密切,或者不是中心性的课题, 向心度最高的是张琪玉和侯汉清,检索语言,很多学科都和他们有联系,但是从密度上看,研究课题的内部不是很密切,但是也高于其余两组。 蒋国华等人的研究题目内部联系也不是很密切,同时与其他研究题目关系也不密切;赖茂生等人的研究课题更接近中心一点,即与其他研究关系比较密切,同时,自身的密度也稍微高于蒋国华等人的研究领域。 切记,对应的是这些研究者的研究主题,而不是研究者本人。
个人分类: 生物医学文本挖掘|13665 次阅读|1 个评论
World Scientific出版的《国际计算方法杂志》被SCI收录
wanyuehua 2010-2-19 10:13
2004 年创刊的International Journal of Computational Methods《国际计算方法杂志》ISSN: 0219-8762,季刊,新加坡世界科学出版社(WORLD SCIENTIFIC PUBL CO PTE LTD, 5 TOH TUCK LINK, SINGAPORE, SINGAPORE, 596224)出版,2009年入选 Web of Science的Science Citation Index Expanded,目前在SCI数据库可以检索到该期刊2008年的第5卷1-4期到第6卷1-4期共66篇论文。 该刊是 EI 收录期刊, EI 从 2006 年开始收录, EI 共收录了该刊 2006-2009 年 122 篇论文。 66篇包括学术论文64篇、评论2篇。 66篇文章的主要国家分布:印度18篇,中国12篇,英国7篇,新加坡6篇,伊朗5篇,美国4篇,日本、马来西亚、巴基斯坦、泰国各3篇等。 中国学者2008-2009年在该期刊发表论文的主要单位有华中科技大学(HUAZHONG UNIV SCI TECHNOL )2篇、江苏大学(JIANGSU UNIV)2篇、香港城市大学(City Univ Hong Kong)1篇、天津大学(Tianjin Univ)1篇、华东交通大学(E China Jiaotong Univ)1篇、哈尔滨工业大学(Harbin Inst Technol)1篇、清华大学(Tsinghua Univ)1篇、西北工业大学(NW Polytech Univ)1篇、上海交通大学( Shanghai Jiao Tong Univ ) 1 篇。 66篇文章共被引用42次,其中2008年被引用2次,2009年被引用39次,2010年被引用1次,平均引用0.64次, H指数为2(有2篇文章每篇最少被引用2次)。 International Journal of Computational Methods《国际计算方法杂志》投稿指南: The journal is devoted to all aspects of modern computational methods including mathematical formulations and theoretical investigations; interpolations and approximation techniques; error analysis techniques and algorithms; fast algorithms and real-time computation; multi-scale bridging algorithms; adaptive analysis techniques and algorithms; implementation, coding and parallelization issues; novel and practical applications. The articles can involve theory, algorithm, programming, coding, numerical simulation and/or novel application of computational techniques to problems in engineering, science, and other disciplines related to computations. Examples of fields covered by the journal are: Computational mechanics for solids and structures, Computational fluid dynamics, Computational heat transfer, Computational inverse problem, Computational mathematics, Computational meso/micro/nano mechanics, Computational biology, Computational penetration mechanics, Meshfree methods, Particle methods, Molecular and Quantum methods, Advanced Finite element methods, Advanced Finite difference methods, Advanced Finite volume methods, High-performance computing techniques. 网址: http://www.worldscinet.com/ijcm/ijcm.shtml 编委会: http://www.worldscinet.com/ijcm/mkt/editorial.shtml 作者指南: http://www.worldscinet.com/ijcm/mkt/guidelines.shtml 在线投稿: http://www.worldscinet.com/ijcm/editorial/submitpaper.shtml
个人分类: SCI投稿|12789 次阅读|0 个评论
未来十年内的计算机是个啥样子?说说我的希望
yangxintie 2009-8-23 19:16
将来的计算机是啥样子? 不要说得太远,就说未来十年内我所希望的样子吧, 我心目中概括起来就是四个字:快、小、智、能。有些现在已经实现,有些正在实现 一 先说快,运算速度将由于提前进位的串行运算新算法而千百倍的提高   根据美国专家表示,新一代的超级电脑很可能在明年问世,其每秒浮点运算次数可高达1000兆次,千兆级电脑的运算能力相当于逾一万台桌上型电脑的总和,在普通个人电脑上得穷毕生时间才能完成的运算,在现今的超级电脑上大概得花5小时完成,若使用千兆级电脑则仅需2小时.但是所有现代计算机都是靠增加并行运算器的数量增加速度的,但是遇到很多问题并不能像切成豆腐块一样同时来烹炒,就需要很长的时间来进行串行运算。串行运算最麻烦的是进位,简单的诺依曼计算机靠移位全加来求和做乘法,需要的时间最长。进位和位数N的关系成ln(N)倍增长,70年代中国一个叫史丰收的孩子解决了此问题,就是把进位提前用判断的办法得出来,然后用十字交乘法把高位的乘法结果先输出出来。以乘法为基础,除法,开方,根式,以及对数,三角函数的结果都可以连续从高位到低位输出,这样就可以把计算机的计算器设计成串行的,同时有许多段落在计算机运算的加工链上进行处理,计算机实际和流水线一样了,先算数字的头部,后处理身子部分,最后处理尾巴。一节一节算出来。过去计算机教材一言九鼎,说串行计算方式落后缓慢,是没有考虑到新算法情况下的糊涂话,面对新算法,就对应有新的计算器设计,我们已经在一些计算器设计里面看到了通过判断提前进位的影子,但是计算器的设计理论不彻底颠覆,新理论下既有串行又有并行的新式计算器还将是遥遥无期,我们希望这个过程快一些,这就需要中国科学家加倍的努力。 我们并不指望每一家都能有一台像深蓝一样的计算机,但是比现有计算机数值计算速度及处理图像速度提高100倍并不是难事情了,这就是NVIDIA公司办得好事情,现在计算机计算器的瓶颈使得很多计算者眼光落在了显卡上面,因为显卡上面有几百个流处理器GPU可以代替计算器来CPU来使用,所以NVIDIA公司就给他配上了一个叫做裤褡(cuda)的软件,使得数值计算已经成百倍提高,尽管现在在一个城市里面还仅仅很少几个人能用这种技术来加速数值计算,但是手中银子不多又想多出成果的研究人员还是对他十分关心,可以说将来计算机一定会有新的在新串行算法基础上的计算器问世,比裤褡程序为基础的纯并行运算又会有百倍提高,深蓝一样的超级能力计算机走进普通研究所和实验室不是幻想。 二 再 说小,这首先归功于材料的改进而形成的高集成度。      纳米材料的使用使得科学家可以制造出世界上最小的计算机逻辑电路,也就是一个由单分子碳组成的双晶体管元件。这一成果将使未来的电脑芯片变得更小、传输速度更快、耗电量更少。   构计算机逻辑电路的双晶体管是碳纳米管,他比头发还细10万倍,根据摩尔定律,每18个月,集成电路中可容纳的晶体管数目会呈几何级增长,从而使计算机芯片的性能翻倍提高。在未来的10-15年间,由于硅的物理特性,目前普遍使用的硅晶体管制造技术将发展到极限,难以继续,到那时碳纳米管的时代将到来,它将使处理器的体积更小、能集成更多的晶体管,进一步提高计算机的性能。现有计算机将会追求更微型的晶体管,开发出功能强大的微晶片。这项突破可使未来的超级电脑只有指甲般大小。米粒大或者指甲盖大的计算机如同耳环和戒指一样戴在手上并不是不可能的。 然而,计算机并不仅仅是CPU和存储介质。但是鼠标和键盘由于人体工学的原因必须有一定的大小,现阶段至少需要一个触摸屏来代替,都是外围微设备的烦心事。所以就是手机大小的掌上宝,也不能做的太小,至少得留出手指头或者触笔分辨的大小来。 其次,我们可以注意到现在已经孕育着一场变革,新的计算机可以既没有屏幕,也没有触摸原件,信号输入可以借助光学图像进行。说到这里就要谈到计算机图像技术的开发,他已经使得战斗机上面有了电脑眼睛作为信息源的目标方位距离判断系统,其实这种技术转变一下,由两个摄像头和一台数字计算机组成的视频识别输入系统,利用分别放置在水平和垂直位置的两个摄像头来采集人手移动的图像序列,通过数字计算机的图像处理系统识别,最终得出人手所键入的信息。由此可以实现无键盘、无鼠标的输入操作,拥有较高的输入识别率,并且由于只需要两个普通摄像头,设备简单,成本低廉,便于维护更新。(详见专利CN1664755)所以利用摄像头(电脑眼)一秒钟25帧的判断速度,计算机也很容易判断手指敲在什么地方,手指头是什么姿势,或者给你更进一步判断你的口型表示说了些什么,你的眼睛表示了些什么,这些都可以作为信号进行输入以后,所以键盘和鼠标根本都是不需要的了,或者可以变成虚拟的,你随便在桌子上敲或者摸,只要通过约定的信号通知计算机这是敲键盘还是拖鼠标,计算机都会经过分析把你的要求办到。再加上输出部分不一定用屏幕,可以使用投影或者人机结合的神经输入系统,最差的也可以通过特殊眼镜输出高分辨率立体图像,所以计算机确实可以变成非常小。 三 未来的计算机最吸引人的一点应当是人工智能。   第五代计算机并不是一个新名词,泛指具有人工智能的新一代计算机,它具有推理、联想、判断、决策、学习等功能。计算机的发展将在什么时候进入第五代?是一个很难回答的问题,程序和系统都进化的很快,但是难就难在推理和思考这些人类基本的功能进展并不十分满意,到现在一些带有初级智能的软件,解一个几百个未知数交联的非线性都很困难。甚至一个常微分方程的特征值问题,也是并不那么容易解决的,何况现在的实际科学技术问题,动不动就要上偏微分方程组,人类的知识发展并不像原来所想像的那么快。尽管如此,我还是相信未来的计算机可以帮助人类分析问题,总结规律,学习规律和发展规律。 过去听说微软的盖茨有个愿望,把所有的人类知识课程都使用计算机软件进行归纳和演示,让人类学习再不困难,可是久等不至,也许知识爆炸的今天,编讲义比不上知识更新的速度。但是我还是希望有些人来铺垫这方面的工作,让知识获取不再困难。 假如我是高中学生,我希望计算机能够让我不那么累,计算机现在虽然能把高等数学里面吉米多维其习题集一提不落的做下来,但是他甚至不能为我讲一讲他高中题是怎么做的,尤其是现在注重启发式和分析问题解决问题能力,计算机就不能代替我或者帮助我进行此类锻炼,把我从题海战术的苦海中解救出来?或者更理想一些,如果计算机能够把这些习题变成类似魔兽或者仙剑传奇一类的游戏,让我寓教于乐该多好! 四,再说能,计算机应当成为一个家庭的信息中心,娱乐中心,健康中心,以及饮食烹调卫生等家务管理中心以及安全的防护中心。 这点可能大家比我知道的还多: 计算机的发展应当是和电视,高清的界限越来越模糊; 计算机和手机电话的界限也越来越模糊; 人人手里的手机大小的东西,应当既是通讯设备,也是照相,看电视,联网,定位,翻译,以及计算机终端。其实现在已经有了,但是后面需要更便捷,更便宜。 现在计算机上面连带的那么多讨厌的连接线也由于无线连接,蓝牙技术而变得非常简介,但是发挥的作用越来愈大,无线连接使得计算机和微波炉,电饭煲,电冰箱,洗衣机,空调,电暖,光线以及噪声消除,甚至安全防护的红外监控,摄像头监控都联系成了一个整体。 举个例子说: 如果你家有老人或者病人,在睡眠中计算机就可以通过无线网络把你的脉像,心电,脑电传输到监控中心,早上一起床,你家老人会得到寿星网络主持人的亲切问候和关心的健康建议。 如果您是年轻人,计算机帮助你干脆在家里上班,并且替你打理好公司的业务,把你的工作和其他部门有效连接,计算机在帮助你研讨艰深的问题的同时,又会在一定的时间内阻断你的工作,半逼迫的建议你打一场虚拟的乒乓球或者篮球,其实你根本用不着走出房门,液晶屏上面足够逼真的出现了你参加的篮球队或者羽毛球场地,你只要想象着挥拍子或者投篮并且出一身臭汗就行了。打乒乓球的东东我已经试过了,尽管还不够完美,还要通过一条传感器线联到主机上,但是我相信不远的将来几年,两个电脑眼就会代替这条讨厌的传感器引线,而我手里不仅可以拿乒乓球,也可以拿琵琶或者冬不拉了。 总而言之,这就是下面几十年内我所希望的计算机,他将走进千万家,给我们带来生活上的便利的同时,也会促进科学技术更快发展。
个人分类: 交叉科学|2537 次阅读|7 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-6 02:19

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部