博文

《中国激光》封面-硅基光电计算

已有 2169 次阅读 2020-6-4 17:39 |系统分类:论文交流

封面 | 硅基光电计算

原创周治平中国激光今天

本文为中国激光第1816篇。

欢迎点击在看、转发，让更多人看到。

撰稿 | 周治平，许鹏飞，董晓文

编辑 | 沈灵灵

封面 | 周治平,许鹏飞,董晓文.硅基光电计算[J].中国激光,2020,47(6):0600001

背景介绍

硅基光电计算是建立在硅基光电子学基础上的一种新型计算体系，如图1所示。硅基光电子学是探讨微纳米量级光子、电子及光电子器件在不同材料体系中的工作原理，并使用与硅基集成电路工艺兼容的技术和方法，将它们异质集成在同一硅衬底上形成一个完整的具有综合功能的新型大规模光电集成芯片的一门科学。

图1 硅基光电计算体系

早期硅基光电子概念的提出是为了解决传统微电子芯片中核心单元之间的互连通信瓶颈问题。近十年来，硅基光电子因其与CMOS技术兼容的集成工艺和光域通信互连方面的优点，不仅在通信领域实现了产业化，快速占领市场份额，还催生了其他前沿应用领域，如人工智能处理器中的光电计算，成为了具有多样化应用潜力的硬件平台。

基于硅基光电子技术的光电计算，利用光的优异特性，如低延迟、低损耗、超宽频带、多维复用、波动特性等，与微电子技术结合，在硅衬底上巧妙构造软硬件深度融合的光电计算体系，解决传统微电子处理器在高速计算应用上的算力、能耗和输入输出瓶颈问题，成为光电子学、微电子学、光子学、数学、算法、计算机系统等深度融合的新型交叉学科。

关键进展

以现阶段热门的人工智能为例，其开发过程依赖专用的硬件，如图像处理单元（GPU）和专用集成电路（ASIC），为样本训练和模型参数调优提供算力基础。根据硅谷人工智能研究组织OpenAI统计，在2012-2020年的8年间，深度人工神经网络的浮点计算量以指数速率快速增长，平均每3.4个月翻一倍，远超集成电路摩尔定律的增长速率，同时也伴随惊人的能耗问题，限制了人工智能的发展。因此，在后摩尔定律时代，发展新的人工智能计算硬件是当务之急。

人工神经网络计算中包含大量矩阵相关的基本运算，如矩阵乘法、点乘内积和乘加计算等。如图2所示，在深度卷积神经网络的隐藏层中的卷积核与特征图之间存在大量的矩阵卷积操作，在全连接层则通过矩阵乘法实现层间传递。当矩阵规模较大时，通过微电子处理器进行大量的二进制矩阵运算，效率较低，延迟较高，难以实现高速实时的人工智能应用。

图2 人工神经网络运算过程的矩阵乘法和卷积运算

硅基光电计算，以片上光电融合为基础，利用电子的逻辑运算优势和光子的光学变换、等效映射、相干探测、高速互连等方式，有望构建大算力、低能耗的光电矩阵计算硬件体系，如图3所示。

学术界和产业界对光电计算的算力、能耗和可行性等指标做了预测和评估：

(1)任意矩阵可通过奇异值分解，分解成两个酉矩阵和一个对角特征值矩阵相乘，其中酉矩阵和特征值矩阵可通过级联的马赫-曾德尔干涉（MZI）网络实现。传输损耗＜1dB/cm的大规模低损耗的MZI网络，是实现光电矩阵运算的硬件基础，可利用硅基光电子技术制备。

(2)利用高速电光调制的大规模MZI网络实现矩阵运算，在典型深度的多层MLP神经网络中，可以达到10¹⁸ MAC/s的等效矩阵乘法算力量级，比使用ASIC微电子芯片进行的同类运算快5个数量级。

(3)在自差相干探测的光电乘加器中，可实现接近标准量子极限的模拟乘加计算。在典型的神经网络神经元规模下，光电乘加运算的标准量子极限理论能耗在10^-18 J/MAC量级，而目前实际可行的光电乘加器件能耗约为10^-15 J/MAC量级，相比电子乘加器运算的10^-12 J/MAC量级，有3~4个数量级的能效提升。

图3 硅基光电计算案例

除了人工神经网络矩阵运算以外，硅基光电子技术在模拟计算、离散傅里叶变换、集成光量子逻辑门和神经拟态计算等研究和应用中也取得了如下的重要进展：

(1)在伊辛问题和图最大割问题等非确定性多项式NP问题中，通过软硬件深度融合可设计高能效和高性能的光电启发式算法求解器。在硅基光电系统的快速循环迭代下，实现NP问题的模型能量快速演化收敛，得到复杂问题的可行解。

(2)通过硅基光电子平台的片上光学变换，构建低延迟的光电离散傅里叶变换DFT器件和系统，可克服无线局域网和蜂窝数据通信中多径效应和信道衰减等数据传输问题，实现OFDM系统的载波信道复用，是未来微波无线通信中降低数据通信延迟的可行技术方案。

(3)在电控光量子处理器中，通过多维度调控的硅基光电子器件库，使得片上多量子态的量子信息操控和处理成为可能；利用硅基光电子芯片的高集成度，突破量子信息处理的实验规模，同时避免了光电元件的空间占用，有利于量子计算的大规模可拓展应用。

(4)在基于硅基光电子技术的神经拟态芯片中，片上光互连的优势可促使低损耗、低延迟的光电神经元和神经拟态系统的构建。随着光脉冲神经元数量的增加，神经元节点间的信息通信和复杂连接可组成大规模的光电神经系统，通过神经系统的训练，进而实现复杂的类脑人工智能。

总结与展望

硅基光电计算是未来提高处理器算力、减少能耗、降低数据处理和通信延迟的关键技术，具有重要的战略意义。

然而，现阶段高性能计算在研究过程中存在目标不明确、发展路线规划混乱等现象，为此，我们认为下面三点需要在业界成为共识：

1、光电计算的特点和意义。光子由于自身的特点，难以便捷高效地实现相互作用、单元缓存和逻辑运算，其器件集成度也难以达到电子集成电路的规模，因而，利用“光子计算”来取代“电子计算”是不切实际的。“硅基光电计算”是光电子学、微电子学、光子学、数学、算法、计算机系统等深度结合的新型交叉学科，通过软件和硬件的深度联合设计，有望实现超高性能计算。

2、光电融合的发展趋势。在硅基光电计算中，光子和电子相辅相成，缺一不可，光电融合是必然趋势。通过与硅基集成电路工艺兼容的技术和方法，将光子、光电子和微电子器件集成在同一硅基芯片平台上，形成优势互补的整体，才能突破现有“电子计算”的性能极限，摆脱“光子计算”的观念误区，更好地推动光电计算的实际应用。

3、硅基光电计算系统。其架构需要包含如图4所示的基本单元，其中光电计算单元(Optoelectronic Computing Unit, OECU)是计算处理性能提升的关键，用以实现高速的矩阵运算和模拟计算等。一些在光域上不便进行的计算操作，如信号延迟、数据缓存和逻辑运算等，仍需要引入算术逻辑单元（Arithmetic & Logic Unit, ALU），主控（Control Unit），寄存器（Register）、缓存（Memory）等，在电子处理单元中实现。而计算、控制和存储单元之间的互连通信和硬件系统I/O等，则通过光互连来实现。