2001年,Zachos curve奠定了新生代气候历史的框架,19年里获得了8k以上的引用,被称为“地学图片之王” 。 现在,新王登基了,名字叫CENOGRID。 过去6600万年以来,大型恐龙绝灭,被子植物、哺乳类和鸟类繁盛,是地质历史中的新生代。新生代早期两极没有冰盖,晚期两极出现大规模冰盖。温室气体浓度一度超过2000ppmv,而到末次冰期不足200ppmv。古气候学家一直希望获得新生代以来的气候变化记录,来理解现代的地球气候演化规律和发展趋势。 整整100年前,米兰科维奇提出地球轨道参数变化,包括偏心率、倾角以及岁差,影响了地球表面获得的太阳辐射纬度和季节分配,驱动了地球气候准周期变化(Milankovitch, 1920)。过去50年中,米兰科维奇假说不但成了一种古气候研究的理论范式,而且也为古气候研究提供了天文定年方法。 从1980年代中期开始,古气候学者利用深海沉积物的碳、氧同位素记录来集成重建新生代气候历史。迄今最有影响的集成曲线是2001年UCSC古海洋学教授Jim Zachos团队发表在SCIENCE上的论文(Zachos et al., 2001a)。这篇文章很大程度上奠定了学界对新生代气候演化的整体认识。但当时,天文定年时间标尺刚刚迈进了古近纪门槛(Zachos et al., 2001b),新生代早期的时间标尺主要依赖于生物地层和磁性地层,还有不少分歧。 在过去20年里,全球新获得的深海沉积钻孔极大地弥补了这些缺憾,天文时间标尺逐渐跨过新生代,向古生代延伸。新的集成曲线呼之欲出。 CENOGRID钻孔分布 最近,这项工作由德国不来梅大学海洋环境科学中心(MARUM)的Thomas Westerhold领衔完成,论文9月11日在SCIENCE发表(Westerhold et al., 2020)。 他们在超过1000个深海沉积钻孔中挑选出14个钻孔,仔细检查并修正了这些岩芯的拼接方式,选择两个长寿的有孔虫属 Cibicidoides 和 Nuttallides 的氧、碳同位素记录重建气候历史。根据初步的时间标尺,补充测试了部分晚中新世到早始新世的样品,来保证足够的时间分辨率。他们收集了所有记录已有的天文时间标尺,并且把这些时间标尺统一调整到La2010b的轨道方案,最终获得了一条经过天文调谐定年的,连续覆盖整个新生代全球气候参考曲线CENOGRID( CENO zoic G lobal R eference benthic foraminifer carbon and oxygen I sotope D ataset)。 CENOGRID数据集 CENOGRID.xls 数据集由23629个数据点组成,时间分辨率渐新世以来高达2ka,古新世和始新世为4.4ka,估计年代误差古新世-始新世为10万年,渐新世-中中新世为5万年,晚中新世-更新世为1万年。这是全球第一条完整覆盖新生代的高清晰度同位素地层参考曲线。 全球气候是一个复杂的动态系统,在万年到百万年尺度上,对准周期性的天文强迫有复杂的非线性响应。为研究CENOGRID的时域特征,研究团队进行了重现分析(recurrence analysis,也称递归分析)。重现分析可以揭示系统的非线性动力学过程,以及非线性相互作用信息,重现图是对时间序列的内部结构及可预测性的可视化。 CENOGRID氧同位素的重现图揭示了4种截然不同的方块区域。每个方块对应着气候在特定状态下反复循环。新生代气候据此可以分成4个状态,称为热室、温室、冷室和冰室状态。热室状态是从56Ma持续到47Ma,温度比现在高10度,还出现了氧同位素和碳同位素同步负漂的极热事件。温室状态有两个时期,分别是66Ma到56Ma,以及47Ma到34Ma。这两个温室状态温度相似,但碳同位素值和二氧化碳浓度截然不同。34Ma前后始新世-渐新世界线是新生代最显著的转换事件。冷室状态从34Ma持续到3.3Ma,以13.9Ma可以分为两个阶段。3.3Ma之后为冰室状态,地球的气候受北半球冰盖消长控制。这4种状态的划分,与之前对新生代气候历史的认识大体相符,但是重现图首次提供了统计稳健的客观证据。 CENOGRID氧同位素重现图清晰显示了新生代气候的不同状态 演化谱显示,在13.9Ma以前,包括地球热室、温室以及冷室状态的第一阶段,气候周期以偏心率为主,意味着低纬过程驱动着气候演化,推测偏心率调控岁差,影响了季风降水的季节性,进而作用于全球水汽和能量的分布。而倾角周期在暖室热室和第一阶段的冷室状态中表现不显著,可能和当时冰盖的规模小,缺乏高纬的放大效应所致。随着高纬变冷和冰盖增长,13.9Ma之后地轴倾斜度的信号逐渐增强,到3.3Ma成为冰室地球气候系统的主导周期。 CENOGRID的演化谱 作者们还计算了CENOGRID曲线重现分析的确定性,定量描述系统的可预测性。当确定性接近0,表示系统是随机的,不可预测,接近1,表明系统确定。结果显示,温室和热室地球比冷室和冰室地球更可预测。34Ma南极冰盖出现,确定性参数显著降低,地球气候系统非线性程度大大增强。在冷室地球第一阶段中,南极冰量相对较少的25-14Ma,确定性也相对较高。碳、氧同位素比较而言,6Ma之前,北极冰量增加,碳同位素的确定性高于氧同位素,主要原因可能是碳同位素主要受制于低纬过程,受极地冰量影响较小。直到6Ma之后,冰冻圈才深刻地影响了碳循环。到3.3Ma之后,氧同位素显示出强烈的偏心率周期,确定性有所增强。 CENOGRID重现分析的确定性 相对而言,热室地球比温室地球更加不易预测,主要原因是极热事件显示了强烈的非线性过程,放大了天文强迫。另外,值得注意的是,47Ma之后,确定性波动幅度越来越大,直到34Ma到达临界点,变成了不可预测的状态。据此,作者推测,两极的冰量不仅仅定义了地球的基本气候状态,同时影响了气候系统对天文辐射响应的可预测性。 CENOGRID团队还同时公开了对未来气候的预测:目前人为造成的全球变暖的速度远远超过了在新生代任何时候的自然气候波动,并且有可能将地球气候从目前的冰室推向热室状态。“预计的人为变暖将比这要大得多,IPCC预测,如果‘一切照旧’,2300年全球气温达到5000万年以来的最高水平。” CENOGRID团队对未来气候的预测 参考文献 Milankovitch, M., 1920. Théorie mathématique des phénomènes thermiques produits par la radiation solaire. Gauthier-Villrs, Paris. Westerhold, T., Marwan, N., Drury, A.J., Liebrand, D., Agnini, C., Anagnostou, E., Barnet, J.S.K., Bohaty, S.M., De Vleeschouwer, D., Florindo, F., Frederichs, T., Hodell, D.A., Holbourn, A.E., Kroon, D., Lauretano, V., Littler, K., Lourens, L.J., Lyle, M., Pälike, H., Röhl, U., Tian, J., Wilkens, R.H., Wilson, P.A., Zachos, J.C., 2020. An astronomically dated record of Earth’s climate and its predictability over the last 66 million years. Science 369, 1383-1387. Doi: 10.1126/science.aba6853. Zachos, J., Pagani, M., Sloan, L., Thomas, E., Billups, K., 2001a. Trends, rhythms, and aberrations in global climate 65 Ma to present. Science 292, 686-693. Zachos, J.C., Shackleton, N.J., Revenaugh, J.S., Pälike, H., Flower, B.P., 2001b. Climate response to orbital forcing across the Oligocene-Miocene boundary. Science 292, 274-278.
我: 我是这样教导学生 NLP和 AI 的: 人工智能里面没有智能 知识系统里面没有知识 一切都是自己跟自己玩 一切都是为了自己玩自己的时候 努力玩得似乎符合逻辑 自然 方便 而且容易记忆和维护 学: 前面的听懂了,AI 这块有点懵懂 我: 没关系 前面听懂了是关键。后面是哲学,哲学的事儿不必那么懂。你都懂了 我这个做导师的怎么吃饭呢? 学: 给功能词加 features 怎样才妥? 我: 功能词可以枚举,原则上可以没有 features,无所谓妥不妥。看你怎么用 用起来觉得妥就妥 觉得别扭或捣乱 就不妥。如果你永远不用 则没有妥不妥的问题 给了与不给一个样 因为永远没用到。没用到是可能的,譬如你总是为这个词写 WORD 的规则, 不让它有机会被 feature 的规则匹配上 那么 features 就是摆设 也就谈不上妥不妥。 学: 有道理。本来就这么几个词,写WORD就好了,不需要为Feature伤脑筋。 我: 有点开窍的意思 学: 跟老师多交流,才能开窍,不然我就钻进自己的死胡同了。 我: 人都是这样的 钻进n个胡同以后才能在 n+ 的时候开窍。没进过胡同就开窍的 那不是天才 那是死人。 学: NLP 里面的知识表达,包括词典的 features,应该怎么设计呢? 我: 从词典表达 lexical features 到句法语义逻辑的表达,大多没有黑白分明的标准答案。 就是自己这么给了 显得蛮合理 也好记忆 否则自己就不舒服 或记不住。更重要的是 给了 features 以后 规则好写了 规则自然 简洁 有概括性 且方便维护。 almost everything is coordination u assign u use no one is in between no intelligence no god as long as it makes sense to you (not to others) so u know what u r doing as long as it is natural and easy to remember as long as you find it convenient to use certain features in rules and rules are easy to read and easy to maintain in principle u can assign anything to any words or choose not to assign what goes around comes around you play with yourself computer knows nothing features are just 0s or 1s WHAT GOES AROUND COMES AROUND that is NLP in an integrated system whether it refers to POS, chunking, SVO or logical form it is to make your job easy and yourself comfortable u have no need to make others happy unless your system is a middleware commodity to serve your clients if your NLP and your NLP apps are within your own control they are integrated in your system in your own architecture everything is internal coordination This is my lecture on NLP Architecture for Dummies 白: you是谁?个人、团队、公司? 我: good question, it is the architect in most cases: he has the say. Sometimes it can be a bit democratic if the architect wants to motivate his team, for example the naming right. 白: 是全局系统的architect,还是NLP这嘎达的architect? 我: a bit of knowledge is named as f1 or f2, that is arbitrary and the major consideration is memonic-like, features must be easy to remember, but sometimes we let a team member decide its name, such practice often makes the team happy, wow I can act like God, wow I can decide a drop of the sea in the system language … 白: 伟哥还没回答我最后一个问题: 是全局系统的architect,还是NLP这嘎达的architect? 我: the former because we are talking about NLP and NLP apps in an integrated system: apps 不是产品 而是语义落地。落地后 还有一个产品层面 包括 UI 等 那已经不劳我们操心了。落地是与产品的接口而已。NLP 核心引擎与 NLP 落地 是一个无缝连接的系统 这种 design 可以羡慕死人。 如果是有缝对接 如果是两拨人马 两个设计师 甚至两个公司 那就扯不完的皮 擦不完的屁股 成不了大事儿。NLP 和 NLP 产品可以分开 而且应该分开 但是 NLP 与 NLP落地 最好不分开。NLP 落地 包括(1) IE (2) MT (3) dialogue (mapping) (4) QA (5)…… 内部分层 但外部不分开 这就叫无缝连接 可以说 offshelf 害死人,component technology 没有啥前途。选择 offshelf 或 license components 往往是无奈之举,自己暂时没有能力 或不具备条件做,也有找的借口冠冕堂皇:不要 reinvent wheels,最后害的还是自己。 我们已经害过几次自己了 吃尽了苦头 才有这 “十年一悟”,以前说过的: 做工业NLP 自给自足是王道。 白: 这个,关键看公司拥有什么样的专家了。专家不同模式也不同。 我: 也与时代有关: 20 年后也许不必自给自足,就一样做好NLP落地。 【相关】 【立委科普:NLP 联络图 】 【立委科普:自然语言系统架构简说】 自给自足是NLP王道 置顶:立委科学网博客NLP博文一览(定期更新版)】 《朝华午拾》总目录