机器学习与物理建模的结合正在改变着科学研究的范式。那些希望通过计算建模突破科学边界、解决困难问题的人们正在以前所未有的新方式集结起来。他们需要新的基础设施新的协作平台,新的代码框架,新的数据处理手段,新的算力使用方式;他们需要新的文化追求通力协作、惠及大众;追求知识与工具的自由交流与分享;追求尊重并欣赏相互的成就、和而不同。 DeepModeling社区是这样的一群人的社区。 何为DeepModeling? 机器学习与物理建模是计算的两大战场。前者是处理复杂信息与数据的有效工具;后者是人们认知物理世界的科学方式。二者的有效结合所激发的活力正在影响着科学研究的方方面面。DeepModeling最终将是机器学习、物理建模与前沿计算模式极致结合的一套方法论和工具的沉淀。人们被DeepModeling社区所吸引,是因为它开放与包容的环境,以及它推动全球科学计算事业发展的使命。 为什么选择开源? 对开源一词有不同的解读。DeepModeling社区人对此的共识是,开源是一种基于开放共享精神的软件协同开发模式。机器学习和计算机科学领域的人或许对它早已熟悉,但它在科学计算领域还没有很盛行。我们所提倡的是,一个方法或软件,不应因发表文章的期刊好坏来分别高下,而应就解决问题的能力和对科学的实际贡献论英雄。方法软件的可持续发展需要持续投入人力、不断改进,并需要在开放的环境中把解决的一个个实际问题作为最朴素的测试。这往往是从事科学计算的个人或小组难以承担的。开源社区可以提供好的解决方案。 DeepModeling社区的历史 DeepModeling社区DeepModeling社区始于deepmdkit项目的发起。deepmdkit是将机器学习与分子动力学结合的软件工具,克服了分子动力学领域长期面临的效率与精度难以兼得的困难。deepmdkit的早期开发者们用DeepModeling这一名字来表示利用深度学习(DeepLearning)工具解决传统多尺度建模(MultiscaleModeling)中的高维灾难问题。DeepModeling也因此成为最初deepmdkit项目所在的Github组织名称(https:github。comdeepmodeling)。在deepmdkit之后,DeepModeling社区陆续发起了dpdata、dpgen、dpdispatcher等项目,并通过deepkskit、ABACUS等项目将建模尺度延伸至电子结构。DeepModeling现有项目的发展也让来自世界各地的、各个领域的做分子模拟的人们走在了一起。 DeepModeling社区的短期计划与长期愿景 短时间内,DeepModeling社区现有开发者将聚焦于原子尺度模拟方法和工具的发展。这包括薛定谔方程求解、电子结构计算、分子动力学模拟、粗粒化分子动力学模拟等;这还包括相应的数据生成、模型训练、高性能优化等内容;此外,这也包括针对不同体系、不同场景、不同目的的不同工作流及其管理工具、算力调度工具的发展,等等。 需要指出的是,物理模型与机器学习的结合往往从根本上改变了一个软件、一个流程的实现逻辑。因此,新基础设施的打造不会一劳永逸,而是必将在持续的迭代与频繁的重构中逐渐完善。 长期来看,DeepModeling社区致力于将所有尺度的物理模型与机器学习方法相结合,运用最前沿的计算工具,解决人类社会所面临的最有挑战性的科学技术问题。 你可以如何做出贡献? 如果你想在DeepModeling社区已有项目做贡献,请直接上,或者联系相应的开发者交流想法;如果你想在DeepModeling社区开辟新的项目,或者希望DeepModeling社区帮助你开发你的项目,请联系contactdeepmodeling。org。 如果你是热爱科学的程序员,被DeepModeling开源社区致力打造的未来科学计算平台所吸引,你不仅可以贡献新的算法,也可以贡献代码开发规范、文档写作规范、社区数据库、任务调度、工作流管理等工具,还可以为DeepModeling社区代码架构设计、高性能优化等工作做贡献。科学计算领域的人们将衷心欣赏你的才能和贡献。 如果你是熟悉电子结构、分子动力学、有限元方法等编程框架的硬核开发者,DeepModeling社区将是你大展身手的地方。机器学习的加入让我们从架构设计、每个任务的具体实现、到高性能优化都需要重新思考、反复琢磨。你将成为连接不同领域开发者、贡献者、用户的重要桥梁。 如果你只用过一些基本的科学软件,多多少少做过些后处理的脚本,DeepModeling社区会很需要你!试着在githubgitee和其他交流平台上提问交流、试着提意见,直到试着fork、commit、pr你一点一滴的贡献会让DeepModeling社区变得更好,DeepModeling社区也将非常感谢你的贡献。 哪怕你只是一个旁观者,如果你支持DeepModeling社区的理念,你的认可和传播也将是对DeepModeling社区最大的肯定与支持。 结语 尽管人工智能与计算能力有了飞越式的发展,科学计算群体很大程度上仍习惯于传统的套路。很多地方严重依赖祖传代码,很多商用软件的核心算法也已经过时。这种自给自足的科学研究模式像是农业时代的小农经济模式,往往效率低下。直到近年来,计算科学领域涌现出一批有潜力的开源社区。但是,这些社区往往针对的是特定尺度的特定工具,且往往被特定学术课题组维护,在持续开发、用户体验等方面面临严重挑战。 DeepModeling项目将改变这一切。 机器学习与物理建模的结合呼唤新的模式开源社区模式。这样的模式在计算机和电子工业历史上早有实现Linux和安卓是最好的例子。从这个意义上,DeepModeling社区是将这些想法借鉴到了科学计算领域。对于所有做计算科学工程的人而言,高效、可复用、可持续优化的建模工具可以让他们摆脱无模型可用的尴尬,摆脱模型反复调参的困局;对于所有做机器学习的人而言,物理模型将会给他们提供新颖而广阔的场景。以开源社区的方式协同开发将使每个人的工作更高效、及时、可靠、透明。这种紧密合作、相互成就的精神也必将激励越来越多的人推动计算的发展、造福人类社会。这是一个振奋人心的机会。这是科学计算的未来! 原文链接: https:github。comdeepmodelingcommunity https:gitee。comdeepmodelingcommunity