关于科技创新的几个观点
Who? When? Why?
2025.2 读朱啸虎讲了一个中国现实主义AIGC故事 - 创业邦有感
读后感
- 最前沿的科研创新(0到1)风险很大,现在做科研又很吃资源,主要靠政府或大厂。因为有风险,初创企业很难有天量资金持续支持。以材料领域科研范式来说,数年/数十年后理论成为主导,企业很难做这件事,比如深势科技,因为他没有能力(足够资金)承担失败的风险(目标是明确的,但走那条道路不确定)。因此,最前言的创新发生在科研院所。
- 模仿永远只是模仿,科研不同于赚钱,1-100和0-1的创新贡献是本质上不同的。国内投资人比较喜欢轻资产、快钱、热钱,不喜欢重金投入难点/前言研发。因为现在经济不景气,投资人手里没钱,得保守些。不站在最前沿,永远只是跟随者,站在巨人肩膀上,花的钱确实少了,但是永远活在别人体系里,万事不得超生了。
- 中国还是有做的厉害的地方的,供应链、商业化、产品盈利模式、优秀的消费平台、巨大的体量等等。同时会有deepseek这种初创公司、本土团队勇于创新,有能力,最重要是有心性去做。
- 接着上面的,你创业也好、研究也罢,参考朱啸虎对投资者和鄂维南对学生/PI的拷问:未来的应用场景(市场在哪里?多大市场?)过去发展历程和为什么是现在?(通古知今,知道行业逻辑,认清现状和问题)为什么是现在的你?(你的核心的不可替代的优势是什么?)
- 关于泡沫和热,我觉得有一些好处,热会吸引更多人和资本进来,推动技术和产业发展,如果冷门则发展缓慢,甚至消亡。但是热也要有一定的限度,不然就过热不理智了,潮水退去一地狼藉。
- 关于护城河的问题,科学研发和企业一样的,随着开源软件/模型/框架的增多,开源成为趋势。大家都能去用好的模型,那么垂直领域的数据/具体体系-反应的物理化学理解就是新的护城河了。数据的追赶不如模型容易,因为模型进步逐渐放缓。有必要实现组内或更大范围的数据整理和存储再利用工作。
技术进步加速科学创新、从小作坊到平台式研发
2025.12.31 读DeepModeling 2025 社区年会--点亮“科学电网”有感
读后感
- 从LLM到AGI for Science:智能体(SciMaster、PJLAB的书生、GaliLeo 科学智算平台、LASPAI、Molpilot)涌现,逐渐可用,日后可能处于中心位置,调度各种基础设施(文献、数据、模型、算法、算力、实验)。在LLM之前,是江俊的文献+计算+高通量实验平台,现在是更通用的智能体+多模态模型+大规模算力+高通量实验平台。
- 超越预训练大模型:多模态的基础(Fundamental)科学模型, (PJLAB主任周文通的展望、ODesign、DPA3)。多模态的中心/基础模态是什么?比如LLM类多模态模型,基础是文本。由于构效关系,材料领域的多模态fundamental模型可能是结构(--相互作用--性质)。
- 大语言模型、多模态模型、自动驾驶模型,经验是约束/转换越少,越End-to-End,模型效果越好;计算科学领域相反(?),模型(物理)约束越多,模型效果越好(really? MACE相较于NEP,谁的约束多、物理启发多,谁更End-to-End?)。这里可能的原因是数据量、模型大小和所模拟事情复杂程度的差别。
- AI加速的计算科学与技术进步,method、tools快速发展,革新传统计算。解决真实科学问题案例?
- 快速发展的当下,我们该聚焦什么?投身前沿技术/沉淀物理化学见解?
- 作坊式科研v.s. 平台式科研:技术进步加速创新(AI自身迭代快, AI又加速科研),创新(??真的是创新吗,0-1/1-10?)变得可复制、可扩展吗? 有科研规模的scaling law? 我认为当前“昙花一现的灵感”对推进研究还是很重要的。平台式的科研,平台为我们带来了什么? 交叉团队/SOP-workflow(大规模同类工作亟需)/集中资源/分工? 用bottom-up方法做完universal FF,下一步是什么?
注意
Under consructure.