1、梁文锋是典型的“小镇做题家”:出生于广东湛江的五(三)线城市、17岁考入浙江大学,2010年硕士毕业于浙江大学信息与通信工程专业。
2、硕士毕业后,梁文锋就带领团队开始使用机器学习等技术探索全自动量化交易。2010年,他和浙江大学校友创立了雅克比投资。
3、2015年6月,30岁的梁文锋与“股东出轨女下属”的徐进联合创办杭州幻方科技有限公司(幻方量化、High-Flyer),依靠数学与人工智能进行量化投资,立志成为世界顶级的量化对冲基金。
4、2021年,幻方量化管理规模已突破了1000亿元,同一年,梁文锋开始找寻“副业”,找供应商买了数千张英伟达GPU显卡(当时应该买的是RTX4090、A100、L40等),发力AI技术。而到2023年,幻方量化管理总规模已降到400多亿元。(数据应该有错误,编者注)
5、2023年初,幻方量化曾宣布自身拥有1万张英伟达A100 GPU卡,后来我们了解到,当时幻方量化说了假话,它当时仅拥有数千张A100卡而已,剩下则是消费卡、老款显卡,还有用云服务方式租用A100显卡。业内人士将其视为,一个亿万富翁寻找新爱好时的“古怪行为”。
6、DeepSeek热潮很大程度上与国内媒体所谓“中国大模型企业超越美国”这类东升西降的热捧是分不开。其实,DeepSeek技术并未稀奇到“惊叹”程度,DeepSeek V1版本的时候很粗糙,当时大量使用GPT的开源数据,甚至一度调用过GPT-3.5 API接口。如今的“AI界的拼多多”,本身是AI infra技术和团队 AI 技术能力强。因此,媒体用DeepSeek单一模型证实中国 AI 技术超越美国,是逻辑上的“以偏概全”错误,DeepSeek是 AI 技术迭代的受益者,但这并不代表它在技术上具备了超越OpenAI等领先企业的实力。
7、DeepSeek的实例进一步表明,AI技术并不存在明显的“护城河”,模型技术的超越已成为常态,“六小虎”并不是唯一头部。然而,AI算力规模的增长以及长期的模型迭代是否能够真正超越OpenAI,才是决定AI大模型发展的关键因素。
8、DeepSeek不融资、短期没有上市意愿,良好的现金流促使DeepSeek招聘大量 AI 研究人才,形成所谓“研究院”氛围,只负责前沿,不负责商业,甚至团队非常懂基础设施和芯片原理。此外,他还从对冲基金行业带走了最好的团队加入DeepSeek。