DeepSeek梁文锋:我们不过是站在开源社区巨人们的肩膀上,给国产大模型这栋大厦多拧了几颗螺丝 技术理想主义者的崛起
在人工智能领域,一场激烈的竞争正在上演。去年12月,国内大模型公司“深度求索”推出的DeepSeek-V3以极低的训练成本实现了与GPT-4等顶尖模型相媲美的性能,震惊了业界。不到一个月后,DeepSeek再次震动全球AI圈。
1月27日,随着新模型DeepSeek-R1的推出,Deepseek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。这一消息引起了广大用户对这款新兴应用的兴趣。DeepSeek创始人梁文锋逐渐被外界关注。梁文锋1985年出生于广东省湛江市,17岁考入浙江大学。值得注意的是,中国还有两位AI领域的知名人物也来自广东:Kimi创始人杨植麟来自广东汕头,人工智能领域的杰出科学家何恺明来自广东广州。
梁文锋被誉为“极致的80后技术理想主义者”,每天专注于看论文、写代码和参与小组讨论。2002年,他对数学建模充满热情,考入浙江大学电子信息工程专业,并于2010年获得信息与通信工程硕士学位。在校期间,他对金融市场产生了浓厚兴趣,特别是在2008年全球金融危机时,他带领团队探索了机器学习技术在全自动量化交易中的应用潜力,为他的职业生涯奠定了基础。
毕业后,梁文锋将目光转向更广阔的金融市场。2013年,他与浙大同学徐进共同创立了杭州雅克比投资管理有限公司,两年后又成立了杭州幻方科技有限公司,致力于通过数学和人工智能进行量化投资。2015年的市场波动中,幻方依靠先进的高频量化策略取得了显著成绩。
2016年,幻方推出了首个基于深度学习的交易模型,并实现了所有量化策略的AI化转型。2018年,幻方正式确立了以AI为核心的发展战略。随着业务扩展,算力瓶颈显现。2019年,梁文锋带领团队自主研发了“萤火一号”训练平台,总投资近2亿元,搭载了1100块GPU。两年后,“萤火二号”的投入增加到10亿元,搭载了约1万张英伟达A100显卡。2021年,幻方的资产管理规模突破千亿大关,跻身国内量化私募领域的前列。2023年,梁文锋宣布进军通用人工智能领域,并创办了深度求索DeepSeek,专注于开发真正的人类级别的人工智能。
今年1月20日下午,中共中央政治局常委、国务院总理李强主持座谈会,听取对《政府工作报告(征求意见稿)》的意见建议。梁文锋出席此次座谈会,这被解读为国家对科技创新的重视。座谈会上,李强强调要以科技创新推动新旧动能转换,集中力量突破关键核心技术和前沿技术,加快推进科技成果产业化,努力培育更多经济新增长点。
杨植麟出生于1992年,本科毕业于清华大学计算机系,拥有卡耐基梅隆大学计算机专业博士学位。他曾师从苹果公司前AI负责人,并在Facebook AI Research和Google Brain工作。2023年4月17日,杨植麟创立北京月之暗面科技有限公司(Moonshot AI)。同年10月,月之暗面宣布在“长文本”领域实现突破,推出了支持输入20万汉字的智能助手产品Kimi Chat,引起广泛关注。
何恺明是广东广州人。2015年,他和他的团队凭借152层深度残差网络ResNet-152在ImageNet图像识别大赛中击败多个业界团队,获得第一。2016年8月,何恺明离开微软亚洲研究院,加入Facebook AI Research(FAIR),担任研究科学家。2024年,他正式回归学界,加入麻省理工学院(MIT)电气工程与计算机科学系担任教职。