21世纪经济报道记者 申俊涵 北京报道
(资料图)
近日,AIGC领域一笔大额融资十分引人注目。
6月中旬,成立不到半年时间的生数科技,宣布完成近亿元人民币的天使轮融资。本轮由蚂蚁集团领投,BV百度风投、卓源资本跟投。目前,公司估值已达1亿美元。本轮资金将主要用于核心研发团队的建设,加速多模态大模型和应用产品的研发。
在竞争日益激烈的大模型赛道中,生数科技并非无名之辈。它由清华系AI公司瑞莱智慧RealAI、蚂蚁集团和BV百度风投联合孵化成立,团队核心成员主要来自清华大学人工智能研究院,由前瑞莱智慧副总裁唐家渝出任首席执行官。
“天使轮融资近亿元并不是一个小数目,特别是考虑到现在的资本市场环境,这也反映出了投资人对于生数技术稀缺性和商业潜力的认可。”一位长期关注AIGC赛道的一线投资机构高管人士对21世纪经济报道分析说。
同时据21世纪经济报道了解,作为瑞莱智慧的天使投资方,BV百度风投见证了瑞莱智慧的发展。而当瑞莱智慧创始团队最早提出孵化生数科技构想的时候,BV百度风投团队立马表现出强烈的兴趣。
基于对多模态模型发展趋势的看好,以及对朱军教授领导的生数科技团队在多模态模型和生成模型领域技术能力的认可,BV百度风投团队毫不犹豫的参与到对生数科技的投资孵化过程中。这也是继西湖心辰、Morph Studio之后,BV百度风投在今年投出的第三个AI内容生成相关的项目。
大模型创业注定是场小众创业,只有在AI领域具备极高专业度并且在资本圈富有号召力的团队,才有机会胜出。如果把生数科技和其他刚开始创业的大模型公司对比,生数科技在资本层面尚处于相对比较早期的阶段,这也是为什么生数科技首轮融资仅限于瑞莱智慧老股东的原因之一。
关于公司下一步的融资计划,生数科技CEO唐家渝对21世纪经济报道透露,公司预计最快在7月份启动新一轮融资。
“现在市场热度还是比较高,如今的整个大模型市场正慢慢进入从概念论证到应用探索的阶段。除了要求具备技术壁垒外,投资机构对团队的产品化能力、落地能力也更加关注了。”他说。
清华系出身,产业方与早期投资方共同孵化
生数科技的诞生源于产业方瑞莱智慧和投资方蚂蚁集团、BV百度风投的共同孵化。据了解,瑞莱智慧成立于2018年,曾获得BV百度风投、卓源资本、松禾资本、考拉基金等的早期投资。
早在2013年的清华实验室阶段,其创始团队成员就开始深度生成式模型相关的研究工作,涉及生成式模型理论基础、高效学习和推理算法,以及音乐生成、人脸合成等多个方向。近两年,扩散模型作为生成式模型新方法开始流行,瑞莱智慧的创始成员也是很早就参与其中。随着公司业务的发展和生成式人工智能的火热,瑞莱智慧团队希望分拆孵化一家新公司更聚焦于大模型赛道,也就有了后来的生数科技。
唐家渝谈到,这样做主要是出于两点考虑。一方面,从业务的角度,瑞莱智慧的业务方向聚焦于安全可控的人工智能解决方案,例如提升AI技术及应用的安全性、可靠性等,服务于B端客户,生数则是聚焦在多模态大模型和应用开发,涉及C端产品,业务定位上有不同;二是大模型创业前期对资源投入需求是巨大的,独立分拆运营更加合适。
在今年春节前,瑞莱智慧创始团队就向BV百度风投CEO、管理合伙人高雪披露了孵化生数科技的想法。那时,ChatGPT在国内尚处于热门阶段,创投界和工业界主要关注的是语言模型的机会。但是,学界对多模态研究的兴趣已在逐渐升温。
从技术及其未来应用的发展趋势来看,BV百度风投团队都认为多模态具有巨大的潜力。因此,当唐家渝与高雪正式谈论孵化生数科技时,高雪给予了坚定的支持,并立即表达了参与意愿。
在孵化过程中,BV百度风投与生数团队就技术、产品和商业模式进行了深入讨论。由于BV百度风投在多模态领域的布局全面且历时较长,其在公司早期筹备过程中对海外产品技术的发展、国内底层模型公司的发展路径和商业模式等方面给出了建议。在商业合作和算力合作方面,也积极协助生数科技寻找合作伙伴,并促成了合作。
“一个行业的发展,需要更多的投资机构、创业者和产业伙伴的参与。BV百度风投在早期就开始深入布局生成式AI领域,无论是在应用层,还是模型层,都能够为创业者在关键资源上提供支持,如人才、计算能力、合作伙伴等方面,对我们团队的发展带来了关键的帮助。”唐家渝总结说。
无惧“百模”竞争,底层基础设施与上层应用端同步发力
如今国内的大模型赛道堪称“百模大战”,不论是百度、阿里、科大讯飞等大公司,还是王小川创办的百川智能等公司,都是赛道中的强有力竞争者。
“我们认为,这轮大模型或生成式AI的热潮与其他热潮有所不同。尽管资本的涨落具有周期性,但我们对大模型对生产力提升带来的实际改善有强烈信心。”一位生数科技的早期投资人在接受21世纪经济报道采访时说。
在他看来,与行业其他公司相比,生数科技的优势在于两点。一方面,生数科技团队在生成模型的底层技术上有过前沿的创新,在DPM(扩散概率模型)拥有深厚的技术积累,比如最近朱军教授团队提出的多模态扩散大模型UniDiffuser,这与行业内的其他公司有较为明显的差异;另一方面,相比海外的多模态公司,生数科技在中国的独特定位具有显著优势,且3D、视频的生成效果全球领先,相信在广阔的中国市场中,有机会诞生属于中国自己的底层多模态大模型。
唐家渝谈到,在百舸争流的大模型赛道中,生数科技的定位是同时关注基础模型层和应用层。既发力底层基础设施,自研通用的多模态大模型。同时也布局上层应用,基于底层模型能力面向图像生成、3D生成、视频生成等应用场景打造垂类应用产品。
“我们的核心竞争力在于,拥有从0到1 的大模型自研能力,充分理解底层算法原理。”唐家渝说。而作为相比,应用层的团队大多都是基于Stability AI开源模型或是OpenAI这类底座厂商的API进行二次开发,做一些Fine-tune的工作,很大程度上会受制于底层模型的能力。而且不懂原理容易踩坑,很难在短时间内实现大的效果提升,而生数科技能够针对核心算法进行持续的创新和突破,更快更有效的优化模型表现。
目前,生数科技也正在研发产业级的多模态通用大模型,目前已具备图像生成、3D生成、视频生成等能力。在图像生成方向,生数科技的模型效果已经超过Stable Diffusion最新版基础模型,但跟Midjourney V5.2相比在美学性方面还有一定差距,不过唐家渝表示,预计在年内会赶超Midjourney到时候的最新版本。在3D内容生成方面,生数科技能够在无需任何3D训练数据的情况下基于文本生成高质量的3D模型,与Shap-E、DreamFusion、Magic3D等主流模型相比,效果方面可以做到细节精细化,接近产业级应用。
“图像生成在艺术设计、产品设计、动画与游戏制作等创作领域有广泛的商业化潜力。比如美术设计者根据草稿图、创意概念来生成图像,进行动漫人物、游戏场景的制作。3D生成则主要将用于游戏资产制作、数字孪生等场景中的三维模型构建,大大提升3D内容生产的速度和质量。”唐家渝说。
从市场空间看,据Gartner估计,到2025年,超过10%的数据将由人工智能生成,生成式人工智能的市场空间将达到万亿美元规模。“从我们了解到的需求看,目前业内对成熟3D生成的需求迫切程度以及付费意愿度是更高的。”唐家渝说。