如果近期路过上海南京西路、陆家嘴等地铁站,乘客留意会发现,站内的广告牌有多幅AI生成的绘画作品。这些绘画作品都是由国内的生成式AI平台Tiamat提供的。
在海外,当下热度最高的AI生成平台非Midjourney莫属,近段时间,人们用Midjourney生成了各种以假乱真的图片:特朗普被追捕、马斯克成为一名苏联工程师、中国男足获得了世界杯冠军……随便拿出一张都能做到以假乱真的程度。
(资料图片仅供参考)
在国内,成立于2021年的Tiamat相比起来低调不少,但属于国内最早做AI生成的平台之一,其自研的MorpherVLM是国内首个基于概念融合范式提出的近百亿级跨模态生成模型,与海外技术节点、开源社区保持同频。
Tiamat创始团队非常年轻,但在2022年10月,Tiamat已完成数百万美元的天使轮融资,在今年2月,紧接着宣布完成近千万美元 A 轮融资,由DCM和绿洲资本联合领投。
年轻团队,加上国内首家AI生成平台的标签,让背后的创业故事显得非常传奇。第一财经此前拜访了位于上海张江创业工坊的Tiamat办公室,附近是一条AI街区,几栋高楼林立,更多的大厦正在动工修建,Tiamat的气质与这里有些相似:虽然目前稍显冷清,但指向未来。
踩中时代风口
以Text-to-image生成模式、Diffusion模型为显著特点的图像生成平台,正在颠覆传统的内容创作和艺术设计领域。
而学了十年美术,大学转学计算机科学技术的创始人兼CEO青柑,刚好踩在了时代的风口,成立了Tiamat AI绘画平台。
Tiamat 团队从2021年开始进行模型训练,以自研并自主训练底层模型的方式,与海外技术节点、开源社区等保持着同频。青柑表示,在一开始融资的时候,他们还需要花很多精力教育市场,解释什么是AI 生成,什么是多模态。彼时,距离 Stable Diffusion、Midjourney这些引领着行业革新的产品上线还有几个月左右的时间。
作为国内 AI 生成第一批团队,Tiamat 如今也成为了为数不多成功融资并实现了商业化的平台。
“因为我们一方面有自研的底层模型,另一方面商业化跑得也比较快,在这个基础上又是国内做得比较早的,对这个技术也比较敏感,所以我们的两轮融资是比较快就结束了。”青柑表示。
2022年10月,Tiamat完成了数百万美元天使轮融资,投资方为DCM。23年初,Tiamat紧接着宣布完成近千万美元 A 轮融资,由DCM和绿洲资本联合领投。
绿洲资本创始合伙人张津剑此前对第一财经表示,投资的考虑在于,Tiamat团队在技术上有一定的领先性,创始人也很年轻,学习能力也很强,同时这个技术中美之间的差异较小,团队利用这个技术结合中国的审美有一些迭代和创新。
“我们这么年轻的履历摆在这里,大家也会愿意去相信我们,是因为我们确实有实打实的技术在,能够和别人拉开差距,能够有很好的资源。”青柑表示,自己和团队其他核心成员来自于中科院上海科技大学以及伦敦艺术大学,在AI图片引擎、数字孪生等方面,团队都有技术积淀。
青柑介绍,创始人团队在大学的时候就已经形成,在大四就拿到了第一笔种子类融资,在有技术,且有学校支持的情况下,团队创业做AI生成是顺理成章的。
创始团队早期在开源技术社区里面待了很久,当时AIGC的概念还没有兴起,青柑对第一财经表示,“在21年下半年的时候,当时在社区里面有一些技术大佬提出了大模型的可能性,当时很敏锐第一时间关注到了,那个时候还不叫AIGC,就是单纯发现了一个新的技术,觉得这个事情很有意思,所以我们非常早就在开源技术社区里面去做很多相关的技术研发。”
做得早、与海外开源技术社区同频,是Tiamat的优势,青柑表示,“Tiamat在自研和内测的系统和Midjourney的内测几乎是同时的,可能相差不过半个月,因为他们的负责人和大家在技术社区里会互相讨论一些问题。”
在推出后,Tiamat在4个月内全网曝光量达到了5000万,这些全都是自然流量,Tiamat表示,一直都没有在营销上花钱投广。
一开始因为图片审美质量较高,Tiamat更多是在符合调性的小红书上火起来的,在发布了内测图片后,Tiamat引起了非常大的关注,至今#Tiamat人工智能艺术#在小红书上还有2300多万的持续点击和浏览。有趣的是,很多品牌方和资方也是通过小红书找到团队的。
据团队介绍,目前Tiamat已经与央视网,以及《时尚芭莎》、《嘉人》等一线时尚大刊建立长期合作关系,并与众多头部游戏公司开展了战略合作。在产品一侧,已经实现了内测高活跃用户数千人、月度新增数万人,社区用户涵盖国内设计、艺术创作、多模态技术等头部博主。
“我们应该是国内AI图像领域在商业化方面跑得最快的。去年 Q4,我们有几百万元的合同订单。”青柑表示。目前,Tiamat 20%的用户群体是小B端的设计师,60%是泛设计行业人群,其他则是对新技术和新数据更感兴趣的人。
何以立足
虽然做得很早,但在当下AI生成平台涌现的情况下,Tiamat凭借什么立足,AI绘画能否建立护城河?
青柑认为,与海外热度最高的Midjourney、Stable Diffusion等对比,Tiamat的模型和社区优势主要体现在中文自然语言处理上的持续积累,以及能够提供更适合国内用户需求特点的图像,并将核心用户定位于专业人群。Tiamat生成的图片有相对独特的审美和风格。
文本图像生成领域是从2022年二三月开始公开测试,去年七八月,SD(Stable Diffusion)这一类开源模型放出来之后,紧接着就有大量的创业者入局。青柑观察到,很多公司可以不通过训练而直接将SD的模型封装起来使用,大大降低了AI生成的门槛,这也是平台涌现的原因。
但这一类已经训练好的模型,在具体的商业化上会有一些局限性。在图像的商业化方面,会更关注的是精准性、可控性这些指标,能不能更好地让图像展现出人类理想的构图、或者一致性的角色等。
青柑解释,开源开的是已经训练好的模型,但这个东西具体是怎么训练的,数据训练上的细节是很难被大家知道并模仿的,在这个基础上进一步去做图像的精准性、可控性和商业化,就很难,这也是Tiamat为什么要坚持自研模型的原因。
“在国内市场经常会遇到的一些情况是,一些厂商需要图像生成的供应商,可能会找到一些用了开源模型的公司,发现没法达到好的效果,然后再来找我们。”青柑提到,自研也是Tiamat商业化比较顺利的理由之一,因为非自研的服务商始终不能特别直接地生成一个行业想要的东西。
以服装领域为例,如果需要 AI 来代替设计师或者帮设计师寻找灵感,首先他们的输入方式一定是服装设计领域的“黑话”,如领口版式、版型,不一定是外行能够理解到的行业知识。所以团队在去做行业模型的时候会先去理解设计师之间的沟通语言,再去理解对应的图片,在此过程中需要重新去构建一些图像文本作为训练数据集,基于大模型去调整,然后才能做行业的专有模型。
但在这个基础上,众多有实力的大厂也在入局 AI生成,是否会对团队带来一些压力?青柑认为,就图像生成来说,并没有观察到像文本领域一样由参数量引发的质变,因此,在数据清洗和数据选择这一方面,大厂要去经历的流程和创业公司没有太大区别。
此外,对于大厂来说,基于产品生态,在训练语料的数据量上会有一定优势,但可用性上不一定更强。再加上中文的语汇环境特点更加复杂,数据清洗难度很大,目前实际可用性的文本量级并没有这么高,可能仅为英文语境可用性的 1/20。
而相比于ChatGPT这样的文字大模型,一次训练可能会花掉几十到几百万美元,AI 生成模型需要的参数量级在十亿左右,要低将近 100 倍,成本压力相对较小,这也是创业团队的机会。
“从一个比较直观的感受切入,如果文本出现了一些逻辑上的错误或对话上的失真,用户可以很快地感受到,而不像对于图片的细微瑕疵可能会有更好的包容度。”青柑表示,在文字大模型上花费的时间精力和算力是远大于AI Art 领域的,对于Tiamat来说,不停地把模型的参数量级进行扩张并不是最重要的指标,而是更多的关注这个图像本身的可控性。