「打造中国openai」,「西湖心辰」这家创立时间不到两年的发英小公司怎么敢夸下海口?
相比于国内的其他创业团队,心辰具有以下几大优势:
1.在大模型的雄帖寻找研究和商业化落地要早一年。积累了超过百万的明星客户,并训练出了匹敌gpt3.5的公司模型rio。
2.创始人蓝振忠曾在google主导研发了大模型albert(学术引用4300 ),蓝振在大模型领域颇有作用力,忠也中国也让他和ai风云人物们建立了紧密合作,发英比如transformer作者、雄帖寻找character.ai创始人noam shazeer。明星
3.初步组建了一支高人才密度的公司团队,覆盖了大模型的蓝振架构、训练、忠也中国推理等关键环节,发英吸纳了来自google、meta、amazon等公司的高管和科研专家。
4.背靠中国的新型研究型大学西湖大学,拥有丰厚的人才储备和强大的算力资源。
在蓝振忠看来,多模态大模型在ai进化演变中是一个必然趋势,这也是西湖心辰想要打造的「中国openai」的目标之一——创造一个可以自助联网的多模态大模型。蓝振忠深知要做成中国openai需要「高举高打」,正在寻觅一位如sam altman一样拥有极强的资源整合能力、充满远见且对工艺狂热的ceo入局。
作者|李梅 西西
编辑|陈彩娴
无论近日蹭 chatgpt 热度的讨论有多少,一个客观的行业事实却是:在赶超 openai、打造「中国版 chatgpt」的决赛圈中,最终能登上光明顶的团队并不多。
大致来说,目前国内追击 chatgpt 的团队可以分为三类:一类是有人才、有资本的互联网大厂,如百度、京东、字节等;一类是有强大科研实力(尤指能开发语言大模型)的产学研初创团队,如西湖心辰、智谱 ai等;还有一类,则是 chatgpt 火起来后入局的互联网老兵们,如王慧文、王小川等。(ai科技评论稍后将会推出更详细的派系梳理,敬请关注)
这三类团队,各有优势与劣势,但需要具备的基本要素却是共通的:首先要有充足的资金,因为大模型的研发需要大量的算力投入;其次要有能干的研发人才,精通运算规则与工程,能够训练出性能卓越的语言大模型;最后是擅长商业落地的职业经理人团队,能够整合资源、把握市场、搞定客户……而这一点,常被忽略。
为什么 openai 能研发出 dall·e 与 chatgpt 这样的产物?
openai 成立的目标是实现通用机器智能(agi),这个专业的词汇实际上并不能为大众所耳熟能详,但通过 chatgpt,现在所有的互联网客户都能在与 chatgpt 的交互中直接感受到了一个知识跨领域的 ai 系统是什么样的,了解到 ai 不再是 alphago 这样只能下围棋的机器。
总的来说,首先是良好的产物设计创新,而这反映了 openai 团队在落实宏远目标上的优秀执行能力:既能仰望星空,又能脚踏实地。
openai 做对了三件事:一是积极对外争取资源,引入了像微软这样的巨头;二是保持了研发团队的创新独立性,敢于激进地科研;三是具有沿途下蛋的商业思维,在追随 agi 的道路上,开发创新产物,既能吸引客户,又能通过强化学习的方式收集大量优质信息,反哺科研。
换言之,国内的三类团队在追击 chatgpt 的过程中,也要具备这三要素。大厂的潜力暂不评论,但偏科研的 aigc 初创团队与偏商业的二次/连续创业团队,在起点上的劣势则显而易见,前者缺商业资源能力,后者缺人才与工艺积累。
西湖心辰的创始人蓝振忠很早就看到了这个风险点。作为一家由西湖大学孵化的初创企业,西湖心辰正在积极寻找像 openai 的sam altman 一样既对工艺狂热,又有极强资源整合能力的 ceo。
一位有经验的 ceo,对 chatgpt 类的初创公司意味着什么?又为什么要加入西湖心辰这样的初创公司?
—— 1 ——
独树一帜的「chatgpt 玩家」
在这波 chatgpt 的玩家中,西湖心辰是一个独特的团队,其独特之处与它的创始人蓝振忠有密切联系。(此前ai科技评论报道过《albert一作蓝振忠:从谷歌离职回到西湖大学,只为打造一个24小时在线的「心理咨询师」》)
蓝振忠的本科毕业于中山大学,后到卡内基梅隆大学读博,研究方向为计算机视觉与多媒体分析。蓝振忠对机器智能的想象,是像电影《her》里面的萨曼莎一样,能文能武,掌握文字、语音、图像多个模态的能力,所以立志成为多模态研究者,2018年加入谷歌 ai 的研究与机器智能组从事自然语言处理(nlp)研究。
在谷歌,蓝振忠依托谷歌的 tpu 资源,两个月就训练出了性能媲美 3 亿参数大模型 bert 的轻量化版本:albert,开拓了 ai 领域内研究轻量化大模型的先例。2020年6月回国、加入西湖大学后,蓝振忠又继续基于大模型开发了辅助心理咨询的聊天机器人「小天」,并创立了西湖心辰。
创始人同时具备语言大模型与视觉模型训练能力的特质,让西湖心辰也从一开始就朝着多模态的产物方向增长。在sd开源之前,心辰就敏锐的判断text2image模型正在脱离实验室的范畴,达到商用级别, 在2022年8月快速推出了ai画图产物「盗梦师」(现已改为「造梦日记」)。
据了解,「造梦日记」目前积累了超过百万 c 端客户,数十家 b 端客户。作为一个次日留存接近 50% 的小程序,造梦日记一方面能在商业上盈利,为西湖心辰研发大模型输血;另一方面,造梦日记与小天一样,像 openai 的逻辑,在与客户的交互中收集了领先行业的高质量信息,反哺了运算规则的优化。
「造梦日记」优秀画作入选2022卢浮宫国际艺术展
国内语言大模型的玩法最先是在学术圈兴起,产学研团队有物理性的客观优势。西湖心辰能在这波 chatgpt 中紧跟行业步伐,与国内的大小厂竞争,也是因为其有领先其他玩家数年的语言大模型研发基础、商业化产物探索与坚实的科研人才基础。
chatgpt 还没出来之前,西湖心辰就已经有自研的文本生成产物「hey friday」。他们最早在海外推广,有数万客户,去年八月 aigc 在国内火起来后,他们就开始研发面向国内的文本生成产物,chatgpt 刚出来没多久,西湖心辰就推出了类 chatgpt ——「心辰chat」。
在时间上,心辰chat 比一批号称「即将推出」的公司快了将近一个月、甚至两个月的时间。相比许多功能未明的种子「中国版 chatgpt」,心辰chat 目前更具确定性,抢了先机。
在产物设计上,心辰chat也做了许多创新:
首先,「心辰chat」是一个可以自助上网的 ai 系统。我们向它提问新近发生的事件,比如「马斯克什么时候收购了twitter?」、「美团联合创始人王慧文,最近做了什么?」等等,它都能对答如流。
「心辰chat」问答示例
而 chatgpt 目前无法访问互联网上的内容,接入bing搜索之后才能联网,所以对于「马斯克什么时候收购了推特」的提问,它则会根据旧语料给出「马斯克最近并没有收购过推特,推特是一家独立的公司......」这样的回答。
其次,「心辰chat」是一个多模态对话系统。chatgpt只具有文本生成的单模态功能,但在与「心辰chat」的对话中,我们除了能让它写作以外,还可以用它来生成图像。
「心辰chat」生成图像示例
如上图所示,在所生成图像的基础上,客户还可以直接「用嘴修图」,交互方式便捷有趣。
在蓝振忠看来,多模态是一个必然趋势,因为单模态的学习能力有限,比如客户告诉 ai一个颜色词「红」,如果「看不到」红色对应的图像,ai 是无法理解这个词的;类似地,假如只有关于「跑」的文字和图像,ai 也无法获取这个动作的真正含义。
虽然西湖心辰是一家初创公司,但由于创始团队在文本与图像两个模态上均有一定时间的积累,同时避免像谷歌急匆匆推出与 chatgpt 差异化不大的产物 bard 引来的反感与抨击,西湖心辰选择追求多模态版的「中国版 chatgpt」。
西湖心辰有积累,但蓝振忠也看到:作为一个小团队,能否田忌赛马,在国产 chatgpt 的竞争中冲出重围,西湖心辰还需要更强的武装与策略。
—— 2 ——
西湖心辰的长处与短板
「如果我们今年不打算入局 chatgpt,我们今年的盈利就已经能覆盖研发投入、实现净利润收入了。」蓝振忠告诉 ai 科技评论。
行业内的一个共识是:agi 的实现是万里长征,沿途会产生许多能引起小爆点的成果,正如 dall·e 不会是 openai 的收官之作一样,chatgpt 之后,openai 也会在原来的基础上推出更强大的产物。agi 需要长期主义,chatgpt 的追随也同样如此。
当蓝振忠与团队决定加入打造中国版 chatgpt 后,他们就意识到,他们需要一位 ceo。
长城非一日建成,agi 的研究也非一日之功。虽然文字生成神器 chatgpt 是一个更为具体的目标,但在蓝振忠等玩家的眼中,chatgpt 只是通往罗马的一个驿站。而就拿这个小小的驿站来说,最终能参与的团队就不会太多。
以语言大模型的研发为例。信息、运算规则与算力,三者缺一不可。平心而论,西湖心辰在类 chatgpt 上的科研基础与工艺积累已经超过了大多数的 ai 公司。
首先看信息。
chatgpt 之所以能甩开全球的竞争对手,关键在于信息积累。chatgpt 一经推出,一周内就收获了百万客户的使用,在初始信息(客户反馈)的积累上对模型不断迭代,强者愈强。但幸运的是,chatgpt 进不来中国,所以中国的团队还有机会。
目前来看,追击 chatgpt 的三类中国团队当前都处于起跑线上,大厂、初创企业与资本大鳄的差距都还不算太大。凭借工艺积累,西湖心辰这样的小公司是有长板的。
以信息为例。西湖心辰的产物矩阵包含小天、造梦日记、hey friday,合计客户量超过 140 万 c 端客户、数十家 b 端客户。早期的信息积累,包括客户咨询、写作、绘画的提示词描述等,能够为心辰chat提供高质量的信息源泉,这是许多公司所没有的。
其次是运算规则人才。
chatgpt 的诞生并非偶然,跟其背后的团队 openai 聚集了一批科研天才有很大关系。
一位博士毕业的行业观察者告诉 ai 科技评论,openai 的成功与其团队的年轻化与理想化分不开。
从个人增长的规律来看,无论国内外,无论有没有「35 岁被裁员」的压力,许多科研人才过了35岁、40岁后,都普遍从一个有理想的科研青年,进入了回归家庭的养老状态。学术界也逃不开「35 岁」的年龄分水岭:由于通过长聘教轨制度考核的难度太大,许多青年教师在拿到终身教职后就会选择躺平。
因此,一个能吸引年轻、有理想的人才的团队,将是决胜 chatgpt 的关键。而依托高校科研力量、能不断聚集年轻科研人才的团队,在这一点上具有独特优势。
据了解,目前西湖心辰的团队已经有大模型研发的工艺积累,比如 rio模型,是国内最早商业化落地的经过 instructional learning 的大模型,其效果已经超越了原版gpt-3。比如造梦日记能做到秒级出图和更强的中文理解,也是心辰团队对于采样函数和模型理解层做了独特的优化的结果。
此外,西湖大学为西湖心辰提供了强大的算力支持。蓝振忠介绍,如果西湖心辰只在图像生成与文本写作上发力,现有的人才资源、客户资源与算力资源是足够的;但在追赶 agi 与 chatgpt 这样更大的目标上,西湖心辰需要更多的资源。
算力是关键的壁垒之一。
如上图所示,大模型的研发需要解决诸多问题,左图中从右往左,黄色部分到绿色部分、再到黑色部分,研发环节会越来越底层,难度越大、研发投入也需要更多。目前,大多数的团队都只进行到信息端的信息标注,运算规则端的监督学习,而 openai 是从信息清洗、自监督学习开始,从底层做起。
日前谷歌推出 bard 来与微软对战,行业人评价这本质上是 tpu 与 gpu 的对决。而对国内没有 tpu 的团队(包括西湖心辰在内)来说,算力的壁垒会更高。据蓝振忠了解,国内许多公司、甚至大厂,都没有一千张以上的 gpu,那么对西湖心辰这样的创业公司来说自然更难。
对于这个问题,蓝振忠很理性。他认为,要解决资源问题,一要引入更多的资本,二要与大公司合作(如微软与 openai 的模式),三要建立良好的客户联系(包含小 b 端)。而目前,西湖心辰的团队中,包括蓝振忠本人也是一位科学家,更擅长做研究。
因此,西湖心辰需要一位 ceo!
—— 3 ——
寻找「奥特曼」
从造梦日记开始,西湖心辰就进入了许多投资人与行业的眼中。这意味着,西湖心辰将要进入下一个更大的阶段,同时也将面临更大的挑战。
加上越来越多的玩家涌入 chatgpt,aigc 往工程化更进一步,蓝振忠知道,寻找一位能高举高打的ceo很关键。他们相信,西湖心辰会是国内最有潜力实现 chatgpt 的团队之一,但现实的问题也需要脚踏实地去解决。
早在图像生成中,蓝振忠就向ai科技评论表示:「不仅是 ai 画画,事实上文本生成也具备极大的潜力。」
与图像生成相比,文本生成的客户基础展示出了更大的成本优势。
不同于图像生成的客户囿于 b 端、甚至小 b 端,图像生成的使用群体主要是专业人群,场景也有限,而文本生成的应用场景覆盖营销文案写作、邮件写作、办公写作、论文写作、短消息回复等等用途,也更细碎。一个图像生成软件目前在风格与内容泛化上的能力仍较弱,只能与垂直领域结合,但文本生成可以同时提供多项功能支持,任何人都可以使用、也都需要。
因此,虽然语言大模型的投入更大,但当客户足够多,数十亿的成本平摊下来,几乎可以忽略不计,跟高速的建设是一个逻辑。同时,类似插画师的客户群像在使用工具上的能力更强,而文本生成的客户更多是 c 端小客户,后者更愿意依托现有产物,这也给了类似 chatgpt 这样的文本生成产物提供更大的增值支持空间。
事实上,这也是微软的 ceo 萨特亚对机器智能的理想。自萨特亚接手微软 ceo 后,他认为微软的业务应该依托三个方向的科技投入,而这三大工艺则是云端服务、机器智能与量子计算。在萨特亚的想象中,我们的生活还远远没有智能化;如果足够智能化,那么一个普通的职工每天就不会花那么多时间在琐碎的办公环节上,比如回复邮件、写工作汇报、写周报日报、订机票等等。
而文本生成,正可以帮助人们的时间从这些琐碎的日常中解放出来。——这也是蓝振忠的科研理念。从研究机器智能开始,他就相信,未来会有《her》里面的萨曼莎一样的 ai 系统,让每个人都有一个私人助理。
蓝振忠表示,他希望寻找一位能认同该理念、对 ai 能产生的价值潜力有强认同的 ceo。只有发自内心的认同,才能全力以赴。
他指出,sam altman 当初引入微软这样的资本大鳄,对 openai 研发出 chatgpt 是功不可没的关键一步。微软对 openai 有认同,为支持 chatgpt 的研发,萨特亚曾坚决抵抗内部的反对、甚至绕过 cfo 直接调用原本用于微软内部研发的支持器。
在追求 agi 的道路上,sam altman 不一味坚持工艺理想主义,眼光独到、引入微软,平衡了工艺增长的需求与商业转化的目标,找到了一条正确的道路帮助 openai 往 agi 的理想更近一步。随着 chatgpt 的成功,微软又大笔加注,openai 的科研实力也将肉眼可见地潜力无限。
蓝振忠谈道:回到中国的市场来看,西湖心辰与 openai 在人才与规模上具有许多相同之处。openai 能在谷歌、微软、facebook 等等大厂云集的美国赛场中突围而出,西湖心辰在国内同样也有机会。
作为一名科学家,蓝振忠很严谨,不画饼。过往的产物打造已经验证了西湖心辰的商业潜力,蓝振忠与团队清楚自己的科技实力,也看到自身运营经验的不足,而合作是共赢的基础。西湖心辰需要 ceo、需要战友,也需要k8凯发天生赢家一触即发人生的合作伙伴。
chatgpt 有门槛,有商业价值。西湖心辰麻雀虽小、五脏俱全,加之当前国内风云未定,如果你是一位看好 chatgpt 的成功创业者,西湖心辰邀请你来当 ceo!(公众号:雷峰网(公众号:雷峰网))
有兴趣的读者欢迎自荐,联系西湖心辰创始人蓝振忠:lanzhenzhong@westlake.edu.cn
(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。