生成式AI技术栈 图片来源:A16Z在发展初期,依靠大模型供应商是应用层公司起步甚至发展业务的好办法。但在初具规模之后,如何处理模型与应用之间的关系,成为了生成式AI应用公司不得不面临的重大问题。 一种看法是,模型即服务(Model as a Service),这足以让一个小型的开发团队快速迭代,并随着技术的进步及时更换模型供应商。Jasper确实也这么做了,除了OpenAI的模型之外,Jasper在其产品中还纳入了其他开源模型,例如GPT-J、GPT-NeoX、T5和BLOOM。另一种看法是,对专有的产品数据进行重新训练,自研大模型。李志飞也提到,“面对专业用户,Jasper原本存在一种可能的路径,那就是自建大模型、开发出独特的满足专业用户的产品feature,从而留住专业用户”。但同时他也认为,这并不是一条乐观的道路。自研大模型对团队的资金和人才有更高的要求,初创公司很难具备科技巨头的财力、物力、人力。况且,在美国以OpenAI为代表的几家头部大模型公司已经逐渐占据主导地位,部分开源大模型也基本完成了生态建设。这也是为什么,做AIGC应用领域的创业公司这么多,大模型却还是巨头们的游戏。越来越多的开发者正在提出同一个担忧,如果继续使用OpenAI的API进行应用层开发,OpenAI最终是不是可能会发布和他们竞争的产品?除了聊天机器人ChatGPT,OpenAI还曾发布过三款产品,文字生成图像工具DALL-E、自然语言转代码系统Codex、自动语音识别系统Whisper:
大量的资金、人才、技术涌入了基础大模型,而对于应用层的讨论声音要小很多。大模型是基础设施,需要通过应用才能和用户产生关系。这是一个更大的生态。百度创始人、董事长兼首席执行官李彦宏认为生成式AI将催生新产品、新业态,会有很多创业和投资,大模型时代最大的机会在于应用层。他曾表示,“在应用层,将会出现全新的、十倍于现在微信和抖音的创业机遇”。AI应用层的变革主要分为两类,一种是常见的基于大模型做既有产品的升级,代表公司为微软、Salesforce、阿里巴巴等科技巨头,以及大量的中小软件公司。微软已经将OpenAI的大模型能力,引入其全系产品中,包括New Bing搜索引擎、Microsoft 365 Copilot、Windows Copilot,国内阿里巴巴旗下的钉钉,也基于旗下通义千问模型进行了改造。传统SaaS公司正在快速接入AI。在细分行业领域,AI产品多应用在销售、咨询、管理等产业场景中,帮助企业打造竞争壁垒。以全球排名第一的CRM厂商Salesforce为例,Salesforce坚持AI+数据+CRM战略,在2023年推出两个AI产品EinsteinGPT、SlackGPT。另外一种,则是基于AI大模型的原生应用,但目前尚未爆发。以最近爆火的Agent为例,Agent作为人与LLM的中介,可能会挑战原有平台的分发机制,用户不再依赖平台使用软件,而是直接与Agent互动获取服务,过去SaaS也可能会变成AaaS(Agent as a Service)。新的产品逻辑将进一步降低用户使用技术的门槛,并渗透到新的使用场景。无论是既有的互联网产品还是正在成长的AI原生应用,在大模型时代都有可能经历新一轮洗牌。金山办公技术总监熊龙飞告诉「甲子光年」:“关键在于,要构建自己的技术壁垒。”过去的积累与面向未来的投入都很重要。比如,金山办公除了大模型的功能模块之外,还积累了35年的文档处理底层技术,以及从2017年开始投入研发的AI能力。此外,为了结合大模型,金山办公还特地开发了向量化系统、提示词管理器、各类AI能力和大模型的外挂系统等基础技术。应用层公司的核心壁垒不仅仅在于模型能力,产品设计、数据管理、服务网络等方面同样重要。以Grammarly为例,有用户告诉「甲子光年」,“Grammarly主要应用场景有键盘输入法、浏览器插件和各个终端应用。ChatGPT在论文写作或者满分作文上兴许能用到,但日常沟通还是Grammarly更方便” 。随着模型能力的发展,算力价值在应用层可能被抹平,数据才是长期的壁垒所在。真格基金管理合伙人戴雨森在之前的一次演讲中表示,“当数据的质量和数量增加时,模型的性能和效果会提升,同时也会增加用户壁垒”。以微信为例,最早期的微信其实没有壁垒,后来通过与众多用户之间的特有关系形成了网络效应,从而产生壁垒。在大模型可以覆盖的通用场景之外,创业者在垂直领域积累深厚独特的行业数据,或者做冷门领域的先行者,或许更有可能获得成功。新一轮的AI浪潮无异于大浪淘沙,只有拥有核心本领才能立于不败之地。