图片来源@视觉中国
(相关资料图)
“十倍于移动互联网的平台革命”,不仅吸引着国内众多科技大厂投身AI新浪潮,或自研通用大模型,或推出相关产品和解决方案,向企业服务、金融、工业等行业加速渗透,同时也引发细分领域的诸多垂直厂商积极占位,深耕领域内的“一亩三分地”。
某种程度上而言,大模型是垂直厂商们“不得不为之”的“跟风”选择,即便在资金、技术、人才等硬件条件上与科技大厂相比不具优势,但面对新兴技术浪潮的冲击,不进则退,且极容易被新进入者颠覆。
这个新进入者,既包括新兴的大模型创业公司,也指向“借机”扎根产业深处的科技巨头。
以小博大,在夹缝中找机会继百度、阿里、华为等第一梯度玩家陆续发布大模型相关产品、方案,腾讯云也于近日正式公布行业大模型技术方案,加之今日发布大模型服务平台“火山方舟”的火山引擎,国内“头号玩家”们的大模型技术方案和商业路径终于全部“浮”于台面之上。
“基本可以判断,所有行业都值得用大模型重做一遍。当然重做的方式可能有很大的差异,有些行业只需要用通用大模型做finetune或者对齐,但有些行业可能需要从头开始训练,有些行业甚至连模型结构都要换掉。”毫末智行数据智能科学家贺翔对大模型的商业前景判断,与当前市场上的主流声音一致,认为大模型正成为人工智能浪潮的重要拐点。
尽管大模型是片蓝海,蕴藏着“万亿级商业价值”,但“百模大战”、“千模竞帆”并非戏言,产业侧则是更具确定性的商业标的,竞争激烈程度不言而喻。
百度、阿里、腾讯等具有技术积累、团队优势和资金支持的科技大厂率先抢跑,并加速应用落地,开启新一轮行业客户之争。
百度曾宣称与超过300家企业成为生态伙伴;4月阿里云也宣布与七家企业推动大模型在油气、电力、交通等行业落地;华为早前就已发布盘古金融、电力、药物分子三个垂直领域大模型;而刚刚公布MaaS解决方案的腾讯已和数十个行业的22家企业达成大模型共建合作;火山引擎则透露抖音集团内部已有十多个业务团队试用“火山方舟”,首批邀测企业包括金融、汽车、消费等众多行业客户。
而刚刚发布私域大模型的传统ICT厂商新华三、将于7月发布大模型的京东等等,都关注大模型与产业融合,直接瞄准垂直赛道。
大厂综合实力更强,一旦模型与场景“飞轮”转起来,更快的掌握优质数据并搭建起服务生态,垂直行业厂商们想再要追赶只会难上加难。
但并非没有一搏的资本。综合了专家经验、组织能力、工程能力的产业knowhow,是业界普遍认为垂直行业厂商构建大模型的资源壁垒与护城河。长期根植于一线客户,深入的需求理解和丰富的落地场景优势,也是垂直行业厂商可贵的“筹码”。
押注专业化,行业数据大比拼“大模型这个赛道还是太早期了,如果说GPT-4和Bard、LLaMA、Claude(编者注:分别是谷歌、Meta、OpenAI前员工创立的Anthropic发布的大模型)等国外不同技术栈的大模型还存在比拼的话,那么国内的大模型还没有进入赛场(过于早期,没有商用,无法比较),所以目前不存在国内通用大模型之间的比拼。而在作为基石的国内通用大模型还没有真正进入赛场的情况下,垂直大模型也不存在太多的可比性,一切都还在早期。”伙伴云董事长兼 CEO戴志康对正见TrueView表示。
他进一步举例补充,“某个用于Text2SQL(编者注:将自然语言文本Text转换成结构化查询语言SQL的过程)的垂直模型,可能还比不上LLaMA通用开源模型的Text2SQL能力。”
目前大模型开展虽轰烈,却还处于初级阶段。百度、阿里等较早公布大模型技术路径和架构全景的头部公司,产品也均未进入公测,属于垂直行业厂商的时间窗口尚未关闭。
“垂类行业只要紧跟潮流,精准解决用户需求,不会脱离AI大模型。”某股权投资机构副总裁史松坡向正见TrueView分析了垂直行业厂商在大模型时代的机会点,“大模型的落地和应用离不开掌握着流量和用户的垂类厂商,它们需要解决的是如何紧跟大模型,并利用相关技术解决尚未满足的行业客户需求。”
加快大模型项目共创,由单点测试扩散至规模化商用,积累垂直领域数据和业务know-how,进而优化大模型训练和调优能力,挖掘和解决行业客户尚未被顾及,或被充分改造的痛点,将数字化延伸至产业的“神经末梢”处,这也许是当前窗口期内垂直行业厂商们的机会所在。
当前越是传统的行业,对大模型产品和解决方案越是有针对性、专业性和精准度的高要求。专业的训练数据和行业知识库是领域大模型的难点,也是垂直行业厂商的优势。
“假定大家训练和调优能力都差不多,那么谁有最大量、最高质量的垂直领域数据集,谁就拥有了产出更优质垂直模型的能力。即便现在训练和调优能力稍弱,但长期来讲技术能力是能够被追平的,而数据集的鸿沟则不一定能被追平。”在戴志康看来,“真正影响垂直厂商的差距点只有一个,即用于训练垂直模型的数据集。”
贺翔同样认为垂直与通用大模型“隔行如隔山”。“在纯语言相关的垂直领域,可能存在垂直大模型与通用大模型的竞争。但是在自动驾驶这种独特的垂直领域,不管是语料、任务、还是测评标准,都与通用大模型完全不一致,只能够用自动驾驶大模型来解决。”
新的马拉松赛跑,在尝试中找出路目前大模型技术和产品密集发布,却尚未有成熟案例和成功路径借鉴,垂直厂商们只能摸着石头过河,是MaaS(Model-as-a-Service,模型即服务),还是“完全没有必要去卷大模型,而是应该投身到应用层创新”,标准答案尚未生成。
火山引擎总裁谭待判断,“企业使用大模型,未来可能会呈现“1+N”的模式:“1”是通过自研或深度合作,形成1个主力模型;由于成本和场景复杂多元等原因,在这个主力模型之外,还会有N个模型同时应用。”
“企业所需的并非仅仅是一个大模型,而是多个大模型。”竹间智能创始人兼CEO简仁贤持相同观点,“坦率来说,目前绝大多数的生成式AI都是基于谷歌开发的Transformer开发出来的模型”,他认为大模型是不是自研已经不重要了,“真正重要的是,最后用大模型驱动做出的产品是否有实际应用价值。”竹间智能提供的是MaaS服务模式,并设定目标要让企业在99万的预算内即可打造一个企业自有的大模型。
“中国不太注重生态,一般都是把别人全‘灭’了、全‘杀’了,其实自己也没有发展起来。”自研大模型的Pre-A+轮企业澜舟科技创始人兼CEO周明号召行业厂商应该有一种平和的心态,“To B存在很多新的创业机会,包括对客户、行业的理解,客户与大模型团队的互动,形成某种意义上的战略合作伙伴,或者形成所谓数据飞轮、功能飞轮,做得越深,相应的壁垒就越高。任何一个公司进入到该领域,包括巨头公司,都要花同样的功夫进行积累。”
虽路径不一,垂直行业厂商却目标一致。皆是用好大模型这一新的生产力工具,升级原有的生产方式,建立新的生产关系。而这也将是垂直厂商和在互联网及两次AI浪潮期间崛起的明星企业间,一场新的马拉松赛跑。
“垂直模型的底座仍然是通用模型,最终决定市场格局的,是底座通用模型的能力和上层垂直模型的优化。而现在通用模型的发展日新月异,所以垂直模型也面临刚发布不久就需要升级底座的情况。”戴志康解释说,“基于ChatGLM-6B研发的垂直模型,即便当下效果不错,但当三个月后ChatGLM-6B被xxx-6B超越,垂直模型也面临重新洗牌的局面。”他直言,“如果认为现在凭借垂直模型就能构成拐点,可能只是一种市场营销手段。”
在长期竞争中,没有稳固不变和一蹴而就的市场格局。这场新的马拉松赛跑,匆忙开局,终点未知。
标签: