好久没打理Blog了,今天抽时间聊聊当下的企业AI应用需求趋势。
一、企业AI应用需求的底层逻辑
如果从去年年底开始算,我们接触的需求也不少了,具体数量肯定在四五百个以上,各类需求都有。如果一定要做个归纳分类,那可以从客户需求的出发点切入来分类,或者说从底层逻辑来分类。
01用新技术解决老问题
概述:这一类需求是最旺盛的,也是最精确的,但也是技术难度上最高的。
这类企业AI应用需求主要的应用场景可以归为三种:
降本增效:往往体现在企业内部办公场景:
- 如从纸质文件(扫描或拍摄后)中提取关键信息,可以加快信息收集和整理速度;
- 如基于规则和逻辑的比对,可以发现流程文件的明显错误和不合理性,常用于合同和项目文件的预审批等;
- 使用RAG对企业内部各类知识库进行问答,让用户在知识获取上得到前所未有的体验,如咨询报销流程,咨询某个设备的维修替换标准过程等,都可以让用户体验到更便捷更快速且具备汇总能力的回复体验;
- 当然还有内容生成,特别是列了大纲之后让大模型帮忙生成整篇文章,然后一步步进行润色或改写等。
这些都是降本增效的企业内部应用场景。
更好的对客服务水平:第二种常见的场景是对客服务,如智能客服。智能客服已经存在很久了,但多年来一直都没有被用户正视,比如在打客服电话的时候,我们都会基于按“0”键转人工服务。原因也很明显,交互过于机械化,理解意图能力很差,而且对于企业一方,维护的人工成本太高。但大模型出来之后,通过RAG和Agent,加上以前就有的NER等技术,在理解能力、准确度上已经发生了很大提升(从平均60%左右提升到平均80%?),可以完成更多任务。而且在知识维护方面,区别于之前需要人工去阅读理解资料,再做抽取,形成问答对(FAQ),现在普遍的维护工作是将资料文件扔给系统,让系统自动化进行处理,从提取、分块、向量化、元数据存储,再到索引创建,在处理大多数问答场景的时候都可以做到完全自动化维护。
- 销售/运维的辅助工具:还有一种场景也很常见,但往往都来自于体量较大的公司,那就是基于知识库来协同公司不同体系之间的工作。比如具有高知识含量的药企和高新技术等企业中,其研发体系与销售体系、研发体系和运营体系之间的协同。企业知识库建设和使用可以分成四步:知识生产、知识汇聚、知识协同和知识应用,这里的重点是知识应用,如何让在外面的销售和一线运营/运维工程师可以快速获取研发侧创造的产品知识进行销售和维护,并且在实践过程中反馈问题,提升知识的实用性。这里最主要的AI应用就是在知识整理好之后,对知识的问答。加上培训、开始和实战模拟等附带辅助工具,可以提升公司的产品和销售的协同,让最新的产品特性可以开始在市场铺开。第一时间形成最新的战斗力非常重要,而不是新产品新特性研发出来的半年之后,大部分销售才知道这是什么。
02 尝试新方案新产品
这世界上聪明人很多,有创意的人也很多,可以经常出一些非常好的点子,但点子和真正能做好一件事还是相差很远的。很多失败的案例都是在某一环节或多个环节出了问题,导致最终功亏一篑。这些环节包括:
- 市场接受度:市场是否接受你的产品,需要看在成本、使用体验或者客户价值感(甚至虚荣心)等方面是否能让目标客群放弃现有的使用习惯和产品,转而接受你的。嗯,现在没有那么多新的市场用户可以去挖掘了,特别对于toB市场,会付钱的客户可能总体上就是那些。
- 是否可以运营:我们毕竟还没有进入AGI时代,所以toB业务中还是需要人的参与的,如果一个新产品,对于运营人员的要求极高(可能是知识水平,操作技能,或者心理素质),那么它最终会成为摆设。
- 技术是否可以实现:大模型这一波确实让技术往前走了很多步,但是幻觉问题会长时间存在,如果仅仅是用大模型解决所有问题,那必然是会存在很多“概率”发生的问题的。我们在规划产品的时候,可能会去低谷这些问题的严重性,但后续让这个产品暂停下来的,很多时候是技术上的硬性能力缺失。比如图表识别,现在的多模态是可以识别一些标准的图表,但是对于实际中更灵活的分析图表,目前还没有很好的办法保证较高的分析能力,而需要人为去标准很多内容才能达到可用水平。
尝试新方案新产品的需求在今年上半年还是挺多的,下半年渐渐少了。我了解的很多客户,他们大部分最后都放弃了。
但我不是想说大家不要去尝试那些别人没做过的事情,而是要有方法:
- 多和技术团队交流:自己能花大量时间把当前LLM的发展了解透彻当然是好的,但我相信很多公司的业务负责人都有自己的本职工作,可能并没有那么多时间泡在技术研究里面。所以最好的方法是多和一些专门做LLM应用的技术团队多聊聊,比如我们TorchV,哈哈。好处在于不仅你可以知道哪些技术目前已经成熟,哪些虽然看上去很热,但依然有先天缺陷。另外,这些团队往往会有比较丰富的应用经历,还能从他们的视角提供一些好的建议。技术这一关,对于我们把目标定在哪个度的思考是非常重要的。
- 进行POC:POC(Proof of Concept,概念验证)是 一种测试不确定的方式,可以包含技术成熟度验证、运营能力验证和市场接受度验证:
- 技术成熟度验证:如果我们要完成的业务一共有A-B-C-D-E-F-G这样的环节,那么我们可以先去确定哪些环节极有可能会造成整个业务最终无法完成。比如先抽出B-C-F来测试,缺失环节可以先用人工来补缺,而不是花大量时间来开发系统。这样做的好处是可以验证是否这个业务在技术上是否真的可行,而且也可以为运营和市场提供一个Demo去验证他们的环节是否可行;
- 运营和市场接受度:有了Demo,就可以让运营人员试用,去感受是否可以有效运营,运营技能要求太高,也是阻碍一个产品最终被市场接受的重要原因。另外对于对外服务的产品,市场接受度也可以先用Demo进行测试,推广给一些愿意尝鲜的客户使用,获得使用反馈和购买意愿。
总之,尝试新方案新产品是非常难的,专属于少部分有远见有胆识的人,一旦成功,可能会有较高的收益回馈,但一定要注意方法。
03 科技创新需要
科技创新类的需求往往来自于央国企,交付物除了系统之外往往还需要协助甲方撰写和梳理论文所需材料。
实话实说,至少在上半年,很多这类需求相对来说价值不明确,更多是想借助AI强行搞出一个应用,进行所在体系内部的科技创新比赛。为什么我说价值不明确,因为目往往没有可量化的目标,且功能庞杂,比赛的评判方式更多是强方案,弱演示,而且一旦过了比赛,也很难被应用于实际生产中。所以此类商机最终转化成正式项目的不多。
但也不是所有科技创新类应用都没下文,今年还是有一个契机让这类项目最终成行。这个契机就是央国企的HC没变的情况下,派遣用工在减少,确实有些企业需要提升效率,所以效率类的需求还是有最终变成正式项目的可能性存在的。
二、当前趋势
从今年的7月份开始,我们感受到的AI应用市场有一些明显变化,下面我简要说说自己的感受。
01 通用场景的简洁与高要求
通用场景可以认为是在各行各业都能用的场景,比如基于Bot的问答功能。7月份开始,我们发现有一批传统企业开始提AI应用需求了,举例来说,比如BBA中的两家,还有大型的政务类应用需求。他们的共同特点是功能非常简单,也就是一个问答服务,但难度很高——准确率100%。
一般情况下,如果只是找几个人来测试,95%的准确率就已经不太能测出错误来了,只有在多端密集测试的时候才能发现问题。所以100%的准确率是不太可能达到的,客户其实也是清楚的。但是95%依然是非常困难的,仅仅使用LLM+RAG是很难做到这么高的准确率的,于是,很多辅助技术就被拉上来了。比如基于BERT的NER,槽位作为判断条件也被大量使用,多轮反问缩小范围,动态few-shot也必须要用上,……
一顿操作猛如虎,还好我们在一些场景中确实可以达到95%以上的准确率了。
你会发现在通用场景的趋势,区别于去年和上半年的很多AI探索者、尝鲜者提出的不少“脑洞”应用,下半年的很多传统大企业的需求是相对务实的:功能简单,但要求非常高(拒绝玩具)。
02 专用需求增多
专用场景的需求对于无行业背景的开发团队来说,理解其实比较难的,所以很多团队也根本没办法自主想到这些场景。
我们接触到的常见行业包括能源、医药和矿业等,因为涉及到客户信息,所以这里就不展开讲了。专用需求的特点是如果你对这个行业没有比较深的了解,根本不清楚哪些是刚需,哪些是伪需求。这些行业对于我们这样的团队来说有优势也有劣势:
- 优势:一旦和客户一起梳理清楚需求,在这个行业内针对AI应用部分,不太有强大竞争对手;
- 劣势:资质有时候很麻烦,另外就是流程非常长,没有大半年甚至一年,很难收到钱….
三、总结
好了,今天就说这么多了,如果您的组织刚好在考虑AI应用,可以联系我。
回顾一下今天的内容:
1. AI应用需求产生的三种场景原因:
- 新技术解决老问题;
- 新产品尝试;
- 科技创新需要。
2.下半年需求变化趋势
- 通用场景简约而不简单;
- 专用需求逐渐增多,抓住一两个行业会非常有利。
最后,我们团队现在还是很享受做这种简约而不简单的事情的,感觉产品能力提升非常快。上半年因为需求五花八门,一度也出现了乱打的情况,产品和技术沉淀变慢了,现在聚焦回来挺好的。
另外我们觉得
完成一个个小而难的任务,会让你具备解决大而难问题的能力;
完成一个个不论大小却简单的任务,是不足以让你有解决大而难问题的能力的。