我的学习笔记

土猛的员外

ChatGPT可以为智慧文旅带来什么

最近只要你接触互联网,一定被ChatGPT疯狂刷屏了。确实ChatGPT作为AI领域的应用服务,据说出发布到1亿使用者只用了60天,而且还在以指数级的速度增长用户,给全世界在AI方向上带来了全新的想象空间。因为我一直在主导公司的AI产品“力石小知”,所以最近也被多位客户和同事问到ChatGPT的事情,那今天就来聊聊我自己的理解,ChatGPT可能给文旅行业带来什么影响。

下面我会从以下几项内容来讲述:

  1. ChatGPT是什么;
  2. 缩小到文旅行业,ChatGPT有无法解决的问题;
  3. ChatGPT会给文旅行业带来哪些改变,包括游客习惯、从业者思维和产品形态等;
  4. 聊聊给行业的启示。

一、ChatGPT是什么

其实大家上网搜一下,已经有太多ChatGPT的介绍了,我不太想复制黏贴,就用我自己的语言来简单介绍一下吧,尽量让所有朋友都能看得懂。

ChatGPT是OpenAI这个组织的一个产品,OpenAI的创始人叫山姆·阿尔特曼(Sam Altman),也是一个斯坦福辍学的天才,投资他的主要有哈佛辍学的比尔盖茨(微软)和特斯拉的马斯克等。今天我们不去管商业的东西,先来简单讲一下技术,特别是在ChatGPT相关的认知智能(听懂人类的自然说话的语言,并进行对话)的发展历程:

  • 人类最早去解决自然语言问题用的方法是语言学家的语法逻辑,当然,这个计划失败了,主要原因不是逻辑问题,而是这种方式无法借助计算机的能力,以至于无法大面积突破;
  • 后面采用的是统计学能力,狭义上可以理解为用计算机和统计学去分析已有的海量人类语言,然后通过其中的单次/词语出现的频次和先后顺序等来猜测这句话的意图,该方法在翻译、语音转文字等方面非常有效,但是对于自然语言的解析还是不够;
  • 随后就是基于机器学习(下面的图例主要讲机器学习)的各种升级,如深度学习和神经网络阶段,这里就有谷歌推出的Transformer和双向无监督预训练模型BERT,而ChatGPT的主要模型GPT也是基于Transformer的,GPT可以翻译为一种生成式的预训练Transformer模型,如果只从技术上来说,BERT应该优于GPT,特别是在GPT2出来之前。当然,现在的ChatGPT用的是GPT3.5。

下面我用一个大部分人可以看懂的例子来讲述一下这些人工智能的原理,当然,只是一个例子,所以屏蔽了大量的细节。

弹子球机

假设我们有一个弹子球机器,把各种不同(颜色、重量、尺寸)的球从顶部扔进去,球会和里面的这些柱子(杯子上方的这些圈圈)相碰撞,最终掉下来,落进最下面的杯子里。我们期望机器可以做到”红色的球最终掉进红色的杯子,蓝色球掉进蓝色杯子,依次类推“,我们可以做的事情是调整机器里面的柱子(假设这些柱子表面是不规则的,而且我们可以旋转这些柱子)。

如果我们一次次进行试验,然后不断去调整里面的柱子,是可以达到一个比较理想的状态的。需要注意的是,这里我们采用计算机来做试验,所以如果试验100次不够,那就1亿次,如果柱子的层数不够而引起达不到理想的状态,那么我们可以不断增加柱子,就像图里面,每个柱子其实又可以细化成无数的柱子。最终让红球落到红杯子,蓝球落到蓝杯子,…… 。这时候,这些所有的柱子(参数)的状态,就形成了一个模型,这个模型的作用就是按颜色分球。

当然,这还是属于有监督学习,后面从Transformer组件出来之后,衍生出BERT和GPT这两个模型,都逐渐摆脱了有监督学习,转变为无监督学习。BERT是将维基百科全部吃下去了,然后自己消化学习;而GPT模型GPT2开始吃下去的数据和知识就更多,以至于到GPT3.5,它的模型内部已经有1750亿个参数(一个参数你可以理解为一根柱子)。可以无监督学习得益于fine-tune(你理解为微调就好了),它是基于价值选择的许多函数组成的,包括softmax等梯度函数。好吧!后面的我也开始感觉很吃力了,至少已经不能深入浅出地讲出来让大家很容易就听懂了。

说回到ChatGPT,它就是基于GPT3.5大模型的一个人工智能对话应用,是一种终端实现,是可以让咱们这些普通人可以接触使用的。而这次之所以会闹的如此轩然大波,很重要的原因是它确实已经可以帮我们做一些事情了,特别是它非常像一个人在和你对话,而且掌握着无穷的知识的人。

现在让人最爽的应该写作,比如下图所示。

lanqiu

然后它还有很强的多轮对话能力,能够很好识别上下文的意思。我把它里面空着的日期、地点和我的名字等发给它,于是:

lanqiu2

还有就是写代码的能力也非常不错,当然,仅限于小白级别的程序员水平。更高层级的程序要做的事情更多是在做决策,而不是写代码,比如考虑代码的扩展性,或者应对客户后期会提出的一些新需求等,在代码上做一些架构思考和铺垫工作。

code

是不是觉得ChatGPT很牛逼啊,确实是非常牛逼的,有划时代意义!

但是它依然还有很多缺陷,下面会提到。

另外提一句,作为Transformer的创始公司,Google目前的大模型参数节点到了5400亿的级别,是OpenAI的3倍多。只是,OpenAI作为一家”在野党“,即使还有诸多不完美,依然受到热捧,而谷歌作为”执政党“,必须要拿出更完美的产品才能得到世人的满意,就这点来说,Google是吃了一个暗亏的。期待Google的Bard出来之后的表现,毕竟现在它还在搜索引擎领域面临着OpenAI加持之后的Bing搜索引擎(隶属于OpenAI最大的股东微软的产品)的威胁。

二、在文旅行业,ChatGPT还有哪些问题无法解决

ChatGPT的出现我个人认为积极的意义绝对更大,但是各行业的从业人员觉得划时代的狂欢(会被取代的从业者除外)已经到来了,那事实是还早着。

ChatGPT出来不久,我就注册了,并将它和小知做了一些对比,发现ChatGPT目前还有一些比较麻烦的事情。

首先是精准服务问题

目前的测试感受上来说,ChatGPT确实可以模拟人类的话语体系,但是在准确度不高。比如上图中关于”地体去颐和园的话怎么走“,它给出的答案中漏洞百出:

  1. ​ 西直门站没有10号线(正确的回答是4号线);
  2. ​ 10号线没有颐和园站(正确的回答是4号线坐到西苑站)。

如果这样的回复用在景区官方提供的服务上,那必然是造成投诉的。所以在精准服务上,ChatGPT现阶段还做的不够好,它更像是一个5岁的孩子,已经会学大人说话了,但是说的内容就是一本正经胡说八道。虽然我依然觉得它还是会成长的,成长到更加成熟的阶段,但是即使是大人,对于这些精准服务的内容也不一定就知道的。所以,在精准服务这一环上来说,知识库,特别是精准的知识库,依然是无法取代的存在。

其次是实时数据更新

在景区场景中,经常会遇到一些极端天气,比如城市里的冰雹,海岛的台风/大风,都会让景区管理部门紧急关停服务。

这些信息目前是无法实时维护到ChatGPT上的,就会对游客造成很多困扰,以致引起游客投诉。当然,据说最新的ChatGPT Plus(我还没注册)已经可以学习最新的新闻内容了。但是对于如此庞大的信息内容,学习也是需要一段时间的,比如7天,那对于紧急关停等通知内容是不能有效消化的。所以这里需要的是一些人工的维护,可以及时打上补丁。

目前ChatGPT对中国是不开放的,以后会不会开放目前无定论。如果国内自己的大模型出来了,那可能有机会开放开发者接口,让相应的客户有机会去临时修改各类服务信息。

最后是从服务中得到的问题分析

如果企业A在ChatGPT上开了一个服务账号,ChatGPT会不会帮助企业A分析该企业的用户咨询中发现的各类问题,比如服务中存在的盲区、咨询中洞察到的商机等,这些对于很多企业是非常急需的(目前小知的一些客户对该需求很旺盛)。

目前没有在任何信息渠道发现ChatGPT会不会有这样的服务,这里面核心点在于企业A购买了服务之后,对他和他的客户产生的数据是否使用权。

三、ChatGPT会给文旅行业带来哪些改变

虽然我们上一章提了一些目前它还不太适应文旅行业的事实,但是就像我前面也表达过的观点:ChatGPT给各行业带来更多的肯定是正向的东西,下面简单讲述一下我自己思考的ChatGPT会给文旅行业带来的影响。

首先是市场教育成本和用户习惯改变

力石小知的底层模型使用的是BERT,说起来和ChatGPT的底层模型GPT属于同宗同门,但是近三年的推广中,其实非常大的现实问题就是认可度。我们目前的优质客户里面,往往都有一个在技术层面上本身就比较”狂热“,或者对新事物比较有探索精神的负责人,也正是因为他们的力主推荐,小知才能在这些客户(景区)发展地很好。其他客户,更多是不知所措,或者可有可无的态。但是随着ChatGPT这波全球热潮,60天就获得1亿活跃用户,现在哪怕是以前不在意的一些景区客户,和我交流时也会聊上一句ChatGPT。所以,客户侧对于AI服务的认可度接下来会断崖式上升(断崖式不知道用的对不对)。

更可怕的是用户侧,在文旅行业也就是游客或者(博物馆的)参观者。他们同样会这一波ChatGPT热潮影响着,接下来他们对于AI服务产品的使用意愿也会断崖式上升。

越来越旺的市场需求对于产品的提升是最大的利好,相信不用一年时间,市场需求就会几十倍的增长,届时,如果你(景区、文博场馆)没有,那就会被认为Low。

其次是改变游客的使用方式

目前景区对游客提供的在线服务一般是聚焦在微信公众号或者微信小程序上的,当然,还有APP等。目前的服务提供方式仅有浏览的方式,而很多服务项是被隐藏的很深,或者需要游客比较细致才能完成自己所需的服务需求的。

下面来举一个例子,比较一下加入AI服务之后,会如何改变游客的使用方式。

我们以B景区为例,小程序中可选择的门票包括成人票、老年票(60周岁以上半价、70周岁以上免费)、半价票(身高1.2米以下或6周岁以下免票、1.2米-1.5米或6周岁-18周岁半票),实际的票务规则会更加详细。这时候,一个游客带着一个4岁的孩子,加上父母(分别是72岁和69岁),那买票的时候,是不是要把老年票、半价票的规则都好好研究一遍才能下单。

如果是用AI服务呢?直接语音咨询的方式就可以,如以下场景:

1
2
3
4
5
6
7
8
9
10
11
12
13
游客:“我要买票”

---AI服务:”请问您需要购买几张票?“

游客:“我自己,加上一个4岁的孩子,还有我的父母”

---AI服务:“好的,可否再问一下,您的父母分别是什么年龄?”

游客:“爸爸72岁,妈妈69岁(或19556月)”

---AI服务:“感谢您的配合,根据您提供的购票人员情况,您一共需要买一张成人票,和一张半价票,根据票务规则,您的孩子和父亲可享受免票优惠,您本人需要购买一张成人票,您的母亲还不满70周岁,需要购买一张半价票。是否现在为您下单?”

游客:“好的”

最后,AI服务在界面上提供购票入口,可能包括实名身份证信息输入,电子票接收人的手机号码输入等,然后是一张成人票+一张半价票的总价支付界面,待游客支付,完成订单。

上面这个例子,我们用感性一点的方式去思考,至少游客不需要把进行心算,不需要去临时记忆景区B的各种票务规则,不用说“让我找个地方坐下来好好看看怎么买票”。

最后是服务产品的模式升级

从这次微软(还是在强调一下,它是OpenAI的最大股东)推出的集成ChatGPT的内测版Bing的截图可以看到,Bing除了默认的搜索引擎界面,还有一个类似对话方式的界面。也就是说,搜索引擎除了输入关键字之外,还可以像聊天一样使用了。

那么对于我们现在的绝大多数文旅行业的公众号、小程序和APP呢,后面会不会因为ChatGPT这样的AI能力而增加新的交互方式,比如像小知的交互。

从游客使用方式上来说,传统的浏览方式适合于游客还无法明确知道的目的时使用;而AI方式则更适合于游客有明确目的,或者目的比较复杂的情况下使用。

就像网上有人说的“现在所有的网站和APP都会被ChatGPT(或类似的AI服务)重新再做一遍!”,我觉得在很近的未来,这种情况就会发生。

四、总结

这次ChatGPT改变的不仅仅是文旅行业,更可能是改变全人类的生活习惯。就像原来在杭州给北京传个信,驿马要跑近半个月;就像以前2007年前,我们大部分人想不到手机会如此巨大的改变我们的生活。

作为行业从业者,唯有积极学习,然后努力应用,为行业做出贡献,为游客带来游玩体验上的大幅提升。

最后,力石小知团队目前已经在原有的BERT基础上,又进行了GPT2的内部技术测试,这玩意儿老费钱了,特别是GPU的投入,多多益善。未来,在这一类产品的研发上,拼的主要是“人才”、“资金(硬件投入)”和“业务场景(特别是数据)”。幸运的是,目前力石小知在这三方面都已经有一定的积累。

文旅行业的AI研究和应用,依然任重道远。






关注我的微信公众号,可收到实时更新通知

公众号:土猛的员外


TorchV AI支持试用!

如您有大模型应用方面的企业需求,欢迎咨询!