您当前的位置: 主页 > 新闻资讯

新闻资讯

chatGPT如何在油气数字化领域应用?

讨论一个热门的话题,油气数字化领域是否该引入chatGPT应用?

这不是一篇技术文章,只需要深度学习的初步知识你就能看懂。

一、什么是chatGPT

1、chatGPT是一个GPT模型驱动的生成式对话引擎。

chatGPT作为一个对话式智能工具,背后的引擎是GPT(generative pre-trained transformer),而chatGPT就是一种基于GPT的生成式语言模型,它使用RLHF(reinforcement learning from human feedback)本质是一种人机交互的、问答式的搜索。chatGPT是AIGC(AI产生内容)领域的巨大突破。

关注GPT很久了,各种扫盲文章不知道看了多少篇了,虽然技术深度依旧不足,但总算能够理解这种技术的本质。早在两个多月前,数字盆地的博客文章就绘制了一张“AI发展简史”图(可以去看看,图很棒),同时将chatGPT3.5和GPT4标定为AI发展史上最大的里程碑,那个时候ChatGPT还没有现在这么炒作的火热,但我依然被GPT的强大所震撼,且坚信这必然是一个里程碑。

其实除了研发chatGPT的OpenAI,Google和Facebook一直在做大语言模型(LLM,Large language Model)。GPT使用的是Transformer框架,使用这类技术框架的小型(创业)AI技术公司还有inflection,adept,cohere等很多。国内以百度为首的类似公司也很多,因为chatGPT的火热,这些公司一下子啊进入大众视野,其实,LLM大模型一直就是一个很热的技术方向。

2、chatGPT的优势,就是AI LLM大模型的优势。

(1)chatGPT是大语言模型。

简称“大模型”吧,请记住这个词,也许后面的日子它会和“大数据”一样常常出现。

GPT是一个人工智能的“大语言模型(LLM)”,背后是整合了自监督学习、Transformer、强化学习、知识图谱等技术的大语言模型,Transformer且不说即将发布的GPT4具有150万亿个参数,就是chatGPT背后的GPT3.5,也有1750亿参数,远远超过当前我们使用的深度学习模型,且GPT3的transformer层多达96个,这种模型训练出来的“智能”毫无疑问是革命性的。

早在多年前国际很多专家就坚信大模型是AI的未来(OpenAI),也有很多专家认为Ai大模型是垃圾(如谷歌),也有很多专家认为大模型是未来然后是垃圾现在又变成未来,但总归来来说,近期大家基本达到一直,那就是“大模型”确实是AI的未来。

(2)chatGPT是human feedback的

RLHF机制让GPT根据人类反馈进行调节,通过这种训练增强了人类对于模型的调节,实现持续学习。

(3)chatGPT是投入巨大且持续的,一旦产生优势不好追赶。

OpenAI早期有马斯克等一投资人创办的大模型创新企业,从那时到现在所烧掉的钱,不说算法,就说消耗的算力(水电GPU等)成本都远远超过国内AI企业的投入了。

而且这种漫长的发展时期中不仅仅是技术的壁垒,更多是数据、数据方法和经验的积累,有时候它更像是一个系统工程的成功,而不是我们常说的某一个技术的成功。

3、chatGPT的不足,就是他胡说八道的时候你也不知道。

GPT大模型并没有在基础技术上的巨大突破。chatGPT在一定程度上是综合了强化学习、转换和知识图谱的一种预训练模型,同时也创造性的应用Tamer框架、近端策略优化、RLHF等技术极大提升了训练和预测过程,即 它通过整合聚合多种AI技术而不是孤立的使用他们而获得了巨大能力,而这种能力又在海量投资带来的海量算法和海量人力(数据加工标注等)加持下变成了现实。

但是,chatGPT的大模型是一种“通用模型”,且这种通用模型还是基于语言模型构建的,这注定了这种模型的优势是人类语言的交互,而不是那么的精确和系统化、工程化,这与工业领域对于算法的整体要求是不匹配的。

面对科技和工程领域的问题,ChatGPT会一本正经(且自信)的向你胡说八道,而且给出一些精密但实际毫无关系的公式算法来辅助这种胡说八道,只有经过一定学术训练的人才能识别这种学术逻辑的混乱,而在一般人眼中,这恰恰是表现的非常“专业”。

所以chatGPT是一个擅长语言的通用人工智能,不是专业智能,更不是强人工智能。它并不能理解问题的本质,目前也看不到创新思考的趋势,更没有工业角度的精密逻辑,它就是一种海量信息的关联诞生的智能。大量的文章也都在指出了chatGPT在一些技术和工业领域的 错误、无逻辑、似是而非,目前看这些问题在未来的解决也将是一个长期的过程。

二、GPT市场反馈的小窥

1、对chatGPT的盛赞,更多是个人工作生活方式和人类文明方向的关注

chatGPT的生成式问答技术首先颠覆的是“搜索”领域,而这个领域的庞大规模的利润基本被google所掌握,对于Goole这样企业的根基的动摇是这个技术引起关注的重要原因。

chatGPT确实具有改变未来的可能,当前对于它不吝啬的赞美,更多是从生活模式、从人类文明发展的的角度。仔细想想,纯AI技术角度,以及工业落地角度,其实没有那么多的评论和经验(但恰恰是这少数的几篇文章才是你认识OpenAI和GPT核心核心核心的最重要手段)。

2、企业对OpenAi的投资不是为人类技术发展,而是可以直接获得吸引人的新产品新功能。

就看看微软为什么给openAI投资150亿美元?

首先还是因为搜索。Bing终于可以从低于10%的占有率攀升了, 这也是google为何匆忙推出Bard,百度推出文心一言,以及大量技术企业的蠢蠢欲动。

其次是AIGC领域的应用。我们近期总是谈论自动编写报告、自动生成论文,自动成图,自动编码,自动创作等等,那么你想过没有这些创作是和什么软件的应用场景绑定的?没错,Microsoft OFFICE365。

其实这两个产品方向对于chatGPT都属于AIGC,基于AIGC的搜索,很可能成为下一代的搜索,以人类语言理解为出发点的搜索。

3、对于chatGPT背后的大模型LLM的关注,其实挺狗血的。

无论国内国外,早先做LLM的其实很多的,但这玩意烧钱,国外大厂扛得住,国内大厂就卷的多,没有人愿意做这些没有前期收益的投入,停的停、死的死,还苟延残喘的大概也是半死不活。OK,现在chatGPT火了,这么多团队一拥而上要搞自己的LLM,可是现在看了这么多的文章,从来没有一个人回答这个问题:OpenAI的chatGPT做了什么才成功的?为什么那么多类似的公司用的类似的技术做了那么久都没有成功甚至连Google都搞砸了?chatGPT的秘诀和优势在哪里呢?没人知道,是的,蜂拥而上的人们,没有人真正的知道chatGPT为什么成功。

4、油气领域的GPT市场发展,是挺懵的状态,都在等等看。

很久很久之前我认识一个油气公司叫做吉普太,现在叫做金阳普泰,他们很早就预测到了GPT的诞生并将公司命名为GPT。除此之外,放眼国际范围好像真的没有看到过chatGPT或者大模型在油气领域的应用。

虽然GPT已经诞生三年了,但chatGPT来的有些太迅猛,油气领域大家普遍还是在一个反应期,并没有弄明白GPT的底层逻辑,也不理解为什么大众会对这个技术持以如此大的热情。其实我也很迷惑,一个语言模型,其实并没有解决工业逻辑的运行规则,有什么理由判定它会带来油气研究和产业升级的变革?

但毫无疑问是未来几个月,你会看到大量的、爆发式的油气行业应用GPT或chatGPT的文章出现,毕竟,核心技术还在OpenAI手里,我们用人家的API来开发一些比较炫目的应用其实并不是很难的事情。此外,金阳普泰那个,是个玩笑啦。

下面的内容,回到老本行,更多从油气行业角度来思考问题,和chatGPT的技术没太大的关联了。

三、chatGPT给我们带来了什么思考?

chatGPT的学习为我们带来了两个巨大的收获。

1、从技术角度,是:要从多模型多技术混合角度来解决一个应用问题。

那就是我们不要从“单纯的AI技术角度来解决某一个问题”,很多人赞美知识图谱、某深度学习模型、GNN模型,但放在应用领域,真正好的解决方案都是面向问题的一个技术的组合与聚合,或者是工程化完美的融合。

虽然算法已经非常牛B了,但我看来,chatGPT的成功绝对不是这个算法,而是技术的聚合、算力的堆砌、数据的处理、流程的优化,最后还有市场需求连接和支撑的能力。

2、从产品角度,是:产品的好用,是值得你去不断的打磨的。

我不认为有什么技术是OpenAI垄断性的,相反,这些技术如何整合型应用并消解其带来的各种小问题可能是大量而长期的困难。chatGPT能够给你一个不低于 80%准确率的、详细的答案,而且能根据你的反馈进行答案的调整,这种成功更多的体现在对用户需求的把握和体会,是对用户问题的深入而广泛的“分析”,解决问题“态度”是这个产品成功的重要因素。

四、如何开始油气领域的“大模型”之旅?

油气领域的“大模型”的应用,我个人能够想到的是如下四个步骤:

首先先找行业内的应用场景,即大模型的应用点,用什么方法(精准搜索,信息组织,报告编写)解决什么问题(业务点);第二在应用过程中寻找、评价具有性价比的大模型;第三是构建产业大模型,即基于第二步的通用大模型和第一步的应用场景积累,结合进行产业大模型构建。第四是将大模型与产业的业务框架进行融合。

1、应用大模型。先使用“大模型”技术,跑通油气领域数字化的流程并取得应用效果。

再说一遍,大模型是大势所趋,尤其在个人知识获取方面。即便我们不用GPT或者BARD,那么类似的“大模型”技术也会雨后春笋般的爆发出来,在社会层面变我们的生活,而且很可能是极大的改变。

所以,面向应用可以马上开始大模型的流程实践。从你的油气业务需求出发,发掘在地震地质、油藏、钻完井、储层改造等各个核心领域中可能的应用点,包括触发设计思路、提供报告的自动生成等等,这些都是应用的开始,通过这个开始实现chatGPT及GPT的 “应用”。

2、选择大模型。大模型技术门槛不高,行业需要等待价格合理的“大模型”产生。

chatGPT大模型的出现,必然让一大群深度学习和知识图谱的研究项目因为失去存在意义而死掉,这是技术领域带来的冲击。

但是,GPT大模型并没有在技术上的突破。chatGPT在一定程度上是综合了强化学习、转换和知识图谱的一种预训练模型,它通过整合聚合多种AI技术而不是孤立的使用他们而获得了巨大能力,而这种能力又在海量投资带来的海量算法和海量人力(数据加工标注等)加持下变成了现实。

所以你看,ChatGPT的技术门槛不是那么不可逾越。由于大模型的应用效果已经充分展现,未来大量的AI公司都会义无反顾的投入这种模型的研究,未来两年是大模型研究的爆发期,会有很多企业产生,很多死去。

有可能,今年你100元买到的东西到了明年不到1块钱你可以买到更好的,而且还不会陷入为“老化技术”买单的无效投入。我认为,这种基于高度技术把控下的精打细算非常的重要。

3、产业大模型。等待,选择,然后聚焦于如何将其变成油气产业大模型

注意分工,面向通用行业的就做底层大模型,面向科学和产业就需要应用好的大模型来做落地应用。

只有在通用行业,也就说通过技术获得通用市场而非特定领域的巨大利润的行业,才能具备支撑这种技术研发的市场。所以,面向通用市场的企业可以尝试大模型研究,特定行业或者产业的封闭性领域我并不建议做这种基础模型设计和模型训练投入,无论效益还是影响力都不值得。

油气行业是一个很局部的行业而不是一种通用的行业,虽然利润可能很高但市场很局限且抗风险能力很弱,当投入巨大且风险巨大的时候对于行业稳定发展是不利的,这种投入必须控制。

4、基于“行业”的AI大模型,未来的应用模式如何设计?

chatGPT的大模型是一种“通用模型”。这种通用模型还是基于语言模型构建的,这注定了这种模型不是那么的精确和系统化、工程化,这与油气领域对于算法的整体要求是不匹配的。

所以,结论是:哪怕面向学科和产业的AI大语言模型,也不能代替一个学科和产业的系统性逻辑阐述。

很多人会说要重视chatGPT的可成长性,其未来工业领域的应用不可限量。我同意成长性,但却并不认为这种智能能够成长替代工业系统。从其底层技术看,大模型对各种AI模型的综合应用更加接近人类大脑的工作机理(DL已经很接近了),但它依旧与工业系统的智能具有不同的机理构成。

油气领域的数学建模是精密工业系统,作为科学和技术的结合体,它非常主张要素的因果性和逻辑的系统性,这并不是当前技术下大语言模型的优势,实时上你从很多文章也可以当看到,在数学、工程方法、工业技术等领域,chatGPT能做到的非常有限,其质量也达不到工程的要求高度。

所以,主题框架依旧要使用传统的工业技术来构建,但是在一些人类参与交互的环节,如人的创新思考支撑、文档编制、绘图、海量信息归纳,等等都可以引入大模型来辅助。

对,油气工业的业务流程与计算模拟方法,依旧是油气工业的数字化核心,强大如chatGPT在很久的未来都不能替代它。但是,短期内,你可以应用chatGPT解决海量数据的智能化检索和基于自助式问答的辅助;长期,你可以联合一个更好的“通用大模型”,建立一个基于行业的智能体来解决工程流程辅助问题。但无论长期和短期,针对油气工业流程的工业方法流程和模型分析算法,这些依旧是构建工业的骨架和主体。

五、油气领域应用GPT的三个问题

我的看法总结为三点。

首先,chatGPT可以进行业内应用,但会有天花板。

其次,chatGPT代表的“大模型”值得在行业或产业中进行探索应用,但前提是你已经做好必要的关键技术储备和数据准备工作;

最后,你还得有钱,至少是马爸爸那种有钱。

1、首先,油气数字化领域是否该引入chatGPT的应用?

当然应该。

chatGPT及其背后的AI大模型,是智能化技术发展的趋势,也是AI当前各种技术到了一个可以聚合的爆发点,奥斯曼这方面的前瞻性还是很厉害的。

学习掌握这种方法背后的各种技术,应用openAI提供的API来调用chatGPT的功能,解决一些我们在油气数据搜索、问答和关联触发中的问题,也可以使用chatGPT自动生成一些各油气领域的设计和总结报告,甚至面向一个主题的代码或者成图,这都是有可能。

而且,我墙裂建议大家组织几场“chatGPT能够用来做什么”的头脑风暴会,从工作工具角度来看,这东西真的用处太大了!不是戏谑,我认真的。

而且,这是短期内可以见效的突破。

2、其次,油气数字化领域是否该全面切入chatGPT的应用?

不应该。

因为需要首先解决chatGPT带来的成本安全和数据问题。

首先是成本-效益

chatGPT正在从非盈利转向盈利和闭源,与其合作的成本巨大,只有微软这样具有庞大“通用性”市场规模的公司才能将支付的合作费用从市场赚回来,而油气行业是没有这样的暴利的,即便有也和GPT关系不大。前面是效益方面,那么从成本方面,你的油气数字化应用是否支撑GPT庞大的训练成本,比如先来两百个小目标?

其次是安全

由于训练和预测的算法复杂性,可以看到的未来也只能部署在公有云上,chatGPT的训练需要将你的文档、图件、报告、设计等所有资料上传和加工。数据安全、数据所有权、数据溯源等问题,这些问题在互联网领域不是那么收到重视,但在产业和企业领域,这就是高度的机密性相关,目前看不到这种保障。

最后是训练数据的质量能否解决

数据问题是最为重要的一点,大量的数据需要定义、治理、关联在内的数据预处理才能训练。互联网领域的海量数据处理相对来说已经比较成熟,但到了油气这种专业化的领域,数据之间的FAIR(就是统一概念本体定义以加强数据的彼此认知和交换)都不能解决,后面的数据标准化、规范化、系统性和全面性等等都是问题,这种基础的缺失导致chatGPT难以产生大规模的效果。

上述这些基础性的问题没解决、基础工作都没完成情况下,切入很难的

3、最后,油气数字化领域是否该全面切入大模型的应用?

不应该。

因为油气行业有自己的工业技术框架。

油气领域发展了近百年,信息化与数字化怎么也有四五十年了,大数据和AI目前在油气行业中广泛应用,但AI仍旧是基于油气计算分析的一个工业技术框架来进行的,这个工业框架我个人觉得未来二十年不会颠覆。

chatGPT这种大模型是AI领域的巨大进步,但颠覆并改变油气工业框架还需要时间。

此外,这种面向行业和学科的GPT颠覆性的应用目前没有看到成功案例。OpenAI除了chatGPT还有其他几个项目,也在不同领域研究这种大模型智能,但似乎还没有明显的成功。一方面,国内有这种技术实力和砸钱实力的公司,似乎极少极少;另一个方面,砸钱砸人就是办成了,你能带来这个产业多大的改变,这个,我也估算不到。

六、结束语

虽然关注GPT很久了,但OpenAI系统化的技术论文相对较少,同时个人对于Transformer研究深度远远不足,因此一直不能对于GPT有更多的剖析。昨晚与肖院长关于这个课题进行了沟通和讨论,尤其一些见解,针锋相对。肖院长作为这个领域的重量级大家,使我对自己的论题态度及其形成过程做了梳理和反思,但到目前我很难全面改变自己一年以来建立的上述观点。

我对自己定位只是油气领域数字化新技术应用,所以,以上的内容都只能被看做一些观点和建议,而不是技术论述。这篇文章占用了凌晨两个多小时时间,一方面是给自己一点思考的总结和积累,另一方面对油气行业数字化领域的技术专家们也能够提供一点参考,浅薄和不成熟是必然的。

谢谢,希望听到你的想法,也希望你们提出更多的建设性建议。



(完)


上一篇: 没有了
下一篇:推荐 :ChatGPT研究框架(80页PPT)
  • 地址:陕西省西咸新区沣东新城能源金贸区能源路秦创原·科创大厦9楼
  • 邮箱:chejp@163.com
  • 电话:15191489572
Copyright © 2020-2021 西安图宾智能科技有限公司 版权所有陕ICP备2021013228号
Top