5月6日下午14:30,CCF成都站主题为“基于数据融合的油井生产优化推荐”学术论坛在明理楼B306拉开序幕。计科院院长赵刚教授主持活动,电子科技大学徐增林教授,川庆钻探工程有限公司杨洪德部长和金沙娱场城app7979闵帆教授分别围绕主题作出报告。甲骨文公司闫哲经理、四川师范大学和金沙娱场城app7979石工院、地科院等师生也积极参与论坛活动。下午18:00,论坛圆满结束。
赵刚教授首先隆重的向大家介绍与会的嘉宾,并对他们表示诚挚的欢迎。然后赵刚教授介绍到,现在数字化油田作为国家重点发展目标,但是面临着很多努力,很多投入,很有实际战略意义,但是收效不名校的窘境。挑战同时也是机遇,计科院积极承办此次CCF成都站论坛活动,并商定论坛主题为“基于数据融合的油井生产优化推荐”。
徐增林教授感谢赵刚教授和闵帆教授的盛情邀请后,为大家作了题为《多源异构大数据的方法与工具》的主题报告。他指出,大数据驱动科技革命,大数据在宏观上可以改变未来战争、摧毁暴力恐怖、维护公共安全,在微观上可以辅助健康管理、实现个性教育。而针对大数据的应用,基本途径就是寻找新算法降低时空复杂度、采用降低数据尺度的算法和采用分而治之的并行化处理。此外,徐教授也强调一个观点——“Data scientists spend most of their time cleaning data”,认为对大数据的处理关键在于数据清理,否则多源、异构等特性在实际应用中会带来额外的开销。特别是基于大数据的机器学习已经成为机器学习领域的研究重点和热点,如何处理好这些多源异构数据,直接关系着未来领域走向和工业发展。最后,徐教授向在座师生介绍了大数据的主要融合方法以及主要使用工具等。报告过程气氛热烈,与会师生积极提问,徐增林教授不仅逐一回答同时也延伸开来介绍了更多的专业技术知识。
川庆钻探工程有限公司的杨洪德部长也围绕论坛主题,作了题为《地震勘探数据及应用简介》的主题报告。杨洪德部长首先阐述了自己对大数据的思考,大数据是大量数据还是广阔的数据?然后他以地震勘探为例,一炮就会回收几个G的数据,而完成一次地震勘探一般需要发生上千炮,上万炮,就单纯一个项目的数据量就将达到数十个T。这数十个T的数据意味着大数据吗?另一方面,在一次地震勘测中,地震数据采集,地震数据处理,地震资料解释,储层预测研究四个阶段都会以前者为基础产生更多的解释数据,大数据应用是用单一一个阶段的数据还是综合起来的数据?如果是综合起来的数据,怎样做到有效的融合对应?而在现实应用中,能否通过以往的数据实现快速识别圈闭,勾绘轮廓;能否描述断层空间展布;能否识别属性异常,并描述边界异常;拾取反演异构。与会嘉宾和师生就杨洪德部长提出的若干问题和猜想进行了深入的讨论分析。在讨论与分析的过程中,大家对地震勘探数据和融合数据有了更深一步的了解。
最后,闵帆教授也针对“油田大数据的必要性”、“如何做油田大数据”和“不同领域如何合作”三个议题,和大家作深入的探讨交流。讨论从不同视角,不同应用层面和不同用户几个层面共同分析了闵帆教授提出的几个背景性问题。最后大家充分肯定了油田大数据的必要性;至于如何做油田大数据,首先还是需要有必要的探索性尝试,然后就是多领域的交流合作;至于如何促进不同领域的合作,拥有专业背景的技术人员必不可少,但是更重要的是一个明确的需求。
下午6:00,在与会嘉宾和师生合影留念后,学术论坛正式结束。活动受到师生的一致称赞,计科院研究生王宏杰表示,把大数据融入到具体的工业生产中,大数据的价值得到更大的开发,对以后的研究方向有了更清晰的定位,希望以后多举办类似学术论坛。
计科院
附:精彩问答
Q: |
大数据与行业应用之间,是先有鸡还是先有蛋?大数据催生了行业应用还是行业应用积累了大数据? |
A: |
大数据本身是一个阶段后产物,但同时也是下一阶段的前提,谁先谁后不重要,关键在于大数据已融入各行业,不可分割。 |
|
|
Q: |
数据清洗标准如果和行业数据处理标准不一致该怎么办? |
A: |
数据清洗一般是在行业处理后数据之上的进一步处理,具体情况需要具体分析。清洗不一定意味着信息的损失,还可以是逻辑的转化,如把名词化或数值化的转化等。 |
|
|
A: |
所谓数据融合,是基于什么标准的融合?不同数据源的数据该如何融合?融合过后会产生高冗余吗? |
Q: |
目前多源异构的数据融合一般采用合成核的方式进行融合,具体点就是多核学习和映射降维等。融合过后的数据一般都会存在不同程度的冗余,但是经过后期的约简操作等可以消除无效冗余。 |
|
|
Q: |
相似性在某些实际项目中可能不起作用,表面上的结果是相同的,但是其实际完全是不一样的。如两个油田的表现出来的油压都是相同的,但是产生这些油压的原因各不相同。因为没有完全相同的油井,第一个油井的经验不一定能移植到第二个油井生产中。 |
A: |
首先是具体问题具体分析;其次是会产生表面结果相同,但是成因不同的原因是对关键属性没有采集到,如果能对这些成因有效采集,那么就不会出现上述问题。实例与实例之间没有完全相同的,关键在于对特征的采集。 |
|
|
Q: |
大数据在油田中究竟是一个噱头,还是一系列切实的需求? |
A: |
油田中有大量的数据,并且这些大数据有高的隐藏价值,但是现在相应的应用非常少。油田大数据决不是一个噱头,而是真真实实的需求。 |
|
|
Q: |
有时候一项数据就可以得到理想的结果,还需要进行数据融合吗?就好像通过CT数据就能知道是否骨折,不要血液方面的数据。 |
A: |
单个数据有用,结合起来可能更有用。血液数据和CT数据融合后也能判断是否骨折,但是融合后的数据能应用到更多的层面,远比这些单一数据应用的和还多。数据到应用需要模型和环境的配合。 |
|
|
Q: |
使用大数据方法,优化到空间究竟有多大? |
A: |
就好像出行工具多种多样,如果较近距离,飞机和火车用的时间都一样,但是一旦距离很远,飞机的优势将会远远超过火车。大数据也是如此,在数据量不大的时候,也学传统数据方法和针对大数据的方法没有太大的区别,但是数据量一旦提高几个量级,针对大数据的数据处理方法优势就会很明显了。 |