欢迎进入人工智能互联网官方网站!
人工智能互联网
专业
专业
我的位置: 主页 > 专业
交叉学科促进统计学的发展
发布时间:2023-02-16
  |  
阅读量:
  |  

    交叉学科是指不同学科之间相互交叉、融合、渗透而出现的新兴学科。如化学与物理学的交叉形成了物理化学化学物理学,化学与生物学的交叉形成了生物化学化学生物学,物理学与生物学交叉形成了生物物理学等。学科交叉融合是未来科学发展的必然趋势,是加速科技创新的重要驱动力

20世纪下半叶,交叉学科研究与应用成为热点。多学科的交叉与融合解决了很多学科内难题,极大程度上推动了科学的发展。

本文旨在讨论统计学与其他学科交叉的内在动机和外部要求,同时,基于统计学未来可能的研究与应用动态,本文展示了统计学研究的10个重要发展方向。

 

统计学+”交叉学科的设置与建设

从学科设置角度来看,我国教育部学位管理与研究生教育司授予的统计学+交叉学科数量不断增加,其中,统计学+交叉学科定义为所属一级学科包含统计学的交叉学科。截至2019531日,我国共授予153所高校(含508个交叉学科)自设交叉学科,其中统计学+交叉学科共16个。至2020630日,我国新增8所高校(含53个交叉学科)自设交叉学科,其中统计学+交叉

学科新增了1个,即大数据统计。至2021630日,我国新增了24所高校(含80个交叉学科)自设交叉学科,其中统计学+交叉学科共新增4个,即生物信息学、车辆制造科学与工程、金融科技和大数据经济。

从交叉范围来看,统计学+交叉学科涉及范围愈加广泛,截至2021630日,我国共有185所高校(含616个交叉学科)备案了交叉学科。统计学+交叉学科专业有21个(包含3所高校开设数据科学),分别为数据科学、能源经济与管理、工业与系统工程、经济信息管理、全球价值链、电子商务与信息管理、媒介经营与管理、金融工程、流通经济与管理、流通工程与技术管理、大数据科学与应用、数理金融、大数据金融、经济计算与模拟、大数据统计、生物信息学、车辆制造科学与工程、金融科技、大数据经济。自2019年教育部授予交叉学科以来,统计学涉及了经济学、理学、管理学等学科的交叉领域。我国交叉学科的一级学科分布结果显示,至2021年,统计学的交叉学科比例在一级学科并列排名29,一级学科所占比例为3.4%统计学+交叉学科涉及的学科范围越来越广,逐渐被医学、工学等学科所交叉。值得注意的是,一级学科应用经济学涉及交叉学科的比例达到13%,从专业设置的角度看,其中经济统计学专业在交叉学科建设中起到了举足轻重的作用。

 

统计学的未来发展动态

从统计学的发展历史中可以看出,统计学是在应用过程中发展壮大,其生命力也体现于实践应用。目前,统计学在交叉学科的促进下已在以下领域获得广泛应用:第一,学科内部和学科之间的交叉,包括物理学和化学、生物数学和生物统计学、天体物理学和天文学、流行病统计和医疗统计、生态学和环境统计学、经济计量学、农业统计、人口统计、保险数学、心理计量学、法律和法医统计学、军事经济统计学等;第二,学科与技术的交叉,包括神经网络、区块链、人工智能、可靠性分析与寿命检验、数据库和可视化、网络媒介经营与管理、网络供应链管理、表决系统和政治学、管理科学与工程等。随着数据要素市场配置的不断优化,统计学的研究和应用体现出了新的能动性,也就是说,统计学的应用不断加深和创新的同时,也将会开辟出新的领域(朱建平等,2014)。为了更明确统计学应用研究的动态及未来发展趋势,本文将从以下10个方面对统计学研究的重要领域及方向进行剖析。

(一)处理社会经济复杂适应系统的统计学理论与方法研究

社会经济复杂适应系统是一个以人为核心,涉及人类各种活动复杂因素的庞大系统,其包括社会、经济、教育、科学技术及生态环境等领域,是一类重要的、典型的复杂适应系统(王晶华和施红玉,2002)。社会经济复杂适应系统具有若干特殊的情况与性质,使其难于描述、分析和控制。如主体和环境,即国家政府和国际组织,构成了系统的组元,当社会经济系统形成了一个有机的整体时,其主要原因是由主体与主体之间甚至包含主体与环境之间的相互作用所造成的。

社会经济复杂适应系统按照横向和纵向可以划分为许多相对独立的子系统。类似的例子还经常在环境、生态问题中遇到,如碳中和背景下我国经济高质量发展的系统性研究、重大传染性疾病的传播途径与监测监控等等。此外,在这类复杂系统研究与应用过程中,对于子系统的相互作用还需要深入探讨,会涉及到自然界中的诸多竞争关系,如物主与寄生物之间的竞争、种群生存之间的竞争或捕食系统的研究等等。

从统计角度研究社会经济复杂适应系统面临的挑战,主要体现在以下三个方面:第一,描述复杂适应系统需用成千上万个参数和变量,这是复杂高维数据研究的重要领域;第二,数据可获得性发生变化,打破了传统试验获得数据的方式,更多的数据往往只能通过观察得到,即难于保证数据的可重复性和随机性;第三,复杂系统将带来数据的复杂性,即数据来源、数据结构和数据格式等都呈现不均衡态势,给数据融合和数据整合提出更高的要求。这样,传统的统计学方法受到限制,需要研究全新的统计理论和方法进行处理。这一领域在国内外处于起步阶段,将会成为相当长时期内统计应用发展的重要趋势之一。

(二)数据要素的开发与应用研究

近年来,随着大数据、互联网、物联网、云计算、人工智能等新兴技术的发展,人们进一步发现数字的经济重要性。如今数据要素作为经济发展新的生产要素,不仅给传统经济注入了新的动能,也加速推动全社会经济的数字化发展,促进与数据紧密相关的新模式和新业态的迅速崛起。那么,对数据经济产业进行科学核算,培育大数据市场,才能提高数据的可交易性,更好地推动数据的开放共享;充分发挥数据要素新动能,开发数据新产品,加强应用服务,才能提升和实现数据资源的价值;进一步探讨统计法律的规范,清晰数据的产权交易,才能更好地实现数据的整合与保护。

因此,这些问题给统计学提供了理论和应用的研究方向:第一,数据作为要素,其概念的理论界定和统计界定,统计对象的确定,包括数据与自然资源、资本、劳动和技术要素的联系与区别;第二,数据要素统计框架的构建,数据要素市场统计,数据要素生产收入核算;第三,数据要素的增长贡献及其对国民经济各部门、国家治理各领域的影响测度等。

(三)数字经济运行机制的统计研究

数字经济是指以数据资源作为关键生产要素、以现代信息网络作为重要载体、以信息通信技术的有效使用作为效率提升和经济结构优化重要推动力的一系列经济活动。数字经济的发展给传统的经济统计带来了巨大挑战,如开展数字经济运行机制模拟及运行状况评价研究;数字经济核算的系统理论框架与方法体系研究;数字经济环境下宏观经济的统计监测及预警研究;数字经济与经济增长和其他产业的联动效应研究等。

(四)大数据质量提升研究

随着智能产品的大规模普及,某些行业或企业通过互联网和物联网,人为产生大量的虚数据假数据,这不是传统的统计数据质量问题,而且在数据类型发生巨大变化的同时,将这类数据以结构化数据、半结构化数据、非结构化数据形式融合在一个研究的统一体中。与传统数据相比,大数据时代下各种涉及数据运行的系统更容易产生数据质量问题,直接影响数据的存储、处理、分析等性能,给数据质量保障带来巨大的挑战,影响数据要素新动能的发挥(朱建平等,2019在数据的生命周期中,影响数据质量的因素表现为信息、技术、流程和管理。为改进和提高大数据质量,确保数据功能,必须从大数据产生的源头抓起,从现代化管理入手,强化大数据质量管理的思想观念,把这一观念渗透到提升大数据质量的全过程,对数据运行机制进行全过程监控。从数据分析的角度,深入研究大数据形成过程中所遵循的客观规律,剖析其产生的内在机理,探索其科学有效的控制和改进措施。

(五)网络产品的质量和生产率统计方法及应用研究

广泛意义下,网络产品是指在国民经济数字化基础上产生的物质产品、信息产品和网络服务等的总称,包括通过数字化技术改造后的机器设备所生产出来的各种物质产品,在数字化平台上所生产流通的各类信息产品,以及通过数字化交易平台所提供的各式劳务。近年来,随着数字经济的发展,生产率和产品质量得到提高的互联网企业和网络产品获得了迅速的发展和提升。企业的管理者和决策者要提高网络产品的质量和生产率,分析网络产品生产全过程,那么科学的统计方法是必不可少的工具,这也是一个全新的研究领域,可以从统计角度探讨,在网络产品的过程控制、网络产品的可靠性等方面展开研究。第一,网络产品的统计过程控制研究迫切需要引进新思想,需要打破数据正态分布假定的条件,从根本上重新设计这些方法;第二,试验设计是一项重要技术,其核心目的是连续改进网络产品工程运行过程,保持数据采集过程的连续性,同时保证动态环境下的稳定性,因此探讨不同因素的水平设计将是根本;第三,针对网络产品寿命研究的模型构建还需做更多的工作;第四,针对网络产品的生产效率研究,过去的一些工作表明,贝叶斯理论与方法将是分析和提高生产率的有效工具,同时动态环境的接受抽样也是该领域的重要技术之一。

(六)遥感信息与空间统计学的理论和应用研究

随着智能化推进遥感技术的不断发展,遥感数据的类型越来越丰富,数据的来源越来越多源化,遥感数据内在特性越来越鲜明,这给遥感大数据的智能化处理提出了新的挑战(宋维静等,2014)。空间统计学的大量应用,促使数据分析工作者对空间统计学理论和方法开展相关研究。第一,遥感大数据稀疏表征理论和方法的研究,基函数的构建和稀疏分解的方法研究;第二,时空数据挖掘技术的研究,典型例子包括重大传染病聚集性发现研究、古建筑或土地资源利用演变模式的发现研究、城市智能交通行为研究、飓风或地震等自然灾害发现研究;第三,遥感大数据内在结构特征和存在形式的建模问题,特别是针对机器学习机制,通过数据的降维、特征选择、模式识别和知识表达等技术,研究如何有效利用不同类型的遥感数据和信息。

(七)社会经济大数据计算研究(计算社会经济学)

随着智能化技术的飞跃发展,人类参与各种社会活动的行为数据,以及社会发展过程的历史数据,被越来越多的传感设备和数据采集终端记录下来。这些数据是通过互联网、物联网、智能遥感、移动通信、社交网络等产生的新型数据,而不是传统的社会科学处理的数据字段和惯常数据。这些数据的分析与理解,需要先进的机器学习和数据挖掘技术,这给社会科学研究者提出了新的要求。第一,这些数据来源广、精度高、规模大、实时性强,可以提高数据的稠密性,为多源数据整合开辟新的研究领域;第二,通过对新型数据的分析,可以更好地感知社会经济新态势,探讨和孕育新理论,发现可能的异常,预测未来发展趋势等等;第三,基于大规模真实数据对新型数据的研究,特别是对与社会发展过程有关的经济发展问题,以及与经济发展有关的社会问题研究,将开辟应用统计学研究的新领域。这一新型数据的研究,充分体现了社会科学、经济学和计算机科学理念与方法的深度融合,可以将其界定为计算社会经济学,其应用能够扩展到司法领域中法庭第三方数据证据的分析与认定,使用物联网数据进行决策科学化的应用,以及使用通信数据进行金融风险防控方面的应用等等。

(八)健康医学和生物卫生中的大数据分析应用研究(计算社会医学)

随着大数据应用范围的不断扩展,健康医学、公共卫生和生物科技领域逐渐发展形成惠及全民互联网+大健康的新兴业态,这使得人民群众对美好健康生活期望值不断提高。在推动数据科学技术与健康医疗、公共卫生和生物科技深度融合的过程中,开展大数据应用既是机会同时也面临着巨大的挑战。健康医学和生物卫生大数据应用研究的方向是社会化医学和个性化医学,即以健康医疗大数据研究为基础,通过新的模式引导政务、教育、商业、环境等各个领域的变革;通过新的思维为个体量身设计出最佳治疗、康养、养老、社保等方案,以期达到最佳的定制健康医疗模式。该领域研究可以界定为计算社会医学,其所涉及大数据的开发环节,即存储数据、收集数据、挖掘数据、数据转化实用,以及智能化产品的实现,都离不开统计理论和方法的应用:第一,通过健康医疗大数据应用,促进优质医疗资源科学合理配置,充分体现医疗资源的均衡性,努力提高人民群

众幸福感;第二,通过健康医疗大数据研究,深化医疗改革,为优化多级医疗服务体系,进一步实现异地结算和远程服务,注入新动力;第三,通过健康医疗大数据应用,开展健康科技新产品研发,创建健康服务新态势,推进上下游全健康产业链的发展。

(九)统计学方法在企业数字化转型中的应用研究

在微观层面,数字经济推动企业治理和互动模式的深刻变革,越来越多的企业开始重视和关注快了推动数字化转型的步伐,将组织创新、技术创新、跨界创新、融合创新,作为实现企业走向数字化发展和高质量发展的重要标志。数字化转型就是有目标地开发数字化技术,利用数据和数字技术的力量,支持并创建一个充满活力的数字化商业模式。而统计学理论支撑和应用,将直接关系到企业数字化转型的质量和效率,统计学可以为企业提供真实可靠的各项数据信息,帮助企业在数字化转型过程中,做出科学决策,创造出更多经济和社会效益,提升企业可持续发展的能力。有关的研究主要集中在以下几个方面:第一,运用统计学理论和方法,建立完善的企业数字化转型评价指标体系;第二,利用大数据、人工智能、区块链等创新技术,构建数字化转型机制,获取企业运营各环节的核心数据,建立企业的动态数据模型;第三,运用统计学方法,并结合行业大数据构建预警监测系统,加强企业核心竞争力;第四,将人工智能和现代统计学方法相结合,对企业生产经营过程实施科学的设计和控制等等。

(十)计算机软件中的统计理论研究

统计模拟与计算机软件是实现统计理论方法应用的重要支撑,也是充分体现统计理论方法赋能人工智能的重要工具。该领域的问题主要体现在两个方面:一是开发计算过程中,有效的统计计算理论和方法;二是开发软件过程中,通过计算机实现理论方法的应用。前者更依赖于统计学理论工作者,重点是理论和方法的研究;后者需要统计学与计算机相互配合才能解决,重点是算法和技术的研究。主要研究方向包括大数据集合与多源数据的处理方法、集成算法在统计计算中的应用、统计计算理论与数据挖掘技术比较研究、统计软件设计与开发及相关研究等。第一,数据挖掘技术中的统计学基础理论研究,以及通过统计理论方法的深入研究,提升数据挖掘技术水平;第二,大数据可视化技术中统计学内在含义的研究,实时实现交互图象数据分析;第三,行业或专业的统计软件开发研究,例如环境科学、流行病学、心理计量学、地质学、语言学、制图学及其他领域的应用软件。


摘自:交叉学科促进统计学的发展(图1)交叉学科促进统计学的发展_朱建平.pdf