飞扬范文网
当前位置 首页 >作文大全 >

数据挖掘技术在制造型企业信息化中的应用

发布时间:2022-10-21 15:50:09 浏览数:

[摘要] 介绍了数据挖掘的概念,基本任务及数据挖掘的方法和技术,分析了数据挖掘技术在制造型企业信息系统中的应用。讨论了构建一个基于数据挖掘技术的制造型企业决策支持系统基本结构框架。

[关键词] 数据挖掘 信息系统 决策支持系统

目前,随着计算机技术和通信技术的不断进步,制造型企业的信息化进程也不断前进,许多企业由从前各部门独立开发的信息系统,上升到现在的ERP,电子商务等先进综合的管理信息系统的应用,极大地提高了企业的核心竞争力,但这些系统基本上是为业务流程自动化而设计的OLTP应用,由此产生大量的业务数据,这些数据并不是各个业务部门管理人员所需要的决策支持信息,因而造成了“数据丰富,信息贫乏”的现象。如何从这些丰富的业务数据中获得知识,帮助制造型企业的各级管理人员进行科学的决策,让企业在日益激烈的市场环境下,能迅速地适应市场的需要并快速地做出响应,这成为了企业信息化工作的当务之急。

一、数据挖掘

1.数据挖掘简介。数据挖掘就是从大量的数据中挖掘出有用的信息,即从大量的、不完全的、有噪音的、模糊的、随机的实际应用数据中发现隐含的、规律性的、人们事先未知的,但又是潜在有用的并且最终可理解的信息和知识的非平凡过程。它是一门交叉学科,融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。数据挖掘涉及使用各种各样的算法来完成不同的任务。所有这些算法都试图为数据建立合适的模型,并确定与所分析数据的特征最符合的模型。在企业信息化中应用数据挖掘技术就是利用计算机技术高度自动化地分析企业信息化过程中积累的大量数据,做出归纳性的推理,从中挖掘出潜在的模型,预测客户的行为,帮助企业的决策者调整市场策略和生产计划,减少库存的风险,做出科学的决策。

2.数据挖掘的基本任务。根据发现知识的不同,数据挖掘的任务主要分为以下6类:(1)关联分析,揭示隐藏在数据之间相互关系的一项数据挖掘任务。(2)序列发现,是指确定数据之间与时间相关的序列模式,利用该模式可对未来的相关行为进行预测。(3)聚类分析,是指依赖样本间关联的量度标准将其自动分成几个群组,且使同一群组内的样本相似,而属于不同群组的样本相异的一组方法。(4)分类,是指找出一个类别的概念描述,它代表了这个类别数据的整体信息,一般用规则或决策树模式表示。(5)偏差检测,就是从数据分析中发现某些异常情况是否重要,从而获得有用的知识。(6)预测,就是利用历史数据找出变化规律,建立模型,并用此模型来预测未来数据的种类、特征等。

3.数据挖掘方法和技术。数据挖掘方法是由人工智能、机器学习的方法发展而来,同时结合传统的统计分析方法、模糊数学方法、科学计算以及可视化技术,以数据库为研究对象的方法和技术。数据挖掘方法和技术可分为六类:归纳学习方法、仿生物技术、公式发现、统计分析方法、模糊数学方法和可视化技术。

(1)归纳学习方法。归纳学习方法分为基于信息论的方法和基于集合论的方法。①信息论方法,是利用信息论的原理在数据库中寻找信息量最大的属性来建立属性的决策树。②集合论方法,是根据数据库中各属性的元组集合之间关系来建立属性间的规则。主要用于分类问题。

(2)仿生物技术。仿生物技术典型的方法是神经网络方法和遗传算法。1)神经网络方法:模拟人脑神经元结构,依据人脑的工作方式进行建模的一种方法,其在半结构化和非结构化问题的分类及预测方面具有较大的优势。2)遗传算法:是模拟生物遗传进化过程,对选择、交叉及变异过程建立数学算法。遗传算法已在优化计算和分类机器学习方面发挥了显著的效果。

(3)公式发现。公式发现是通过在工程和科学数据库(由实验数据组成)中对若干数据项(变量)进行一定的数学运算,求得相应得数学公式,并用其来概括大量数据的方法。

4.统计分析方法。统计分析是通过对总体中的样本数据进行分析,得出描述和推断该总体信息和知识的方法,主要包括6类方法:常用统计,相关分析,回归分析,假设检验,聚类分析,判断分析。

5.模糊数学方法。模糊数学是反映人们思维的一种方式。将模糊数学应用于数据挖掘的各项任务中就形成了模糊数据挖掘。利用模糊集合论理论进行数据挖掘的方法有:模糊模式识别、模糊聚类、模糊分类。

6.可视化技术。可视化技术是一种图形显示技术。例如,把数据库中多维数据变成多种图形,便于揭示数据中内在本质以及分布规律。

二、数据挖掘技术在制造型企业信息化中应用分析

目前制造型企业信息化建设都以ERP理论为标准。ERP(Enterprise Resource Planning)企业资源计划是由美国GarterGroup Inc.咨询公司首先提出的,其主要宗旨是对企业所拥有的人、财、物、信息、时间和空间等综合资源进行综合平衡和优化管理,面向全球市场,协调企业各管理部门,围绕市场导向开展业务活动,使企业在市场竞争中全方位地发挥足够的能力,从而取得最好的经济效益。概括地说,ERP是建立在信息技术基础上,利用现代企业的先进管理思想,全面地集成了企业的所有资源信息,并为企业提供决策、计划、控制与经营业绩评估的全方位和系统化的管理平台。基于ERP理论的信息系统主要包括生产计划管理、质量管理、设备管理、采购管理、库存管理、销售管理、客户关系管理、成本管理和财务管理等几个主要的功能模块,同时各模块的信息被全面地集成在同一数据库管理系统中,以便各功能模块能方便地使用其他模块的信息。

1.客户关系管理中的数据挖掘技术应用。ERP理论强调面向市场,以达到最大的客户满意度为导向来决定整个企业的生产经营活动。因此在该模块中可以根据客户信息及客户购买产品的信息利用聚类分析方法,对客户的购买行为进行分类,从而获得哪些客户群对哪些产品有偏好,利用关联分析方法,分析客户购买了某种产品后是否还会购买相关的其他产品,便于营销部门制定针对性的营销计划,生产计划部门制定出有针对性的生产计划。

2.销售管理中的数据挖掘技术应用。销售管理系统主要完成制订销售政策,制订销售计划,合理分配分销资源(人员、库存与管理网络的营运),控制销售回款等工作。

(1)销售趋势及销售价格分析:根据历史销售数据利用神经网络、回归分析和时序数据挖掘等技术预测未来的销售趋势,帮助管理人员制订销售政策和销售计划,合理分配分销资源。

(2)信用评估和防止欺诈分析:利用神经网络、决策树等数据挖掘方法进行客户信用的分析,帮助管理人员控制销售回款。

3.库存管理中的数据挖掘技术应用。库存管理系统主要对计划存储、流通的有关物品进行相应的管理以满足生产和销售的需要。根据仓库信息及销售和生产计划利用神经网络、回归分析和决策树等数据挖掘方法预测未来库存,帮助管理人员进行库存量的控制。

4.采购管理中的数据挖掘技术应用。采购管理系统主要实现接受采购指示,选择供应商,下达订单,订单跟踪和验收货物等管理工作。在该子系统中,可以根据供应商的历史数据和采购物品的历史信息利用神经网络、决策树和时序数据挖掘等数据挖掘方法对供应商进行信用分析,进行物品供应的数量、价格以及供应时间的分析,帮助管理人员选择供应商及下达订单。

5.设备管理中的数据挖掘技术应用。设备管理系统通过对企业的设备与仪器台账的基本信息、运行情况、保养情况、故障和事故情况处理、设备使用部门的变动情况及有关备件管理等信息的管理,使各级部门能及时地了解设备从安装、使用、变动到报废等过程的信息。

6.质量管理中的数据挖掘技术应用。质量管理系统主要实现质量检验与控制,质量分析等功能。在该子系统中,可以根据质量标准和质量检验的历史数据,对质量问题进行聚类分析形成不同的分类,然后运用决策树技术形成规则,帮助系统对质量问题进行自动分类;利用关联分析方法分析产生质量问题的关联因素,帮助管理人员进行质量控制。

7.生产计划管理中的数据挖掘技术应用。制造型企业涉及的有关生产计划分为三种:综合计划(是销售计划与生产规划计划的综合考虑),主生产计划及物料需求计划,其中综合计划决定了主生产计划,主生产计划决定了物料需求计划。

三、基于数据挖掘技术的企业信息管理决策支持系统

基于数据挖掘技术的企业信息管理决策支持系统,其目的是从业务系统积累的大量数据中发现对企业各级管理人员所需的决策支持信息,并将其展现给系统的使用者。数据挖掘被认为是知识发现过程的一个特定步骤,它用专门算法从数据中抽取合适的模型,这些模型经过评估后成为有用的知识,人们使用这些知识对现有的业务数据进行分析和对未来的业务进行预测,从而达到决策支持的目的。基于以上讨论,一种基于数据挖掘技术的制造型企业信息管理决策支持系统基本结构框架如图所示。

本系统由人机交互模块、决策支持模块、模型管理模块、模型库、知识库和业务数据库或数据仓库组成。

1.业务数据库或数据仓库。业务数据库是企业业务管理信息系统建立的数据库,数据仓库是将分布在企业中多个业务管理系统中的数据进行抽取、清洗、转换,并按决策主题的需要进行重新组织,形成面向主题的、集成的、稳定的、不同时间的数据集合。它们都可作为数据挖掘的数据源。

2.模型管理模块。数据挖掘模型的构造是一个不断调整的过程,例如一些数据挖掘方法,需要利用样本数据进行有指导或无指导地自学习过程才能得到可用的知识模型,同时知识模型也并不是一成不变的,随着时间的推移,数据的变化,需要进行调整以适应新的环境。该模块主要用于构造和维护数据挖掘模型,对数据挖掘模型进行评估,最终得到用户可以使用的知识模型。

3.决策支持模块。根据用户的需要,在决策支持模块中,利用相应的知识模型,对相应的数据源进行分析和计算,并将结果通过各种可视化的工具和图形用户界面展现。

4.模型库。模型库用于存储实现模型算法的子程序、模型的结构参数文件、有关的样本数据文件、学习结果文件及学习误差文件等等。

5.知识库。知识库中包含了在解决问题时所用的知识。即那些既不能用数据表示、也不能用模型描述的专门知识和历史经验。知识库中除了专家提供的知识,还包含在数据挖掘过程中得到的知识。知识库中的知识可对数据挖掘过程不断地提出指导和改进,同时对于挖掘结果和分析结果的有价值信息也会及时地输入知识库中存储,还可以向前台的人机交互界面直接输出知识模式。

6.人机交互模块。人机交互模块是决策支持系统的人机交互接口,它负责接收和检验用户的请求,为决策者提供信息收集、问题识别以及模型构造、使用、改进、分析和计算等功能。

本文在介绍数据挖掘概况的基础上,讲述了这门技术在制造型企业信息管理系统中应用的可能性及其应用特点。数据挖掘技术作为一门新兴技术为制造型企业信息化管理提供决策支持提供了一种有效、可行的解决方案。随着数据挖掘技术和网络技术的发展,数据挖掘技术在制造型企业信息管理中的作用将会推向一个更高的层次,分析、决策及知识处理会从一台机器上的集中式处理,变成在网络环境下的分布、或分布再加上并行的处理方式。这些变化将会为制造型企业信息化作出贡献,为企业带来巨大的经济效益。

参考文献:

[1]Margaret H.Dunham:数据挖掘教程[M].北京:清华大学出版社,2005

[2]Jiawei Han等:数据挖掘概念与技术[M].北京:机械工业出版社,2001

相关热词搜索: 企业信息化 数据挖掘 制造 技术