(12)发明专利申请
(10)申请公布号 CN 110321960 A(43)申请公布日 2019.10.11
(21)申请号 201910615242.4(22)申请日 2019.07.09
(71)申请人 上海新增鼎网络技术有限公司
地址 200135 上海市浦东新区绿科路90号(72)发明人 李会文 刘琼 薛罡 万波
朱跃飞 程宏 (51)Int.Cl.
G06K 9/62(2006.01)G06Q 10/04(2012.01)G06Q 50/04(2012.01)
权利要求书1页 说明书4页 附图2页
CN 110321960 A(54)发明名称
一种工厂生产要素的预测方法及系统(57)摘要
本发明公开了一种工厂生产要素的预测方法及系统,属于数据处理技术领域。该预测方法包括以下步骤:构建物联网传感器网络,实时采集工厂的运行数据;对运行数据进行预处理,提取运行数据的数据特征;对数据特征进行筛选、
建立训练集;采用K重交叉验证法对优化和整合,
训练集内的数据特征进行训练,得到K个模型;采用集成学习算法分别对K个模型进行预测,得到单一预测结果。本发明通过采用物联网技术进行数据的采集,可以实现工厂无关化的快速、准确、实时、稳定的数据采集。另外,本发明还通过采用K重交叉验证法,结合多个算法训练多个模型,可以解决单一算法预测会存在的模型单一、不容易泛化等问题,从而可以提高对模型预测的准确性。
CN 110321960 A
权 利 要 求 书
1/1页
1.一种工厂生产要素的预测方法,其特征在于,包括以下步骤:通过物联网技术构建物联网传感器网络,实时采集工厂的运行数据;结合统计分析方法,对运行数据进行预处理,提取运行数据的数据特征;对数据特征进行筛选、优化和整合,建立训练集;
采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;采用集成学习算法分别对K个模型进行预测,得到单一预测结果。2.根据权利要求1所述的一种工厂生产要素的预测方法,其特征在于,所述的运行数据包括人员数据、公用工程数据、车辆数据和设备工艺仪表数据。
3.根据权利要求1所述的一种工厂生产要素的预测方法,其特征在于,所述的K重交叉验证法包括以下步骤:先将训练集分割成K份子样本,取一个单独的子样本作为用于验证模型的数据集,其余K-1份子样本用于训练;然后重复上述步骤,将每一份子样本作为用于验证模型的数据集,得到K个模型。
4.根据权利要求1所述的一种工厂生产要素的预测方法,其特征在于,所述的单一预测结果为K个模型预测结果的加权平均数。
5.根据权利要求1所述的一种工厂生产要素的预测方法,其特征在于,所述的集成学习算法为线性回归、LightGBM和SVM中的至少两种。
6.根据权利要求1-5中任一项所述的一种工厂生产要素的预测方法,其特征在于,所述的预测方法还包括以下步骤:采用贝叶斯优化算法分别对K个模型进行调参。
7.根据权利要求6所述的一种工厂生产要素的预测方法,其特征在于,所述的预测方法还包括以下步骤:采用L2损失函数对单一预测结果进行评估。
8.一种工厂生产要素的预测系统,其特征在于,包括:采集模块,用于通过物联网技术构建物联网传感器网络,实时采集工厂的运行数据;处理模块,用于结合统计分析方法,对运行数据进行预处理,提取运行数据的数据特征;
整合模块,用于对数据特征进行筛选、优化和整合,建立训练集;训练模块,用于采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;预测模块,用于采用集成学习算法分别对K个模型进行预测,得到单一预测结果。9.根据权利要求8所述的一种工厂生产要素的预测系统,其特征在于,所述的预测系统还包括:调参模块,用于采用贝叶斯优化算法分别对K个模型进行调参。
10.根据权利要求9所述的一种工厂生产要素的预测系统,其特征在于,所述的预测系统还包括:评估模块,用于采用L2损失函数对单一预测结果进行评估。
2
CN 110321960 A
说 明 书
一种工厂生产要素的预测方法及系统
1/4页
技术领域
[0001]本发明涉及数据处理技术领域,具体是一种工厂生产要素的预测方法及系统。背景技术
[0002]工厂生产要素(产量、产品/原材料库存等)预测系统的核心是统计分析、建模和机器学习。与此同时,海量的工厂数据必须有大数据平台的支撑。准确的工厂生产要素预测能够给企业方的决策层,提供强有力的整体规划及发展方向策略。但是在实际应用中,大部分中小企业缺乏相应技术支撑,难以准确的进行生产要素预测或预测准确率较差,导致不可挽回的经济损失。因此,稳定可靠、精度准确的预测方法,成为当前该领域亟待解决的问题。[0003]目前,对于监督学习运用在工厂生产要素预测的系统实例在国内极少。在传统的生产要素预测方法中,较为常用的机器学习模型在生产环境中单一化比较严重,比如仅仅应用单一的基于线性回归(Linear Regression)、支持向量机(Support Vector Machine,SVM)、分布式梯度提升(Light Gradient Boosting Machine,LightGBM)、随机森林或者极端梯度提升(eXtreme Gradient Boosting,XGBoost)等模型;其次,传统训练模型一般在线下完成,通过人工部署模型;再次,传统训练模型所需的工厂数据的获得主要依靠传统的人工记录或者其他的传感设备。[0004]因此,目前传统的生产要素的预测方法至少存在以下几方面的问题:
1、缺少集成学习模块,模型准确率不高。现有的机器学习系统一般采用训练和预测分离的办法,所以一般预测时只采用一种算法、一个模型。这样可能会导致无法探索出复杂数据与预测目标之间的多层差异性关系,也就无法做出更准确的预测。[0005]2、各个算法插入灵活性不够。由于每个工厂生产环境各不相同,需要预测的生产要素、所需采集的数据也千差万别,采用单一算法来预测所有工厂、所有生产要素可能效果不佳,实际生产环境中部署的系统一般只能在线下人工训练不同模型,而不能直接通过图形界面在系统中在线配置、训练。[0006]3、特征的选择,缺乏比较系统的特征工程,对模型的特征需求缺少智能化和准确性。
[0007]4、数据的获取途径孤立、单一,缺乏系统的物联网数据采集技术。发明内容
[0008]本发明的目的在于提供一种工厂生产要素的预测方法及系统,以解决上述背景技术中提出的问题。
[0009]为实现上述目的,本发明实施例提供如下技术方案:
一种工厂生产要素的预测方法,包括以下步骤:通过物联网技术构建物联网传感器网络,实时采集工厂的运行数据;结合统计分析方法,对运行数据进行预处理,提取运行数据的数据特征;对数据特征进行筛选、优化和整合,建立训练集;
3
CN 110321960 A
说 明 书
2/4页
采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;采用集成学习算法分别对K个模型进行预测,得到单一预测结果。[0010]本发明实施例采用的一种优选方案,所述的运行数据包括人员数据、公用工程数据、车辆数据和设备工艺仪表数据。
[0011]本发明实施例采用的另一种优选方案,所述的K重交叉验证法包括以下步骤:先将训练集分割成K份子样本,取一个单独的子样本作为用于验证模型的数据集,其余K-1份子样本用于训练;然后重复上述步骤,将每一份子样本作为用于验证模型的数据集,得到K个模型。
[0012]本发明实施例采用的另一种优选方案,所述的单一预测结果为K个模型预测结果的加权平均数。
[0013]本发明实施例采用的另一种优选方案,所述的集成学习算法为线性回归、LightGBM和SVM中的的至少两种。
[0014]本发明实施例采用的另一种优选方案,所述的预测方法还包括以下步骤:采用贝叶斯优化算法分别对K个模型进行调参。
[0015]本发明实施例采用的另一种优选方案,所述的预测方法还包括以下步骤:采用L2损失函数对单一预测结果进行评估。
[0016]本发明实施例还提供了一种工厂生产要素的预测系统,其包括:
采集模块,用于通过物联网技术构建物联网传感器网络,实时采集工厂的运行数据;处理模块,用于结合统计分析方法,对运行数据进行预处理,提取运行数据的数据特征;
整合模块,用于对数据特征进行筛选、优化和整合,建立训练集;训练模块,用于采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;预测模块,用于采用集成学习算法分别对K个模型进行预测,得到单一预测结果。[0017]本发明实施例采用的另一种优选方案,所述的预测系统还包括:调参模块,用于采用贝叶斯优化算法分别对K个模型进行调参。[0018]本发明实施例采用的另一种优选方案,所述的预测系统还包括:评估模块,用于采用L2损失函数对单一预测结果进行评估。
[0019]本发明实施例的提供的上述技术方案,相比于现有技术,具有以下技术效果:
本发明实施例通过采用物联网技术进行数据的采集,可以实现工厂无关化的快速、准确、实时、稳定的数据采集,从而可以解决数据获取的准确度和联动性较差,对数据分析、特征工程以及模型带来前端错误累加等问题。本发明实施例还通过采用K重交叉验证法,结合多个算法训练多个模型的方案,可以解决单一算法预测会存在的模型单一,不容易泛化等问题,从而可以提高对模型预测的准确性。附图说明
[0020]图1为实施例1提供的一种工厂生产要素的预测方法的流程示意图。[0021]图2为实施例2提供的一种工厂生产要素的预测系统的结构示意图。
4
CN 110321960 A
说 明 书
3/4页
具体实施方式
[0022]下面的具体实施例是结合本说明书中提供的附图对本申请的技术方案作出的具体、清楚的描述。其中,说明书的附图只是为了用于将本申请的技术方案呈现得更加清楚明了,并不代表实际生产或使用中的形状或大小,以及也不能将附图的标记作为所涉及的权利要求的限制。[0023]实施例1
参照附图1,该实施例提供了一种工厂生产要素的预测方法,其包括以下步骤:S1、通过物联网技术构建物联网传感器网络,实时采集工厂包括人员数据、公用工程数据、车辆数据和设备工艺仪表数据等在内的运行数据。其中,通过物联网技术可以实现工厂无关化的快速、准确、实时、稳定的数据采集;人员数据包括进出厂的人数等,公用工程数据包括水、电、气和煤等的使用量,车辆数据包括原料/产品进出厂车辆数量等,设备工艺仪表数据包括流量、温度、电流等工艺参数。[0024]S2、基于大数据与人工智能技术,并结合统计分析方法,对上述采集到的运行数据进行预处理,提取运行数据的数据特征。[0025]S3、采用静态函数、长短期记忆网络(Long Short-Term Memory,LSTM)、随机森林等筛选算法和优化算法,对数据特征进行筛选、优化和整合,建立训练集。[0026]S4、采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;具体的,先将训练集分割成K份子样本,取一个单独的子样本作为用于验证模型的数据集,其余K-1份子样本用于训练;然后重复上述步骤,将每一份子样本作为用于验证模型的数据集,得到K个模型。通过同时重复运用随机产生的子样本进行训练和验证,得到K个模型,可以保证所有训练集中的数据都有被用做训练,从而可以提高训练的准确性,以及可以避免类似普通的交叉验证一样将训练集分割出1/4或1/5用作验证数据集而导致在数据少的情况下容易出现过拟合的问题。[0027]S5、采用贝叶斯优化算法分别对K个模型进行调参,以提高模型训练的准确性。[0028]S6、采用集成学习算法分别对K个模型进行预测,分别得到与K个模型相对应的K个预测结果,然后对取该K个模型预测结果的加权平均数作为最终的单一预测结果。其中,所述的集成学习算法为线性回归、LightGBM和SVM中的至少两种。[0029]S7、采用L2损失函数对上述取得的单一预测结果进行评估。若评估不合格,则重复S1~S6的步骤。[0030]具体的,当上述的K取值为5时,即产生了5个模型,通过对这5个模型分别用线性回归和LightGBM算法进行预测,可以得到两组单一预测结果(线性回归算法的单一预测结果和LightGBM算法的单一预测结果);然后,通过对这两组单一预测结果使用L2损失函数进行评估,可以得到单一预测结果的均方根误差和R平方值如下表1。[0031]表1单一预测结果线性回归LightGBM均方根误差68.190054.5133R平方0.524795350.69629989
从上表1可以看到,通过该实施例提供的预测方法可以得到准确性较高的预测结果,而且,通过多种算法的比较,还可以选取误差较小、拟合度较高的算法进行模型预测,从而可
5
CN 110321960 A
说 明 书
4/4页
以为训练工厂生产要素预测模型提供灵活、强大、可扩展的智能平台。[0032]实施例2
参照附图2,该实施例提供了一种用于实现上述实施例1提供的工厂生产要素预测方法的预测系统,其包括采集模块、处理模块、整合模块、训练模块、预测模块、调参模块和评估模块。具体的,采集模块,用于通过物联网技术构建物联网传感器网络,实时采集工厂的运行数据;处理模块,用于结合统计分析方法,对运行数据进行预处理,提取运行数据的数据特征;整合模块,用于对数据特征进行筛选、优化和整合,建立训练集;训练模块,用于采用K重交叉验证法对训练集内的数据特征进行训练,得到K个模型;预测模块,用于采用集成学习算法分别对K个模型进行预测,得到单一预测结果;调参模块,用于采用贝叶斯优化算法分别对K个模型进行调参;评估模块,用于采用L2损失函数对单一预测结果进行评估。[0033]综上所述,本发明实施例通过采用物联网技术进行数据的采集,可以实现工厂无关化的快速、准确、实时、稳定的数据采集,从而可以解决数据获取的准确度和联动性较差,对数据分析、特征工程以及模型带来前端错误累加等问题。本发明实施例还通过采用K重交叉验证法,结合多个算法训练多个模型的方案,可以解决单一算法预测会存在的模型单一,不容易泛化等问题,从而可以提高对模型预测的准确性。[0034]需要说明的是,上述实施例只是针对本申请的技术方案和技术特征进行具体、清楚的描述。而对于本领域技术人员而言,属于现有技术或者公知常识的方案或特征,在上面实施例中就不作详细地描述了。[0035]当然,本申请的技术方案不只局限于上述的实施例,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,从而可以形成本领域技术人员可以理解的其他实施方式。
6
CN 110321960 A
说 明 书 附 图
1/2页
图1
7
CN 110321960 A
说 明 书 附 图
2/2页
图2
8
因篇幅问题不能全部显示,请点此查看更多更全内容