基于hadoop平台的数据挖掘算法实证研究Empirical Research on Data Mining Algorithm Based on Hadoop Platform
高飞;
摘要(Abstract):
在数据挖掘过程中,由于决策树在分析阶段存在单一递进关系,会导致数据的分析效率不高。针对这一问题,文章提出了基于hadoop平台的数据挖掘算法,并展开了相关实证研究。首先,采用广度优先策略对数据集挖掘算法决策树展开设计,将节点之间的最小加权欧氏距离作为划分基准,利用hadoop平台中的MapReduce程序实现对决策树节点分枝操作的并行处理,以此建立决策树的层级关系,实现对待处理数据集的逐层分析。然后,对数据挖掘算法的Map函数展开设计,以待分析数据
关键词(KeyWords): hadoop平台;数据挖掘算法;实证研究
基金项目(Foundation): 2022年度广西高校中青年教师科研基础能力提升项目“基于Hadoop的计算机类专业课程云平台设计与实现”(编号:2022KY1436)
作者(Authors): 高飞;
参考文献(References):
- [1]文芳,黄慧玲,李腾达,等.基于FPgrowth关联规则的图书馆数据快速挖掘算法研究[J].重庆理工大学学报(自然科学),2020(6):189-194.
- [2]熊蕾,彭吉琼,李铭,等.基于深度学习的基层网络数据个性化挖掘算法[J].计算机仿真,2022(1):318-321+332.
- [3]李华群.基于改进Apriori算法在图书馆数据挖掘中应用分析[J].内蒙古科技与经济,2021(24):66-68+73.
- [4]解艳.基于大数据挖掘处理的多维数据去重聚类算法分析模型仿真[J].自动化技术与应用,2021(12):112-115.
- [5]王营,高琦,李婷玉,等.基于改进FPgrowth算法的售后服务数据挖掘[J].现代制造工程,2021(6):31-37.
- [6]李瑞峰,杨海峰,蔡江辉,等.一种基于加权深度森林的离群数据挖掘算法[J].小型微型计算机系统,2022(7):1426-1431.
- [7]李珺,刘鹤,朱良宽.基于改进的Kmeans算法的关联规则数据挖掘研究[J].小型微型计算机系统,2021(1):15-19.
- [8]李锐,黄煜坤,董路通,等.基于电网调控业务多文本数据挖掘的机器学习算法的研究与应用[J].电子设计工程,2021(9):107-111.