当前位置: 主页 > 社会实践 >

未来之心探索金寨第十九弹

来源:安徽财经大学经济 作者:安安

基于决策树模型分析不同人群对于金寨电商模式的认可程度

1.模型的准备

决策树算法是一种用于归纳分类的算法,它通过对训练集的学习,挖掘有用的规则,用于对新集进行预测。决策树是一种用于对实例进行分类的树形结构。决策树由节点(node)和有向边(directed edge)组成。节点的类型有两种:内部节点和叶子节点。其中,内部节点表示一个特征或属性的测试条件(用于分开具有不同特性的记录),叶子节点表示一个分类。决策树构建的原理是通过对各个属性的不断划分使得决策树的分支节点所包含的样本尽量属于同一类别,即节点的纯度越来越高,而决策树构建的关键在于纯度的度量。CART分类树算法使用基尼系数代表模型的纯度,基尼系数越小,则不纯度越低,特征越好。

分类树中,假设某个样本空间有k类,对于生成好的一颗决策树的某叶子节点,假定该叶结点含有样本数目为m,可以分别统计该叶子节点下每个分类的频数 。每个类别的概率 ,于是这个叶子节点的信息熵就是 。信息熵越小,系统的区分度越明显。所以最终对于一棵分类树的评价可以用下面的公式来评判( 叶子节点的权重,可以更具样本数目来决定): 。对于不同的算法,并不完全都是用信息熵,也可以采用基尼系数来代替信息熵。具体的,假设一K类样本占全部样本的比值为 ,则D的基尼系数计算公式如下: 。

2.模型的建立

以问卷搜集到的信息中的个人情况中的性别信息、职业信息、年龄段,以及被调查者对于金寨电商模式的认可程度和对金寨电商模式的发展前景的看法的文本为分析对象,在构建决策树时,我们选取1158个人的信息作为训练集,290人作为测试集。最后通过测试集测试模型训练的准确率可以达到84.5666%。下图为所构建决策树的整体分析情况,Python运行代码见附件。

其中,为防止过拟合现象,需要对决策树进行剪枝,即预剪枝和后剪枝。预剪枝:树还没完全分裂的时候,设定好阈值,阻止其分裂。后剪枝:当树完全分裂之后,开始进行剪枝:由完全树 开始,剪枝部分结点(叶子节点,或者子节点)得到 ,再次剪枝部分结点得到 …,直到剩下树根的树(就是根节点) ;在验证数据集上对这k个树分别评价,选择损失函数最小的树 。

采用CART代价复杂度剪枝方法(CCP):

1、决策好一颗树,除去叶子节点后有 ;

2、计算每个子节点剪枝后的表面误差率增益

其中, ,loss(t)是剪枝后的损失函数,loss(T)是剪枝前的损失函数,leaf(T)是剪枝前T节点下面的叶子节点数。

3、 ,剪枝最小的节点 。

http://www.dxsbao.com/shijian/547992.html 点此复制本页地址

相关内容

聊城大学教育科学学院组织参加西部计划教育展馆

【教科】我院组织参观西部计划教育展馆为加强青年学子对我校西部计划工作的了解,弘扬志愿服务精神,培养青年学子的家国情怀,3月27日,教育科学学院组织同学们到文华苑参观西部计划教育…… 王海燕 杨鑫淼 吴 聊城大学教育科学学院查看全文 >>

聊城大学教科院开展第二十五个“世界睡眠日”义诊活动

为增强全院师生对睡眠健康的认识,倡导科学睡眠理念,3月20日,教育科学学院分工会联合聊城市人民医院在4#C121开展了第二十五个“世界睡眠日”义诊活动。聊城市人民医院麻醉科和耳鼻喉科的…… 吴依凡 王婧宇 聊城大学教育科学学院查看全文 >>

聊城大学教科院召开深入贯彻中央八项规定精神 学习教育启动会议

为深入学习贯彻中央八项规定精神,扎实开展好深入贯彻中央八项规定精神学习教育,3月25日,教育科学学院党委在4#C214召开深入贯彻中央八项规定精神学习教育启动会议。学院党委书记王迎秋主…… 毕延琛 聊城大学教育科学学院查看全文 >>

聊城大学教科院组织安全教育专题政治理论学习

为加强宣传引导,深化教师思想认识,增强政治自觉,推动安全工作落实,3月20日,教育科学学院在4#C221组织开展全体教工安全教育专题政治理论学习,学习由党委书记王迎秋主持。党委副书记吴…… 刘雨佳 李晓斐 聊城大学教育科学学院查看全文 >>

聊城大学教科院“红途铸梦”服务队赴黄山路社区开展“赓续红色血脉 致敬时

【教科】我院“红途铸梦”服务队赴黄山路社区开展“赓续红色血脉致敬时代楷模”社区实践为弘扬红色革命精神,传承榜样力量,引导青少年厚植爱国情怀,3月8日,教育科学学院“红途铸梦”服…… 杨佳美 聊城大学教育科学学院查看全文 >>

聊城大学教科院开展心理素质拓展嘉年华活动

3月16日,教育科学学院在西校区北操场开展心理素质拓展嘉年华活动。本次活动面向大一和大二年级同学,共组建8支队伍,每支队伍由8名同学组成。本次活动将心理健康教育与体育运动巧妙融合,…… 徐源璐 吴依凡 聊城大学教育科学学院查看全文 >>

聊城大学教科院开展“绘心绘意 愈见美好”心理绘画疗愈展

为引导同学们探索内心世界,释放情绪压力,实现心灵的疗愈与成长,3月15日,教育科学学院在4#C121开展“绘心绘意愈见美好”心理绘画疗愈展。活动伊始,主讲人详细介绍了评选规则,作品将从…… 毛思宇 聊城大学教育科学学院查看全文 >>

聊城大学教科院举办“传承雷锋精神 争做时代先锋”主题观影活动

为传承和弘扬雷锋精神,培养同学们的爱国情怀和社会责任感,3月5日,教育科学学院在11#A601举办“传承雷锋精神争做时代先锋”主题观影活动。活动伊始,主持人就本次主题观影活动展开细致介…… 蔡梦娇 王梦涵 聊城大学教育科学学院查看全文 >>

推荐内容

革命馆里话初心,奋斗路上正青春:福建医科大学基础医学院临床医学(“5

学雷锋系列活动三月的春风,带着温暖与希望,吹拂着大地,也吹响了传承雷锋精神的号角。为深入践行社会主义核心价值观,激励…

“名郡植春筑福庭”——“美化环境,共享健康” 名郡社区卫生行动

为营造整洁、卫生、健康的社区生活环境,团支部组织团员们对名郡荷塘社区环境进行了清理。福建医科大学基础医学院临床医学(…

仁心续火承先志,碧波芳草筑安康:福建医科大学基础医学院临床医学(“5

为将健康知识和服务送到社区居民身边,2025年3月15日福建医科大学基础医学院临床医学(“5+3”一体化)2023级志愿服务队第二小分…

清明追思,大爱永存 ——皖南医学院红十字协会举办清明节缅怀遗体捐献者活

为弘扬“人道、博爱、奉献”的红十字精神,倡导遗体捐献事业的社会价值,清明节前日,皖南医学院红十字协会在皖南医学院遗体…

郑州财经学院青年马克思主义者培养工程“秋实班”学员赴河南省团校参观学

为深入学习贯彻习近平新时代中国特色社会主义思想和党的二十大、二十届二中、三中全会精神,贯彻落实习近平总书记关于青年工…

最新发布

“乡村振兴背景下农村地区发展情况”第1弹
针对此次研究,我们在实地调研的基础上设计问卷,主要通过问卷网的问卷服务以分层抽样和两阶段抽样相结合的方式对全国范围的居民进行调查。并利用描述性统计分析和列联表分析初步了解调查人群基本信息以及对…
未来之心探索金寨第二十二弹
一、“互联网+”绘制金寨脱贫发展蓝图(一)“三个农民”——互联网+农特产品一年之际在于春。早春时节,“三个农民”迅速按下了“启动键”,挂了“前进档”。发出帮扶,是三个农民做强做大电商的‘金钥匙’…
未来之心探索金寨第二十一弹
一、“互联网+”绘制金寨脱贫发展蓝图(一)“三个农民”——互联网+农特产品一年之际在于春。早春时节,“三个农民”迅速按下了“启动键”,挂了“前进档”。发出帮扶,是三个农民做强做大电商的‘金钥匙’…
未来之心探索金寨第二十弹
精准乡村振兴战略的明确提出为我国脱贫攻坚任务指明了前进的方向,旅游乡村振兴作为我国脱贫的创新手段之一,旅游乡村振兴政策的制定和旅游乡村振兴规划的实施正面临着许多现实困境。因此,通过问卷调查,采…
未来之心探索金寨第十八弹
基于列联检验对受访者不同特征的相关性分析1.理论基础列联表检验分析是问卷调查中常用的判断某个问题的两个或多个不同特征之间是否存在联系的统计分析方法,包括卡方独立性检验、一致性检验和拟合优度检验。…
未来之心探索金寨第十七弹
二、基于列联分析对被调查者金寨发展认知及金寨发展力度的探究(一)基于列联表分析对被调查者金寨发展认知的特征分析在初步了解受访者对金寨发展的认知度后,团队将研究对象细化为金寨发展的认知情况,在此…
未来之心探索金寨第十六弹
一、问卷调查分析本次调研共投放网络问卷1600份,有效填写人次1540,回收率为96.25%,涉及26个问题,包括用户基本信息、家庭居住金寨生态以及自己家乡金寨生态三个方面。1.调查样本性别分布情况在参与调查问卷的160…
未来之心探索金寨第十五弹
1、调查对象与范围在正式调查中,共发放问卷1200份,金寨县具有代表性的地区农民,最终有效问卷1084份,问卷的有效率为90.3%。2、抽样设计(1)抽样方法由于全县的人口众多,调查总体过大,且采取网上问卷的方式…
未来之心探索金寨第十四弹
调查方式1、文案调查法文案调查法是市场调查前期必选的方法,并贯穿其实施的全过程。文案调查法根据研究目的与任务的需要,通过一定手段与技术搜集二手资料信息。文案调查法的目的是搜集截止到目前,已经形…
未来之心探索金寨第十三弹
实践具体规划流程安排互联网,作为信息时代的优秀产物,已经不仅仅是一种工具,更是一种思维。现如今,中国要全面实现建成小康社会目标,乡村振兴脱贫成为关键所在。如果将符合信息时代的互联网思维这对螺旋…