2021年2月10日晚9时,山东大学土建与水利学院“科研我当先”实践团队线上进行第九次内容分享。会议由曹博文同学主持,全体成员参加。
本次线上交流由曹博文同学主讲,他关于围棋AI中的AlphaGo整体算法进行了深入浅出的分享 。
首先曹博文同学简单讲解了深度卷积神经网络(DCNN)的核心思想,之后介绍了Deepmind团队基于DCNN实现的四个“大脑”:SL.Policy Network(监督学习策略网络)RL.Policy Network(强化学习策略网络),Rollout(随机模拟走子),Vaue Network(价值网络)。
之后曹博文通过与传统博弈游戏树搜索算法——极大极小搜索进行对比,点明了传统算法解决围棋问题的困难性,引出了AlphaGo整体算法的框架,也是算法核心——蒙特卡洛树搜索。蒙特卡洛树搜索的主要概念是搜索,即沿着博弈树向下的一组遍历过程。单次遍历的路径会从根节点(当前博弈状态)延伸到没有完全展开的节点,未完全展开的节点表示其子节点至少有一个未访问到。遇到未完全展开的节点时,它的一个未访问子节点将会作为单次模拟的根节点,随后模拟的结果将会反向传播回当前树的根节点并更新博弈树的节点统计数据。一旦搜索受限于时间或计算力而终止,下一步行动将基于收集到的统计数据进行决策。
他通过对蒙特卡洛树算法原理的讲解,带着大家完整地体会了一遍AlphaGo算法的流程。
通过此次曹博文同学的分享,团队成员对AlphaGo的算法实现原理有了大致的了解,拓展了知识。本次会议分享持续了三十五分种,对于非本专业的学生是一次很好的学习机会。
http://www.dxsbao.com/shijian/339122.html
点此复制本页地址
为深化校际合作,吸引优质生源,4月2日,文法学院常务副院长罗艳娟、教学助理兼办公室主任徐梓滢、新闻传播学教研室主任申琳一行赴开封,先后走访河南省杞县希望高中、开封市通许一高开展……
徐梓滢 河南科技学院新科学院法律系查看全文 >>
为弘扬中华优秀传统文化,增强青少年文化自信,丰富孩子们的课余生活,4月1日上午,青年志愿者协会文法学院分会携手贺堤学校,为六年级一班学生量身打造了一场别开生面的传统文化盛宴。青……
王玥忻 河南科技学院新科学院法律系查看全文 >>
为深入贯彻落实全面从严治党要求,扎实推进作风建设,3月27-28日,文法学采取集中学习、个人自学和交流研讨相结合的形式,举办为期两天的深入贯彻中央八项规定精神学习教育读书班。在读书……
程潇 苏一飞 河南科技学院新科学院法律系查看全文 >>
为贯彻落实党的二十届三中全会部署,巩固拓展学习贯彻习近平新时代中国特色社会主义思想主题教育成果,巩固深化党纪学习教育成果,锲而不舍落实中央八项规定精神,推进作风建设常态化长……
郝鑫蕊 河南科技学院新科学院法律系查看全文 >>
为贯彻落实党的二十届三中全会部署,巩固习近平新时代中国特色社会主义思想主题教育成果,学习中央八项规定精神,深化党风廉政建设,增强党员干部责任意识和规则意识。2025年3月27日上午,……
张欣茹 河南科技学院新科学院法律系查看全文 >>
3月26日,新乡工程学院文法学院常务副院长罗艳娟带队,率学院教师代表一行4人赴平顶山学院文学院考察交流,重点围绕师范专业认证、学科建设、实践教学创新及实验室建设等主题展开深入探讨……
冯莉娟 河南科技学院新科学院法律系查看全文 >>
为提升同学们的心理素养,培养阅读习惯,打破社交壁垒,实现自我成长,和悦·心语辅导员工作室于3月26日晚7点在综合实验楼520活动室成功举办“文心悦读”文化沙龙。本次活动以经典心理学书……
王玥忻 河南科技学院新科学院法律系查看全文 >>
为深入贯彻青少年法治教育理念,助力构建平安校园,3月27日下午,青年志愿者协会文法学院分会携手树德外国语小学,为四年级一班学生量身打造了一场别开生面的“法律知识小讲堂”主题课堂……
王玥忻 河南科技学院新科学院法律系查看全文 >>