4.建立模型
因为我们采取2011-2017年的数据,数目大于4,所以我们要考虑通过训练组和试验组来选择是采用传统的GM(1,1)还是新信息GM(1,1)或者新陈代谢GM(1,1)模型。样本量4
基于灰色预测模型得到绿色墙材市场到2023第一季度均会有较好的前景这一结论下,我们想进一步了解用户对绿色墙材未来发展的看法,所以我们针对问卷最后一题的开放式题目,进行了文本挖掘。
8.1文本挖掘
文本挖掘是挖掘用户观点的有效方法,基于此我们针对问卷唯一的主观题“您对绿色墙体未来发展情况的看法是”进行文本挖掘,直观的展示用户想法。我们的文本挖掘主要有中文分词、词频统计、词云绘制三个方面。
8.2文本挖掘三个方面
(1)中文分词
在语言处理中,为了能更好地处理句子,往往需要将句子拆分为词语。中文分词是将句子中的汉字切分为单独的词,相比于英文的切分,汉字的切分要更加的困难,但是Python提供的中文分词jieba库很好的解决了这个问题。我们将答案先导入到txt文件然后导入Python进行一系列的处理,最后得到结果。
,
的估计值为:
http://www.dxsbao.com/shijian/548043.html 点此复制本页地址