(五)SPSS多元回归分析
SPSS多元回归分析是指在相关变量中将一个变量视为因变量,其他一个或多个变量视为自变量,建立多个变量之间线性或非线性数学模型数量关系式并利用样本数据进行分析的统计分析方法。
(六)模糊综合评价法
模糊综合评价法是一种基于模糊数学的综合评价方法。该综合评价法根据模糊数学的隶属度理论把定性评价转化为定量评价,即用模糊数学对受到多种因素制约的事物或对象做出一个总体的评价。
(七)关联规则
关联分析是一种简单、实用的分析技术,是指发现存在于大量数据集中的关联性或相关性,从而描述一个事物中某些属性同时岀现的规律和模式。关联分析可从大量数据中发现事物、特征或者数据之间的,频繁出现的相互依赖关系和关联关系。
(八)文本处理与分词
在使用网络爬虫后,团队得到了海量的文本数据。为了方便进一步的分析与挖掘,团队首先需要讲无用信息筛选掉,并进行初步的分词处理。
首先需要去除无用符号,尤其是网络中容易出现的表情符号,再除去无用字符后,得到较为整洁的文本。随后使用中文停词表,将文本中的关联词,和没有蕴含信息的词语删去。最后使用python的jieba库进行分析并进行词频统计,绘制出可视化词云图,分析出热点词汇,初步把握人们的关注重点,为进一步的分析打下基础。
(九)文本情感倾向分析
基于感情词典,并通过一定的赋权规则,对已经进行初步分词的文本进行情感倾向分析。
判断这段话所涉及的情感词数目,若存在积极词,则积极词值加一分,若存在消极词,则消极词值加一分。在统计的过程中,同时判断该情感词前面是否存在程度副词,若存在需要根据程度副词的不同种类赋予不同的权重,并乘以情感词数。最后得出情感得分,一般为负则表示情感为消极情感,为真判断为积极情感,也可以通过得分绝对值的大小判断文本感情的强烈程度。
http://www.dxsbao.com/shijian/549975.html 点此复制本页地址