快捷导航

        如何使用集搜客分词平台做社会网络图分析?

        2020-4-13 19:23| 发布者: ym| 查看: 1514| 【亚州】专区在线: 0

        摘要: 社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。 1、新建任务并导入符合格式要 ...

        社会网络关系图在文本挖掘分析中,可以探索发现两两词语之间的关系、哪些词语处于核心地位,下面我们利用集搜客的文本分词和分类检索平台的“社会网络”菜单,就能得到网络图和矩阵表。

        1、共词匹配

        新建任务并导入符合格式要求的文本数据后,详细操作见《分词和分类检索平台使用手册》,然后点进“社会网络”菜单,如果前面步骤做了选词操作,那么直接点击“共词匹配”按钮,就会计算两两词语在原数据(导入的文本数据)里的共现次数;如果没有选词,那么可以点“加词”按钮,把手工整理好的词语添加进去即可。


        2、生成网络图

        做完上面第1步,点击“网络图”按钮,就可以生成网络图,如果需要引用,可以截图,暂不支持调整样式和大小。


        2.1、看核心词的连线

        网络图默认是展示共词矩阵表里的所有词语关系,所以当词语太多时,就会看到密密麻麻一团。通过设置要展示的连线数量,系统就会根据词语关联度从大到小排序,优先画出处于核心地位的词语间连线,这样可以更好地发现核心词语与其他词语之间的共现关系。


        2.2、看词语的关联度

        在网络图里,用圆点大小来表示词语的关联度大小,即与该词有连线的词语数量,把鼠标悬浮在圆点上,即可看到该词语的关联度数值。由于使用的是无向网络图,所以这里的关联度也能表示点的中心性,即核心地位大小,所以,词语的关联度越大,圆点越大,词语就越重要。


        2.3、看两个词语的共现次数

        网络图里有共现关系的两个词语是用线条连接的,把鼠标悬浮在连线上,就能看到两个词语的共现次数,即这两个词语同时出现在多少条原数据里,一般是用连线的粗细来表示,这里为了整体效果则用一样粗细的线条表示。


        3、下载共词矩阵表

        点击“下载共词矩阵”按钮,即可下载到共词矩阵表。如果进一步挖掘网络关系,可以基于矩阵表,再整理出网络图节点的属性表、样式表。


        矩阵表里,水平、垂直相交的单元格里,就是两个词语的共现次数,大于0就是有共现关系,等于0就是没有共现关系;词语的关联度可以通过计算大于0的单元格数量来表示。

        1

        鲜花

        握手

        雷人

        路过

        鸡蛋

        刚表态过的朋友 (1 人)

        相关阅读

        最新【亚州】专区在线

        GMT+8, 2020-7-5 20:31