【 第1页 第2页 】 | |
于强:从大数据看台湾网民如何攻击谭德塞 | |
http://www.CRNTT.com 2020-04-14 00:06:56 |
我们对于所有的网友的讨论的整体文本(共111万5092字)进行了词频分析,除去语气助词(真的、就是、这样、还是、应该)和一些表达基本含义的词语(中国、WHO、谭德塞、世卫、世界、组织、全世界、病毒、疫情、新闻、台湾、表示、看到),得到了词云图。 从词频当中看,排名第一的词是“尼哥”(英语Negro的音译)声量达到了4031,与总声量的比例竟然达到1:20,意味着平均每20次发言中就会辱骂谭德塞一次“尼哥”,比例已经惊人的高。除此之外,“垃圾”、“黑人”、“黑鬼”、“恶心”、“智障”、“废物”等对谭德赛进行辱骂的词语也排在了词频的前50名。另外,值得注意的是,台湾网友还对于谭德塞的名字进行了恶意的改写,把“谭”写成“痰”,声量频次是560。 另外,台湾网民定居于谭德塞进行攻击的同时,也对大陆进行了恶劣的攻击和抹黑,辱骂大陆是“支那”的声量达到了2028,与总声量的比例竟然达到1:39。 谭德塞说台湾网民对他进行人身攻击、辱骂和种族歧视是完全成立的,大数据分析的结果完全支持谭德塞的判断。 |
【 第1页 第2页 】 |