微博情感信息挖掘系統(tǒng)
2018-01-13 10:33:28 來源:本站原創(chuàng) 瀏覽:205次經(jīng)過不完全統(tǒng)計(jì),我國(guó)的微博用戶已經(jīng)達(dá)到了三億多,通過微博很多人能夠表達(dá)自己的情感以及一些其他的信息,如何能夠針對(duì)這種信息,敏感問題進(jìn)行分析,是本課題所要解決的問題。通過對(duì)微博的敏感話題,相關(guān)的熱點(diǎn)情感態(tài)度等分析,能夠了解一個(gè)人的情感動(dòng)向,防止不正當(dāng)?shù)男畔⑦M(jìn)行傳播,也對(duì)不穩(wěn)定因素的分析有一定的主導(dǎo)作用。
本系統(tǒng)可以實(shí)現(xiàn)如下幾個(gè)功能:
1、針對(duì)微博的信息進(jìn)行格式化處理,主要是對(duì)微博的標(biāo)題,內(nèi)容,轉(zhuǎn)發(fā)數(shù)等信息進(jìn)行數(shù)據(jù)庫(kù)的存儲(chǔ)。等待后期的分析。
2、數(shù)據(jù)信息清洗:利用分詞系統(tǒng)針對(duì)當(dāng)前熱門的微博進(jìn)行分析,去除特殊符號(hào)和停用詞等不常用詞語。
3、建立情感詞數(shù)據(jù)庫(kù),建立消極情感詞庫(kù)和積極情感詞庫(kù),為針對(duì)微博數(shù)據(jù)挖掘做準(zhǔn)備。
4、利用蟻群算法針對(duì)微博的動(dòng)態(tài)情感信息進(jìn)行分析,主要是要實(shí)現(xiàn)如下幾個(gè)的關(guān)聯(lián):
a)事件與情感的關(guān)聯(lián),可以通過事件與情感的關(guān)聯(lián),發(fā)現(xiàn)引起積極情感和消極情感的事件。
b)通過用戶和情感的關(guān)聯(lián)來發(fā)現(xiàn)用戶在某個(gè)時(shí)間段與積極和消極情感的關(guān)聯(lián),并能給用戶一個(gè)情感變化的曲線。
5、以曲線的方式,能夠針對(duì)直觀的情感波動(dòng)進(jìn)行分析。