大數(shù)據(jù)分析網(wǎng)絡(luò)暢銷書與網(wǎng)絡(luò)流行語的相關(guān)性
2019-03-19 11:31:53 來源:本站原創(chuàng) 瀏覽:388次網(wǎng)絡(luò)流行語是近幾年伴隨網(wǎng)絡(luò)出現(xiàn)的一種簡潔、具有一定的創(chuàng)造性的語言,具有短時間內(nèi)擴散開的特點。所以網(wǎng)絡(luò)流行語也逐漸成為一種網(wǎng)絡(luò)文化,并且能夠逐漸應(yīng)用開來。在網(wǎng)絡(luò)暢銷書方面,通過網(wǎng)絡(luò)的暢銷書也是傳播大量數(shù)據(jù)及信息的重要途徑,流行語和暢銷書在某些方面的傳播有可能會有相似的地方,所以,根據(jù)大數(shù)據(jù)來分析網(wǎng)絡(luò)暢銷書與網(wǎng)絡(luò)流行語是否有其相關(guān)性也是當(dāng)前畢業(yè)設(shè)計研究的一個重點分析對象,本課題主要是一種操作和研究的技能鍛煉,能夠針對以下幾點進(jìn)行研究。系統(tǒng)主要是后端的服務(wù)端的數(shù)據(jù)分析,mysql數(shù)據(jù)的數(shù)據(jù)存儲以及在windows端下的可視化編程的數(shù)據(jù)分析結(jié)果展示,該系統(tǒng)部署安裝在linux操作系統(tǒng)下,linux可以安裝在windows操作系統(tǒng)的虛擬機下進(jìn)行操作,并且將網(wǎng)絡(luò)建立成內(nèi)網(wǎng),在windows下利用jsp網(wǎng)頁的技術(shù)進(jìn)行數(shù)據(jù)分析結(jié)果的展示,使用操作方便,具有一定的用戶體驗。本系統(tǒng)主要處理以下工作和研究:
1.收集網(wǎng)絡(luò)暢銷書與網(wǎng)絡(luò)流行語的數(shù)據(jù)
2.通過搭建hadoop服務(wù)集群,對數(shù)據(jù)進(jìn)行整理、過濾,存儲到hive中,對數(shù)據(jù)進(jìn)行分析處理,完成可視化編程并顯示數(shù)據(jù)。
3.按照特定的算法進(jìn)行分析處理
針對大數(shù)據(jù)研究過程中的操作和分析,可能存在的問題:收集數(shù)據(jù)會有一定的困難,對數(shù)據(jù)進(jìn)行分析處理可能也會由于專業(yè)知識不足而有一些困難。