首頁 > 期刊 > 自然科學(xué)與工程技術(shù) > 基礎(chǔ)科學(xué) > 基礎(chǔ)科學(xué)綜合 > 中國科學(xué)技術(shù)大學(xué)學(xué)報 > 基于MapReduce的商品評論熱點(diǎn)發(fā)現(xiàn)算法研究 【正文】
摘要:提出一種基于MapReduce框架的商品評論熱點(diǎn)發(fā)現(xiàn)并行算法——PR-HD算法.PR-HD算法使用爬蟲技術(shù)提取某電商平臺下某熱門手機(jī)的評論數(shù)據(jù)生成評論數(shù)據(jù)集,以TF-IDF算法來計算特征詞的權(quán)重,通過特征詞添加位置權(quán)重的方式來得到特征詞的最終權(quán)值,建立向量空間模型(VSM)計算不同評論語句的相似度,使用Canopy算法和K-means算法相結(jié)合從而實(shí)現(xiàn)商品評論的熱點(diǎn)發(fā)現(xiàn).這使得產(chǎn)品開發(fā)人員可以從中獲取更直接有效的建議和反饋.
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社
主管單位:中國科學(xué)院;主辦單位:中國科學(xué)技術(shù)大學(xué)
一對一咨詢服務(wù)、簡單快捷、省時省力
了解更多 >直郵到家、實(shí)時跟蹤、更安全更省心
了解更多 >去除中間環(huán)節(jié)享受低價,物流進(jìn)度實(shí)時通知
了解更多 >正版雜志,匹配度高、性價比高、成功率高
了解更多 >