首頁 > 期刊 > 自然科學與工程技術 > 信息科技 > 電子信息科學綜合 > 數據分析與知識發現 > 基于機器學習的社交媒體用戶分類研究 【正文】
摘要:【目的】充分利用社交媒體用戶的個人多維度信息,研究用戶自動分類問題。【方法】將社交媒體用戶定義為個體民眾、媒體、政府和組織4種類型,從用戶多維度信息中提取人口統計學、命名和自我描述三組特征,構建基于機器學習算法的用戶自動分類模型,在Twitter真實數據集上通過實驗對比各分類算法性能,并分析各組特征的貢獻度。【結果】支持向量機和隨機梯度下降分類模型的準確率和召回率均在83%以上,命名、人口統計學和自我描述特征對于分類性能的影響依次遞增。【局限】由于標注的用戶數量有限,可能無法讓模型充分學習用戶特征,而且沒有考慮不同類型用戶數量的不均衡問題。【結論】基于支持向量機和隨機梯度下降的分類模型能夠較準確地識別出4種類型用戶,對后續社交媒體用戶劃分研究具有借鑒意義。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社