论文查重_免费论文查重_知网学术不端论文查重检测系统入口_论文查重软件

論文查重服務(wù)12年
211、985指定查重網(wǎng)
  • 全國咨詢電話:
    0571-28284626

基于用戶關(guān)系和文本的微博用戶相似性度量

作者:admin 來源:www.qhcgg.cn 時間:2021-07-03 18:01:16

基于用戶關(guān)系和文本的微博用戶相似性度量

摘要:用戶相似性論文的檢索重量是用戶關(guān)系分析的基礎(chǔ),在推薦系統(tǒng)、用戶集群、社區(qū)發(fā)現(xiàn)等方面具有重要意義。對于微博用戶的社交關(guān)系和微博文本,分別提供類似度計算方法,并構(gòu)建加權(quán)集成的用戶類似性度量方法。

最后與用戶的類似度量的實驗分析進(jìn)行比較,對于傳統(tǒng)的用戶類似度的計算方法,所提出的方法在準(zhǔn)確性和回收率方面明顯提高,并且顯示了該方法度量的用戶相似性的有效性。微博是一個基于用戶社交關(guān)系發(fā)布、共享和獲取信息的在線社交平臺,在微博上,可以隨時發(fā)送信息,轉(zhuǎn)發(fā)感興趣的微博內(nèi)容,進(jìn)行點評和評論。據(jù)新浪微博官方發(fā)布的數(shù)據(jù)顯示,目前微博月的活動用戶已經(jīng)超過4億人,構(gòu)成了龐大的用戶網(wǎng)絡(luò),分析并挖掘微博平臺上用戶的特點以及發(fā)布的內(nèi)容和關(guān)注關(guān)系這是目前流行的研究方向,用戶的類似度計算是其中重要的研究點。

用戶類似度計算相關(guān)技術(shù)可以用于朋友推薦、類似的用戶發(fā)現(xiàn),并且可以在大容量用戶中發(fā)掘與目標(biāo)用戶的關(guān)系、興趣等特征維度相似的用戶,并向目標(biāo)用戶推薦。此外,用戶類似度計算在用戶集群、社區(qū)發(fā)現(xiàn)、熱點微博客跟蹤等方面具有重要意義[2]。

本論文將社會關(guān)系(興趣、粉絲)和微博客文本的兩個屬性相結(jié)合,并提供微博客用戶的類似性度量方法。1社交媒體上關(guān)于用戶的信息,總體來說,①用戶的背景信息包括年齡、性別、地理位置、教育、職業(yè)、標(biāo)簽信息等。②用戶的社交關(guān)系包括興趣、粉絲、轉(zhuǎn)發(fā)、稱贊等。③用戶發(fā)布的微博客信息。現(xiàn)有研究的許多工作是基于上述三個信息中的一個或多個來構(gòu)建用戶的類似度量的方法。

Bhattacharyya等[3]從用戶的背景信息中提取關(guān)鍵字,通過計算關(guān)鍵字的意思距離來表示關(guān)鍵字的類似性,進(jìn)而測量用戶之間的類似度。分析Twitter用戶的興趣和粉絲的關(guān)系,利用由用戶關(guān)系構(gòu)成的網(wǎng)絡(luò)構(gòu)造來測量用戶之間的相似性。

Kahanda等[5]利用用戶之間的傳送、注釋、文件傳送等交互行為來測量用戶的類似度。Xiang等[6]根據(jù)用戶的屬性(包括學(xué)校、職場、興趣小組、地理位置等)和用戶之間的相互作用來計算用戶關(guān)系的強(qiáng)度。徐志明等[7]在進(jìn)行微博用戶的類似性度量時,提供用戶的背景信息、微博文本、社交信息等各種屬性的類似度計算方法,實驗各屬性對類似度計算的影響大小,社交信息對用戶的類似性度量影響最大。我認(rèn)為有響力。

鄭志緒等[8]將微博用戶自身的背景信息和交互信息的兩個屬性結(jié)合起來,利用層級分析法決定各屬性的權(quán)利值,最后構(gòu)建綜合的用戶類似度計算模型。姚雅修等[9]分別計算用戶間社交信息的類似度、微博內(nèi)容的類似度和交互關(guān)系的類似度,最后融合各類類似度,導(dǎo)出兩個用戶的總類似度,進(jìn)行用戶推薦。本文使用用戶的社交關(guān)系和微博客文本來構(gòu)建用戶的類似性度量方法,并提供基于用戶的社交關(guān)系信息和微博客文本信息的用戶類似度計算方法。基于Jaccard[10-11]方法,用戶之間的公共朋友根據(jù)熱而被賦予權(quán)重,類似度的計算結(jié)果變得更合理。

②關(guān)于微博文本的類似度計算,使用LDA模型[12]表示微博文本,計算類似度,比基于TF-IDF的VSM模型[13-14]有效地降低文本向量的維度,提高了類似度計算的效果。2微博客用戶類似度計算模式2.1用戶社交關(guān)系類似度計算在微博客平臺上存在用戶間關(guān)心和關(guān)心的關(guān)系,關(guān)注用戶感興趣的賬戶,吸引其他用戶到自己的粉絲興趣和關(guān)心的關(guān)系不斷擴(kuò)大,構(gòu)成了龐大的社交網(wǎng)絡(luò)。

微博客用戶的關(guān)心信息和粉絲信息直觀地反映了用戶的興趣,兩個微博用戶的共同粉絲和關(guān)心者很多,表明他們有著更密切的社交聯(lián)系。這個也可以在一定程度上反映用戶之間的類似度。對于微博客用戶u,其社交信息如上所述示為Jaccard。該方法通過兩個用戶之間的共同感興趣的用戶的比例來測量用戶之間的類似度。該方法對于不同的共同感興趣的用戶,不管狀況如何,無論是更高的熱用戶(即風(fēng)機(jī)較多)還是一般用戶,對用戶類似度的計算結(jié)果的影響都相同。但是,實際上并不是這樣。微博平臺上有很受歡迎的用戶。這些受歡迎的用戶是超級粉絲,受到很多微博用戶的喜愛。對這樣受歡迎的用戶感興趣,往往不能反映出用戶真正的興趣。相比之下,微博用戶在某種意義上反映了用戶真正的興趣。

基于上述現(xiàn)象,在計算用戶u和用戶v感興趣的類似度時,越是關(guān)注微博用戶z的粉絲越多,在計算感興趣的類似度時權(quán)重越小。與此相對,粉絲數(shù)越少,計算關(guān)注度時的分量越大。基于這種想法,本文中基于Jaccard方法,可以基于2.2來表示每個共同的興趣因其熱而具有不同的權(quán)重,并且用戶感興趣的信息的類似度的計算公式。LDA用戶微博文本類似度計算可以使用戶在微博平臺上隨時發(fā)表自己的想法和見解,并且可以轉(zhuǎn)發(fā)和評論感興趣的用戶的微博內(nèi)容。微博文本是微博用戶之間交互交流的主要媒體,微博文本直接表達(dá)了用戶感興趣的內(nèi)容和話題。

兩個用戶所投稿的微博客文本的類似度可以有效地表示兩個用戶之間的類似度。基于TF-IDF的矢量空間模型(VSM)文本類似度計算方法被廣泛用于微博客文本類似度計算[7,9]。

將用戶的微博文本拼接在一個文檔中,對關(guān)鍵字進(jìn)行分類、提取,使用TF-IDF計算關(guān)鍵字權(quán)重,最終將用戶的微博表示為一個文本向量,根據(jù)余弦類似度計算兩個用戶的微博文本的類似度做。VSM將文檔表示為高緯度、稀疏的文本向量,由于計算效率不高,VSM不能忽略單詞之間的關(guān)系,完全建模自然語言的復(fù)雜性問題。對于上述方法中存在的缺陷,本文使用LDA主題模型進(jìn)行了文本類似度計算。

LDA(LatentDirichletAlloca?tion)模型是對文檔數(shù)據(jù)的主題信息進(jìn)行建模的方法,并且具有文檔主題-特征詞的三層糊精網(wǎng)絡(luò)結(jié)構(gòu)。本文利用LDA模型對用戶的微博文本進(jìn)行建模,即利用文本的統(tǒng)計特性,挖掘不同主題與單詞之間的潛在關(guān)系,以主題分布的形式展開文檔,通過該分布計算文本的類似度。

使用LDA主題模型來計算文本的類似度可以比矢量空間模型更好地表示文本的意義,并且可以有效地降低文本向量的維度。用戶投稿的微博客

推薦閱讀,更多相關(guān)內(nèi)容:

免費(fèi)的畢業(yè)論文檢測軟件可靠嗎?

學(xué)術(shù)查重系統(tǒng)有自動降重的功能嗎?

學(xué)術(shù)不端網(wǎng)檢測系統(tǒng)查重系統(tǒng)的四大優(yōu)勢

2020cnki官方查重哪些是屬于學(xué)術(shù)不端的行為?

碩士研究生投稿論文檢測系統(tǒng)文獻(xiàn)庫有哪些

本科發(fā)表論文嗎本科發(fā)表論文章 本科發(fā)表論文在哪里發(fā)表

北京工商大學(xué)碩士論文查重要求及重復(fù)率 北京工商大學(xué)碩士論文字?jǐn)?shù)一

在哪里可以買畢業(yè)論文ppt在哪里可以買畢業(yè)論文答辯

查重規(guī)則咋地幸免

中國學(xué)術(shù)查重能測試英文論文嗎?

自己可以提前進(jìn)行論文查重嗎?

論文怎么查重論文軟件-論文怎么查重沒通過

為了不讓同學(xué)們在查重上浪費(fèi)時間今天分享一下查重經(jīng)驗

中國碩士學(xué)術(shù)查重率一篇多少錢?

本科畢業(yè)論文學(xué)術(shù)檢測系統(tǒng)怎樣檢測 中國學(xué)術(shù)PMLC本科畢業(yè)論文查重檢測系統(tǒng)

保定學(xué)院碩士論文查重要求及重復(fù)率

學(xué)術(shù)不端論文查重編號真?zhèn)悟炞C

最新的西安電子科技大學(xué)通信工程學(xué)院研究生論文查重通知 西安電子科技大學(xué)通信工程學(xué)院在哪個校區(qū)

三峽電力職業(yè)學(xué)院碩士論文查重要求及重復(fù)率一

北京吉利大學(xué)專科論文查重要求及重復(fù)率 北京吉利大學(xué)藝術(shù)專業(yè)專科網(wǎng)上能查到嗎一

學(xué)術(shù)不端外語論文查重檢測

淘寶學(xué)術(shù)查重多次對學(xué)校有沒有影響

博士論文檢測系統(tǒng)文獻(xiàn)對比庫有哪些

畢業(yè)論文開題報告有什么格式? 學(xué)前教育畢業(yè)論文開題報告格式模板

論文查重系統(tǒng)優(yōu)點 中南財經(jīng)政法大學(xué)論文查重系統(tǒng)

主站蜘蛛池模板: 塑胶跑道施工-硅pu篮球场施工-塑胶网球场建造-丙烯酸球场材料厂家-奥茵 | 球盟会·(中国)官方网站 | 好物生环保网、环保论坛 - 环保人的学习交流平台 | 深圳公司注册-工商注册代理-注册公司流程和费用_护航财税 | 螺杆式冷水机-低温冷水机厂家-冷冻机-风冷式-水冷式冷水机-上海祝松机械有限公司 | 防火门-专业生产甲级不锈钢钢质防火门厂家资质齐全-广东恒磊安防设备有限公司 | 桂林腻子粉_内墙外墙抗裂砂浆腻子粉推荐广西鑫达涂料厂家供应 | 耐酸碱泵-自吸耐酸碱泵型号「品牌厂家」立式耐酸碱泵价格-昆山国宝过滤机有限公司首页 | Magnescale探规,Magnescale磁栅尺,Magnescale传感器,Magnescale测厚仪,Mitutoyo光栅尺,笔式位移传感器-苏州连达精密量仪有限公司 | 高精度-恒温冷水机-螺杆式冰水机-蒸发冷冷水机-北京蓝海神骏科技有限公司 | 风淋室生产厂家报价_传递窗|送风口|臭氧机|FFU-山东盛之源净化设备 | _网名词典_网名大全_qq网名_情侣网名_个性网名 | 大型果蔬切片机-水果冬瓜削皮机-洗菜机切菜机-肇庆市凤翔餐饮设备有限公司 | 泉州陶瓷pc砖_园林景观砖厂家_石英砖地铺石价格 _福建暴风石英砖 | 液压油缸-液压站生产厂家-洛阳泰诺液压科技有限公司 | 电磁辐射仪-电磁辐射检测仪-pm2.5检测仪-多功能射线检测仪-上海何亦仪器仪表有限公司 | 南京办公用品网-办公文具用品批发-打印机耗材采购 | 手持气象站_便携式气象站_农业气象站_负氧离子监测站-山东万象环境 | 威海防火彩钢板,威海岩棉复合板,威海彩钢瓦-文登区九龙岩棉复合板厂 | 铝板冲孔网,不锈钢冲孔网,圆孔冲孔网板,鳄鱼嘴-鱼眼防滑板,盾构走道板-江拓数控冲孔网厂-河北江拓丝网有限公司 | 自动气象站_农业气象站_超声波气象站_防爆气象站-山东万象环境科技有限公司 | 电缆隧道在线监测-智慧配电站房-升压站在线监测-江苏久创电气科技有限公司 | CXB船用变压器-JCZ系列制动器-HH101船用铜质开关-上海永上船舶电器厂 | 不锈钢反应釜,不锈钢反应釜厂家-价格-威海鑫泰化工机械有限公司 不干胶标签-不干胶贴纸-不干胶标签定制-不干胶标签印刷厂-弗雷曼纸业(苏州)有限公司 | 济南网站建设|济南建网站|济南网站建设公司【济南腾飞网络】【荐】 | 半容积式换热器_北京浮动盘管换热器厂家|北京亿丰上达 | 电动高尔夫球车|电动观光车|电动巡逻车|电动越野车厂家-绿友机械集团股份有限公司 | pbootcms网站模板|织梦模板|网站源码|jquery建站特效-html5模板网 | 超声波成孔成槽质量检测仪-压浆机-桥梁预应力智能张拉设备-上海硕冠检测设备有限公司 | 丹尼克尔拧紧枪_自动送钉机_智能电批_柔性振动盘_螺丝供料器品牌 | 全自动固相萃取仪_高通量真空平行浓缩仪-勤业永为 | 磷酸肌酸二钠盐,肌酐磷酰氯-沾化欣瑞康生物科技 | PAS糖原染色-CBA流式多因子-明胶酶谱MMP-上海研谨生物科技有限公司 | 铸铁平台,大理石平台专业生产厂家_河北-北重机械 | 北京遮阳网-防尘盖土网-盖土草坪-迷彩网-防尘网生产厂家-京兴科技 | 甲级防雷检测仪-乙级防雷检测仪厂家-上海胜绪电气有限公司 | 家用净水器代理批发加盟_净水机招商代理_全屋净水器定制品牌_【劳伦斯官网】 | 牛奶检测仪-乳成分分析仪-北京海谊 | 长沙一级消防工程公司_智能化弱电_机电安装_亮化工程专业施工承包_湖南公共安全工程有限公司 | 深圳工程师职称评定条件及流程_深圳职称评审_职称评审-职称网 | 南京蜂窝纸箱_南京木托盘_南京纸托盘-南京博恒包装有限公司 |