预印迹 文章 版本1 保存在廊下 此版本不是对等审核的

推特配置文件的相似性近似

版本1:收稿日期:2021年6月6日/批准日期:2021年6月7日/在线日期:2021年6月7日(16:16:18 CEST)

如何引用:shoeibi,n .;shoeibi,n .;chamoso,p .;alizadehsani,z .;Corchado,J.M。推特轮廓的相似性近似值。预印迹2021.,2021060196(DOI:10.20944 / PREPRINPS202106.0196.v1)。shoeibi,n .;shoeibi,n .;chamoso,p .;alizadehsani,z .;Corchado,J.M。推特轮廓的相似性近似值。预印象2021,2021060196(DOI:10.20944 /预印纸202106.0196.v1)。

抽象的

社交媒体平台从过去十年来完全是生活方式的无可否认的部分。分析所分享的信息是了解人类行为的关键步骤。社交媒体分析旨在为用户提供更好的体验和升值用户满意度。但首先,有必要知道如何以及从哪个方面比较用户彼此。在本文中,提出了一种智能系统来衡量推特轮廓的相似性。为此,首先,已经使用官方Twitter API提取了每个配置文件的时间线。然后,所有信息都给出所提出的系统。接下来,派生简档的三个方面。行为比是时间序列相关信息,显示用户的一致性和习惯。动态时间翘曲已被用于比较两种轮廓的行为比率。 Next, Graph Network Analysis is used for monitoring the interactions of the user and its audience; for estimating the similarity of graphs, Jaccard similarity is used. Finally, for the Content similarity measurement, natural language processing techniques for preprocessing and TF-IDF for feature extraction are employed and then compared using the cosine similarity method. Results have presented the similarity level of different profiles. As the case study, people with the same interest show higher similarity. This way of comparison is helpful in many other areas. Also, it enables to find duplicate profiles; those are profiles with almost the same behavior and content.

主题领域

推特;社交媒体;社交网络;社交网络分析;图分析;文字相似;自然语言处理;用户订婚。

评论(0)

我们鼓励广泛的读者评论和反馈。看评论的标准和我们的多样性陈述。

留下公众评论
向作者发送私人评论
意见 0.
下载 0.
评论 0.
指标 0.


×
警报
通知我关于本文的更新或在发布对等审核版本时。
我们在网站上使用cookie以确保您获得最佳体验。
阅读更多关于我们的饼干的更多信息在这里