- 主题:我最近的研究成果
惨惨惨
自己回复自己最多
【 在 klbs (困了便睡) 的大作中提到: 】
: 数据来源:四十版2023年3月份的全部帖子
: ID回复关系:第一个ID是回复人,第二个ID是被回复人
: 后面还有一个ID发文量与影响力报告,暂时按发文量排序
: 这个数据和当年家版的石头姐的版本有点像,根据这个数据,也可以生成每个ID的十大回复ID和十大被回复ID。
--
FROM 112.96.58.*
影响力是怎么计算的
为啥我的影响力如此之高
【 在 klbs (困了便睡) 的大作中提到: 】
: 影响力太高也不好,说明对待别人回复你的帖子有很多都没有回复,这样显得不够“礼貌”。
:
: 【 在 TimeAndRiver 的大作中提到: 】
: : 惨惨惨
--
FROM 112.96.58.*
这个计算不合理
【 在 klbs (困了便睡) 的大作中提到: 】
: 别人回复你的帖子总数除以你的发文数就是影响力
:
: 你的影响力高可能是有一部分别人回复你的帖子你没有回复导致的
:
--
FROM 112.96.58.*
水木可能没有这样的数据
【 在 klbs (困了便睡) 的大作中提到: 】
: 你提一个合理的看看
: 【 在 TimeAndRiver 的大作中提到: 】
: : 这个计算不合理
:
--
FROM 112.96.58.*
用户在文章上阅读耗费的时间与字数的相除
以及用户第二次阅读的时间
用户阅读同样一篇文章的总次数
【 在 klbs (困了便睡) 的大作中提到: 】
: 你需要什么样的数据
: 【 在 TimeAndRiver 的大作中提到: 】
: : 水木可能没有这样的数据
: :
--
FROM 112.96.58.*
这还没有到算法呢
只是对用户是否感兴趣文章做个数据采集而已
【 在 klbs (困了便睡) 的大作中提到: 】
: 今日头条就是这个算法,推荐机制也是这么来的
: 【 在 TimeAndRiver 的大作中提到: 】
: : 用户在文章上阅读耗费的时间与字数的相除
: : 以及用户第二次阅读的时间
--
FROM 223.104.65.*