- 主题:Re: [原创]需求开发团队(舆情监控软件及工具类)
现在还采集不到。比如典型的北京通APP,上面的12345是很值得重视的内容,但就采集不下来
【 在 slowaction 的大作中提到: 】
: 不能从web获取的数据,怎么采集下来
--
FROM 221.221.178.*
没有金刚钻咋揽陶瓷活!
【 在 foxknox 的大作中提到: 】
: 干这个,你这个单位密级够不够哟
:
--
FROM 114.250.138.*
干这个不需要密级
头条抖音都是公开信息
相当做一个推荐站搜索站,只要有本事随便搞
【 在 zyw123 的大作中提到: 】
: 没有金刚钻咋揽陶瓷活!
--
FROM 223.211.168.*
APP的内容通过抓包就行,如果内嵌证书抓不到数据,反编译之后去分析一下难度也不大。
就是看预算到不到位,比这个难的我们都采集过。
【 在 BtoJ 的大作中提到: 】
: 现在还采集不到。比如典型的北京通APP,上面的12345是很值得重视的内容,但就采集不下来
:
--
FROM 221.218.214.*
我无法理解有人用抓包甚至反编译的方法來获取抖音内容
抖音都是视频
你抓包反编译拿到了视频
我拿个摄像头对着屏幕拍一样能拿到
【 在 Suley 的大作中提到: 】
: APP的内容通过抓包就行,如果内嵌证书抓不到数据,反编译之后去分析一下难度也不大。
: 就是看预算到不到位,比这个难的我们都采集过。
: :
--
FROM 223.211.168.*
抓包的话,肯定通过骨干网络节点获取大量数据才有足够高的效率
拍屏幕这种方法过于粗暴哈
--
FROM 120.244.142.*
骨干网络节点也能监控到吗
【 在 jansea (沧浪客) 的大作中提到: 】
: 抓包的话,肯定通过骨干网络节点获取大量数据才有足够高的效率
: 拍屏幕这种方法过于粗暴哈
--
FROM 113.118.151.*
抓包和主动采集适用场景分别很大
不要被过往项目或者自身经验蒙蔽了
比如有人要分析水木,你也骨干网抓包么?
我把所有板面爬一遍就行了
成本和你的抓包方案差好几个数量级
【 在 jansea 的大作中提到: 】
: 抓包的话,肯定通过骨干网络节点获取大量数据才有足够高的效率
: 拍屏幕这种方法过于粗暴哈
--
FROM 223.211.168.*
抓包或者反编译拿到接口结构和签名参数后,
可以大规模去采,将单条视频的获取成本降到极低程度,而且不需要额外处理就能能获取到更多结构化的数据,如视频精确的发布时间、发布账号的相关信息、评论点赞数量。
我们的平台每天入库大约三百万+短视频,用你这个方法无法达到高效率和低成本啊。
【 在 slowaction 的大作中提到: 】
: 我无法理解有人用抓包甚至反编译的方法來获取抖音内容
: 抖音都是视频
: 你抓包反编译拿到了视频
: ...................
--
FROM 221.218.214.*
抓包是用来分析APP和服务器的通信方式,不是用来采集数据
【 在 slowaction 的大作中提到: 】
: 抓包和主动采集适用场景分别很大
: 不要被过往项目或者自身经验蒙蔽了
: 比如有人要分析水木,你也骨干网抓包么?
: ...................
--
FROM 221.218.214.*