- 主题:有对高考录取数据感兴趣的吗
哥们,你这个其实挺有用的,特别是对外地考生。对北京考生作用小一点,但是并不是没什么用。
北京之前出的到专业的是大白本,扫描版PDF,只能看,没有按条件搜索。
去年给了网页版,可以按专业搜索,按分数/排名搜索。到今年再给网页版时,很可能只有上一个年度的数据了。
即使是网页版,分专业给的是分数段人数统计,10分一段,不是分数线。这一点差点很远。
【 在 wdrq83 的大作中提到: 】
: 我这个是收录了所有学校所有专业的录取数据,根据排名,可查询到名次附近的哪些院校的哪些专业,也可以根据专业,查询哪些学校可以报
:
--
FROM 39.155.178.*
想向您请教:如何抓取这些招生数据的?各高校的数据是凌乱不一,好像不太好抓呀。
本想私信请教,但是我现在发短信息被封了,我也不知道我说了啥被封的,我又不八卦,呵呵。
【 在 wdrq83 的大作中提到: 】
: 是吧,我觉得也是
:
--
FROM 39.155.178.*
我用selenium去抓数据,对网页的结构要求太死了,没有办法抓。所以只能做些常用的网站的例行抓取。
给个思路?
【 在 wdrq83 的大作中提到: 】
: 所以数据的设计和统一非常重要,我也花了一些时间去分析的,抓数据好抓,程序运行呗。
:
--
FROM 39.155.178.*
难怪之前有个版友怼你,你懂个啥?分数线当然没用,但是人家这个分分钟就可以转成排名。
你看考试院公布的,到专业的是10分一段的分数段,不是分数线或者排名,而且新的年份公布了,
能不能看到之前年份的,还不确定。你这回帖的阅读理解能力就只看了个关键词,还没看全。
【 在 xiongym 的大作中提到: 】
: 你看最低排名就知道了。
: 看分数线都是初级选手。
: 根本不懂行情。
: ...................
--
FROM 120.244.23.*
根据大白本反推,人家说的你也信?大白本也是10分一段的分数段好不好?没有别的数据,就根据这个反推?
你们湘潭大学数学是真厉害,说出来让我们也学一学?
【 在 xiongym 的大作中提到: 】
: 你去看看B站北京某老师的吧。
: 人家团队每年对北京大白本反向推算出,强基的分数和人数。
: 楼主这种已经早就不值钱没有用了。
: ...................
--
FROM 120.244.23.*
哈哈哈,只要我在北京考到376名之内,啥历史数据对我都没有用。
要是我考到377名到400名之间,上一年清北的小道消息更有用,比大白本还有用,不能再细说了,呵呵。
【 在 beanspower 的大作中提到: 】
:
: 可以理解,你一个码农吭哧吭哧的做出来一个比较强大的数据库,有人说用处不大你肯定觉得有点受伤。
: 其实,不是用处不大,连粪球都有屎壳郎喜欢呢,这么大一个数据库怎么能说没有用呢。我个人觉得,你的这个工具的主要受众一定和张雪峰的重合。
: ...................
--
FROM 39.155.178.*
376名之内,你看这些数据,真不如了解上一年的小道消息,然后直接去与驻校老师单聊。
【 在 beanspower 的大作中提到: 】
:
: 杠精你好。其实呢,即便是“在北京考到376名之内”,历史数据也有用哦,比如top2的各个专业组的录取分数你不关心吗? “你的这个分数去年只够上p大考古专业”的历史数据不需要关心一下吗?
:
--
FROM 39.155.178.*