- 主题:有对高考录取数据感兴趣的吗
我收集了去年全国800多个公办院校的专业录取分数和名次,为填报志愿做个参考,有感兴趣的吗
都是官网爬的,整理数据花了不少时间,自己用有点浪费
--
FROM 223.72.82.*
我这个是收录了所有学校所有专业的录取数据,根据排名,可查询到名次附近的哪些院校的哪些专业,也可以根据专业,查询哪些学校可以报
【 在 qikule 的大作中提到: 】
: 考试院官网上录取结束后有所有在京招生录取分数分布统计。
: [upload=1][/upload]
--
FROM 223.72.82.*
或者简言之,你用眼睛去看不一定都能筛选出你想要的数据,但是程序可以给你你想要的任何数据
--
FROM 223.72.82.*
是吧,我觉得也是
【 在 zuan2zuan 的大作中提到: 】
: 哥们,你这个其实挺有用的,特别是对外地考生。对北京考生作用小一点,但是并不是没什么用。
: 北京之前出的到专业的是大白本,扫描版PDF,只能看,没有按条件搜索。
: 去年给了网页版,可以按专业搜索,按分数/排名搜索。到今年再给网页版时,很可能只有上一个年度的数据了。
: ...................
--
FROM 223.72.82.*
必然是全国的都有
【 在 kingarthur 的大作中提到: 】
: 只有在北京市的,还是有在各个省的录取分数排名?
--
FROM 223.72.82.*
所以数据的设计和统一非常重要,我也花了一些时间去分析的,抓数据好抓,程序运行呗。
【 在 zuan2zuan 的大作中提到: 】
: 想向您请教:如何抓取这些招生数据的?各高校的数据是凌乱不一,好像不太好抓呀。
: 本想私信请教,但是我现在发短信息被封了,我也不知道我说了啥被封的,我又不八卦,呵呵。
:
--
FROM 223.72.82.*
抓取复杂数据必须得手薅啊,模拟js commit数据啦,解析html原本文件啦,这些肯定自己写,而不是用别人的工具
,资深码农表示,我用着adobe 不爽,亲自下手解析pdf取数据。
说来真是不公平,福昕的pdf解析居然用adobe的lib解析数据,真是丢脸!就这样还能上市。
【 在 zuan2zuan 的大作中提到: 】
: 我用selenium去抓数据,对网页的结构要求太死了,没有办法抓。所以只能做些常用的网站的例行抓取。
: 给个思路?
:
--
FROM 223.72.82.*
我已经有了,都是些小软件,这么多年自己积攒了不少好东西
【 在 xiongym 的大作中提到: 】
: 你可以搞个专门软件,替代这个呀。
:
--
FROM 223.72.82.*
不管怎么推测,预测,都需要数据积累,没有数据,干什么都不好使
【 在 xiongym 的大作中提到: 】
: 你去看看B站北京某老师的吧。
: 人家团队每年对北京大白本反向推算出,强基的分数和人数。
: 楼主这种已经早就不值钱没有用了。
: ...................
--
FROM 223.72.82.*
华五没有专业数据,有专业组的
官网上提供的,我这里都有
【 在 xiongym 的大作中提到: 】
: 考试一定额大白本才是最全面的数据。
: 你清北华五的数据,那个网页上面都没有。
:
--
FROM 223.72.82.*