- 主题:有对高考录取数据感兴趣的吗
你好,感谢分享一下吧,谢谢啦,zxqnyl@139.com
【 在 wdrq83 的大作中提到: 】
: 我收集了去年全国800多个公办院校的专业录取分数和名次,为填报志愿做个参考,有感兴趣的吗
:
: 都是官网爬的,整理数据花了不少时间,自己用有点浪费
: --
:
发自「今日水木 on XT2251-1」
※ 来源:·水木社区
http://www.mysmth.net·[FROM: 123.113.155.*]
FROM 123.113.155.*
求分享数据, jiangzhanyong@qq.com
【 在 wdrq83 的大作中提到: 】
: 我收集了去年全国800多个公办院校的专业录取分数和名次,为填报志愿做个参考,有感兴趣的吗
: 都是官网爬的,整理数据花了不少时间,自己用有点浪费
--
FROM 120.244.144.*
本来北京教育考试院就有数据库对外公开录取线。
大白本方便看专业最低排名和分数线区间就可以了。
因为本来都是多维变量。
楼主这种去忽悠三四线人员才有发展。
【 在 beanspower 的大作中提到: 】
: 我也分析过,这种数据,基本上只对550分以下考生有用,和张雪峰的受众重合。
--
FROM 222.130.135.*
你看最低排名就知道了。
看分数线都是初级选手。
根本不懂行情。
【 在 zuan2zuan 的大作中提到: 】
: 哥们,你这个其实挺有用的,特别是对外地考生。对北京考生作用小一点,但是并不是没什么用。
: 北京之前出的到专业的是大白本,扫描版PDF,只能看,没有按条件搜索。
: 去年给了网页版,可以按专业搜索,按分数/排名搜索。到今年再给网页版时,很可能只有上一个年度的数据了。
: ...................
--
FROM 222.130.135.*
抓取复杂数据必须得手薅啊,模拟js commit数据啦,解析html原本文件啦,这些肯定自己写,而不是用别人的工具
,资深码农表示,我用着adobe 不爽,亲自下手解析pdf取数据。
说来真是不公平,福昕的pdf解析居然用adobe的lib解析数据,真是丢脸!就这样还能上市。
【 在 zuan2zuan 的大作中提到: 】
: 我用selenium去抓数据,对网页的结构要求太死了,没有办法抓。所以只能做些常用的网站的例行抓取。
: 给个思路?
:
--
FROM 223.72.82.*
你可以搞个专门软件,替代这个呀。
【 在 wdrq83 的大作中提到: 】
: 抓取复杂数据必须得手薅啊,模拟js commit数据啦,解析html原本文件啦,这些肯定自己写,而不是用别人的工具
: ,资深码农表示,我用着adobe 不爽,亲自下手解析pdf取数据。
: 说来真是不公平,福昕的pdf解析居然用adobe的lib解析数据,真是丢脸!就这样还能上市。
: ...................
--
FROM 222.130.135.*
【 在 xiongym 的大作中提到: 】
: 本来北京教育考试院就有数据库对外公开录取线。
: 大白本方便看专业最低排名和分数线区间就可以了。
: 因为本来都是多维变量。
: ...................
是的,比如《2022年全国普通高等学校在京招生录取分数分布统计-本科批次.pdf》,这种是考试院发布的文档,无比权威,自己考什么名次,大概只能哪些学校,花个2,3个小时就能看了7788了...
--
FROM 123.123.251.*
反而是1.5W名以后的,只能全国到处盲选了。
【 在 beanspower 的大作中提到: 】
: 是的,比如《2022年全国普通高等学校在京招生录取分数分布统计-本科批次.pdf》,这种是考试院发布的文档,无比权威,自己考什么名次,大概只能哪些学校,花个2,3个小时就能看了7788了...
--
FROM 222.130.135.*
【 在 xiongym 的大作中提到: 】
: 反而是1.5W名以后的,只能全国到处盲选了。
:
550以下的,确实选择就很多了。
比如什么朔州学院平顶山学院等等,都能上啊。
我有个邻居的孩子前几年孩子去云南上了个什么大学,学农业的,不知道都是怎么选出来的,因为可选的太多了。
--
FROM 123.123.251.*
温州肯顿,丑国还挺认同那里的成绩。
去深圳北理工莫斯科,赌一把俄语翻身。
我同学小孩,好像在读欧洲预科,赌出国。
成绩太差的。
【 在 beanspower 的大作中提到: 】
: 550以下的,确实选择就很多了。
: 比如什么朔州学院平顶山学院等等,都能上啊。
: 我有个邻居的孩子前几年孩子去云南上了个什么大学,学农业的,不知道都是怎么选出来的,因为可选的太多了。
: ...................
--
FROM 222.130.135.*