河南高考数据汇总, 数据来源 河南省招生办公室网站
综合信息参见 2017 年招生信息概况
每年的数据都是固定的, 请勿使用本工具反复抓取数据
data 目录下的 .json 数据文件位置及重要结构解释
base provinces {省市代号: 省市名称}
PC {批次代号: 批次名称}
KL {科类代号: 科类名称}
schools {省市代号: [院校代号]}
shengkong 本年省控分数线
fen 本年分数段统计, {科别代号: [[分数, 累计考生]...]}
累计考生为加入政策性照顾分后对应总分及以上考生累计人数
schools 院校基本信息, 可用于生成信息表格
plans {院校代号: {批次代号: {科别代号: {专业代号: {total: 计划录取}}}}}
所有 total 属性表示该分支之下计划招生合计数
科别之下的 history 表示上年平行投档线
叶子对象的 href 属性保存原始页面地址
total 本年分批次, 科类招生计划人数统计
{total: 计划总数, 批次代号: {total: 批次总数, 科别代号: 科别总数}}
zero 属性汇总招生计划为零的院校, 通常这些是全国招生.
history 上年平行投档线汇总
planless 本年本科无招生计划的院校 {院校代号: 院校名称}
renamed 本年名称变化的院校 {院校代号: {old: 原用名, now: 现用名}
批次代号 {科别代号:[[最低投档分数, 院校代号, 计划招生, 比例因子]]}
比例因子的算法
先统计某院校计划招生总是 S, 限本科批次, 分批次, 分科类
然后每条记录所占的比例数就是: 计划招生/S
rank 综合历史投档线, 预测第一二批次院校投档线
{
批次代号: {
科别代号: [
[预测投档线, 上年最低投档线, 竞争考生, 优势考生, 院校代号...]
]
}
}
算法
以 history.json 作为预测基础
以本年计划数和过省控线考生数量, 计算不同批次科类招生系数
以分数排序, 该分数下的累计考生总数*招生系数作为投档考生数量
以院校历史投档线排名为顺序
以本年院校计划消耗投档考生数量, 招不满投档线下降
满招后剩余考生计入下轮消耗优势考生
备注:
官方地址中按省市查询的院校总数与全部院校总数不符
- gh-pages 分支
- 一个长图表囊括所有重要信息, 左文右理, 中间是分数段
Apache License 2.0 Copyright 2017 @YU HengChun