Skip to content
This repository has been archived by the owner on Jun 13, 2018. It is now read-only.

Latest commit

 

History

History
76 lines (52 loc) · 2.96 KB

README.md

File metadata and controls

76 lines (52 loc) · 2.96 KB

JinBang

河南高考数据汇总, 数据来源 河南省招生办公室网站

综合信息参见 2017 年招生信息概况

每年的数据都是固定的, 请勿使用本工具反复抓取数据

data 目录下的 .json 数据文件位置及重要结构解释

base        provinces {省市代号: 省市名称}
			PC {批次代号: 批次名称}
			KL {科类代号: 科类名称}
			schools {省市代号: [院校代号]}

shengkong   本年省控分数线

fen         本年分数段统计, {科别代号: [[分数, 累计考生]...]}
            累计考生为加入政策性照顾分后对应总分及以上考生累计人数

schools     院校基本信息, 可用于生成信息表格

plans       {院校代号: {批次代号: {科别代号: {专业代号: {total: 计划录取}}}}}
            所有 total 属性表示该分支之下计划招生合计数
            科别之下的 history 表示上年平行投档线
            叶子对象的 href 属性保存原始页面地址

total       本年分批次, 科类招生计划人数统计
            {total: 计划总数, 批次代号: {total: 批次总数, 科别代号: 科别总数}}
            zero 属性汇总招生计划为零的院校, 通常这些是全国招生.

history     上年平行投档线汇总
            planless   本年本科无招生计划的院校 {院校代号: 院校名称}
            renamed    本年名称变化的院校 {院校代号: {old: 原用名, now: 现用名}
            批次代号   {科别代号:[[最低投档分数, 院校代号, 计划招生, 比例因子]]}
                       比例因子的算法
                       先统计某院校计划招生总是 S, 限本科批次, 分批次, 分科类
                       然后每条记录所占的比例数就是: 计划招生/S


rank        综合历史投档线, 预测第一二批次院校投档线
            {
                批次代号: {
                    科别代号: [
                        [预测投档线, 上年最低投档线, 竞争考生, 优势考生, 院校代号...]
                    ]
                }
            }

            算法

                以 history.json 作为预测基础
                以本年计划数和过省控线考生数量, 计算不同批次科类招生系数
                以分数排序, 该分数下的累计考生总数*招生系数作为投档考生数量
                以院校历史投档线排名为顺序
                以本年院校计划消耗投档考生数量, 招不满投档线下降
                满招后剩余考生计入下轮消耗优势考生

备注:

官方地址中按省市查询的院校总数与全部院校总数不符

TODO

  1. gh-pages 分支
  2. 一个长图表囊括所有重要信息, 左文右理, 中间是分数段

License

Apache License 2.0 Copyright 2017 @YU HengChun