Skip to content

Latest commit

 

History

History
245 lines (130 loc) · 11.6 KB

ProjectDescription.md

File metadata and controls

245 lines (130 loc) · 11.6 KB

黑白棋 AI 项目说明

[TOC]

v0.0.2 [2017-12-15]

注意:该内容可能会随时更新,以最新版为准。请在 GitHub -> Project Description 上阅读。

项目简介

该项目是个人项目,学生需要独立完成。学生需要使用 C 语言实现一个黑白棋走子程序(以下称为大脑程序),使用 stdin 来接收对手落子情况、通过计算后使用 stdout 输出自己的落子(见输入输出格式)。算法不限,但有时间和内存上的限制(见比赛规则)。

学生需要将大脑程序的源码递交到指定的在线评测平台。平台会对所有同学的大脑程序两两进行机-机黑白棋对抗比赛。比赛获胜方可获得积分。学生在该项目中取得的最终成绩取决于在平台上比赛总积分的名次(见排名和评分规则)。

对抗规则

  1. 每个大脑程序都会与其他学生的大脑程序各进行一场比赛,每场比赛都有多局。

  2. 为了确保公平性,每一场比赛都进行偶数局,对于一方来说,其中一半的局执黑、一半的局执白。

比赛规则

  1. 对局采用 16 * 16 黑白棋棋盘。

  2. 对局开始时,两个黑棋放在 (7,8) 和 (8,7) 上,两个白棋放在 (7,7) 和 (8,8) 上(见附录中的初始局面)。

  3. 黑子先行,双方轮流落子。只要落子和棋盘上任一枚己方的棋子在一条线上(横、直、斜线皆可)夹着对方棋子,就能将对方的这些棋子转变为我己方。一个合法的落子必须至少翻转对手的一枚棋子。

  4. 若某方落子后,对手在任一位置落子都不能夹住任一颗棋子,则这一方继续落子。即对局过程中可能出现某一方连续落子的情况。

  5. 当双方皆不能落子时,对局结束,子多的一方取得本局胜利;若对局结束时双方子数一致,则平局。

  6. 轮到己方走子时,大脑程序需要在 5 秒时间内给出落子方案。

  7. 每一局中,己方不能使用超过 180 秒的总时间(对方走子时不算己方用时)。

  8. 大脑程序任何时刻都不能使用超过 350 MB 的内存。

  9. 在对方走子时,己方的程序会继续保持运行。

注意:

  1. 若某一方首先超出时间限制或空间限制,或程序异常退出,则判该局这一方负。

  2. 学生递交的代码会在云平台上运行,视平台任务压力不同,助教可能随时调整硬件配置调节压力,因此代码需要能在不同的 CPU 配置下都不超过时间限制。

  3. 大脑程序将绑定在一个 CPU 核心上运行,因此使用多线程不会带来速度提升。

  4. 大脑程序将运行在沙盒中,互相隔离,没有文件读写权限。调用被限制的函数可能会导致异常退出。

排名和评分规则

  1. 对于每一场比赛,赢得局数较多的一方获得该场比赛胜利,另一方负,否则平。

  2. 胜一场比赛获得 3 积分;平一场比赛获得 1 积分;负一场比赛不获得积分。

  3. 一个同学的总积分是其大脑程序与其他同学最新大脑程序比赛的积分总和。

  4. 学生可以递交多次大脑程序,每次递交都会重置总积分,即总积分会按照最新一次递交的程序累计。

  5. 为了避免资源被滥用,每个学生有递交频率上限,包括每两次递交代码的最短间隔限制,和今日代码已消耗时间的限制。这些频率上限会随时调整,调整时会在 QQ 群公告;学生也可以在在线评测平台的递交界面里看到当前递交频率限制。

  6. 学生递交的代码不得超出 1 MB 大小。一般情况下代码不会长到超出这个限制。

  7. 学生在该项目中的成绩取决于以下因素:

    • 主要因素:期末答辩当天零点(时间另行通知)时的总积分排名(排名越高则成绩越高,反之亦然)

    • 次要因素:答辩情况

  8. 学生需确保最终代码的美观、可读,包括拥有一致的缩进、一致的变量命名、良好的代码组织、尽可能避免重复代码等,否则将视情况至多扣除总分的 30% 分数。

  9. 学生任何时刻不得抄袭网上现有代码或其他学生代码(包括非最终版代码),一经发现并核实,本门课将直接以作弊处理。

比赛积分示例

例如,设总共有 A,B,C,D 四个同学递交了大脑程序 A1,B1,C1,D1,那么排行榜将来自于以下六场比赛的总积分(若有 3 个初始局面,则每场比赛有 6 局,总共有 36 局):

A1 vs B1, A1 vs C1, A1 vs D1

B1 vs C1, B1 vs D1

C1 vs D1

后来,A1 递交了一个新的大脑程序 A2,那么排行榜则会变成来自于以下六场比赛的总积分:

A2 vs B1, A2 vs C1, A2 vs D1

B1 vs C1, B1 vs D1

C1 vs D1

请注意,A 同学第一次递交的大脑程序 A1 已经不在排行榜的计算范围之内了,排行榜总是反映了各同学最新的一份大脑程序的相互对战结果。

输入输出格式

学生的黑白棋大脑程序需要从标准输入 (stdin) 接收指令,并相应地做出响应,将响应输出到标准输出 (stdout)。每一个指令都独占一行。大脑程序的响应也需要独占一行(即跟随一个换行符 \n)。以下是大脑程序需要支持的指令:

START [FIELD]

在开始对局前,大脑程序一定会收到该指令,指令表明了己方有关的信息。FIELD 代表该己方大脑执子颜色,FIELD1 时代表己方执黑棋,FIELD2 时代表己方执白棋。

收到该指令后,大脑程序需要在 5 秒响应 OK,否则判负。

示例

平台发送指令:

START 1

大脑程序回复:

OK

PLACE [ROW] [COL]

该指令代表一次对手的落子,ROWCOL 是对手落子的行列坐标(坐标从 0 开始)。由于可能出现己方无法落子从而对手连续落子的情况,因此该指令可能会连续出现多次。大脑程序不需要回复该指令。

示例

平台发送指令:

PLACE 10 10

大脑程序不需要回复。

TURN

该指令代表轮到己方落子。大脑程序收到该指令后,经过计算得出己方走子,并将走子的行列坐标以空格分割作为响应内容。大脑程序需要在指定时限内做出走子响应,否则判负。

该指令可能直接出现在 START 指令之后,即己方执黑棋开局;也可能出现在若干次 PLACE 指令之后,即对手落子完毕轮到己方落子。注意,若对手落子完毕后游戏直接结束,则 PLACE 指令之后不会跟随有 TURN 指令。

示例

平台发送指令:

TURN

大脑程序回复:

11 10

END [FIELD]

代表该局比赛结束,其中 FIELD 代表获胜方,FIELD 为 0 时是平局,FIELD1 时是己方获胜,为 2 时是对方获胜。在收到该指令后,大脑程序不需要做任何响应,可以自行决定是否要退出程序(在评测时,无论大脑程序是否主动退出,它最后都会被关闭)。该指令可能在任何时刻出现,例如出现在 BEGIN 前的话,可能是对手程序崩溃导致的这场比赛直接结束。

特别注意:在大脑程序启动后、没收到该指令前,大脑程序的自行提起退出将会导致被判负。

示例

平台发送指令:

END 1

大脑程序不需要回复。

调试指令

为了方便调试,大脑程序可以在任何时刻输出 DEBUG [MESSAGE](需要独占一行,且不能超出一行)。该内容将会被记录到日志,而不会被平台处理。学生可以在平台上下载到完整的日志从而方便调试 bug。大脑程序可以调试输出任意多次,但单条 MESSAGE 不能大于 16 KB(超出部分会被截断)且所有 MESSAGE 累计不能超过 32 KB(超出部分会被忽略),而不会记录到日志。

注意:该输出不能替代其他任何指令的响应。例如收到 TURN 指令后,需要响应一个坐标,那么输出 DEBUG [MESSAGE] 后,大脑程序仍然需要继续输出坐标。

示例

大脑程序输出:

DEBUG Hello World!

直接终止判负的情况

以下是一部分可能导致比赛中途终止直接结束并判负的情况。

在不允许响应的情况下响应

例如,己方刚刚响应完 TURN 指令,需要等待下一个 TURN 之后再走子。若此时己方继续输出内容(调试输出除外),则直接判负。

响应内容格式不正确或无效走子

例如,对于 TURN 指令,己方需要响应一对空格分割的坐标。若响应的内容格式不正确(调试输出除外),则直接判负。若响应的坐标在棋盘以外,或指定的位置处已经有落子,或者处于不合法的位置,则也判负。

超出时间限制或空间限制

时间限制包括单个指令的时间限制和总时间限制。对于 START 指令,需要在 5 秒内响应;对于 TURN 指令,需要在指定的单步走子时间内响应,见比赛规则。总时间限制同样见比赛规则,它的计算从 START 开始,到 END 结束,期间对方落子时不计时间。

程序自身崩溃

由于各种原因(如访问无效内存地址)程序崩溃了,则该局直接判负。

编程注意事项

  1. scanf 函数在没有数据可供读取时会阻塞,因此请勿在不该读取指令的时候读取指令。例如轮到你的 AI 输出了,却执行了一句 scanf,那么你的程序就会无限等待下去直到超时。

  2. 大多数情况下,printf 的输出会被缓存而不会立刻输出,这会导致超时。可以使用 fflush 函数解决这个问题:请在 printf 后紧跟语句 fflush(stdout) 来刷新缓冲区。

  3. 若想利用对方走子的时间进行计算,你可能需要使用多线程技术。由于平台环境是 Windows,因此建议使用 Windows 平台下相关 API 以免出现不兼容情况。

  4. 特别提醒:若要使用高级算法,请确保能在答辩时应对关于该算法的提问,否则将被视为抄袭。

附录

初始局面

在线评测平台操作说明

  1. 在电脑上使用较新版本 Chrome 或 Firefox 浏览器打开平台地址 http://sseclass.tongji.edu.cn/reversi/

  2. 点击导航栏右上角 “Sign In” 按钮登录,用户名和密码都是你的学号(若无法登录,请联系群里的助教)。

  3. 若你是第一次登录,会要求你修改到一个新密码,以免账号被别人冒用。另外还会要求你输入一个昵称。这个昵称会显示在首页的记分牌上,所有人都能看得见,且以后也可以随意修改。

  4. 导航栏上点击 Scoreboard 可以看到记分牌,即当前的总积分排名。记分牌十分钟更新一次。

  5. 导航栏上点击 Submission 后,右侧菜单中可以切换界面到你自己的递交记录(My Submissions)、别人的递交记录(All Submissions)或递交新代码(Submit New Brain)的页面。

  6. 递交新代码时,请将你的代码合并到一个单一文件中进行递交,不支持递交多个文件。你还可以选择不同的编译器。

评测环境

GitHub -> Judge Environment