博弈树 分钱币博弈。有一堆钱币,由两位选手轮流进行分堆。要求每个选手每次只能把其中某一堆分成数目不等的两小堆,直到不能再分为止。哪个选手遇到不能再分的情况,就为输。 假设这堆钱币的数量为 7 。博弈树如下。有 max 和 min 两个选手,节点中的 min 和 max ,表示当前节点由响应的选手进行选择 ...
归纳偏好 机器学习本质上是归纳推理。从有限的已知数据得到普遍的知识,不能从逻辑推理得到。比如从犹太人 a 很聪明,犹太人 b 很聪明,犹太人 c 很聪明,推出所有犹太人都很聪明。这个推理不是必然成立的,里面包含了某种偏好它才能成立。 机器学习中把这样的偏好称为归纳偏好。归纳偏好的严格定义:已知 ...