科学网

 找回密码
  注册

tag 标签: 选麦穗

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

选麦穗的数值试验
热度 2 youmingqing 2020-1-13 18:45
0 在学院工作群看到教师选岗的条件,真是有趣呢;又想到选麦穗问题: 从 100 个麦穗中选取一个,逐个观察而决定是否选取;选后不得更换! 我曾在博文说了,“观察前 37 个确定极大值而选取其后出现的更大者 (37% 规 则 ) ,有 37% 的可能会落空。 ……. 倘若看了 75 个都不能满意,看到第 76 个时知道已过了 3/4 、只剩下 1/4 的历程。您想,既然麦穗随机排列,最好的或许已不能取得;眼前的这个若能进入前三名,大约就是剩余的 25 个中最好的。在可选中选出可能的最好,才是切实可行的生活态度。怎能说不比前面的都好就不要呢,那是贪婪啊!” 改完两门课程的试卷,离放假还有几天,也就再说几句。 1 计算机可以模拟选择过程。利用 Qbasic 程序在 100 个( 0, 1 )之间的随机数进行相应试验。其中 B 表示 前 37 个中最大, D 是选取, C 是 100 个中的最大; J 是在总计 100 个数中的大小排序, L 是出现的序号;0 表示未能选取。下表是前 30 次的试验结果。 容易知道,只要排序第一不出现在前 37 个,则选择总能完成,但未必能选到最佳者;若前 37 个出现的极大值总排序第二,则一定能取得最佳者。从上表还可以看到,数据较少时并无统计规律可言,如排序第一出现在 99 和 100 位各两次,且各有一次被取到呢。 2 考察数 M 当然可以调整,下图是 M =15~45 时各进行 10000 次试验取得的排序 1~4 数量;排序 5 以上的次数较少,以实心圆点 ● 合并给出。蓝线是选取到最佳者的近似期望值 10000* ( M /100)*Ln (100/ M ) ;弃取的期望值 10000*( M /100) 。 就取到最佳者的次数而言,考察数 M 在 25~45 之间差别不大,或者说概率函数 – x ln x 在 x = 1/e 达到极大值 1/e =0.3679, 但极值点附近变化并不显著—— x = 0.25 和 0.5 时概率均为 0.3466 ,与极值 1/e 之差为 0.0213 ,即仅降低了 5.8% 。从上图看到,该差别与试验10000次的数据波动相当;另一方面,采用较小的 M 可以有更多的成功机会,且 M = 25 时取得前三的几率是 70% ,而 M = 37 时只有 62% 。 据此可以做出判断: 仅能选择一次且以最优者为目标,可以先考察 25% 而后选择出现的更好者 。若以排序前三为目标可采取其他策略,如观察前 M 1 确定极大值 B 1 ,其后选择出现的更大者至 M 2 ;确定前 M 2 已出现的次大者 B 2 ,以后优于 B 2 即可选取。下图是 M 1=20~35 时的结果。 M 1=25~30 时的结果较好,考虑到弃选的数量, M 2 在 50 左右较好。 最佳者在前 M 1 且次佳者在前 M 2,则上述过程将出现弃选,概率为( M 1/100)* ( M 2/100)。对于 M 1=25、 M 2=50 弃选的概率为12.5%,取得前三的概率约为68%;若考察25个后仅选更好者,则前三的概率约70%,但弃选则高达25%。 3 当然可以考察 M 1 个后分 3 个层次选取:选择优于 已出现的第一、第二、第三者 。下表是总计10000次试验的选取者在100个麦穗中的排序情况 。表中给出观察 25或37后选取更大者的结果作为参考。 4 通常所说的 37% 规则并 不是实际的最优策略: 获得最优 的期望 确实达到最大的37% ,但也有37% 的可能一直等到最后而无可选择 。概率 极值点附近变化较小,而选择1万次的结果仍存在波动。就此而言, 应该依据具体 目标 采取不同的 策略,略述如下。 (1) 若目标是取得第一,则可提前至从第26个开始选择出现的最优者。 (2) 若目标为取得前三,则从第26个开始选择 最优者,从51个开始选择最优或次优者,从76个开始选择进入前三者,但有3/32 的概率弃选,即10% 的可能到最后无可选择。 (3) 如果不准备弃选,则可以在 第21个、41个和61个采取上条方案;而若至80个麦穗时尚未选择,则应以剩余数量中可能的最优者为目标进行选择,如第81个若优于已出现的前4名、第91个优于 已出现的前9名即可选取。 选择是权利,也需要珍惜呢,因为机会是稍纵即逝啊。此前在博文说过,若是看着第 99 个,也知道后面还有 1 个。您会怎么想呢?要是我, 这个眼前的麦穗,只要在已展示的 99 个中排入前50 位就行,超过半数就行 ;除非这个真是不好,才将全部的希望寄予最后。
个人分类: 教学|7221 次阅读|6 个评论
喝酒划拳中的数学(附:摇号和选麦穗)
热度 7 youmingqing 2018-12-5 22:28
冯老师的博文 介绍了划拳的历史及相关知识,学习之后颇有收获。文中特别提及数学内容,称 “ 两人出拳数字相加所得之和的概率是不相同的,以得五的概率最大,得零和十的概率最小 ” 。不过,实际划拳或猜枚或许与此略有些不同。 甲乙两人各出 0~5 之间的一个数字,其和为 0~10 ;若随机出数则结果是 五 的 概率最大,为 6/36 ; 而 结果是零 或十的概率最小,只有 1/36 。这是当然的。 不过,划拳者所报数字与其所伸指头的数目相关,如伸两个指头,则通常会报数 2~7 ;不管报出其中的哪一个数,正确的概率都是 1/6—— 正确与否取决于对方所伸指头的数目;而旁观者猜二、三、四、五、六、七时正确的概率是 3/36 、 4/36 、 5/36 、 6/36 、 5/36 、 4/36 。其间存在差别。 当局者在 6 个数字中猜测而旁观者在 11 个数字中猜测,掌握的信息不同,判断的准确性当然不同。仅举一个例子予以说明:旁观者预猜结果为三,因甲方有 4/6 的可能出零 ~ 三,基于乙方的所出指头数目,各有 1/6 的可能正确;而甲方有 2/6 的可能出 四和五,则不管乙方所出都是不可能正确;于是, 其猜对概率是 4/6 *1/6+2/6*0=4/36 。 最后说句题外话。若酒席有目盲而耳聪者,其听到两位划拳者所报数目之后可以更准确地猜出结果,除非双方都叫“五魁首”而完全不透漏信息。 科学网博客曾经基于医学检查讨论条件概率的问题,似乎有些复杂难解。划拳问题相对简单,或许有助于理解“信息”对判断准确性的重要作用。 附录1:摇号 有博文讨论“真随机数”,想到“经适房的六连号”。作为数学问题就是,从 M 个元素中随机选取 m 个出现 k 连号的概率( k ≤ m )。 对于 LHK 市摇号,有 M = 1138, m = 514, k = 14 ,相应的概率为 0.01500 ,即 14 连号概率为 1.5% ;而 WH 市摇号, M = 5141, m = 124, k = 6, 相应的概率为 8.970*10^(–7) ,略小于百万之一。网上许多文章称:“这种结果出现的概率仅为千万亿分之一”,似乎有误。 或许有人会说,现在只出现一次 k 连号,没有出现两次以上的 k 连号,没有出现 k –1 连号,也没有出现 k +1 连号,等等,实际概率比上面的计算值还要低;因而, …… 。 随机发生的事情在发生之后就是确定的,通常不能再分析事件发生的概率。不过,摇号过程不够透明,有时结果比较奇特而引起民众的误解和猜疑;猜疑若不能平息则会损伤公信力。就此而言, 摇号程序要简单、明确,结果随机但事后任何人都可以“复盘”确认 。 申请截止后迅速公布如下内容: (1) 合格申请数 M ,摇号数 m ,摇号日期 等 ; (2) 中奖者序号 N 为 M * n +1 之整数部分, n 为 sqrt ( A + j π) + sqrt ( B + j π) + sqrt ( C + j π) 之小数部分; (3) 参数 A 、 B 和 C 由 摇号 前一日沪市收盘指数、 某外汇牌价或 摇号现场随机产生(产生方法也应公布) ,等等 ; j =1 to m 。如果出现重复结果,则参数 j 相应顺延。 如此摇号就是一个确定 - 随机 - 确定的过程,公开 - 透明 - 公正的过程。当然,计算公式可以改变;参数 π 可以改为 e 或者根号 2 ; 等等。相关内容只要预先公布就行。 网上文章称:某地摇号 51 次, 有近9 万人一次就中,而 14201 人参加 51 次 未中。 摇号是没有办法的办法,结果肯定不能公平;不过,只要摇号过程可以“复盘”就不会产生猜疑啊。 附录2:从100个麦穗中选取一个,逐个观察而决定是否选取;选后不得更换! 倘若已经到了最后而无可选择,当然得取了那最后一个,不能空手而归;不过,若是看着第 99 个,也知道后面还有 1 个。您会怎么想呢?要是我, 这个眼前的麦穗,只要在已展示的 99 个中排入前50 位就行,超过半数就行 ;除非这个真是不好,才将全部的希望寄予最后。 期望取得最好者不应成为设计策略的目标 。 如果已经看了 75 个,都不能满意;看到第 76 个的时候,知道已经过了 3/4 、只剩下 1/4 的历程。您想,既然麦穗是随机的排列,那么最好的或许已经出现了,或许已不可能取得了。 眼前的这个若能进入前三名,大约就是剩余的 25 个中最好的 。 倘若恰巧是第一,那是机遇 ; 若是第四乃至第五,也该赶紧握在手中 。怎能说不 比前面的都好 就不要。那是贪婪啊! 容易理解, 在看到 第 67 个、 51 个时若其能够达到 第三名、 第二名就可以选取 。至于在 52~66 个之间的选择,那是生活态度而不是数学问题。当然,在看 37~50 个麦穗时,若不如已出现的最好者则放弃不取,即只是选取第一名; 对最初的 36 个麦穗则只作观察。因 100/e=36.79 ,确定数字 36 而不是夏博士博文给出的 37 个,只是自己的生活态度啊。 显然,最好者出现在前 36 个肯定不能取到;即使在 37 个之后出现也未必能够取到——其前面较优者可能被优先选取。 倘若更好的已经失去了,略作伤感之后,得赶紧 在可选中选出可能的最好 ,才是切实可行的生活态度。至于将来或许还有更好的,那也只是或许啊,当不得真的。 我不准备进行数学论证或数值模拟,因为如何选择只是生活态度而已。 第一好者出现在前 36 且第二好者出现在前 50 的概率是 0.18 ,在这样的情形要取得第三、第四好者也是不容易的。 有时候我们并不能承受 20% 的风险 ,因而只得降低目标。就数学问题而言就是, 采取何种策略使选取者为 前 10 名、 20 名或者 前 60 名的概率最大 。 当然,寻求的策略只是成功的概率最大而已,并不能确保绝对的成功。试想,若麦穗以 从好到差 或者 从差到好 的顺序出现,有何种策略能够应对呢? 随机出现或者随机分布是常说的话语。可是,这个世界有真正的随机吗?面对已经出现的结果,相信尚待出现的未知结果依然按随机的方式出现,并依照既定的策略进行选择,我们能够吗?
个人分类: 随笔|7476 次阅读|15 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-12 02:17

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部