Duke, Annie. Thinking in Bets: Making Smarter Decisions When You Don’t Have All the Facts. Illustrated edition. New York: Portfolio, 2018.
书本推荐来自一位经济学教授、目前从事投资的朋友。
作者是世界扑克牌冠军,心理学博士肄业。[1]
书名我感觉很难翻译。因为 bet 在中文里面是 “赌” 的意思,但它显然又和 gamble (赌博)不一样。而这本书,核心在 Why,很少涉及 How,这就导致有一些翻译直接脱离了内容。比如博客来的翻译[2]:“高勝算決策:如何在面對決定時,降低失誤,每次出手成功率都比對手高?” —— 书本只有少量笔墨涉及到“如何”;“每次” 也并不是作者的意思,她强调的恰恰相反,不要“盯盘”细节;“比对手” 就更离谱了,且看后续笔记……
所以,想通过这本书得到一些实用指南的朋友可能会失望。但我觉得它厉害的地方,在于不断重复 Bet 的拆解:
Outcome = skill + luck
通过大量的例证,不同角度的论述,如果看完此书后,能记住这一点就已经非常好了。
由于是心理学的背景,书中引用了大量经典实验。这些故事都比较好理解,且出自专业人士,可以省去校验过程,为未来写作提供不少直接参考。
核心笔记:(夹杂私货版)
•扑克和象棋不同。后者只包含技术,理论上有最优解法(只是人类不知道);扑克则有随机元素,哪怕是高手,也可能抽得一手烂牌,输给新手。
•人生更像扑克,而不是象棋。
•你可能做了好的决定,但依然得到一个差劲的结果。
•你可能做了坏的决定,但是幸运得到了一个好的结果。
•好结果出现的时候,我们倾向解读为技术(skill)。
•坏结果出现的时候,我们倾向解读为运气(luck)。
•大脑的两套系统(类比 Daniel《快思考、慢思考》[3])。Reflexive minds; deliberative minds。前者快,后者准。我们的目标是训练前者也更准。
•人类本能会依靠“快脑”,特别是在面临危险的时候。一个 false positive,总比 false negative 招致的损失要小。
•博弈论(game theory)的不少研究,处理的是理智个体、不完全信息下、具有随机性(mixed stragegy game)的决策问题。
•扑克去掉了“理智个体”这个假设。同理,金融市场、谈判桌、人生,也是如此。
•好的决策,在于决策的过程,而不是决策的结果(因为随机性的加入)。
•习惯说“我不确定”,以反应自己的真实知识水平。“知之為知之,不知為不知,是知也。” —— 孔子。
•“试错” 不是真的 “错误”。一个决策过程,清晰展示了未来的可能性,并且收敛到了最高概率、最大赢面的那个行动,就已经很好了。差劲的结果,并不意味着“错误”,或许平行宇宙中的其他个你,已经得到了更好的结果。
•"Letterman effect": 当你发现身边的人都是傻子时,要问一下是否自己才是傻子……(书中的反例;可以用更好的办法来达到同样的沟通效果)
•不仅仅是在牌桌子上,生活中所有的决策(decision)都是打赌(bet)。
•打赌的外延:选择、概率、风险、决策、信仰。
•在大多数的决策中,我们不是在和一个对手打赌,而是与所有未来可能性中,我们*没有选择* 的那些选项在打赌。(所谓机会成本)
•实验表明,我们会默认听到的信息是真实的(哪怕对方已经明确说明是假信息……)。[Ref, ch2, Gilbert]
•理想的认知过程:观察 → 归纳 → 规律 (信仰/ belief)。
•实际的认知过程:信仰 → 观察 → 修正对观察的解读。(所谓“先入为主”)
•当你相信一件事情的时候,就很容易发现到处都是支持它的证据。
•人们更容易发现他人的偏见(bias),而不容易发现自己的偏见。(所以会引发后文提到的“朋伴体系”)。
•实验表明,越是聪明的人,越不容易发现自己的偏见。他们更自然那地用数据去适配模型,而不是根据新的数据去改进模型。[Ref, ch2, Richard West] [Ref, ch2, Kahan]
•能够意识到自己偏见的人,往往也没有能力去纠正它…… (做人好惨)
•你最好的朋友,会这样挑战你:赌不睹(wanna bet)?这个简单的挑战,会让你突然对根深蒂固的信仰,产生许多实际的问题。比如,谁说的?我怎么会知道?信源质量如何?我相信他们吗?信息的时效性如何?……
•在告知他人一个判断的时候,添加上概率(置信度),会更能赢得他人的信任,这显得你是有在认真思考问题,并尝试为自己的判断负责。这个习惯会为我们赢得协作者。
•经验(experience)并不等于经历(experience)。专家之所以为专家,不在于他们经历了什么,而在于他们从经历的结果中,学到了什么,是为“经验”。
•把未来视作*一类*概率分布。有一种泛函的感觉。我们的决策,影响的是选择了那个具体的概率分布,但并不能决定该分布中哪个具体的事件会发生。
•覆盘的时候,重要的是把运气成分抽离(对概率分布的采样),而专注在技术部分(不同概率分布之间,期望值的差异)。
•案例 SnackWell:因为人们对“低脂食品是好的”深信不疑,美国长达十年推广低脂高糖产品,催生了更多的肥胖症。[Ch3]
•2016 年发表在 JAMA 的一篇文章发现,当年将肥胖归罪于脂肪的三位哈佛科学家,有受到制糖工业的赞助。[Ch5]
•自证偏差(self serving bias)、动机性推理(?)(motivated reasoning)
•扑克牌冠军,即使在赢得比赛后,也是不遗余力地找出决策中*可能的*漏洞。为此,他们花大量功夫,向自己的朋友解释细节。[Ch 3]
•不要为结果(outcome)而辩护(fielding)
•习惯(habit)形成的循环三步骤:信号(cue)、惯例(routine)、奖赏(reward)。
•形成习惯的黄金法则:保持旧有的信号、保持旧有的奖赏,加入新的惯例。[Charles Duhigg, "The Power of Habit"]
•当别人找你谈论一个决策的时候,搞清楚他们的目的:Truth-seeking v.s. Sympathy seeking?(太直没朋友)
•建立一个朋伴体系(buddy system),可以有效帮助你 Think Bets -- 将运气和技术分开。
•不要期待你的所有朋友都有同样的想法。他们没有义务去拿红色药丸。[Ref: Matrix,红色和蓝色,如果选择红色,则会醒来,面对真实世界;如果选择蓝色,可以继续做梦]
•在正式的朋伴体系中,也是可以*偶尔*发发关于运气的牢骚,但要提前声明。
•Alcoholics Anonymous(戒酒无名会)[4]是一个朋伴体系的例子。
•避免形成回声廊(echo chamber)—— 那些总是肯定你的人其实没什么价值。(同理的,总是否定你的人也未必有价值)[信息熵视角]
•人们在讲述过去的故事时,会不自觉选用那些支持他们结论的细节。
•朋伴体系纲领:专注于准确性,而不是寻求确认;通过提前通知,确保为信息负责(accountability);拥抱多样性。
•研究结果:联邦法官在投票的时候也带有政治偏见;但通过(2:1)的配比,裁判团的投票倾向向对方偏移。原文:"disciplining effect"。[Ref: Ch 4, Cass Sunstein]
•让科学家为自己的研究结果押注(bet),可能是比同侪审查(peer review) 更有效的方法。原文:put your money where you mouth were。
•研究结果:关于一系列心理学研究可重现性(reproducibility)的评估,同侪审查的准确率是 58% (几乎等于瞎猜),而建立一个对堵市场(bet market)后,准确率提升到了 71%…… [Ref: Ch4, Anna Dreber]
•采用预测市场(prediction market)做决策的公司有:Google, Microsoft, General Electric, Eli Lilly, Pfizer, Siemens, ... [Ref: Ch4]
•朋伴体系的 CUDO *纲领*。C - Communism,数据属于群组。U - Universalism,对所有断言和证据采取相同的态度,而无关他们的来源。D - Disinterestedness,警惕所有可能的利益冲突(conflict of interest),或者主动声明利益相关(disclaimer)。O - Organised Skepticism,通过小组讨论,鼓励参与和异见。[Ch5, Merton]
•在分享细节的时候,需要有一个固定模板,有助于专家帮忙侦测其中缺少的信息。
•Don't shoot the message (derived from "Don't shoot the messenger")。—— 即“忠言逆耳”。对于不喜欢的信息,你要提取中间的技术性部分而学习,不要因为坏结果而远离信息或者发信息的人。
•Skeptical v.s. Cynical -- 理性批判(skeptical)需要的是良好的态度、文明的披露、友善的沟通。
•表达 Agreeable disagreement 的策略。尝试 "Yes, xxxx, AND yyyy";而不是 “BUT”。前者表示你在贡献新的思路,后者表示你在挑战现状。
•当你一个人的时候,可以用过去的自己和未来的自己作为朋伴体系。
•与过去的自己对话。如 “三省吾身” 的曾子。
•与未来的自己对话 —— 找到延迟满足的理由:精力饱满地出现在同事面前、拥有充足的退休金、获得更健康的身体、…… 可以帮助拒绝当下的诱惑。
•实验:给定 $1000,让受试来分配;当人们通过 VR 游戏,看到自己未来衰老样子的时候,平均分配 $178.10 给退休账户,而看到当下样子的人,平均分配 $73.90 给退休账户。[Ref: Ch6, Jeremy Bailenson]
•后悔是一种糟糕的体验。但后悔并不完全是低效的。你可以与未来的自己对话,将后悔的体验提前。
•Suzy Welch 的 10-10-10 框架:当要做出一个决策的时候,问一下自己,它在 10 分钟会会产生什么结果?10 个月后,会产生什么结果?在 10 年后,会产生什么结果。
•炒股不要“盯盘”。即使是股神巴菲特的投资组合,放在一天中来看,也是上下起伏。股神也逃不过市场踩踏时候的大跌。但坚持从一而终的投资策略,可以在更长的时间范围内,打平随机因素的影响。
•生活也是。我们何尝不是在“盯盘”(ticker watch)自己的人生呢?—— 这周组里有人掉链子了;昨天晚上没有睡好;坚持一周的减脂计划,居然没有效果…… 放在长期来看,这些都不是主要问题。
•我个人最近的一个体会,一旦“盯盘”了,就开始在树立一个无形的对手,需要花更多精力去与其和预期的差距进行对抗,反而无法舒展的做这件事,影响了心态进而影响效果。[Ref: Grace]
•Ulysses pact —— 在自己清醒的时候,定下一些规约,以便在不清醒的时候快速作出(或借由他人作出)熔断性的决策。例子:输到 $600 美金的时候,就要退出牌桌,无论你自认为目前的结果是基于技术还是运气;打牌持续 8 小时候,就一定要退出,即便目前“手气爆表”;一场辩论中,如果超过 20 分钟没有结论,就要及时停止,各自回去寻找数据,重新组织论述,以避免不断重复观点本身;……
•Swear Jar —— 每次说脏话的时候,就往里面放一枚硬币。
•Decision swear jar —— 践行 Think Bets 的原理,一旦发现自己偏离,就扔一枚硬币,以警醒未来的自己,并形成习惯。
•红队 —— 一个总是 challenge 自己的队伍(蓝队是自己)
•场景规划 (scenario planning)—— 一种把连续的概率分布离散化的方法,以提高决策质量。例如:如果客户拒绝怎么办?如果客户预算不够怎么办?如果客户无法完成内部审批怎么办?如果竞争对手有更好的 offer 怎么办?……
•想象一个糟糕的未来,然后倒推,是由于如何一系列决策导致了它?
•不要路径依赖。例如:你打牌先赢了 1000,后输了 1000;你打牌先输了 1000,后赢了 1000。如果是前者,你可能不爽。如果是后者,你可能会很开心,并且把当晚的酒费给包了请客大家。
赌啥子嘛?
四川长大的小朋友,都很熟悉两句话:“赌不赌?”,“赌啥子嘛?”。
以前总觉得四川人有内生的赌性,比如麻将的流行就是一个例子。但仔细琢磨后,才发现,所谓赌(bet),乃是文明辩论的根基。
当两个人各执己见,争执不休的时候,只要有一方问一句“赌不赌?”,就会马上获得片刻安宁。在这静止的瞬间,双方各自从脑中收集证据,判断胜率和赢面。多亏了大脑的量子结构,在真金白银的胜负压力下,另一方可以瞬间计算出对自己最有利的结果。这时候,你可能会听到两个明确的答案。“赌就赌,怕你索?”,又或者 “难求得跟你赌”。—— 这显然比继续争执半个小时有效多了。
没有赌注(no stake)的辩论,就是耍流氓。
四川的赌(bet),又和拉斯维加斯的赌博(gamble)不一样。后者纯粹是运气问题,甚至人们在明知道长期期望为负的情况下还赌,这就不科学,除非他的收益是在赌局之外(比如,开心)。前者则是技术与运气的综合体,透过经济体系,促使专家达成最优决定。
话虽然这样说,我们也并不是支持打麻将。哪怕一个人长期赢牌的机率过半,那也只是牌桌子上的部分。当你下决定要去打牌的时候,就已经在赌一些东西,比如时间和健康。
每一个抉择,其实都是在赌某种未来。对赌的另一方,是那些没有被选择的可能性。
频率派、贝叶斯派、先验派
你扔一个硬币,如果连续十次出现正面,将如何解读?
频率派的结论,会说这个硬币正面出现的概率是 100%。针对目前的观察,这是极大似然(maximum likelyhood)的结论。
贝叶斯派,则会说,这个硬币可能有偏,它出现正面的概率大一些,也许为 60%、也许为 70%、…… 至于具体是多少,它依赖你对硬币正面出现概率的先验分布如何选择。由于似然概率为伯努力分布,它的先验概率均值取 50% 比较合理,所以比较流行的一种先验选择就是 Beta 分布。你完全可以做别的假设,但选择 Beta 的好处是,后验概率也是 Beta 分布,使得增量学习更方便。
更多假设,更多主观因素,但结果更好?
贝叶斯派显然更受现代的统计学习理论青睐,也透过业界大量的实践,证明了它是有效的。通常的做法是,将用于描述世界的变量组成一个网络,一些没有上游的节点,就是超参数,来自人类的先验知识。接着我们让模型不断观察新的数据,透过最大后验(MAP)的方法,去更新其中的节点。当模型收敛的时候,就形成了对知识的有效表达。
以上基本上是教科书范畴。我们发现机器学习的衍化路径,是从“极度客观”的频率派开始的,然后逐渐贝叶斯化。—— 机器生来就擅长从大量观察中总结经验,然后我们给它注入一些主管因素(先验),让结果更好。
读了 Think Bets 这本书后,发现一个有趣的想象,就是人类刚好反过来。实验表明,我们会默认听到的信息是真实的(哪怕对方已经明确说明是假信息……)[Ref, ch2, Gilbert]。理想的认知过程是:观察 → 归纳 → 规律 (信仰/ belief)。而我们实际的认知过程:信仰 → 观察 → 修正对观察的解读。这就是所谓“先入为主”。一旦我们建立某种信念后,再多的观察都可能无济于事。与其修改模型以适应新的数据,我们更擅长修改对数据的解读,来保持模型的稳定……
回到上面硬币的例子。先验派的朋友可能会说:硬币不就是两面各 50% 出现吗?做实验的人出老千吧?他抛的不是一个硬币吧?你确认是亲眼看到他抛的?……
原来人类是先验派的!
以上是一个极端的例子,但既然连机器都已经贝叶斯化了,我们人类是不是也该向机器学习一下……
回归
这本书的整体框架,其实可以用回归(regression)来解释。技术+运气的框架,其实就是模型+噪音的框架。透过回归过程(拟合),我们去除了噪音,找到了模型。
错误
统计上有两类错误(error)。Type I 是系统性的,也叫偏差(bias)。Type II 是随机性的,也叫噪音(noise)。如果我们遇到了一个不好的结果,它属于 error,而我们要鉴定一下,中间有多少是 bias,有多少是 noise。
Noise 是永远存在。你做的决策越多,发生 noise 导致的 error 的概率就越大。
Bias 却是可以尝试降低或消除的。你从过去的经历中学习得更多,因为 bias 发生 error 的概率就越小。
永远不犯错,只有一个办法,就是永远不要做决定。
一旦你开始做决定,就要习惯不时会有失败。
直?
作者讲了一个故事,感觉很搞笑。在一次讲座的间隙,有个人前来,似乎要找她覆盘一手牌。这个人花了很长时间介绍他手上的牌,自己如何出牌,但最后因为对手神乎其技地拿到了更好的牌,结果自己输了。本来间隙就不长,有的人可能会安慰两句,有的人可能会选择快速地给一个点子,结果作者是践行朋伴系统的,紧接着给了句:你当时是如何判断的?结果对方悻悻离去:这个故事的重点不在这里!(潜台词:在于我想吐槽一下我的运气)
我之所以觉得搞笑,是因为我曾经是这样的人。
其实我现在也是。(见 🔗信任公式中的亲密关系[5] )。
然后作者就说,你可以 Think Bets,但要小心没朋友。
她接着说,不要期待你的所有朋友都有同样的想法。不是每个人都是为寻求真相(truthseeking 而来)。你的朋友们没有义务去拿红色药丸。[Ref: Matrix,红色和蓝色,如果选择红色,则会醒来,面对真实世界;如果选择蓝色,可以继续做梦]
过分谦虚
Phil Ivey 在一次赢得世界冠军后,和作者的哥哥去晚餐。在常人看来,这是一个庆祝的时刻。结果 Ivey 用了一个晚上,扭着作者的哥哥来覆盘这场比赛,不断追问“刚才的这个决策,有没有可能是错的呢”?
这样的故事,在顶级扑克圈不胜其数。
高手总是把成功归于运气,而失败归于实力。
他们真的是在谦虚吗?
其实,这是一种策略。其意义并不在于常人面前的“凡尔赛”,而是通过不断的心理暗示,让自己专注于结构性部分。他们当然知道,有时候失败也是运气使然,但他们要做的是,不断提升自己,以便在运气差的时候,也能获得更大的成功概率。
销售
我们应该拜访客户 A 还是拜访客户 B?今年是否应该推出新的产品?我们是否要进行部门重组?根据市场变化,明年的招聘预算要增加吗?……
这些都是模糊预测类问题。之所以销售和管理岗位要设置高额 bonus,就是通过经济手段,逼迫他们作出最好的决策。相反的,研发类岗位,则不会有太多 bonus,因为团队的输出质量,很大程度上由科学的过程管理来控制。
所以从这个性质上来说,销售确实更接近业务本身。CMO 也是离 CEO 最近的位置。
你也许会说,哪怕我做足了功课,选择客户 A,可能最后还是竹篮打水呀?
这种可能性当然存在,就是作者说的“好的决策可能导致差的结果”。但有一个好的决策过程,坚持下去,输输赢赢加总下,结果更可能是正的。决策过程越好,这个正向结果的期望就越大。
如果你发现自己的判断就像丢筛子一样…… 那说明你不适合这份工作。
用 Letterman 的话说:当你发现身边的人都是傻X时,要怀疑一下是否自己才是那个傻X……
有一段时间,身边创业失败的朋友越来越多(也包括我自己)。我们聚在一起,大灌啤酒,诉说着大环境如何如何。
后来在网上看到一句话,发人深省:
确实如此。一次创业失败,有运气的因素。连续创业失败,就得找一下自己的问题了。
一次工作失利,可能有运气的因素。但如果每次换工作都遇到傻X 老板、划水同事、夕阳产业,可能就得认真问一下自己了。
•[1] Duke, Annie. Thinking in Bets: Making Smarter Decisions When You Don’t Have All the Facts. Illustrated edition. New York: Portfolio, 2018.
•[2] 博客来的翻译: https://www.books.com.tw/products/F014060349
•[3] Kahneman, Daniel. Thinking, Fast and Slow. 1st edition. New York: Farrar, Straus and Giroux, 2013.
•[4] Alcoholics Anonymous(戒酒无名会): https://www.aa-hk.org/
•[5] 信任公式中的亲密关系: https://mp.weixin.qq.com/s/h3fvEmIIgqfRsCwU_otemA
No comments:
Post a Comment