To the man with a hammer, everything looks like a nail.

囚徒困境与针锋相对的博弈策略

囚徒困境与针锋相对的博弈策略

“你决定好了吗?”对面的人一脸严肃地看着我。他是我的法官,手里掌握着我的命运。 “你其实只有两条路,要么指认同伙有罪,要么指认同伙无罪!”他继续说。 “如果你指认同伙有罪,而你的同伙说你无罪,你就可以被释放了。”他顿了顿,脸上露出一丝不易察觉的坏笑。 “如果你指认同伙无罪,而你的同伙指认你有罪,那么你等着坐大牢吧!” “如果你们两个都说对方无罪,你们俩只会被关两天就放了……不过没那么简单。” “要是你们两个都说对方有罪,那么你们俩一起蹲监狱吧!” “要知道,你的同伙也知道这个规则,所以你会怎么选?” 法官口中的同伙是另一个关在隔壁屋子里的人,我们并不熟悉,所以我不知道他是个什么样的人,会做出什么选择。 显然,如果他说我有罪,不管我怎么选,我都会坐牢;而如果他说我无罪,我指认他有罪就可以脱身。至于我们俩都指认对方无罪?我想他的想法应该和我一样,都是指认别人有罪是最佳策略。 我决定了,我的选择是…… 这就是博弈论里非常有名的囚徒困境!显然,双方都指认对方无罪是最能获得利益的做法,但这不符合逻辑。不管怎么选,指认对方都是最佳策略。我不能把希望寄托在对他的信任上,毕竟我根本不认识那个家伙! 在这种情境下,最符合逻辑的选择却无法获得最佳利益,而是得到最差的结果。而且这种情况是无解的,它是典型的零和博弈,有人赢就有人输,最终的结果是零。 难道这种博弈真的只能相信人性的恶,而没有信任吗?要知道,对方是否值得信任需要时间、记忆和认知去建立。如果这个游戏只玩一次,理性的选择结果永远都是双输,而不会是合作双赢。 在这个情境下,策略没有什么好选择的,但如果和对方一直持续地玩这个游戏,把坐牢和释放改成输钱和赢钱呢?怎么做才能让自己或者两个人收益最大化? 如果剧情这么发展,策略就会多起来,零和博弈就会变成非零和博弈。双方的目的是共同从第三方赢得更多利益,而不是拼个你死我活。 博弈论专门研究这个问题。他们发现,当持续地让双方在囚徒困境中选择时,可能会生成多种不同的策略,其中“针锋相对”策略既简单又最有效。其策略是:第一次选择合作,之后根据上一次对方的选择,做出相同的选择。意思是:我一开始抱着信任的态度,相信对方。如果对方背叛,那么下一次我也会背叛以示惩罚,之后每一次都根据对方上一次的选择做出相应的回应。 这个策略看似简单,却包含了非常深刻的人性和心理。既然我不能当一个坏人,但也不会只扮演逆来顺受的和事佬;我的包容会让我点到为止,而不是斤斤计较,执拗到底。 了解一些博弈论和策略,可能会让我们在这个世界上的生存更容易一些。…

我为什么选择跑了一个八公里?

我为什么选择跑了一个八公里?

因为早上要去医院复查眼睛,时间比较紧张,所以一开始我犹豫要不要早上去跑步。 跑步的习惯促使我采取行动,所以我需要选择今天的路线。 通常来说,我有两条路线。一条比较喜欢的是七公里,用时稍长,有一个路口可能需要等待;而另一条是六公里,用时稍短,虽然也有一个路口,但是可以通过天桥通过。 所以无论怎么看,我今天应该选择六公里,保证可以锻炼的条件下,用时最小。 然而,奇怪的事情发生了。 我在日常都会拐弯的路口竟然决定等了一下红灯,选择一条自己平时从来没有去跑的路线,而且还沿着这条路线跑出了八公里。心里还惦记着赶时间这回事,所以不由自主地提高了配速,前面几公里的配速都跑进了五分钟。虽然这条路线没有跑过,但是也非常熟悉,因为它有两三个大路口是可能需要等待的。 为什么会这样?在跑上这条路后,我才开始反思这个问题。本来应该选择一条短路线迅速完成锻炼,为什么竟然还跑出了八公里? 最近的阅读和学习让我找到了可能的答案。 第一个是提示 这个提示是当我打开Runkeeper准备记录跑步活动时,发现这个月有一个10KM的挑战活动,我没有参加,但是它显示只剩下几天了。 这个提示显然让我产生了一种联想:是否要参加这个挑战?我应该可以。但是我需要迅速结束,下一次的锻炼时间还有吗?什么时候方便?我要不要选择另一条路线看看? 这个提示使我对选择路线产生了犹豫。 第二个因素是相对论。 在心理学中,相对论选择(Relativity of Choices)理论指出,在A和B选项中难以决定时,一个A-的选择项会让你最后确定选A。 在我这个例子中,跑步的人都倾向于多跑,但是由于赶时间,我可能会选择跑短一些。但是这里的A-选项是一个更长距离的挑战,这促使我在选择时下意识地去选择了一个更长的路线,但是实际上不是想真正完成的路线。 这些决定在那一瞬间就基本上决定了,我甚至在跑到平时那个里程路口时心里还在想,要是剩下的路程能够完成10KM挑战,我有很大的可能性会继续从那条路线上跑。其实内心就是想跑更远的距离。 分析自己内心的思路挺有意思,结合提示影响行为来看,提示的出现促使了想完成更长距离的想法,产生了完成长距离跑的动机,跑者的身份认同也加大了这一筹码,尤其是我已经是跑在路上了,多跑一两公里在当下的决定来看不会成为影响自己时间的重要因素。 所以尽管自己知道赶时间,结果还是提高配速,选择了一条陌生的道路,让自己心理上先满足我没有选长距离跑,因为如果从那个路口出发跑过去,估计就会选择一条明确的路线了,不确定的路线让我自己觉得并没有选择长或者短,但是其实内心上是已经做好了跑长距离的准备了。 真是有趣的一次心理决策啊。…

诚实与道德

诚实与道德

今天在阅读到丹艾瑞里关于诚实的研究时,对于其中提到的“穿冒牌”会增加不诚信的结论很有一些感触。 掌控习惯的James Clear认为,习惯做什么很大的驱动力在于你自己希望成为一个什么样的人,在什么样的身份下就会驱使用自己做出与身份相符的行为。 所以当喜欢穿假名牌的人决定用更小的金钱(投入)来尝试换回更大的收益(传递的社会信号),这一切似乎都说得通了。 在我小时候一件记忆深刻的事情,长辈日常对我的教育都是要正直、诚实,我自己也常因为一些不诚实的言行受到惩罚,然而在一次对家里电表是否改装的检查中,长辈自己改装的事情被检查到了,然后我被要求说:这是我做,因为小孩子可能不懂事。 这件事的结果后面是怎么样我已经没有印象了,但是这种矛盾却让我心里经常不舒服。并且时刻提醒自己应该做一个诚实的人。但在日常生活中,我会在内心中抱怨周围的人似乎太在意金钱,而为了利益似乎什么手段都可以,甚至不法、不合理的事情都可以做。 这让我感到有点悲哀,也有点迷茫。 并不是觉得自己的道德水平更高,甚至有时候我在想是不是自己立了人设而刻意地做出了这些举动。 在进一步明确了身份会给自己打上标签,决定自己做什么后,感到没有那么迷茫了。至少明确了设定自己的身份,立场是有作用的。如果一个人假装了一辈子好人,那他不是好人又是什么呢? 在这里,我至少产生了两个对自己非常有价值的反思点。 第一,要更清晰地明确自己的人设、身份,才能促使自己做更符合每个身份的行为,也才能获得自己想要的结果。采取虚拟、不诚实的手法获得的短期利益,终于会在长期的行为中出现越来越多的问题,和老话说的一样:当你开始说了第一个谎,就要用更多的谎去圆。 这样的人设身份并不是要追求完美人格,要允许自己有缺点,但是缺点并不等于允许降低自己的为人处世的标准。 第二,管他的心态刺激到我了。任何事情只要开一个头,管他的心态就会让这件事情愈演愈烈。我现在明白为什么当我明确要求自己不要吃甜食,但只要在精力耗竭时,给自己说:吃一个吧,因为你累了,因为你可能低血糖,因为你可以明天跑步把热量消耗掉之后,会接二连三地吃下第二块、第三块、甚至一整袋点心。 还记得那时候的心态是这样的:算了,既然都吃了这么多,也不怕这一点,把它全部消灭,以后不买了。😅…

我的微习惯

我的微习惯

自我反思:好习惯与坏习惯的较量 我自诩为一个自律的人,而且也不是没来由的。看看我这些年的战绩吧: 从2009年开始,我与香烟说了再见,至今没有复烟。这可比坚持不看剧透更难哦。 自2022年起,我把对碳酸饮料的无尽渴望锁进了地下室,直到现在一瓶都没碰过。 跑步已经成了我的新老婆,从2012年胖小子变成了苗条佳人。尽管医生禁止我进行高强度运动,马拉松梦碎,但我每周仍旧坚持奔跑两次。 冥想也成了我日常的一部分,每天的坚持让我在工作和学习上都得到了不小的助益。 然而,总有些事情做得不尽人意,甚至有时候还会雪上加霜: 我曾设定目标,实行300天的轻断食。可是从开始到现在,这计划被打乱的次数多到数不清。 我一直梦想体重能降到63公斤左右,可是每次到了64公斤就开始失控,自我放纵让我又回到了起点。 对于时间管理,我曾制定详尽的年度计划,理论上这是非常有帮助的。然而,真实操作起来,常常忽略不更新和检查,让我觉得这更像是形式大于实质。 为什么效果大相径庭? 为什么同一个我,在这些方面的表现会有天壤之别呢?一方面,我能轻松做到许多人难以坚持的事情;另一方面,即使我知道某些事情难以为继,却也总是坚持不到最后。 经过深刻的自我反思,我发现这大概和习惯的养成及摒弃息息相关。特别是在即时满足和延迟满足之间,我似乎需要重新设定正确的目标。 我坚持得好的行为,经过多年的锻炼,已经成为生活的一部分,几乎不需我刻意控制。而那些我难以控制的饮食习惯,仍然根深蒂固,尤其是我对甜食的爱好,常常在情绪冲动时做出非理性的选择。 重新回顾 Atomic Habit的四大定律 这本书是2024年2月完成的阅读。内容清晰简洁,当时也关注了James Clear,认为他的原则方法都是非常有效的。 从重新打开书籍并翻看阅读笔记时,才发现只是觉得书很有用,但是把它变成自己的系统行为却还差了很多,甚至我连微习惯形成的四个过程都已经模糊了。 微习惯的第一定律是提示,要让习惯显而易见。也就是说,用本能反应的方式,提示自己应该做什么。但是如果不想自己做什么的话,就应该减少提示。 微习惯的第二定律是渴求,要让习惯行为对自己有吸引力。所以当制定一个计划或者培养习惯时,想办法增加自己对其愿望是非常重要的。反之,则需要想办法降低自己的渴求度来消除坏习惯的诱惑。 微习惯的第三定律是反应。简单来说就是自己的行为会如何响应上面的提示和渴求。行为越简单,越容易做到,反而如果行为越麻烦,流程越长,则会大大降低行为出现的概率。 微习惯的最后一个定律是奖励。自己的习惯养成能够得到什么样的奖励和鼓励是刺激行为一再重复或者不再重复的动力。好习惯总是当下缺乏奖励,看长期的延时满足,而坏习惯总是能够满足当下,而对将来产生不良的结果。 我应该如何来强化自己的延迟满足 认真回顾以上的四大定律,再来对照自己做得不好的行为就有了比较明显的答案。 1. 提示的力量:隐藏那些诱惑 想象一下,每天下班回家,我被家中摆满的甜食诱惑。这就像是在健身完还要经过一家快餐店——诱惑太大了!所以我决定采取行动:将所有甜食藏得高高的,确保它们不在我的直接视线里。这就像是把曲奇饼藏在了奈斯博格的秘密抽屉里——你知道它在那里,但懒得去取。 2. 渴求的转变:用健康数据说服自己 每当我脑海中闪过“吃点甜的吧”,我就会查看我的健康追踪器,提醒自己,“看,你的血压和睡眠质量会因为不吃甜食而改善!”这就像是有一个小天使在我耳边耳语,不断提醒我坚持下去的好处,而不是让小恶魔诱惑我走向巧克力的黑暗面。 3. 简化获取好习惯的路径,复杂化坏习惯的途径 我给自己设定了一个规则:若想吃甜食,就必须先做30分钟的家务。这样一来,懒惰的我往往会选择放弃,因为比起做家务,不吃甜食似乎是个更容易的选择。这让我每次想起甜食就联想到洗碗和扫地,这两者的结合足以让任何人的甜食欲望速降。 4. 明智的奖励:从小处着眼,步步为营 而不是将目标定为遥不可及的300天,我改为设立每周的小目标。每完成一周不吃甜食,就奖励自己一次电影之夜或购买一本心仪已久的书。这样的即时反馈,让我更有动力继续坚持。毕竟,谁不喜欢在周末看一部好电影,尤其是在知道这是自己努力的成果后? 策略的生动应用:找到乐趣,享受过程 通过上述生动的例子,我希望能给自己带来更多的乐趣和动力,同时也让这个自我提升的旅程不那么单调。就像是在游戏中逐级解锁,每一步都充满了新的挑战和奖励。…

七种武器 – 影响力几大原则的个人理解

七种武器 – 影响力几大原则的个人理解

影响力是著名心理学家罗伯特西奥迪尼的著作,它完整地从心理学、行为经济学层面介绍了影响人们判断和选择的几个最重要的原则。这些原则我的理解如下: 互惠原则 互惠原则是自己感觉印象最深的一条。如果简单地用传统话来说,就是吃人嘴短,拿人手软。因为受了对方的好处,所以心里就会觉得亏欠。这种心理感受并不完全根据得到好处的价值大小。 比如去餐厅吃饭,如果对方希望你给餐厅服务好评,以下的举动:第一:先生,请你给我们餐厅做个好评,我们会赠送你一份小吃第二:先生,这是我们赠送的小吃;稍后:先生,方便您对我们餐厅的服务做出评价吗? 第二种方式由于受了对方的小优惠,更容易达成目的。 利用互惠原则还有很多战术,比如撤退报价。先用一些明显别人不会接受的条件让对方对请求说不,而人内心对自己说不是有些挣扎的,所以在几个不合理的请求后,提出一个明显让步的方案,此时,通常会因为不想再拒绝,而这个方案也还算合理,就会被接受。通常这个方案还是优于本来的底线。 比如在网上购物,买到了不合适的东西想退款或者换货。遇到不愿意处理的商家或者让你承担运费,可以提高自己的要求:必须退款,不退货,甚至按照某些消费条款让别人多赔付;坚持两轮后,处理的客服也会认为这些要求有些过多,在这时,如果退让下来,只退款,然后对方来收取退货,自己不承担邮费,通常可以达成目的。 在工作中,如果希望对方协助自己而不下绊子,给对方带一些小礼物,甚至送一张卡片展示自己的友好,通常就能达到目的。 喜好原则 喜好原则其实在日常社会中非常明显,我们更容易相信和同意自己喜欢的人所表达的观点。 同样,如果对方是一个自己不太喜欢的人,不管对方的观点多么有道理,我们可能下意识也可能反对。 广告商最常用的手法就是请明星代言,这就是对喜好原则应用到极致的实例。这些明星通常都有很多喜欢的观众和听众,因为喜欢他们,所以不管他说的啥,介绍的什么,都会被影响。 近期在抖音上的直播带货,我的理解也是通过让观众喜欢上主播,然后才出手购买了很多自己并不需要的东西,只是为了支持自己的喜爱。 喜好原则有时还可能和联盟原则协同,让我们找到相似的人,因为共同的喜好,从而达到对对方的影响。 社会认同原则 社会认同原则我的理解就是从众行为。一些比较经典的例子如: 已经有超过90%的人完成了问卷大家都在用这款产品,你还在等什么? 因为广告是最适宜发挥影响力的地方,所以在广告中营造出大众选择的感觉很重要。 影响力的开篇即介绍了人的行为模式容易受到触发影响,思考喜欢走捷径,比如认为贵就是好,别人的选择就是对的。 我们在电商购物,很多时候要看这个商品或者店家的评价,有时甚至不管真假,只会根据评分就做出来了判断。这也是一种典型的社会认同。 权威原则 权威原则我最有印象的例子还是广告。因为很多广告特别是药品、牙膏一类的,都是由那些身穿白大褂的人来扮演的。我们其实并不知道真假,但却容易相信。 在从小的教育里,社会和宗教都在传达权威的力量,以致于我们很容易屈从于权威。 最有名的实验米尔格拉姆的电击实验里,成年人在适当的诱导和权威高压下,会做出任何事情。所以我们可以理解在六十年代那个岁月里,为什么文化大革命几乎会让人疯狂地做任何违反常理的举动。 权威的形成有时甚至不需要内容,只要有:头街、穿着、身份标识。 所以在日常社交中,为什么有些人权靠华丽的衣着、租来的豪车也可以大行其道。结合喜好原则–我们更喜欢和容易轻信穿着打扮漂亮的人而不是看起来象流浪汉的人,这条原则就可以在更高的程度上影响他人。 相信在纳粹时代,除了下面会说到的联盟之外,权威也是一条非常重要的影响力原则 联盟原则 联盟原则其实就是拉帮结伙。 我们更容易相信与自己差不多的人,无论好坏,比如老乡,同读一个学校,来自于同一个工作地点或者城市。 如果用一个例子来说明,最简单的就是地图炮:你们河南人,你们西安人,你们东北人,你们黑人,你们白人……等等 在日常沟通中,我们常常会注意到有些人在开场合,马上介绍说:哦,那里我也呆过……之后如何如何。原因就是为了拉近距离。 联盟就是为了拉近人和人的距离,把一群人显得是自己人,而不是像自己人。 由于联盟可以身心合一,或者行动合一,结合其他的一些原则,往往就可以做出惊人的举动。 在我理解,如果要创造企业文化,让大家更有向心力,必须让大家感到是我们。 但是从书里的介绍又提到:如果大量地在公司政策、原则或者规范性的地方使用我们,容易让大家忽视重要的边界,犯下更多的欺瞒的错误。 承诺与一致原则 对于承诺与一致的原则的理解,我是这么想的,人的内心是希望言行一致,让别人觉得自己是一个可信任的人。 所以,在不知不觉中做出承诺的时候,就更容易做到这些承诺。 马上就联想到OKR的工作原理,目标的透明化,让大家看到自己的目标,实际上就是当众做出了一些承诺。因此会更加用力地去实现这些承诺。 在面试前:诱使面试官说为什么邀请你来面试,通常会说一些你不错之类的话,而面试结果可能因此会受影响。 在给大家培训前,让大家对自己来培训的目的做出一些承诺,也可能更容易让大家专注在培训而不是底下玩手机。 稀缺原则 稀缺原则在营销上被用得很多,就是“饥饿营销”。 创造成这种资源很少很独特的状况,激发人的逆反心理,提高人们对资源占有的欲望是其本质。而稀缺本身并不会因此带来更多的体验和价值,完全是心理层面的操纵。 比如还有一天价格就改回去了,你的券再不用就过期了,都是在利用这一原则来刺激人们盲目的消费。 要利用这一原则时,就要能够创建出稀缺的感觉。唐霄颺跟我提过,如果想刺激Z时代的孩子去努力达成什么,那么这个达成目标的唯一性很重要,实际底层的逻辑就是稀缺。 其他 重温这本书,继续理解这几项原则,并且能够融入到行为的理解上,再用简单的故事来描述,是我重写这篇文章的目的。…

WRAP方法论的理解与实践

WRAP方法论的理解与实践

重新阅读希思兄弟的著作,我依旧深受启发。此次阅读最大的收获莫过于掌握了WRAP这一思维模型。 “W”代表“Widen Your Options”,即不局限于肯定或否定的选择,而是开阔思维,主动探索各种可能性,包括反向思维在内的所有选择。 书中指出,一旦我们将选择框定为“是”或“否”,问题本身便限制了解决方案的范围。例如,面对“是否应与伴侣分手”的问题,传统的二元选择模式让我们忽视了更深层次的思考:我们在做出选择时放弃了什么,如果放弃的因素可以另作他用,是否能够拓展我们的视野?这便是说,是否存在一种可能,既不选择分手也能解决分手背后的问题呢? 我们往往忽视聚光灯之外的世界。决策过程中的主要障碍包括:思维狭窄、确认偏误、短期情绪和过度自信。这些障碍无论在我个人的工作还是生活中,或是在同事间,都有所体现。 因此,面对问题时,我们不应急于决策,而应从多个角度分析,寻找增加选择的可能性。此外,结合整合思维和提问的方法论,只有提出恰当的问题,我们才能找到问题的核心。 在“W”方面,结合查理·芒格的多元思维模型和广泛知识,我们可以最大化自己的选择范围。 “R”表示“Reality-Test Your Assumptions”,只有在现实中测试假设,我们才能确定哪些想法可行,哪些不可行。这与SMART目标设定理论及行动力原则紧密相连。无论是多么创新的想法,如果不经实践测试,我们便可能遗漏关键的洞察。 考虑问题时,我们的目的是保持客观,避免仅为验证自己的观点而寻找支持性证据。反思对立观点的益处,能够促进全面而深入的理解。 “放大、缩小视野”的思维模式有助于我们更现实地思考问题,同时避免忽略全局和内心感受。 “A”代表“Attain Distance Before Deciding”,即在做出决定前赋予自己足够的思考空间,避免受短期情绪影响而做出冲动决策。设置时间节点、结束条件等均为有效策略。此外,10-10-10法则也是值得实践的:思考做出某一决定后,短期、中期和长期可能产生的感受。 在决定任何事情前,包括日常生活的小选择,如是否吃蛋糕或违反某个原则,都应先暂停。在日常的娱乐活动中,例如刷抖音或玩游戏,也应给自己设定间隔,反思继续当前活动的必要性。 “P”意味着“Prepare to Be Wrong”,接受任何决策都有可能出错的现实。从行为经济学的视角看,人类天生厌恶损失,许多策略设计正是基于这一心理特征。我们应从核心价值观出发,确定前进的方向,同时做好面对失败的准备。 总结来说,只要我们做好了充分的准备和反思,任何决策都不再是束缚我们的难题。…

Latest News

Mr. Hulu & Hulu 的效率之路

Mr. Hulu & Hulu

© Copyright 2023. Logseq & Obsidian – Productivity | 陕ICP备19000106号-1