<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>投资 on Victor42</title><link>https://victor42.eth.limo/tags/%E6%8A%95%E8%B5%84/</link><description>Recent content in 投资 on Victor42</description><generator>Hugo -- gohugo.io</generator><language>en</language><managingEditor>hi@victor42.work (Victor42)</managingEditor><webMaster>hi@victor42.work (Victor42)</webMaster><lastBuildDate>Wed, 22 Mar 2023 16:14:00 +0000</lastBuildDate><atom:link href="https://victor42.eth.limo/tags/%E6%8A%95%E8%B5%84/index.xml" rel="self" type="application/rss+xml"/><item><title>记一次统计学知识的应用</title><link>https://victor42.eth.limo/post/3633/</link><pubDate>Wed, 22 Mar 2023 16:14:00 +0000</pubDate><author>hi@victor42.work (Victor42)</author><guid>https://victor42.eth.limo/post/3633/</guid><description>&lt;p&gt;统计学刚入门，接触到了概率的基础知识。中学的排列组合我还记得，A(5,3)、C(5,3)这种，一堆阶乘除来除去。我还给自己编了个记忆口诀，组合是大阶乘除以小阶乘除以差阶乘，排列是大阶乘除以差阶乘。&lt;/p&gt;
&lt;p&gt;我真是个很爱算的人，玩游戏都不忘做数学题。英雄无敌4是一个我玩了很久的游戏，其中原版战役海盗的女儿第一关，地图上有4座魔法建筑可以学到魔法技能。整个游戏有5大派系魔法，我特别钟爱自然系魔法，总想让主角学自然法术。但有时候，运气就是那么背，4个魔法建筑都随机不到自然魔法。我决定算一算成功学到的概率，其中2个建筑是直接学会某个随机派系，还有一个是随机出两个派系，二选一，剩下一个建筑牵扯到一些复杂的游戏设定，就不展开讲了。最终算出来学到自然魔法的概率是：&lt;/p&gt;
&lt;p&gt;1 - 4/C(5,1) x 4/C(5,1) x C(4,2)/C(5,2) x C(12,4)/C(15,4) =&lt;br&gt;
1 - 4/5 x 4/5 x 3/5 x 11x10x9/15/14/13 ≈&lt;br&gt;
86%&lt;br&gt;
看来那次没学到是真的背。&lt;/p&gt;
&lt;p&gt;当然，统计学远不止这点内容。最近接触到一个基础概念：期望值，指多次试验中，每次试验的结果与该结果发生概率的乘积之和。它可以用来评估大量反复做同一件事时整体表现如何。&lt;/p&gt;
&lt;p&gt;忽然灵光一现，可以给自己出个练习题了。练习题本身的前提假设是有问题的，后面会解释。但没关系，主要目的是练习概念运用与数据操作：&lt;/p&gt;
&lt;p&gt;获得比特币近3年、5年、有数据以来的每日价格，根据收盘价算出每日较前一日的涨跌幅百分比。把涨跌视作随机发生的概率事件，假设每天都在收盘时买入，并把这笔在第二日收盘时卖出，长此以往，这种操作的期望值如何？没错，这就是把币价波动当做赌场了，通过统计学方法，看看会得到什么结果。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_16-01-39.jpg"
loading="lazy"
alt="CoinGlass比特币历史数据页面截图，显示2023年2月20日至3月22日每日开盘价/最高价/最低价/收盘价/成交量/市值数据表格"
&gt;&lt;/p&gt;
&lt;p&gt;首先，要获得数据。原本是想让ChatGPT或Bing Chat教我爬数据，但一问发现，这是个公开数据，直接导出就是表格了。好吧，爬数据以后再慢慢学，先做题。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-55-06.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，导入pandas读取bitcoin_2020-03-20_2023-03-20.csv文件，显示Date/Open/High/Low/Close/Volume/Market Cap七列数据"
&gt;&lt;/p&gt;
&lt;p&gt;拿到表格导入Jupyter中，初始化一下，发现表里有日期、开盘价、最高价、最低价、收盘价、成交量、市值。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-55-27.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，用pct_change计算每日涨跌幅百分比存入return列，显示date/open/high/low/close/volume/market_cap/return八列数据"
&gt;&lt;/p&gt;
&lt;p&gt;我要用的只有收盘价，根据它来计算出每日较前日的涨跌百分比，记录在return列里。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-55-48.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，用pd.cut将涨跌幅按5%区间分组，return列显示涨跌幅数值，range列显示所属区间如-5%到0%/0%到5%"
&gt;&lt;/p&gt;
&lt;p&gt;既然是把它看作赌场，那么涨还是跌、涨跌百分之多少就是完全随机的，和丢骰子没差别。把return列的百分比值划分到不同的区间，我随便定了个5%作为区间的跨度。然后得出每天的涨跌百分比落在了哪个区间里，记录到另一列中。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-56-06.jpg"
loading="lazy"
alt="Jupyter Notebook分布图代码截图，用matplotlib绘制涨跌幅直方图，横轴-100到100，纵轴0到500，数据集中在0附近呈尖峰分布"
&gt;&lt;/p&gt;
&lt;p&gt;先画个分布图，直观感受下是什么情况。如图所示，几乎全部涨跌都落在正负20%范围内。从历史看来，单日能波动这么多已是极限。而绝大多数落在了正负5%范围内，看来近3年里币价整体平稳。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-56-18.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，用groupby按区间分组计算mean/median/count，显示-20%到20%各区间的平均值/中位数/数量"
&gt;&lt;/p&gt;
&lt;p&gt;现在来计算具体的分布数据。把前面的百分比值按所在区间分组，有很多区间没有数据，去掉空值行之后，得到百分比值在各区间的平均值、中位数、数量。中位数没有用到，但可以和平均值对比做个参考，两者差别不大，表明每个区间内的分布相对均匀。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-56-29.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，计算概率和回报乘积，新增return_probability和product列，显示各区间概率与平均值乘积"
&gt;&lt;/p&gt;
&lt;p&gt;计算出涨跌落在每个区间的概率，也就是用该区间里的数量除以总数量，单开一列记录概率。把平均值和概率相乘，另开一列记录。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/Snipaste_2023-03-22_15-56-40.jpg"
loading="lazy"
alt="Jupyter Notebook代码截图，对product列求和计算期望值，输出结果为-0.1%，表明当天买第二天卖的操作长期期望值接近零"
&gt;&lt;/p&gt;
&lt;p&gt;最终把乘积加总，得到统计学意义上的期望值。3年、5年、有数据以来，期望值都很接近，基本上都接近0。我也试着把区间划得更小，1%为一个区间，结果也差不多。&lt;/p&gt;
&lt;p&gt;期望值为0，表明什么？代表当天买第二天卖的操作，长期坚持下来毫无收获，尽管它诞生以来涨了这么多。&lt;/p&gt;
&lt;p&gt;但要注意，这个结论其实是错误的。因为这个练习题的前提假设就错了，币价的涨跌不能视为独立的概率事件，有太多场外因素对每日涨跌产生影响，同时过去的涨跌也在心理层面对未来的涨跌产生影响。这些影响无法用简单的统计学模型来量化。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2023-03/R.jpg"
loading="lazy"
alt="大富翁4游戏启动画面截图，蓝色地球背景上显示大富翁4标题，下方有START/LOAD/OPTION三个卡通角色按钮"
&gt;&lt;/p&gt;
&lt;p&gt;再者，即使这真是纯概率事件，比如我们实际上活在一个像大富翁游戏那样的虚拟世界中，里面的股票涨跌全是计算机程序生成的随机数，这结论是不是就正确呢？还是错误的，这种当天买第二天卖的操作，不是一无所获，而是注定亏损。因为我们观察的指标是涨跌百分比，每一天这个百分比的基数都不同。无论先涨10%再跌10%，还是先跌10%再涨10%，效果都不是变回原价，而是比原价低。&lt;/p&gt;
&lt;p&gt;一番折腾，基于错误假设得出错误结论。除了练习数据分析技巧外，还有个重要的收获：统计学真的可以验证和研究生活中的问题，只要你尊重和敬畏它的严谨和局限性。这是信心的收获。&lt;/p&gt;</description></item><item><title>年化收益率的陷阱</title><link>https://victor42.eth.limo/post/3606/</link><pubDate>Tue, 11 Jan 2022 17:29:00 +0000</pubDate><author>hi@victor42.work (Victor42)</author><guid>https://victor42.eth.limo/post/3606/</guid><description>&lt;p&gt;我一直很怀疑年化收益率这个指标，在评判基金投资成绩方面到底有没有参考价值，有多大价值？把收益折算到年，就可以横向比较不同基金、不同投资时长，看上去挺客观。但它还夹杂了其他因素，既不能完全反映基金盈利能力，又不能反映真实收益情况。&lt;/p&gt;
&lt;p&gt;用个极端的虚构例子来说明，比如我们两都投同一支基金：&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2022-01/7e049dfc-e68d-40c1-b3ca-c92c47561bb8.jpg"
loading="lazy"
alt="基金净值折线与定投月度实际投入柱状对比图表"
&gt;&lt;/p&gt;
&lt;p&gt;先看左半部分，图里有24列柱子，每列代表一个月，总共代表连续的2年。黑色的折线表示这个基金的净值变化，这基金比较极端，全年净值纹丝不动，除了每年12月31日忽然翻一倍，然后在下一年1月1日落回去。&lt;/p&gt;
&lt;p&gt;先看看你的实际投入和收益。你投了第1年，淡红色柱子表示你的实际投入，每月1日投入120元，你实际投入了120x12=1440元。由于净值一直不变，所以你每月购买的份额是相等的。你以12月31日的价格赎回了，忽略手续费，你总共赎回了2880元，实际收益1440元，实际收益率100%。&lt;/p&gt;
&lt;p&gt;再看看你的年化收益。年化收益率的计算，要把每笔投入折算到年，持有不满一年的，投入金额就要打折扣。打折扣之后的金额，我们暂时叫它“年化投入”，用深红色柱子代表。第1个月年化投入和实际投入相等，120元；第2个月年化投入就打折了，12个月中只有11个月发挥了作用，为了方便计算，我们就当每个月的天数是一样的，所以它年化投入相当于110元；之后同理，每月递减10元。你总共年化投入是120+110+100+&amp;hellip;+10=780，这个数值的意义是说，在这种走势的情况下，你每个月投120相当于第1个月一次性投780。你的年化收益率是实际收益1440/总年化投入780=184.6%。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2022-01/7e049dfc-e68d-40c1-b3ca-c92c47561bb8.jpg"
loading="lazy"
alt="逐月打折计算后的基金月度年化投入深红色柱状图"
&gt;&lt;/p&gt;
&lt;p&gt;然后看看我的实际投入和收益。我投第2年，半年一投，只在1月1日和7月1日各投了一次，每次投720元，实际投入1440元。我赎回时间和你一样，赎回2880元，实际收益1440元，实际收益率100%。&lt;/p&gt;
&lt;p&gt;我的年化收益就和你不一样了。1月的年化投入等于实际投入，就是720元，7月的年化投入，时间只有一半，打对折，年化投入是360元。我总共年化投入是720+360=1080元。我的年化收益率是1440/1080=133.3%。&lt;/p&gt;
&lt;p&gt;&lt;img src="https://cdn.victor42.work/posts/2022-01/7e049dfc-e68d-40c1-b3ca-c92c47561bb8.jpg"
loading="lazy"
alt="两人不同定投策略下总年化投入对比的双柱状图"
&gt;&lt;/p&gt;
&lt;p&gt;我们同样的实际收益，实际收益率都是100%，时间也一样。结果我们总年化投入是不同的，可以看图的右半边两根柱的对比。导致你的年化收益率是184.6%，而我的是133.3%。&lt;/p&gt;
&lt;p&gt;现在是不是觉得年化收益率这个指标很不对劲？它反映的不只是一支基金本身的盈利能力，怎么投也有影响。那这个指标到底是在比较什么呢？&lt;/p&gt;
&lt;p&gt;而且更进一步，这两种投法，我们最终赚的钱实际上会不一样。我们用同样的时间，同样的钱，在基金里赚到一样的收益，但还有基金外面。你资金占用晚，有更长时间放在外面享受银行理财的收益。我资金占用早，一开始就占了一半，年中就全占用了，我闲置资金能享受的理财收益少得多。如果比较我们这两笔钱经过1年分别增值了多少，你的增量就会比我多。&lt;/p&gt;
&lt;p&gt;年化收益率高实际上隐含两个因素，占用资金的时间少，获得的收益高。我们两实际收益相同，年化收益率却不一样，根本原因就是资金占用情况不同。但究竟有多不同？184.6%和133.3%两个数字也反映不出什么来，只知道高的占用资金少。&lt;/p&gt;
&lt;p&gt;回到上面例子，怎么投年化收益率最高？应该是在12月30日一次性全买进去，12月31日再全部赎回。所以如果目标是追求极致的年化收益率，就变成像是在炒股做短线，抓一波大涨就跑。&lt;/p&gt;
&lt;p&gt;这显然有违稳健投资的初衷。既然这样，何不回归本源，干脆追求资产增值速度好了，也就是这笔资金的年复合增长率。总共投入多少资金，投了多久，赎回的时候基金赚了多少，这期间闲置资金理财又赚了多少，根据这些算出资产增值的速度。&lt;/p&gt;
&lt;p&gt;计算表格：&lt;a class="link" href="https://my.feishu.cn/wiki/WMurwbQq6i6SYakjbWAccp8JnHf?from=from_copylink" target="_blank" rel="noopener"
&gt;https://my.feishu.cn/wiki/WMurwbQq6i6SYakjbWAccp8JnHf?from=from_copylink&lt;/a&gt;&lt;/p&gt;</description></item><item><title>付出的效率</title><link>https://victor42.eth.limo/post/3598/</link><pubDate>Fri, 21 May 2021 17:36:57 +0000</pubDate><author>hi@victor42.work (Victor42)</author><guid>https://victor42.eth.limo/post/3598/</guid><description>&lt;p&gt;虽然，绝大多数人工作，都是为了有一天不工作，或者至少不做这份工作。但把个人与社会放在天平两端看，付出和索取一定是相互的。如果换个角度，现在你作为社会整体，站到天平另一端看你自己作为个体的一生，大致会是这样：&lt;/p&gt;
&lt;p&gt;大约20岁以前，这个人基本没有付出，一直在向你索取。大部分索取是父母的额外付出换来的，但也有许多是直接向你伸手 ，比如一些公共福利领域。从20岁到退休年龄，这个人开始有所付出，越来越多，同时也没有停止向你索取，只是索取得少了。到退休年龄后，付出再次减少，某个时刻开始回到只有索取的状态。&lt;/p&gt;
&lt;p&gt;要注意的是，在这个过程中，不要考虑钱的流转，钱只是一种价值交换的媒介。个人和社会间的付出和索取，是相互提供和接受的各种劳动与服务，当然也包括一些精神层面的产物。&lt;/p&gt;
&lt;p&gt;先假定社会是理想的、公正的，忽略社会运转的损耗，人一生的付出总量与索取的总量最终会相等。那么在有付出的阶段，个人的付出必然多于索取。所以这期间你会感觉心累，感觉回报不成比例，感觉想直接穿越到退休年龄。这太正常了，等式就是如此，既不是中年危机，也不是社会问题。&lt;/p&gt;
&lt;p&gt;不过规律是社会的规律，天平另一端的个人不见得关心。个人的目标是尽可能让退休提前到来，这不是过了某年12月31日就往家一坐啥事不干，而是更早达成一生至少应该付出的总量，给自己选择权。现在，如何提前退休，这个问题就变成了：在付出期间，如何提高付出的效率。&lt;/p&gt;
&lt;p&gt;也许人到35左右，有了些成就，在自己的领域成为专家，这正是付出效率大提升的时间窗口。作为先行者，在某个微微微小领域突破行业天花板，把整个行业往前推动1mm。或者作为管理者，把一个团队的人均付出效率提升到你个人单打独斗的水平，甚至超越。当然还有很多创业者，字面意义的，真正开创新行业，人均付出效率可谓井喷。&lt;/p&gt;
&lt;p&gt;当然，也有人攒下积蓄买几套房子，再用剩下的钱开个小超市。他对社会的付出约等于十几间出租屋，以及一个小区的油盐酱醋。虽然价值这玩意太虚，在许多事情上难以作比较。但这两者的社会价值相较如何，相信绝大多数人会有一致的看法。&lt;/p&gt;
&lt;p&gt;可我就是不想再工作了啊！这应该是很多人内心的声音。没错，我也经常吐槽我的工作、所处的行业，如今我没有那么热爱它们。话说回来，工作=付出吗？有的工作看似忙碌，实则有效付出极少，与索取不相称，恰恰和目标背道而驰了。另一方面，也有人不工作，或者说不做狭义的以劳动和时间换报酬的工作，却能创造巨大的价值，比如说投资。&lt;/p&gt;
&lt;p&gt;把做投资看做不劳而获的躺赚，是一种幼稚的想法。无论是存银行定期，还是投资基金股票，正常情况下这些钱都会来到某家企业或个体工商户。他们用这些资金发展了自己的业务，增加了对社会的付出。而你作为一个外行，一个彻头彻尾的门外汉，如果代替他们，用这些资金亲自上阵，必定死相难看。资金仅仅是从你手上暂时地转移到他们手上，就提高了向社会付出的总量，其中价值自然有你一份。&lt;/p&gt;
&lt;p&gt;专业的人做专业的事，要提高自己的付出效率，多数人的最佳选择可能还是坚守本职、发扬光大。实在不想付出劳力，也可以带着提供社会价值的目的，支持其他专业人士，帮他们在自己的领域绽放价值。&lt;/p&gt;
&lt;p&gt;总之，如果要想象自己退休的那一天，不应该是默默躲在沙发角落吃零食刷剧，为从此向社会伸手索取而窃喜。而是自信地说我付出了很多，你们多数人都望尘莫及，我有权力歇一歇。当然，到时候你也未必真的想歇，那就是另一回事了。&lt;/p&gt;</description></item></channel></rss>