diff --git a/README.md b/README.md index 5734c90..3edd554 100644 --- a/README.md +++ b/README.md @@ -8,6 +8,7 @@ * [精细化运营](精细化运营.md) - [决策的核心问题-看得见](决策的核心问题-看得见.md) - [决策的核心问题-看得清](决策的核心问题-看得清.md) + - [影响量化评估的两个要素](影响量化评估的两个要素.md) * [建设风控大数据团队](建设风控大数据团队.md) * [案例:爱奇艺业务风控系统](爱奇艺业务风控系统.md) @@ -35,6 +36,7 @@ * [精细化运营](精细化运营.md) - [决策的核心问题-看得见](决策的核心问题-看得见.md) - [决策的核心问题-看得清](决策的核心问题-看得清.md) + - [影响量化评估的两个要素](影响量化评估的两个要素.md) * [什么是风险](什么是风险.md) * [风控效果量化评估](风控效果量化评估.md) * [安全从自身做起](安全从自身做起.md) diff --git "a/images/\344\273\267\345\200\274\347\275\221.jpg" "b/images/\344\273\267\345\200\274\347\275\221.jpg" new file mode 100644 index 0000000..f528d09 Binary files /dev/null and "b/images/\344\273\267\345\200\274\347\275\221.jpg" differ diff --git "a/images/\346\230\223\347\240\201\345\271\263\345\217\260.jpg" "b/images/\346\230\223\347\240\201\345\271\263\345\217\260.jpg" new file mode 100644 index 0000000..4ef7060 Binary files /dev/null and "b/images/\346\230\223\347\240\201\345\271\263\345\217\260.jpg" differ diff --git "a/images/\346\230\223\347\240\201\345\271\263\345\217\260\346\223\215\344\275\234.jpg" "b/images/\346\230\223\347\240\201\345\271\263\345\217\260\346\223\215\344\275\234.jpg" new file mode 100644 index 0000000..57cbc9e Binary files /dev/null and "b/images/\346\230\223\347\240\201\345\271\263\345\217\260\346\223\215\344\275\234.jpg" differ diff --git "a/\345\206\263\347\255\226\347\232\204\346\240\270\345\277\203\351\227\256\351\242\230-\347\234\213\347\232\204\346\270\205.md" "b/\345\206\263\347\255\226\347\232\204\346\240\270\345\277\203\351\227\256\351\242\230-\347\234\213\347\232\204\346\270\205.md" index 8b3c62a..9eae3b1 100644 --- "a/\345\206\263\347\255\226\347\232\204\346\240\270\345\277\203\351\227\256\351\242\230-\347\234\213\347\232\204\346\270\205.md" +++ "b/\345\206\263\347\255\226\347\232\204\346\240\270\345\277\203\351\227\256\351\242\230-\347\234\213\347\232\204\346\270\205.md" @@ -54,68 +54,3 @@ 3. 提升工具的使用性(人力换时间),例如Zeppelin 这里主要从工具角度来介绍,首先是因为方法论较为抽象,一下难以理解,工具是方法论的具象化延伸,易于理解和落地;其次是提升工具确实可以大幅提升效率。 - -### 为什么制约量化评估精确性的首要问题是成本? - -KPI刚刚在国内流行的时候,我参加过一个公司培训。 - ->讲师:KPI一定要可以衡量,不能是模糊的。例如“实现增长”就不是一个好的目标。 -> ->某位同事提问:我觉得有时候我做的事没办法评估,怎么办? -> ->讲师:肯定是有办法评估的,没有什么是不能量化的。你不能量化是你没有好好思考。 - -这位同事还是一脸疑惑,但再接着问就很尴尬了,因为讲师的意思是“你不能是你水平不够”,再问问题更显得自己水平不够,而且还显得自己不愿意动脑。 - -之后的几年我一直在思考“没有什么是不能量化的”这句话,直到学了经济学之后,我有了我的结论: - -**结论一**:很多实物是可以准确量化的,例如一张桌子的高度 - -**结论二**:对于抽象的价值,也许存在完美的量化体系,但是这个量化体系会有极高的交易成本。"交易成本"是经济学的术语,你可以理解为:即便完美的量化体系存在,维持这个体系的成本也会很高 - -拿“招到了一名员工的价值”举例: -``` -老板问:这个月招聘工作咋样啊? -员工:招了3个人(可计数的实物) -老板:对业务有什么帮助吗?(抽象的价值) -员工A:帮助挺大的,解决了那个团队没有前端开发的问题 -老板:我是问你价值,对项目有啥帮助吗? -员工:因为招的是还没经验的实习生,这个月还没什么明显产出,老员工带新员工自己效率还降低了,影响了项目进度 -老板:你的意思是负价值吗? -员工:以后培养好了,肯定对团队有帮助的(一件事往往包含短期价值和长期价值) -老板:这个帮助的价值是多少? -员工:那个项目以后做完了可以盈利1个亿,没有这几个人,肯定做不完。招聘的价值就写1个亿吧。(确实能找到关联的数字) -老板:这怎么行?!哪部分是这几个新员工做的啊? -员工:我让他们写日报给我,让他们写清楚每个人产生的价值(写日报增加了成本) -实习生:我也不知道我做了个页面的价值啊(问题并未解决) -员工:肯定可以量化的,你多想想(成功把皮球踢出去了) -``` - -这里不是要黑HR,只是招聘是一个十分常见的事情,希望没有风控经验的人也可以理解量化评估的难点。这些难点大致有: -1. 很多事情的价值是长期的,短期价值不明显,甚至有可能是负的,未来的事情又不能准确预测 -2. 很多事情的价值是通过价值网络产生的,也就是说一件事情本身独立存在时是没有价值的,当加入到另一个网络时就会产生价值,很难说一个节点的加入可以增加多少价值。例如一名出租车司机加入网约车平台,对平台的价值 -3. 虽然能找到一些关联的客观数字,但不能都选;各个数字都有侧重点,又说不清选哪个 -4. 即便是同一个数字,不同人也会有不同的价值感受 -5. 量化评估本身就需要花时间,调研、记录、分析、汇总、讨论都需要花时间。当评估需要依赖其他人或团队时(其他人又可能需要依赖其他更多的人),沟通讨论也有成本。自动化是个好办法,但是开发和维护自动化系统也是需要成本的。算一算量化评估的时间有可能已经超过了做事情的时间 - -所以我的意思就是别量化了吗?不是的,我的意思是要明白 **精确的价值量化的成本是极高的,甚至是理论上不可能的。我们能做的是在有限的成本内做量化**。 - ->技术可以提高,但理论的极限无法突破,不要做徒劳的事情。 -> ->我们所能做的事情,不过是在边界内找到相对好的答案。 -> -> ————吴军 《谷歌方法论》 - -既然和成本有关,那么提升方案也就很明显了: -1. 提升量化评估的投入。例如增加评估的时间、人力 -2. 提升量化评估效率。例如系统设计时多考虑评估的部分、评估理念的革新 - -需要注意的是,这里存在一个正反馈:更好的理念可以优化分析效率,优化量化评估效率,优化量化评估成本,优化量化评估准确性,又可以给我们带来新的理念。 - -当然了“正反馈”也意味着如果你做的差,就会导致链条中其他步骤做的更差,形成恶性循环。 - -![量化评估](images/evaluating-cycle.png) - -### 总结 - -“看得清”就是在认知能力边界内,用有限的资源,尽量快速的获得相对有价值的信息。 diff --git "a/\345\275\261\345\223\215\351\207\217\345\214\226\350\257\204\344\274\260\347\232\204\344\270\244\344\270\252\350\246\201\347\264\240.md" "b/\345\275\261\345\223\215\351\207\217\345\214\226\350\257\204\344\274\260\347\232\204\344\270\244\344\270\252\350\246\201\347\264\240.md" new file mode 100644 index 0000000..5a02cb9 --- /dev/null +++ "b/\345\275\261\345\223\215\351\207\217\345\214\226\350\257\204\344\274\260\347\232\204\344\270\244\344\270\252\350\246\201\347\264\240.md" @@ -0,0 +1,96 @@ +# 影响量化评估的两个要素 + +前文介绍了“看得清”,你可能会想,看得多清才算是清呢?多清才足够呢?本文就聊一聊影响量化评估的两个要素。 + +### 一个案例 + +``` +HR老板问:这个月招聘工作咋样啊? +HR:招了3个人(可计数的实物) +HR老板:对业务有什么帮助吗?(抽象的价值) +HR:帮助挺大的,解决了那个团队没有前端开发的问题 +HR老板:我是问你价值,对项目有啥帮助吗? +HR:因为招的是还没经验的实习生,这个月还没什么明显产出,老员工带新员工自己效率还降低了,影响了项目进度 +HR老板:你的意思是负价值吗? +HR:以后培养好了,肯定对团队有帮助的(一件事往往包含短期价值和长期价值) +HR老板:这个帮助的价值是多少? +HR:那个项目以后做完了可以盈利1个亿,没有这几个人,肯定做不完。招聘的价值就写1个亿吧。(确实能找到关联的数字) +HR老板:这怎么行?!哪部分是这几个新员工做的啊? +HR:我让他们写日报给我,让他们写清楚每个人产生的价值(写日报增加了成本) +实习生:我也不知道我做了个页面的价值啊,我觉得这个页面挺重要的,要么就5000元吧。 +HR:隔壁团队花了3天做的页面,和我说5000元。你这个就花了一个上午,怎么就5000?(基于投入成本来评估价值) +实习生:两个系统不一样啊,这个系统用了新的技术,运行更快了。(基于效果来评估价值) +HR:更快了也不值这么多吧,你再想想(价值评估难以达成一致) +``` + +这里不是要黑HR(爱奇艺的HR、行政真的特别好),只是招聘是一个十分常见的事情,希望每个读者都可以理解量化评估的难点。大致有: +1. +2. 很多事情的价值是长期的,短期价值不明显,甚至有可能是负的。预测未来的成本很高,甚至是不可能的 +3. 很多事情的价值是通过价值网络产生的,也就是说一件事情本身独立存在时是没有价值的,当加入到另一个网络时就会产生价值,很难说一个节点的加入可以增加多少价值。例如一名出租车司机加入网约车平台,对平台的价值。 +4. 即便是同一个功能,不同人也会有不同的价值感受 + +概况来说分为两类。首先是量化评估受到成本的制约,其次是价值评估难以达成一致。接下来一个一个解释。 + +### 制约量化评估的首要问题是成本 + +KPI刚刚在国内流行的时候,我参加过一个公司培训。 + +>讲师:KPI一定要可以衡量,不能是模糊的。例如“实现增长”就不是一个好的目标。 +> +>某位同事提问:我觉得有时候我做的事没办法评估,怎么办? +> +>讲师:肯定是有办法评估的,没有什么是不能量化的。你不能量化是你没有好好思考。 + +这位同事还是一脸疑惑,但再接着问就很尴尬了,因为讲师的意思是“你不能是你水平不够”,再问问题更显得自己水平不够,而且还显得自己不愿意动脑。 + +之后的几年我一直在思考“没有什么是不能量化的”这句话,直到学了经济学之后,我得到的结论是:**我不知道世间万物是不是都能量化,但是我确定量化是有成本的**,很多时候还是容易被人忽略的交易成本。 + +拿量一个物品的长度为例。做一张桌子,你需要控制桌子腿的长度,用卷尺量误差在1-2毫米,这就足够了。但在生产线上生产iPhone,为了保证原器件长短误差在千分之三毫米(芯片要在纳米量级),就需要花大量的钱去提升工艺技术了。 + +如果没有成本这个因素,很多事情上人们可以为所欲为。但正因为有成本这个因素,所以: +1. 即便我们很有钱,也不会用顶级数控机床去做张桌子,因为成本太高了,不划算 +2. 大家都想生产利润很高的高端产品,但是没有家家都是高端产品企业,因为成本太高了,体现在买不起高端产品的生产机器,或者雇不起高端产品的专家 + +不只是测量物体,衡量工作也是同理。量化评估需要调研、记录、分析、汇总,首先是需要花时间。特别是当评估需要依赖其他人或团队时(其他人又可能需要依赖其他更多的人),沟通讨论的时间更难把控。其次维护这套流程也要花时间,例如监督大家真的认真记录了工时。即便是采用自动化,开发和维护自动化系统也是需要花钱的。算一算量化评估的时间有可能已经超过了做事情的时间。 + +**成本限制了你会怎么做,成本限制了你能做什么。** + +### 个人主义的主观价值论 +我们的工作中除了量化实物,更多遇到的是量化做一件事的意义,或者说一件事的价值。 +1. 你提出了一个创意的价值是多少? +2. 你帮助同事修复了一个故障的价值是多少? +3. 你开发了一套风控系统的价值是多少? + +如果你在思考这个问题,实际上你正是在估值。你估值的依据是什么呢?别人的估值结果和你一样吗?接下来我们介绍一下“个人主义的主观价值论”的观点。 + +>主观价值理论(英语:subjective theory of value,简称STV)是经济学的价值理论,认为产品和服务本身并没有经济的价值,而是由于个人对它们的需求才有价值存在。而这些价值是依据购买者肯为此付出多少代价(如货币)来计算的。由于世界上每个人都有不同的需求和情况,因此,所谓“正确”的经济价值或价格在客观上是不存在的。 +> +> ————Wikipedia + +主观价值理论认为: +1. 个人估值是个人的估值,不是集体的估值。集体不会感受,不会思考,也不会评估,做出个人估值判断的一定是个人。我们要知道集体不会做任何的事情,机构也不会做任何的事情,学校、机关、民族都不会做任何的事情。我们所说的,我们口头上喜欢说的哪个集体、哪个机构、哪个组织做的什么事情,其实最后都是个人做的。 +2. 它是主观的,绝对主观的。并不存在什么客观的估值,如果没有了人,世界上的财富就没有价值,价值都是人赋予的。 +3. 个人估值不是以个人的愿望为基础的,而是以他所愿意放弃的其他商品的数量来计算的。这是以行动为基础的,而这些行动是可以观察到的。 + +一瓶600mL的纯净水的价值是多少?对于电脑前的你来说,可能2元吧。但假设你身处景区里,这瓶水价格变10元了,你口干舌燥,你会买吗?你可能不会买,因为你觉得不值10元,可以坚持一会儿,出了景区再买。但同时你看到也是有人买的,说明有人的想法和你不一样,他们觉得这瓶水的价值大于10元。那么这瓶水的客观价值到底是多少呢? + +主观价值论认为这瓶水的客观价值是不存在的。主观价值论认为你花不花时间、用了多少心思、花了多大的投资,这本身并不重要,最关键的是你能不能把它卖出去,你能不能适销对路,有没有人需要你生产的产品。在商品经济里面,是结果导向、需求导向,如果你生产的产品没人要,那么不管你投入多少资源,花费多少劳动,它也是不值钱的。所以主观价值论能够更好地指导生产,减少浪费。 + +### 总结 +我的意思就是别量化了吗?不是的,量化评估很有用,是工作中很重要的一部分:更好的理念可以优化分析效率,优化量化评估效率,优化量化评估成本,优化量化评估准确性,又可以给我们带来新的理念。 + +当然了“正反馈”也意味着如果你做的差,就会导致链条中其他步骤做的更差,形成恶性循环。 + +![量化评估](images/evaluating-cycle.png) + +只是要知道制约量化评估,特别是价值量化评估的因素是什么。 + +>技术可以提高,但理论的极限无法突破,不要做徒劳的事情。 +> +>我们所能做的事情,不过是在边界内找到相对好的答案。 +> +> ————吴军 《谷歌方法论》 + +拓展阅读 +=== +《薛兆丰的经济学课》第29讲:个人主义的主管价值论 diff --git "a/\346\211\213\346\234\272\345\217\267\351\243\216\351\231\251\350\257\206\345\210\253.md" "b/\346\211\213\346\234\272\345\217\267\351\243\216\351\231\251\350\257\206\345\210\253.md" index 0d2291a..a00f65d 100644 --- "a/\346\211\213\346\234\272\345\217\267\351\243\216\351\231\251\350\257\206\345\210\253.md" +++ "b/\346\211\213\346\234\272\345\217\267\351\243\216\351\231\251\350\257\206\345\210\253.md" @@ -1 +1,12 @@ -tbc. +# 手机号风险识别(TBC) + +上一篇已介绍了IP维度,这一篇聊一聊另一个常见的维度————手机号维度。 + +《中华人民共和国网络安全法》要求: + +>第二十四条 网络运营者为用户办理网络接入、域名注册服务,办理固定电话、移动电话等入网手续,或者为用户提供信息发布、即时通讯等服务,在与用户签订协议或者确认提供服务时,应当要求用户提供真实身份信息。用户不提供真实身份信息的,网络运营者不得为其提供相关服务。 + +目前大部分APP至少采用手机号验证来完成实名制校验,都实名制了,总该很 + +![易码平台](images/易码平台.jpg) +![易码平台操作](images/易码平台操作.jpg) diff --git "a/\351\243\216\346\216\247\346\225\210\346\236\234\351\207\217\345\214\226\350\257\204\344\274\260.md" "b/\351\243\216\346\216\247\346\225\210\346\236\234\351\207\217\345\214\226\350\257\204\344\274\260.md" index 0d2291a..f3457b6 100644 --- "a/\351\243\216\346\216\247\346\225\210\346\236\234\351\207\217\345\214\226\350\257\204\344\274\260.md" +++ "b/\351\243\216\346\216\247\346\225\210\346\236\234\351\207\217\345\214\226\350\257\204\344\274\260.md" @@ -1 +1,95 @@ -tbc. +# 为什么风控价值的量化评估这么难? + +前一篇[为什么制约量化评估的首要问题是成本](为什么制约量化评估的首要问题是成本.md)已经进行了论述为什么量化评估这么难。不过说的比较笼统,这一篇聚焦在风控行业,看看有哪些特殊之处。 + +先说结论:**风控产出的是信息,当前信息的价值来自于消除了未来的损失。但也正因为损失被消除了,评估不存在的事情很难又很抽象,再加上人们风险偏好的不同,所以风控价值评估也就变成了一件难事**。 + +### 风控的产出是信息 + +我们先来体会一下管理学大师彼得·德鲁克的一句话。 + +>知识工作者并不生产本身具有效用的产品。他不生产有形的产品,例如挖一条水沟、制造一双鞋或一个机械零件。他生产的是知识、创意和信息。这样的产品本身并无用途,只有通过另一位知识工作者,把他的产品当做投入,并转化为另一种产出,它们才具有实际的意义。再伟大的智慧,如果不能应用在行动上,也将只是毫无意义的资料。因此,知识工作者必须做到一些体力工作者不需要做的事,他必须具有有效性。而且,他不能只顾到他的产品本身的效用。 + +工业时代的企业评估大部分职位的方式很简单,就是看生产了几件商品,而商品是匀质、明码标价的,所以比较好评估。但是到了信息时代,大部分职位(例如会计、UI设计师、风控)生产的不再是实体的产品,而是“知识、创意和信息”。这类虚拟的产品首先很难区分质量、很难给出明确价格,其次这类产品很难独立产生价值。 + +例如你是一名开发工程师,做了个风控后台,每天大家上去用。这个后台很重要,没有这个后台大家都不能工作。但是后台没直接拦截黑产,不同人用出来的效果也不一样,价值咋量化? +(产品经理:你系统至少还有用户用,我的产出是PRD,普通用户根本不用,咋办?) + +把风控看做一个整体,风控产出的是信息。例如这个用户是否有风险、这个设备是越狱设备等。这条信息本身没有价值,它的价值来自于信息使用方。这个使用方的价值很可能依赖于它的使用方,于是这就变成了一个价值链条。当价值链条互相关联时,又变成了价值网络。 + +![价值网](images/价值网.jpg) + +在上图中用户最终向价值网络支付了200万,这个是很明确的。但是风控在一个价值网络里的贡献是多少?这个是很难说清的。 + +### 评估没发生的事情 +第二个问题是风控领域很有特色的问题。论述前先来看一段孙子兵法: + +>古之所谓善战者,胜于易胜者也。故善战者之胜也, 无奇胜,无智名,无勇功。故其战胜不忒,不忒者,其所措必胜,胜已败者也。故善战者,立于不败之地,而不失敌之败也。 +> +> —————《孙子兵法·行篇》 + +曹操读后批注 + +>善战者无赫赫之功 +> +> ————曹操《曹选》 + +啥意思呢?简单的来说,真正的高手(善战者),在问题(战争)发生之前已经做了充足的准备,让自己立于不败之地。所以很少陷于被动后奇迹翻盘(无奇胜),无法夺得名声和功劳(无智名,无勇功)。当然了我们不能说碌碌无为的人就是“善战者”,这个逻辑不能这么反着推导。这里搬出两位古人的原因是:在风控效果评估的时候,往往也会陷入“善战者无赫赫之功”的困境。 + +风控很重要的一部分是对项目进行评估,修复可以被利用的漏洞。可正因为漏洞被修复了,黑产就不会攻击并造成实际损失,你也就不知道你到底可以挽回多少损失,你甚至不知道黑产有没有攻击过。 + +有时候我们是在攻击中制止了攻击,即便单次攻击的损失很明确,但我们也只能算出来已经发生了多少损失、挽回了多少损失,我们还是不知道黑产“本来”可以造成多少损失。 + +所以做风控的价值评估,你一定会遇到对没发生的事情进行评估。 + +### 个人偏好 +假设一个安全公司的商务给你介绍他的产品:花10万买了我们的产品,有80%可能避免20万的损失,还有20%的可能什么都不会发生。 + +假设他没有说谎,数据是准确的,那么你会买吗?如果你的公司市值20亿,你会买吗?假设你的公司市值50万,你会买吗?第一年买了,啥事都没发生,第二年你还会买吗? + +这个产品的价格是10万,期望收益是14万(0.8*(20-10)-0.2*10),期望利润是6万。这一点客观来说对谁都是一样的,按照理性选择,买是唯一正确的答案。但是实际为什么会有人不买呢? + +这就要提到心理学中“风险厌恶”的概念 + +>In economics and finance, risk aversion is the behavior of humans (especially consumers and investors), who, when exposed to uncertainty, attempt to lower that uncertainty. It is the hesitation of a person to agree to a situation with an unknown payoff rather than another situation with a more predictable payoff but possibly lower expected payoff. +> +>https://en.wikipedia.org/wiki/Risk_aversion + +面对这两个选择: +1. 20%可能损失10万 +2. 80%节省10万 + +有人会赌20%的可能,万一损失没发生,就省了10万元。这类人愿意承受更多的风险,这套系统对这类人就价值就小,也就不会花钱就买了。反之就会买。所以你怎么评价这个系统的价值呢?是高是低呢? + +### 风控价值是存在的 +评估的第一步,我们需要先从理论上证明风控的价值是存在一个具体值的。如果不存在这个值,那我们也就不用这么费劲了。 + +证明要素: +1. 合理的风控是有价值的。这一点比较好理解,无数次事故告诉我们:如果没有风控,数据会被黑客窃取、活动经费会被薅秃。做了风控,这些事情发生的少了,自然是有价值的。 +2. 风控的价值不是无限的。来看一段领导的讲话。 + +>把安全生产摆到“高于一切、重于一切、先于一切”的位置,时刻紧绷安全生产之弦。要狠抓责任制落实,狠抓隐患排查整治,狠抓安全建设投入,狠抓防控体系建设,坚决遏制重特大事故发生。 +> +> 某篇领导讲话 + +如果安全生产真的“高于一切、重于一切、先于一切”,意味着不惜一切代价都要保证安全生产。买最贵的设备、不停的招人、增加层层的审批、每小时不停的抽查...很明显,真这样搞,也就别生产了。 + +在业务发展、人力资源和风控有冲突的时候,如果不经过评估,真的把“高于一切、重于一切、先于一切”当做了行动准则,不仅会导致资源错配,还会导致业务发展受阻。所以“高于一切、重于一切、先于一切”更多的是口号,而不能真的作为行动准则。 + +3. 既然风控价值大于0,小于无限,那么理论上肯定是存在一个具体的值的。只是因为评估成本限制、信息价值比较模糊、损失并没真实发生三个原因导致风控价值的评估特别的难。 + +## 风控也是一种商品 +直接算出这个值是一件成本很高的事,但是我们可以从侧面估计和修正。 + +从经济学角度出发,风控(产品、服务)其实也是商品,也符合商品的 + +* Availability of substitute goods +* Breadth of definition of a good +* Percentage of income +* Necessity +* Duration +* Brand loyalty +* Who pays + +## 参考 +[Price elasticity of demand](https://en.wikipedia.org/wiki/Price_elasticity_of_demand)