conda 被莫名陈斌波被降级的原因了，什么原因

点击联系发帖人 时间：2018-04-14 19:01

conda update 降级

&nbsp>&nbsp
&nbsp>&nbsp
&nbsp>&nbsp
从Spyder3降级回Spyder2
摘要：Spyder3已经更新了很长时间了,不少问题还是没能解决,比如启动时跳出许多nvcc.exe,然后持续kerneldied,敲代码突然自动退出这种情况也是越来越频繁了。确认历史版本号这是第一步,选择一个3以下的版本号,我的方法比较简单pipinstallspyder==然后就会出现如下的错误Couldnotfindaversionthatsatisfiestherequirementspyder==(fromversions:2.3.0,2.3.1,2.3.2,2.3.3,2
Spyder3已经更新了很长时间了,不少问题还是没能解决,比如启动时跳出许多nvcc.exe,然后持续kernel died,敲代码突然自动退出这种情况也是越来越频繁了。
确认历史版本号
这是第一步,选择一个3以下的版本号,我的方法比较简单
pip install spyder==
然后就会出现如下的错误
Could not find a version that satisfies the requirement spyder== (from versions: 2.3.0, 2.3.1, 2.3.2, 2.3.3, 2.3.4, 2.3.5.2, 2.3.6, 2.3.7, 2.3.8, 2.3.9, 3.0.0b2, 3.0.0b3, 3.0.0b4, 3.0.0b5, 3.0.0b6, 3.0.0b7, 3.0.0, 3.0.1, 3.0.2)
No matching distribution found for spyder==
版本号就这么出来了
选择版本号
这里选择3以下最高的版本2.3.9安装
pip install spyder==2.3.9
更简单的方法
命令如下,简单易懂,就不解释了
pip install spyder&3
anaconda的命令类似
conda install spyder&3
以上是的内容，更多
的内容，请您使用右上方搜索功能获取相关信息。
若你要投稿、删除文章请联系邮箱：zixun-group@service.aliyun.com,工作人员会在五个工作日内给你回复。
云服务器 ECS
可弹性伸缩、安全稳定、简单易用
&40.8元/月起
预测未发生的攻击
&24元/月起
为您提供0门槛上云实践机会
你可能还喜欢
你可能感兴趣
阿里云教程中心为您免费提供
从Spyder3降级回Spyder2相关信息，包括
的信息，所有从Spyder3降级回Spyder2相关内容均不代表阿里云的意见！投稿删除文章请联系邮箱：zixun-group@service.aliyun.com，工作人员会在五个工作日内答复
售前咨询热线
支持与服务
资源和社区
关注阿里云
International&p&本文来源于今日头条&/p&&p&作者：曹欢欢博士 - 今日头条算法架构师&/p&&p&&br&&/p&&blockquote&今天，算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配，但同时，算法也开始面临质疑、挑战和误解。今日头条的推荐算法，从2012年9月第一版开发运行至今，已经经过四次大的调整和修改。&br&今日头条委托资深算法架构师曹欢欢博士，公开今日头条的算法原理，以期推动整个行业问诊算法、建言算法；通过让算法透明，来消除各界对算法的误解，并逐步推动整个行业让算法更好的造福社会。&br&以下为《今日头条算法原理》全文。&/blockquote&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-b8632ccd4db8baf2245c9_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-b8632ccd4db8baf2245c9_r.jpg&&&/figure&&p&&br&&/p&&p&今日头条资深算法架构师曹欢欢：&br&&/p&&p&&br&&/p&&figure&&img src=&https://pic7.zhimg.com/v2-08f9d19d8a46d445a122ea_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic7.zhimg.com/v2-08f9d19d8a46d445a122ea_r.jpg&&&/figure&&p&&br&&/p&&p&本次分享将主要介绍今日头条推荐系统概览以及内容分析、用户标签、评估分析，内容安全等原理。&/p&&h2&一、系统概览&/h2&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-792c45deb51db2c0d3acc657d0bcb71b_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-792c45deb51db2c0d3acc657d0bcb71b_r.jpg&&&/figure&&p&&br&&/p&&p&推荐系统，如果用形式化的方式去描述实际上是拟合一个用户对内容满意度的函数，这个函数需要输入三个维度的变量。第一个维度是内容。头条现在已经是一个综合内容平台，图文、视频、UGC小视频、问答、微头条，每种内容有很多自己的特征，需要考虑怎样提取不同内容类型的特征做好推荐。第二个维度是用户特征。包括各种兴趣标签，职业、年龄、性别等，还有很多模型刻划出的隐式用户兴趣等。第三个维度是环境特征。这是移动互联网时代推荐的特点，用户随时随地移动，在工作场合、通勤、旅游等不同的场景，信息偏好有所偏移。结合三方面的维度，模型会给出一个预估，即推测推荐内容在这一场景下对这一用户是否合适。&/p&&p&这里还有一个问题，如何引入无法直接衡量的目标？&/p&&p&推荐模型中，点击率、阅读时间、点赞、评论、转发包括点赞都是可以量化的目标，能够用模型直接拟合做预估，看线上提升情况可以知道做的好不好。但一个大体量的推荐系统，服务用户众多，不能完全由指标评估，引入数据指标以外的要素也很重要。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-e7f6c6df0cb_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-e7f6c6df0cb_r.jpg&&&/figure&&p&&br&&/p&&p&比如广告和特型内容频控。像问答卡片就是比较特殊的内容形式，其推荐的目标不完全是让用户浏览，还要考虑吸引用户回答为社区贡献内容。这些内容和普通内容如何混排，怎样控制频控都需要考虑。&/p&&p&此外，平台出于内容生态和社会责任的考量，像低俗内容的打压，标题党、低质内容的打压，重要新闻的置顶、加权、强插，低级别账号内容降权都是算法本身无法完成，需要进一步对内容进行干预。&/p&&p&下面我将简单介绍在上述算法目标的基础上如何对其实现。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-b885ad8fc9ef3d460facb_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-b885ad8fc9ef3d460facb_r.jpg&&&/figure&&p&&br&&/p&&p&前面提到的公式y = F(Xi ,Xu ,Xc)，是一个很经典的监督学习问题。可实现的方法有很多，比如传统的协同过滤模型，监督学习算法Logistic Regression模型，基于深度学习的模型，Factorization Machine和GBDT等。&/p&&p&一个优秀的工业级推荐系统需要非常灵活的算法实验平台，可以支持多种算法组合，包括模型结构调整。因为很难有一套通用的模型架构适用于所有的推荐场景。现在很流行将LR和DNN结合，前几年Facebook也将LR和GBDT算法做结合。今日头条旗下几款产品都在沿用同一套强大的算法推荐系统，但根据业务场景不同，模型架构会有所调整。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-3adb9caa0abced7a138171_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-3adb9caa0abced7a138171_r.jpg&&&/figure&&p&&br&&/p&&p&模型之后再看一下典型的推荐特征，主要有四类特征会对推荐起到比较重要的作用。&/p&&p&第一类是相关性特征，就是评估内容的属性和与用户是否匹配。显性的匹配包括关键词匹配、分类匹配、来源匹配、主题匹配等。像FM模型中也有一些隐性匹配，从用户向量与内容向量的距离可以得出。&/p&&p&第二类是环境特征，包括地理位置、时间。这些既是bias特征，也能以此构建一些匹配特征。&/p&&p&第三类是热度特征。包括全局热度、分类热度，主题热度，以及关键词热度等。内容热度信息在大的推荐系统特别在用户冷启动的时候非常有效。&/p&&p&第四类是协同特征，它可以在部分程度上帮助解决所谓算法越推越窄的问题。协同特征并非考虑用户已有历史。而是通过用户行为分析不同用户间相似性，比如点击相似、兴趣分类相似、主题相似、兴趣词相似，甚至向量相似，从而扩展模型的探索能力。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-a7f8efda21_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-a7f8efda21_r.jpg&&&/figure&&p&&br&&/p&&p&模型的训练上，头条系大部分推荐产品采用实时训练。实时训练省资源并且反馈快，这对信息流产品非常重要。用户需要行为信息可以被模型快速捕捉并反馈至下一刷的推荐效果。我们线上目前基于storm集群实时处理样本数据，包括点击、展现、收藏、分享等动作类型。模型参数服务器是内部开发的一套高性能的系统，因为头条数据规模增长太快，类似的开源系统稳定性和性能无法满足，而我们自研的系统底层做了很多针对性的优化，提供了完善运维工具，更适配现有的业务场景。&/p&&p&目前，头条的推荐算法模型在世界范围内也是比较大的，包含几百亿原始特征和数十亿向量特征。整体的训练过程是线上服务器记录实时特征，导入到Kafka文件队列中，然后进一步导入Storm集群消费Kafka数据，客户端回传推荐的label构造训练样本，随后根据最新样本进行在线训练更新模型参数，最终线上模型得到更新。这个过程中主要的延迟在用户的动作反馈延时，因为文章推荐后用户不一定马上看，不考虑这部分时间，整个系统是几乎实时的。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-649efac0f339a44331cf_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-649efac0f339a44331cf_r.jpg&&&/figure&&p&&br&&/p&&p&但因为头条目前的内容量非常大，加上小视频内容有千万级别，推荐系统不可能所有内容全部由模型预估。所以需要设计一些召回策略，每次推荐时从海量内容中筛选出千级别的内容库。召回策略最重要的要求是性能要极致，一般超时不能超过50毫秒。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-f08e05c163d697eca5b13_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-f08e05c163d697eca5b13_r.jpg&&&/figure&&p&&br&&/p&&p&召回策略种类有很多，我们主要用的是倒排的思路。离线维护一个倒排，这个倒排的key可以是分类，topic，实体，来源等，排序考虑热度、新鲜度、动作等。线上召回可以迅速从倒排中根据用户兴趣标签对内容做截断，高效的从很大的内容库中筛选比较靠谱的一小部分内容。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-d1ddcd01aca06cc91a83b31cbc79d4c9_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-d1ddcd01aca06cc91a83b31cbc79d4c9_r.jpg&&&/figure&&p&&br&&/p&&h2&二、内容分析&/h2&&p&内容分析包括文本分析，图片分析和视频分析。头条一开始主要做资讯，今天我们主要讲一下文本分析。文本分析在推荐系统中一个很重要的作用是用户兴趣建模。没有内容及文本标签，无法得到用户兴趣标签。举个例子，只有知道文章标签是互联网，用户看了互联网标签的文章，才能知道用户有互联网标签，其他关键词也一样。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-cb79c6d28ab4a4e1264003_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-cb79c6d28ab4a4e1264003_r.jpg&&&/figure&&p&&br&&/p&&p&另一方面，文本内容的标签可以直接帮助推荐特征，比如魅族的内容可以推荐给关注魅族的用户，这是用户标签的匹配。如果某段时间推荐主频道效果不理想，出现推荐窄化，用户会发现到具体的频道推荐（如科技、体育、娱乐、军事等）中阅读后，再回主feed,推荐效果会更好。因为整个模型是打通的，子频道探索空间较小，更容易满足用户需求。只通过单一信道反馈提高推荐准确率难度会比较大，子频道做的好很重要。而这也需要好的内容分析。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-6eb7845cbeedb4c69aa947_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-6eb7845cbeedb4c69aa947_r.jpg&&&/figure&&p&&br&&/p&&p&上图是今日头条的一个实际文本case。可以看到，这篇文章有分类、关键词、topic、实体词等文本特征。当然不是没有文本特征，推荐系统就不能工作，推荐系统最早期应用在Amazon,甚至沃尔玛时代就有，包括Netfilx做视频推荐也没有文本特征直接协同过滤推荐。但对资讯类产品而言，大部分是消费当天内容，没有文本特征新内容冷启动非常困难，协同类特征无法解决文章冷启动问题。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-426d04b3c86bc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-426d04b3c86bc_r.jpg&&&/figure&&p&&br&&/p&&p&今日头条推荐系统主要抽取的文本特征包括以下几类。首先是语义标签类特征，显式为文章打上语义标签。这部分标签是由人定义的特征，每个标签有明确的意义，标签体系是预定义的。此外还有隐式语义特征，主要是topic特征和关键词特征，其中topic特征是对于词概率分布的描述，无明确意义；而关键词特征会基于一些统一特征描述，无明确集合。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-8e86ba2c5fedad8ff29159_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-8e86ba2c5fedad8ff29159_r.jpg&&&/figure&&p&&br&&/p&&p&另外文本相似度特征也非常重要。在头条，曾经用户反馈最大的问题之一就是为什么总推荐重复的内容。这个问题的难点在于，每个人对重复的定义不一样。举个例子，有人觉得这篇讲皇马和巴萨的文章，昨天已经看过类似内容，今天还说这两个队那就是重复。但对于一个重度球迷而言，尤其是巴萨的球迷，恨不得所有报道都看一遍。解决这一问题需要根据判断相似文章的主题、行文、主体等内容，根据这些特征做线上策略。&/p&&p&同样，还有时空特征，分析内容的发生地点以及时效性。比如武汉限行的事情推给北京用户可能就没有意义。最后还要考虑质量相关特征，判断内容是否低俗，色情，是否是软文，鸡汤？&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-e2f340e2dccf39d15c51cb_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-e2f340e2dccf39d15c51cb_r.jpg&&&/figure&&p&&br&&/p&&p&上图是头条语义标签的特征和使用场景。他们之间层级不同，要求不同。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-fe707f27bfb560_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-fe707f27bfb560_r.jpg&&&/figure&&p&&br&&/p&&p&分类的目标是覆盖全面，希望每篇内容每段视频都有分类；而实体体系要求精准，相同名字或内容要能明确区分究竟指代哪一个人或物，但不用覆盖很全。概念体系则负责解决比较精确又属于抽象概念的语义。这是我们最初的分类，实践中发现分类和概念在技术上能互用，后来统一用了一套技术架构。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-3c408e5b81a77b0ae40789_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&359& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-3c408e5b81a77b0ae40789_r.jpg&&&/figure&&p&&br&&/p&&p&目前，隐式语义特征已经可以很好的帮助推荐，而语义标签需要持续标注，新名词新概念不断出现，标注也要不断迭代。其做好的难度和资源投入要远大于隐式语义特征，那为什么还需要语义标签？有一些产品上的需要，比如频道需要有明确定义的分类内容和容易理解的文本标签体系。语义标签的效果是检查一个公司NLP技术水平的试金石。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-650e1a1bde9e2334f4ded_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-650e1a1bde9e2334f4ded_r.jpg&&&/figure&&p&&br&&/p&&p&今日头条推荐系统的线上分类采用典型的层次化文本分类算法。最上面Root，下面第一层的分类是像科技、体育、财经、娱乐，体育这样的大类，再下面细分足球、篮球、乒乓球、网球、田径、游泳...，足球再细分国际足球、中国足球，中国足球又细分中甲、中超、国家队...，相比单独的分类器，利用层次化文本分类算法能更好地解决数据倾斜的问题。有一些例外是，如果要提高召回，可以看到我们连接了一些飞线。这套架构通用，但根据不同的问题难度，每个元分类器可以异构，像有些分类SVM效果很好，有些要结合CNN，有些要结合RNN再处理一下。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-faa404d321e56d9_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-faa404d321e56d9_r.jpg&&&/figure&&p&&br&&/p&&p&上图是一个实体词识别算法的case。基于分词结果和词性标注选取候选，期间可能需要根据知识库做一些拼接，有些实体是几个词的组合，要确定哪几个词结合在一起能映射实体的描述。如果结果映射多个实体还要通过词向量、topic分布甚至词频本身等去歧，最后计算一个相关性模型。&/p&&h2&三、用户标签&/h2&&p&内容分析和用户标签是推荐系统的两大基石。内容分析涉及到机器学习的内容多一些，相比而言，用户标签工程挑战更大。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-7e2b7ed6fcdd_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-7e2b7ed6fcdd_r.jpg&&&/figure&&p&&br&&/p&&p&今日头条常用的用户标签包括用户感兴趣的类别和主题、关键词、来源、基于兴趣的用户聚类以及各种垂直兴趣特征（车型，体育球队，股票等）。还有性别、年龄、地点等信息。性别信息通过用户第三方社交账号登录得到。年龄信息通常由模型预测，通过机型、阅读时间分布等预估。常驻地点来自用户授权访问位置信息，在位置信息的基础上通过传统聚类的方法拿到常驻点。常驻点结合其他信息，可以推测用户的工作地点、出差地点、旅游地点。这些用户标签非常有助于推荐。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-329d9150533cdf11bda75fdde04b864f_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-329d9150533cdf11bda75fdde04b864f_r.jpg&&&/figure&&p&&br&&/p&&p&当然最简单的用户标签是浏览过的内容标签。但这里涉及到一些数据处理策略。主要包括：一、过滤噪声。通过停留时间短的点击，过滤标题党。二、热点惩罚。对用户在一些热门文章（如前段时间PG One的新闻）上的动作做降权处理。理论上，传播范围较大的内容，置信度会下降。三、时间衰减。用户兴趣会发生偏移，因此策略更偏向新的用户行为。因此，随着用户动作的增加，老的特征权重会随时间衰减，新动作贡献的特征权重会更大。四、惩罚展现。如果一篇推荐给用户的文章没有被点击，相关特征（类别，关键词，来源）权重会被惩罚。当然同时，也要考虑全局背景，是不是相关内容推送比较多，以及相关的关闭和dislike信号等。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-ce40d1e358fde0_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-ce40d1e358fde0_r.jpg&&&/figure&&p&&br&&/p&&p&用户标签挖掘总体比较简单，主要还是刚刚提到的工程挑战。头条用户标签第一版是批量计算框架，流程比较简单，每天抽取昨天的日活用户过去两个月的动作数据，在Hadoop集群上批量计算结果。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-6d7c24492a72edf315e8a2_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-6d7c24492a72edf315e8a2_r.jpg&&&/figure&&p&&br&&/p&&p&但问题在于，随着用户高速增长，兴趣模型种类和其他批量处理任务都在增加，涉及到的计算量太大。2014年，批量处理任务几百万用户标签更新的Hadoop任务，当天完成已经开始勉强。集群计算资源紧张很容易影响其它工作，集中写入分布式存储系统的压力也开始增大，并且用户兴趣标签更新延迟越来越高。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-c3c1a0defc06886cbb3f2d4ed04ed0a0_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-c3c1a0defc06886cbb3f2d4ed04ed0a0_r.jpg&&&/figure&&p&&br&&/p&&p&面对这些挑战。2014年底今日头条上线了用户标签Storm集群流式计算系统。改成流式之后，只要有用户动作更新就更新标签，CPU代价比较小，可以节省80%的CPU时间，大大降低了计算资源开销。同时，只需几十台机器就可以支撑每天数千万用户的兴趣模型更新，并且特征更新速度非常快，基本可以做到准实时。这套系统从上线一直使用至今。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-fc67aad379bdb07fcc501_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-fc67aad379bdb07fcc501_r.jpg&&&/figure&&p&&br&&/p&&p&当然，我们也发现并非所有用户标签都需要流式系统。像用户的性别、年龄、常驻地点这些信息，不需要实时重复计算，就仍然保留daily更新。&/p&&h2&四、评估分析&/h2&&p&上面介绍了推荐系统的整体架构，那么如何评估推荐效果好不好？&/p&&p&有一句我认为非常有智慧的话，“一个事情没法评估就没法优化”。对推荐系统也是一样。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-36cdaf17b7_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-36cdaf17b7_r.jpg&&&/figure&&p&&br&&/p&&p&事实上，很多因素都会影响推荐效果。比如侯选集合变化，召回模块的改进或增加，推荐特征的增加，模型架构的改进在，算法参数的优化等等，不一一举例。评估的意义就在于，很多优化最终可能是负向效果，并不是优化上线后效果就会改进。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-2504dbfaad1e874a3207ac_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-2504dbfaad1e874a3207ac_r.jpg&&&/figure&&p&&br&&/p&&p&全面的评估推荐系统，需要完备的评估体系、强大的实验平台以及易用的经验分析工具。所谓完备的体系就是并非单一指标衡量，不能只看点击率或者停留时长等，需要综合评估。过去几年我们一直在尝试，能不能综合尽可能多的指标合成唯一的评估指标，但仍在探索中。目前，我们上线还是要由各业务比较资深的同学组成评审委员会深入讨论后决定。&/p&&p&很多公司算法做的不好，并非是工程师能力不够，而是需要一个强大的实验平台，还有便捷的实验分析工具，可以智能分析数据指标的置信度。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-164ba16ec30fde5c7de2e0_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-164ba16ec30fde5c7de2e0_r.jpg&&&/figure&&p&&br&&/p&&p&一个良好的评估体系建立需要遵循几个原则，首先是兼顾短期指标与长期指标。我在之前公司负责电商方向的时候观察到，很多策略调整短期内用户觉得新鲜，但是长期看其实没有任何助益。&/p&&p&其次，要兼顾用户指标和生态指标。今日头条作为内容分创作平台，既要为内容创作者提供价值，让他更有尊严的创作，也有义务满足用户，这两者要平衡。还有广告主利益也要考虑，这是多方博弈和平衡的过程。&/p&&p&另外，要注意协同效应的影响。实验中严格的流量隔离很难做到，要注意外部效应。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-9388c1bee9a5a2b7b83b840e91b2da56_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-9388c1bee9a5a2b7b83b840e91b2da56_r.jpg&&&/figure&&p&&br&&/p&&p&强大的实验平台非常直接的优点是，当同时在线的实验比较多时，可以由平台自动分配流量，无需人工沟通，并且实验结束流量立即回收，提高管理效率。这能帮助公司降低分析成本，加快算法迭代效应，使整个系统的算法优化工作能够快速往前推进。&/p&&p&&br&&/p&&figure&&img src=&https://pic1.zhimg.com/v2-7c6c3ebf209fd825a1ce00d714a49d18_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic1.zhimg.com/v2-7c6c3ebf209fd825a1ce00d714a49d18_r.jpg&&&/figure&&p&&br&&/p&&p&这是头条A/B Test实验系统的基本原理。首先我们会做在离线状态下做好用户分桶，然后线上分配实验流量，将桶里用户打上标签，分给实验组。举个例子，开一个10%流量的实验，两个实验组各5%，一个5%是基线，策略和线上大盘一样，另外一个是新的策略。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-e846cb6ca778c0c27a0dba30c2dc958b_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-e846cb6ca778c0c27a0dba30c2dc958b_r.jpg&&&/figure&&p&&br&&/p&&p&实验过程中用户动作会被搜集，基本上是准实时，每小时都可以看到。但因为小时数据有波动，通常是以天为时间节点来看。动作搜集后会有日志处理、分布式统计、写入数据库，非常便捷。&/p&&p&&br&&/p&&figure&&img src=&https://pic2.zhimg.com/v2-a3f6d554ce6e42817fdee217ac7c55d9_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic2.zhimg.com/v2-a3f6d554ce6e42817fdee217ac7c55d9_r.jpg&&&/figure&&p&&br&&/p&&p&在这个系统下工程师只需要设置流量需求、实验时间、定义特殊过滤条件，自定义实验组ID。系统可以自动生成：实验数据对比、实验数据置信度、实验结论总结以及实验优化建议。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-9ec108ce4c058a2f9b44f_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-9ec108ce4c058a2f9b44f_r.jpg&&&/figure&&p&&br&&/p&&p&当然，只有实验平台是远远不够的。线上实验平台只能通过数据指标变化推测用户体验的变化，但数据指标和用户体验存在差异，很多指标不能完全量化。很多改进仍然要通过人工分析，重大改进需要人工评估二次确认。&/p&&h2&五、内容安全&/h2&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-069bfeb111ee39070a88_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-069bfeb111ee39070a88_r.jpg&&&/figure&&p&&br&&/p&&p&最后要介绍今日头条在内容安全上的一些举措。头条现在已经是国内最大的内容创作与分发凭条，必须越来越重视社会责任和行业领导者的责任。如果1%的推荐内容出现问题，就会产生较大的影响。&/p&&p&因此头条从创立伊始就把内容安全放在公司最高优先级队列。成立之初，已经专门设有审核团队负责内容安全。当时研发所有客户端、后端、算法的同学一共才不到40人，头条非常重视内容审核。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-17ba5f74e2b70c73837c6_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-17ba5f74e2b70c73837c6_r.jpg&&&/figure&&p&&br&&/p&&p&现在，今日头条的内容主要来源于两部分，一是具有成熟内容生产能力的PGC平台&/p&&p&一是UGC用户内容，如问答、用户评论、微头条。这两部分内容需要通过统一的审核机制。如果是数量相对少的PGC内容，会直接进行风险审核，没有问题会大范围推荐。UGC内容需要经过一个风险模型的过滤，有问题的会进入二次风险审核。审核通过后，内容会被真正进行推荐。这时如果收到一定量以上的评论或者举报负向反馈，还会再回到复审环节，有问题直接下架。整个机制相对而言比较健全，作为行业领先者，在内容安全上，今日头条一直用最高的标准要求自己。&/p&&p&&br&&/p&&figure&&img src=&https://pic3.zhimg.com/v2-913b877deedf3e_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic3.zhimg.com/v2-913b877deedf3e_r.jpg&&&/figure&&p&&br&&/p&&p&分享内容识别技术主要鉴黄模型，谩骂模型以及低俗模型。今日头条的低俗模型通过深度学习算法训练，样本库非常大，图片、文本同时分析。这部分模型更注重召回率，准确率甚至可以牺牲一些。谩骂模型的样本库同样超过百万，召回率高达95%+，准确率80%+。如果用户经常出言不讳或者不当的评论，我们有一些惩罚机制。&/p&&p&&br&&/p&&figure&&img src=&https://pic4.zhimg.com/v2-f09b34b4f8c2ddcd20de8_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&640& data-rawheight=&360& class=&origin_image zh-lightbox-thumb& width=&640& data-original=&https://pic4.zhimg.com/v2-f09b34b4f8c2ddcd20de8_r.jpg&&&/figure&&p&&br&&/p&&p&泛低质识别涉及的情况非常多，像假新闻、黑稿、题文不符、标题党、内容质量低等等，这部分内容由机器理解是非常难的，需要大量反馈信息，包括其他样本信息比对。目前低质模型的准确率和召回率都不是特别高，还需要结合人工复审，将阈值提高。目前最终的召回已达到95%，这部分其实还有非常多的工作可以做。头条人工智能实验室李航老师目前也在和密歇根大学共建科研项目，设立谣言识别平台。&/p&&p&以上是头条推荐系统的原理分享，希望未来得到更多的建议，帮助我们更好改进工作。&/p&
本文来源于今日头条作者：曹欢欢博士 - 今日头条算法架构师今天，算法分发已经是信息平台、搜索引擎、浏览器、社交软件等几乎所有软件的标配，但同时，算法也开始面临质疑、挑战和误解。今日头条的推荐算法，从2012年9月第一版开发运行至今，已经经过四次…
&figure&&img src=&https://pic2.zhimg.com/v2-c9ae0dab0f86c07e8ede_b.jpg& data-rawwidth=&1000& data-rawheight=&600& class=&origin_image zh-lightbox-thumb& width=&1000& data-original=&https://pic2.zhimg.com/v2-c9ae0dab0f86c07e8ede_r.jpg&&&/figure&&p&&b&作者丨苏剑林&/b&&/p&&p&&b&单位丨广州火焰信息科技有限公司&/b&&/p&&p&&b&研究方向丨NLP，神经网络&/b&&/p&&p&&b&个人主页丨kexue.fm&/b&&/p&&h2&&b&前言&/b&&/h2&&p&今天在 QQ 群里的讨论中看到了 Focal Loss，经搜索它是 Kaiming 大神团队在他们的论文&b&Focal Loss for Dense Object Detection&/b& 提出来的损失函数，利用它改善了图像物体检测的效果。不过我很少做图像任务，不怎么关心图像方面的应用。&/p&&p&本质上讲，Focal Loss 就是一个解决&b&分类问题中类别不平衡、分类难度差异&/b&的一个 loss，总之这个工作一片好评就是了。大家还可以看知乎的讨论：&a href=&https://www.zhihu.com/question/& class=&internal&&如何评价 Kaiming 的 Focal Loss for Dense Object Detection？&/a&&/p&&p&看到这个 loss，开始感觉很神奇，感觉大有用途。&b&因为在 NLP 中，也存在大量的类别不平衡的任务。&/b&&/p&&p&最经典的就是序列标注任务中类别是严重不平衡的，比如在命名实体识别中，显然一句话里边实体是比非实体要少得多，这就是一个类别严重不平衡的情况。&b&我尝试把它用在我的基于序列标注的问答模型中，也有微小提升。&/b&嗯，这的确是一个好 loss。 &/p&&p&接着我再仔细对比了一下，我发现&b&这个 loss 跟我昨晚构思的一个 loss 具有异曲同工之理&/b&。这就促使我写这篇文章了。我将从我自己的思考角度出发，来分析这个问题，最后得到 Focal Loss，也给出我昨晚得到的类似的 loss。&/p&&h2&&b&硬截断&/b&&/h2&&p&整篇文章都是从二分类问题出发，同样的思想可以用于多分类问题。二分类问题的标准 loss 是交叉熵。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-b5ee1f2d51a1c65d8566_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&900& data-rawheight=&112& class=&origin_image zh-lightbox-thumb& width=&900& data-original=&https://pic3.zhimg.com/v2-b5ee1f2d51a1c65d8566_r.jpg&&&/figure&&p&其中 y∈{0,1} 是真实标签，y? 是预测值。当然，对于二分类我们几乎都是用 sigmoid 函数激活 y? =σ(x)，所以相当于：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-afaa3cf22e3c_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&926& data-rawheight=&120& class=&origin_image zh-lightbox-thumb& width=&926& data-original=&https://pic1.zhimg.com/v2-afaa3cf22e3c_r.jpg&&&/figure&&p&我们有 1-σ(x)=σ(-x)。&/p&&p&我在上半年写过的文章&a href=&http://link.zhihu.com/?target=http%3A//kexue.fm/archives/4293/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&文本情感分类（四）：更好的损失函数&/a&中，曾经针对“集中精力关注难分样本”这个想法提出了一个“硬截断”的 loss，形式为：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-9f7cedbcadb5110d5fff12_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&292& data-rawheight=&88& class=&content_image& width=&292&&&/figure&&p&其中：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-28b865f3b3bebf292ee188e97dca8662_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&744& data-rawheight=&136& class=&origin_image zh-lightbox-thumb& width=&744& data-original=&https://pic3.zhimg.com/v2-28b865f3b3bebf292ee188e97dca8662_r.jpg&&&/figure&&p&这样的做法就是：&b&正样本的预测值大于 0.5 的，或者负样本的预测值小于 0.5 的，我都不更新了，把注意力集中在预测不准的那些样本，当然这个阈值可以调整。&/b&这样做能部分地达到目的，但是所需要的迭代次数会大大增加。&/p&&p&原因是这样的：以正样本为例，&b&我只告诉模型正样本的预测值大于 0.5 就不更新了，却没有告诉它要“保持”大于 0.5&/b&，所以下一阶段，它的预测值就很有可能变回小于 0.5 了。当然，如果是这样的话，下一回合它又被更新了，这样反复迭代，理论上也能达到目的，但是迭代次数会大大增加。&/p&&p&所以，要想改进的话，重点就是&b&“不只是要告诉模型正样本的预测值大于0.5就不更新了，而是要告诉模型当其大于0.5后就只需要保持就好了”&/b&。好比老师看到一个学生及格了就不管了，这显然是不行的。如果学生已经及格，那么应该要想办法要他保持目前这个状态甚至变得更好，而不是不管。&/p&&h2&&b&软化 loss&/b&&/h2&&p&硬截断会出现不足，关键地方在于因子 λ(y,y?) 是不可导的，或者说我们认为它导数为 0，因此这一项不会对梯度有任何帮助，从而我们不能从它这里得到合理的反馈（也就是模型不知道“保持”意味着什么）。 &/p&&p&解决这个问题的一个方法就是“软化”这个 loss，&b&“软化”就是把一些本来不可导的函数用一些可导函数来近似&/b&，数学角度应该叫“光滑化”。这样处理之后本来不可导的东西就可导了，类似的算例还有&a href=&http://link.zhihu.com/?target=http%3A//kexue.fm/archives/4277/& class=& wrap external& target=&_blank& rel=&nofollow noreferrer&&梯度下降和EM算法：系出同源，一脉相承&/a&中的 kmeans 部分。我们首先改写一下 &i&L*&/i&。&/p&&figure&&img src=&https://pic3.zhimg.com/v2-03e2b916dff8c735e79486_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&608& data-rawheight=&124& class=&origin_image zh-lightbox-thumb& width=&608& data-original=&https://pic3.zhimg.com/v2-03e2b916dff8c735e79486_r.jpg&&&/figure&&p&这里的 &i&θ&/i& 就是单位阶跃函数：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-032edd57f8da203e0f85ac848b24e096_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&316& data-rawheight=&210& class=&content_image& width=&316&&&/figure&&p&这样的 &i&L*&/i& 跟原来的是完全等价的，由于 &i&σ(0)=0.5&/i&，因此它也等价于：&/p&&figure&&img src=&https://pic3.zhimg.com/v2-bd8a765e69bd5084dfc986_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&520& data-rawheight=&108& class=&origin_image zh-lightbox-thumb& width=&520& data-original=&https://pic3.zhimg.com/v2-bd8a765e69bd5084dfc986_r.jpg&&&/figure&&p&这时候思路就很明显了，要想“软化”这个 loss，就得“软化” &i&θ(x)&/i&，而&b&软化它就再容易不过，它就是 sigmoid 函数&/b&。我们有：&/p&&figure&&img src=&https://pic2.zhimg.com/v2-cbd_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&306& data-rawheight=&84& class=&content_image& width=&306&&&/figure&&p&所以很显然，我们将 &i&θ(x)&/i& 替换为 &i&σ(Kx)&/i& 即可：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-03ce0df8eeabc94851d64_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&564& data-rawheight=&126& class=&origin_image zh-lightbox-thumb& width=&564& data-original=&https://pic1.zhimg.com/v2-03ce0df8eeabc94851d64_r.jpg&&&/figure&&p&这就是我昨晚思考得到的 loss 了，显然实现上也是很容易的。&/p&&p&现在跟 Focal Loss 做个比较。&/p&&h2&&b&Focal Loss&/b&&/h2&&p&Kaiming 大神的 Focal Loss 形式是：&/p&&figure&&img src=&https://pic2.zhimg.com/v2-ec1c9df2be4bfecea241_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&508& data-rawheight=&120& class=&origin_image zh-lightbox-thumb& width=&508& data-original=&https://pic2.zhimg.com/v2-ec1c9df2be4bfecea241_r.jpg&&&/figure&&p&如果落实到 &i&y? =σ(x)&/i& 这个预测，那么就有：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-e443edbddbbff3bec92f68_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&538& data-rawheight=&124& class=&origin_image zh-lightbox-thumb& width=&538& data-original=&https://pic1.zhimg.com/v2-e443edbddbbff3bec92f68_r.jpg&&&/figure&&p&特别地，&b&如果&/b& &b&&i&K&/i&&/b& &b&和&/b& &b&&i&γ&/i&&/b& &b&都取 1，那么&/b& &b&&i&L**=Lfl&/i&&/b&。 &/p&&p&事实上 &i&K&/i& 和 &i&γ&/i& 的作用都是一样的，都是调节权重曲线的陡度，只是调节的方式不一样。注意&i&L**&/i& 或 &i&Lfl&/i& 实际上都已经包含了对不均衡样本的解决方法，或者说，类别不均衡本质上就是分类难度差异的体现。&/p&&p&&b&比如负样本远比正样本多的话，模型肯定会倾向于数目多的负类（可以想象全部样本都判为负类），这时候，负类的&/b& &i&&b&y? γ&/b&&/i& &b&或&/b& &b&&i&σ(Kx&/i&) 都很小，而正类的&/b& &b&&i&(1-y? )γ&/i&&/b& &b&或&/b& &i&&b&σ(-Kx)&/b&&/i& &b&就很大，这时候模型就会开始集中精力关注正样本。&/b& &/p&&p&当然，Kaiming 大神还发现对 &i&Lfl&/i& 做个权重调整，结果会有微小提升。 &/p&&figure&&img src=&https://pic1.zhimg.com/v2-b38f32bbbc1fd6c8f94b394_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&600& data-rawheight=&130& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic1.zhimg.com/v2-b38f32bbbc1fd6c8f94b394_r.jpg&&&/figure&&p&通过一系列调参，得到 &i&α=0.25, γ=2&/i&（在他的模型上）的效果最好。注意在他的任务中，正样本是属于少数样本，也就是说，本来正样本难以“匹敌”负样本，但经过 &i&(1-y? )γ&/i& 和 &i&y?γ&/i& 的“操控”后，也许形势还逆转了，还要对正样本降权。&/p&&p&不过我认为这样调整只是经验结果，理论上很难有一个指导方案来决定 &i&α&/i& 的值，如果没有大算力调参，倒不如直接让 &i&α=0.5&/i&（均等）。&/p&&h2&&b&多分类&/b&&/h2&&p&Focal Loss 在多分类中的形式也很容易得到，其实就是：&/p&&figure&&img src=&https://pic2.zhimg.com/v2-9b26aaa65a56f9f8fe3021_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&350& data-rawheight=&94& class=&content_image& width=&350&&&/figure&&p&&i&y?t&/i& 是目标的预测值，一般就是经过 softmax 后的结果。那我自己构思的 &i&L**&/i& 怎么推广到多分类？也很简单：&/p&&figure&&img src=&https://pic1.zhimg.com/v2-739ba293ab3cac5f25b0cc_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&576& data-rawheight=&78& class=&origin_image zh-lightbox-thumb& width=&576& data-original=&https://pic1.zhimg.com/v2-739ba293ab3cac5f25b0cc_r.jpg&&&/figure&&p&这里 &i&xt&/i& 也是目标的预测值，但它是 softmax 前的结果。&/p&&h2&&b&结语&/b&&/h2&&p&什么？你得到了跟 Kaiming 大神一样想法的东西？&/p&&p&不不不，本文只是对 Kaiming 大神的 Focal Loss 的一个介绍而已。更准确地说，是应对分类不平衡、分类难度差异的一些方案的介绍，并尽可能给出自己的看法而已。当然，本文这样的写法难免有附庸风雅、东施效颦之嫌，请读者海涵。&/p&&blockquote&&b&我是彩蛋&/b&&/blockquote&&p&&b&解锁新姿势：用微信刷论文！&/b&&/p&&p&PaperWeekly小程序上线啦&/p&&p&&b&今日arXiv√猜你喜欢√热门资源√&/b&&/p&&p&随时紧跟最新最热论文&/p&&p&&b&解锁方式&/b&&/p&&p&1. 扫描下方小程序码打开小程序&/p&&p&2. 用PaperWeekly社区账号进行登陆&/p&&p&3. 登陆后即可解锁所有功能&/p&&figure&&img src=&https://pic3.zhimg.com/v2-ddaee17eace2_b.jpg& data-caption=&& data-size=&normal& data-rawwidth=&258& data-rawheight=&258& class=&content_image& width=&258&&&/figure&&p&&b&关于PaperWeekly&/b&&/p&&p&PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域，欢迎在公众号后台点击&b&「交流群」&/b&，小助手将把你带入 PaperWeekly 的交流群里。&/p&&p&&b&微信公众号：PaperWeekly&/b&&/p&&p&&b&新浪微博：@PaperWeekly&/b&&/p&
作者丨苏剑林单位丨广州火焰信息科技有限公司研究方向丨NLP，神经网络个人主页丨kexue.fm前言今天在 QQ 群里的讨论中看到了 Focal Loss，经搜索它是 Kaiming 大神团队在他们的论文Focal Loss for Dense Object Detection 提出来的损失函数，利用它改善了图…
&p&这个答案很长，干货很多，目前来看正在奔着成书的节奏去了（虽然这书估计没一个出版社敢出版）。&/p&&p&为了方便大家阅读，我这里整理了一份摘要和目录。本答案将不定时更新。&/p&&p&&b&第1节
中国房价涨成这样？&/b&&/p&&p&本节主要在于澄清，中国房价就整体而言并不是“涨了十几年”，而是存在很大的地区差异性。当然，一二线这两年确实涨得很厉害。&/p&&p&&b&第2节
经济危机征兆？&/b&&/p&&p&本节是本回答的核心章节。本节的上半部分简述了一小部分世界金融发展史，下半部分则叙述了答主的核心观点以及对于GDP的解读和看法。&/p&&p&&b&第3节
房价与GDP&/b&&/p&&p&回到楼市的话题，重点阐述了过去两年中国出现的楼市暴涨现象的根源以及其与GDP（也就是第二节所述观点）之间的内在联系。&/p&&p&&b&第4节
创业、融资和泡沫&/b&&/p&&p&本节主要阐述答主关于目前鼓励创业的实质及泡沫的观点。&/p&&p&&b&第5节
产业转型的实质：资本的盛宴&/b&&/p&&p&本节主要阐述产业转型过程中无法解决的几个固有矛盾。&/p&&p&&b&第6节
金融危机？&/b&&/p&&p&本节主要是对于未来中国是否会发生金融危机的总体展望，以及答主的其他一些预测。&/p&&p&&b&第7节
中产与剥削&/b&&/p&&p&本节主要阐述中国目前最大的受剥削群体（同时也是支撑本回答第2节核心观点的群体）。&/p&&p&另外，拖到结尾还有惊喜。&/p&&p&********************&/p&&p&以下是正文部分。&/p&&p&&b&一、中国房价涨成这样？&/b&&/p&&p&事实上，自从&a href=&tel:&&&/a&年全国范围的房价狂飙突进运动之后，各城市之间的房价就悄悄开始了分化，再也不是铁板一块、共同进退。&/p&&p&以下来自国家统计局在2016年1月公布的数据：&/p&&p&&br&&/p&&p&&br&&/p&&figure&&img data-rawheight=&301& src=&https://pic1.zhimg.com/v2-06fe980d84d9d762dd0bddd0327de6ec_b.jpg& data-rawwidth=&582& class=&origin_image zh-lightbox-thumb& width=&582& data-original=&https://pic1.zhimg.com/v2-06fe980d84d9d762dd0bddd0327de6ec_r.jpg&&&/figure&&p&&br&&/p&&figure&&img data-rawheight=&329& src=&https://pic4.zhimg.com/v2-9cb10e7c7b67b_b.jpg& data-rawwidth=&589& class=&origin_image zh-lightbox-thumb& width=&589& data-original=&https://pic4.zhimg.com/v2-9cb10e7c7b67b_r.jpg&&&/figure&&p&&br&&/p&&p&上述的走势图可以看到：二三线城市的总体房价从2011年以后就一直处于相对蛰伏状态，在2012年和2014年出现了小幅下跌；而一线城市房价在2013年就出现了一次抛离，到2015年到2016年则出现了大幅抛离。&/p&&p&现实经验也告诉我们，在这几年中，很多二三四五线城市的房价即便没有大幅下跌，也是多年企稳，涨也没涨多少。从2015年开始，中国各城市之间的房价分化趋势越来越加剧。2015年下半年到2016年上半年出现了一线城市大涨，重点二线城市（如苏州、南京、合肥）整体上涨，而多数二三四线城市房价不涨或下跌的现象。&/p&&p&2016年1月各城市的房价涨幅，就反应了这种冰火两重天的境况：&/p&&p&&br&&/p&&figure&&img data-rawheight=&291& src=&https://pic3.zhimg.com/v2-dc0c2e9aa5a8f87fe5eb9a_b.jpg& data-rawwidth=&507& class=&origin_image zh-lightbox-thumb& width=&507& data-original=&https://pic3.zhimg.com/v2-dc0c2e9aa5a8f87fe5eb9a_r.jpg&&&/figure&&p&&b&当然，从去年到今年，由于央妈赤裸裸的把企业杠杆转到居民储蓄部门，部分二三线城市也开始上涨；但至于“涨幅”如何，则更多来自于媒体和房产中介的鼓噪。神州大地上几百个城市，其中大多数城市的房价早已涨不动了。&/b&&/p&&p&另外，早在&a href=&tel:&&&/a&年时候，某些过度炒作城市的房价，如温州、鄂尔多斯，就已经率先发生了泡沫破灭。杭州的房价也曾在2012年出现过下跌的情况。&/p&&p&以下为温州房价自2011年8月至2013年6月的走势图。可以看到，一度高高在上、甚至可以与一线城市平起平坐的温州房价，却在2012年出现了大幅下跌。&/p&&p&&br&&/p&&figure&&img data-rawheight=&220& src=&https://pic2.zhimg.com/v2-cfba5b41131b82aec1e051_b.jpg& data-rawwidth=&448& data-tags=&emoji& class=&origin_image zh-lightbox-thumb& width=&448& data-original=&https://pic2.zhimg.com/v2-cfba5b41131b82aec1e051_r.jpg&&&/figure&&p&&br&&/p&&p&时至今日，我们再也不能说“中国房价将会上涨”或是“中国房价将会下跌”，而只能说“某个城市房价将会上涨/下跌”。&/p&&p&插播一个小福利：今天早上买蛋饼的时候，一个顾客跟蛋饼摊阿姨说：现在房子太贵啦！（我在魔都）正在铺蛋饼的阿姨头也没抬：&b&房子不贵啊，我老家那儿的房子可便宜了。&/b& &/p&&p&所以说智慧在民间啊。&/p&&p&&b&二、经济危机征兆？&/b&&/p&&p&&br&&/p&&figure&&img data-rawheight=&348& src=&https://pic4.zhimg.com/v2-ce565bd5f25057_b.jpg& data-rawwidth=&600& class=&origin_image zh-lightbox-thumb& width=&600& data-original=&https://pic4.zhimg.com/v2-ce565bd5f25057_r.jpg&&&/figure&&p&&br&&/p&&p&&b&日，雷曼兄弟倒闭，国际金融危机突然爆发。几乎是以迅雷不及掩耳盗铃之势传染到了中国，GDP倏地一下降到了6%上方。&/b&&/p&&p&&b&这是一个很重要的信号——这告诉我们，在中国这样的非典型市场经济国家，GDP增速低于6%，很可能就表明“有中国特色的经济危机”已经到来。&/b&&/p&&p&下面我们先来看看经济危机这个术语的本来含义，以及历史回顾。&/p&&p&经济危机是西方资本主义市场经济体系下的一个术语，其含义是：经济危机指的是一个或多个国民经济或整个世界经济在一段比较长的时间内不断收缩（&b&负的经济增长率&/b&）。经济危机是经济发展过程中周期爆发的&b&产能过剩&/b&的危机，也是经济周期中的决定性阶段。 &/p&&p&西方经济危机的经典图景就是产能严重过剩，也就是我们中学政治课本上看到的那个烧不起煤因为煤生产得太多的对话。另外，经济危机也导致GDP出现负增长，宏观经济学概念中认为连续两个季度GDP负增长就可以定义为经济衰退（Recession）。&/p&&p&资本主义世界中的产能过剩是由于自由市场竞争中市场失灵所导致的，是古典自由主义经济学的内在弊端。因此欧美各国开始采用国家干预经济的方式（罗斯福新政，甚至是纳粹主义，都是国家干预经济的方式）缓解、避免经济危机。其本质是凯恩斯主义。&/p&&p&凯恩斯主义鼓吹什么呢？主张国家采用扩张性的经济政策，通过增加需求促进经济增长。即扩大政府开支，实行财政赤字，刺激经济，维持繁荣。&/p&&p&翻译成人话就是：&b&政府要印钱&/b&。&/p&&p&在古典自由市场时期，西方国家政府除了打仗时候要发国债，和平时期哪敢卯足了劲开动印钞机啊？但是自从发现了自由市场的缺点以后，还真得依靠政府来推动。&b&很形象的一个比喻就是，一个国家经济不景气，国王找了经济学家来出谋划策。经济学家说你在地上挖一个大坑，再把它填起来就是了。挖大坑、填大坑都需要政府调动人力物力财力，于是进一步促进上下游产业繁荣，经济就这么搞活了。但是自由市场下谁会脑抽了去挖坑？这就是政府在经济活动中发挥作用。请大家记住这个比喻，下面还会提到。&/b&&/p&&p&但是在二战以后，政府印钱一度是有节操的。用术语来说就是有“锚”的。这个锚就是布雷顿森林体系：美元与黄金挂钩，其他国家货币与美元挂钩。由于黄金储备是有限的，是硬通货，美元一挂钩，也成了硬通货。&/p&&p&这个森林体系的初衷是好的：美元以黄金为锚，你政府印钱就不能哗哗哗地把钱印成废纸了吧？像1920年代德国那样，钱比废纸还废，一美元能兑换42万亿马克就没意思了。&/p&&p&但是再好的体系设计，也抵不过人类的瞎搞。人类最大的瞎搞就是总要到处打仗。美国陷入越战泥潭之后，背上了巨额战争债务。但是美国人背债有个特点：咱善良的中国人是欠人家一百，就得努力赚钱，赚一百来还。老美是欠人家一百，我就印一百美元来还。这可真是无本万利的生意，利用的就是美元的国际霸权地位。&/p&&p&很快，狡猾的法国人就发现：你老美那点黄金储备根本就没法兑换市场上全部的美元。于是嚷嚷的要兑换黄金。尼克松一看，这还了得，造反了不成？于是美国人又有一个特点：虽然平时咱是法治国家，律师地位比谁都高，compliance讲的比谁都起劲，但是关键时候，我违约起来可是一点都不含糊。于是很干脆地宣布布雷顿森林体系作废，黄金与美元脱钩！只留下干瞪眼的法国人，转身拂袖而去，深藏功与名。&/p&&p&布雷顿森林体系尚健在的时候，我在上面说过政府印钱是有节操的。那么破灭以后呢？&/p&&p&毫无疑问：无节操无下限咯！&/p&&p&于是全世界开始了这一轮为期四十多年的、波澜壮阔的利率下降周期。直到现在，降无可降，日本欧洲央行都开始采取负利率了（指的是央行对商业银行的负利率）。&/p&&p&然后大家都发现了一件事：&/p&&p&过去自由市场体系下的经济危机，开始被金融危机取代了。&b&而且几乎是每十年一轮！&/b&&/p&&blockquote&&b&1987年黑色星期一&/b&&br&&br&1987年，因为不断恶化的经济预期和中东局势的不断紧张，当日纽约股票交易所的道·琼斯工业平均指数直线暴跌，造成了华尔街股市的大崩溃。这便是&黑色星期一&。标准普尔指数下跌了20%，无数的人陷入了痛苦。&br&&br&&b&1997年亚洲金融危机&/b&&br&&br&亚洲四小虎一朝回到解放前。&br&&br&&b&2008年世界金融危机&/b&&br&&br&雷曼兄弟申请破产保护、美林“委身”美银、AIG告急等一系列突如其来的“变故”使得世界各国都为美国金融危机而震惊。华尔街对金融衍生产品的“滥用”和对次贷危机的估计不足终酿苦果。此次金融危机迅速引发多米诺骨牌效应，世界各国特别是发展中国家经济基础遭到重创，堪比1929罗斯福执政时期的经济大崩溃。&/blockquote&&figure&&img data-rawheight=&338& src=&https://pic1.zhimg.com/v2-47ad63e720eadb14bb69d_b.jpg& data-rawwidth=&506& data-tags=&emoji& class=&origin_image zh-lightbox-thumb& width=&506& data-original=&https://pic1.zhimg.com/v2-47ad63e720eadb14bb69d_r.jpg&&&/figure&&p&&br&&/p&&p&（黑色星期一）&/p&&p&这是为什么呢？因为钱多必妖。&/p&&ul&&li&市场上钱一泛滥，就很容易给一些高智商犯罪分子兴风作浪的机会。&/li&&li&市场上钱一泛滥，政府一个不留神就会打趔趄（中国政府没打过趔趄？不要太多）&/li&&li&市场上钱一泛滥，就会由于某个突发事件/黑天鹅事件而引发系统性危机，戴维斯双杀，多米诺骨牌。&/li&&/ul&&p&好了，历史回顾部分结束，先去看球了。&/p&&p&***********************&/p&&p&&b&车子在客场极其艰难情况下绝杀拿下3分&/b&，继续写。&/p&&p&前面说到，资本主义国家经典经济危机的特征就是产能相对过剩。这会导致什么连锁反应呢？&/p&&ul&&li&产能过剩 - 产品卖不出去 - 工厂/公司亏损 - 裁员 - 工人普遍失业 &/li&&li&产能过剩 - 产品卖不出去 - 工厂/公司亏损 - 债务违约 - 上下游公司应收账款收不回来 - 上下游公司亏损裁员&/li&&li&社会普遍债务违约 - 银行坏账增加 - 银行破产 &/li&&/ul&&p&&b&失业率&/b&上升，银行破产，经济衰退，这就是我们概念中的经济危机（大家要牢记失业率这个概念，美联储加息有两个重要参考指标，一个是CPI，另一个就是新增非农业部门就业人数和失业率）。&/p&&p&但是你可别忘了，我们是伟大的社会主义国家！用人话说就是：我们可不是什么西方市场经济，更不是自由市场经济。我们现在这种官商结合的资本主义，赤裸裸的资本倒是有了，但可不是马克思韦伯说的那种新教伦理的资本主义精神。&/p&&p&所以我们看到下面这个逻辑和事实链条：&/p&&ul&&li&普遍的产能过剩 - 产品卖不出去 - 国企亏损 - 不裁员（国家买单了，大量僵尸国企继续存在）&/li&&li&普遍的产能过剩 - 产品卖不出去 - 私企亏损裁员 - 鼓励全民创业万众创新 - &b&大量失业青年在街头让人扫二维码&/b&&/li&&li&社会债务违约 - 银行坏账增加 - &/li&&/ul&&p&等等，银行坏账增加那可是实打实的，政府还有什么办法？&/p&&p&办法有的是。早在21世纪初，中国四大国有银行的坏账已经超过1万亿人民币了。就是这时候，长城、信达、华融、东方四大派闪亮登场。别误会，这四家可不是p2p理财平台。而是国家大手笔组建的四大资产管理公司（用人话说就是坏账处理公司）。&/p&&p&他们很慷慨的大笔一挥就把银行的坏账全都接盘接过来了。光阴似箭岁月如梭斗转星移，一晃十多年过去了，这些坏账终于处理了……百分之四十左右。而与此同时，四大国有银行无债一身轻，早就前赴后继的上市了。虽然这个时候四大行的坏账再次超过了一万亿，但人有的是办法，上市公司嘛！而且背后还有国家买单，大不了我再成立四家资产管理公司。&/p&&p&说了这么多，聪明的你估计该有个疑问了：这些手段这么绝妙，能化银行坏账于无形，妙手回春赛华佗，那为什么诺贝尔经济学奖不是每年都颁给中国政府？&/p&&p&答案很简单：所有的风险、债务、后果、损失，已经全都转嫁给普通居民咯。尤其是比较穷的那些。&/p&&p&转嫁的方式就是M2每年蹭蹭的涨，CPI每年蹭蹭的涨，国家向人民征收铸币税，那向来是连眉毛都不会皱一下的。&/p&&p&那么上面说的僵尸国企由国家来买单呢？那照样是通过国家给债务买单的方式间接转嫁、稀释给全体居民。&/p&&p&企业部门尤其是房地产部门去杠杆谁来买单呢？居民把储蓄拿出来，再加上拼命借入银行贷款，房贷创下天量（见下文中的表格），从而以居民加杠杆的方式来帮助企业去杠杆。&/p&&p&鼓励万众创新全民创业，让街头到处是扫二维码的呢？国企我能控制得了失业率，私企控制不了，那我就利用你中国人的智慧（小聪明）啊，善于发财喜欢发财的本能啊，鼓励你上街给人扫二维码。那不是又解决私企的失业问题了吗？&/p&&p&于是，经济危机的两大经典图景——银行破产和大量失业，就全都消融于无形。代价是什么呢？就是屁民们享受不到太多经济发展结果，证据就是（1）国民平均收入的增长小于GDP增长速度；（2）财富基尼系数不断扩大。从而导致一小部分富人得到（说难听就是窃取）了大部分经济发展的果实，而绝大多数穷人，包括那些从来没上过知乎的穷人，手里那些钱却不断缩水。&/p&&p&*********************&/p&&p&说了这洋洋洒洒一大堆，该回到最上面我那个略有点惊悚的言论了：为什么GDP降到6%以下就说明有中国特色的经济危机？什么是有中国特色的经济危机？&b&以及，我前面说过金融危机十年一轮，下一轮会是中国吗？&/b&&/p&&p&先说GDP。&/p&&p&根据经典经济危机定义，中国永远也不会有经济危机，永远也有不会有衰退（Recession）。那是因为经济危机的意思就是GDP增速为负。而中国现在还是六点几呢，按照知乎网友那什么图的说法（我一向看不起这人），比世界上绝大多数发达国家都高。多好啊！&/p&&p&但你别忘了，中国可不是自由市场经济。国家想拉动经济增长，那不要太简单。&b&在地上挖个坑就完事了！&/b&&/p&&p&你别说，还真是这样。你看看遍地那么多高铁站，除了京沪的人满为患以外，小城市的高铁站很多都相对冷清，效益如何只有他们自己心里清楚。我经常出差，有时候看着那些装修豪华，冷冷清清的小城市高铁站就忍不住发愣。&/p&&p&那么每年，&b&政府挖坑式增长&/b&会带来多少经济增长呢？根据我的测算，其实也不是测算，就看政府的口号就知道了：&/p&&p&&b&保8那会儿，政府挖坑式增长的贡献差不多是5-7%&/b&&/p&&p&&b&现在要保6.5%，那么很显然政府挖坑式增长差不多下降到4-6%&/b&&/p&&p&&b&********插播GDP学术解释时间***********&/b&&/p&&p&这里我停下来稍微解释一下。上面这两句看似拍脑袋的结论其实是基于科学分析的，用术语说就是：&/p&&p&&b&与政府推动和主导&u&有关的项目&/u&占GDP的比重为70%-80%左右。“挖坑式增长”只是个比喻，指的是政府出面来推动经济增长（一般较注重解决就业问题而不太注重经济效益），而这就是社会主义市场经济的最大特色之一。&/b&&/p&&p&同志们，GDP的构成知道不？中学课本都教过：投资+消费+净出口。曼昆的宏观经济学还加上了一个政府采购，那么在中国的国情下其实也是政府投资的一部分。&/p&&p&&b&投资指的是生产工具方面的产出，注重未来。&/b&其包括政府投资和民间投资。现在问题是什么呢？就是民间投资极其萎靡。看两个数据就知道：1）&i&2&/i&016 年1-6 月份，民间固定资产投资 158797 亿元，&b&同比名义增长 2.8%&/b&；2）2016年7月以来银行发放居民贷款的数据，其中房贷占很大一部分比例（2016年7月房贷甚至超过100%）。&/p&&p&好了，这就表明，当政府喊出“保***”口号的时候，说明民间已经开始不行了，得靠政府赤膊上阵了。&/p&&p&至于消费呢？&b&消费指的是最终产品方面的产出，注重现在。要注意的是消费不是我们概念中的居民消费，工程项目中采购最终工业产品也叫消费。第三产业也不只是我们概念中的理发餐饮酒店，房地产和金融都是第三产业。从我的项目经验来看，消费方面也是政府主导占大头。何况中国GDP统计里面把政府采购也列在消费部门里面。&/b&&/p&&p&近年来消费占GDP的比重逐年上升，但正如上面的学术解释：投资与消费的比重调整只能说明经济体更注重未来的产出还是现在的产出，所以后发国家的投资比重较大，而经过高速增长基建完善的国家其投资比重必然逐步下降。&/p&&p&净出口就不提了，自从人民币启动对美元的升值周期以来，这个部门在GDP舞台上就长期没有存在感了。&/p&&p&政府投资和主导的形式当然是多种多样的，比如有人说高铁不是政府出钱啊？对啊，政府出钱有各种花式出法。&b&比如什么PPP啦，BOT啦&/b&，都是从西方资本主义世界学过来的。换算成人话说就是：政府登高呼号，底下应者云集。钱是民间出的，或者东西是民间造的，但政府是牵头的。然而问题来了：东西造出来了效益不好怎么办？政府可不管，反正我登高呼号就行了。&/p&&p&现在第三产业发展不错，但是——我又要说但是——&b&很多是政府无视经济规律，单纯为了制造新经济增长点解决就业而倡导的结果。&/b&就比如民间动漫产业，很多地方政府单凭生产的集数来给予奖励，这就导致内容上的粗制滥造。房地产和金融这种第三产业就更不用提了。&/p&&p&&b&********插播GDP学术解释时间结束********&/b&&/p&&p&那么，如果GDP降到6%以下呢？当初金融危机，不知道大家有没有印象。全社会普遍的哀鸿遍野，结果GDP还有六点几，这里面估计几乎全是政府挖坑式增长所带来的。&/p&&p&所以，有中国特色的经济危机的特点就是：&/p&&p&1）经济增长全靠政府挖坑，其他部门奄奄一息。&/p&&p&2）政府继续大量印钱，把所有风险、债务、后果、损失转嫁、稀释给居民。&/p&&p&3）至于那些失业的、待业的、家里蹲的，政府鼓励你们创业，给你们画一个大饼，至于大饼吃不吃得到，政府不负责。&/p&&p&&b&大家注意到没有，这不是西方国家那种猛烈的、突然的、让人来不及反应就被掐死的经济危机。&/b&&/p&&p&&b&而是：温水煮青蛙式的、温柔的、缓释的、潜移默化式的经济危机。&/b&&/p&&p&这个话题太大，还有金融危机以及与房价互动没讲。先洗洗睡，之后有时间继续讲。&/p&&p&&b&***********************&/b&&/p&&p&在此先感谢仁人志士出手相助，让我能继续编辑这个答案。&/p&&p&&b&三、房价与GDP&/b&&/p&&p&GDP指的是最终产品和服务价值。买卖二手房对GDP并无直接贡献，因为二手房交易额不统计在GDP里面。你去二手市场上倒卖个千百次都没有新的财富产生，自然就没GDP了。&/p&&p&那么为啥XX要纵容一线城市、包括若干二线城市房价上天呢？&/p&&p&我们来插播一段新闻。&/p&&blockquote&&i&3月14日，国新办举行月国民经济运行情况发布会，国家统计局新闻发言人盛来运在会上披露，&b&今年1-2月全国房地产开发投资9854亿元，同比增长8.9%，增速比去年全年提高2个百分点，也创下了近两年以来的新高。&/b&有分析指出，尽管多地楼市调控相继收紧，&b&但随着去库存政策生效&/b&，部分热门城市的土地市场竞争依旧激烈，成为推高商品房投资增速的重要原因。 &/i& &i&去年全国房地产投资数据始终处于小幅波动的状态，&/i& &i&最高涨幅出现在1-4月，但也仅为7.2%，随即就在年中跌落至5.3%，对比不难发现，今年开年的投资数据确实出现了明显回暖。&/i&&/blockquote&&p&国家最关心的是两件事：去库存
房地产投资增速。前者是给房地产商去杠杆、拆除债务定时炸弹；后者则是直接创造GDP引擎。那么要如何达成这个目标呢？&/p&&p&《圣经旧约央妈创世纪》&/p&&p&起初，央妈创造天地。&/p&&p&第一日，央妈说：要有钱。于是楼市里就有了钱。&/p&&p&第二日，忽如一夜春风来，一线楼市梨花开。一线居民开始纷纷贷款买房，还吸引了二三四线的土豪过去买房，然后一线繁荣、其他城市萧条。这就是2015年第二季度的情况。&/p&&p&第三日，一线楼市的热度开始传染到少数二线楼市，比如苏州南京。苏州南京的楼市开始狂飙突进。这就是2015年第三季度到2016年第二季度的情况。这时候房地产投资开始回升，部分二线楼市去库存目标实现。但三四线跟不上啊？于是2016年年中房地产投资增速有所回落。&/p&&p&第四日，央妈下面的商业银行再接再厉不屈不挠，房贷不断创出新高，甚至创下在单月超过了全社会贷款总量的神迹，堪比耶稣用五张饼两条鱼喂饱五千人。于是一二线楼市的热度逐渐扩散到全国。这是2016年第三季度的情况。&/p&&p&第五日，大家开始看见很多过去销声匿迹很久的城市也出现在房价涨幅榜名单里面。国家终于开始实现三四线城市去库存目标，于是顺手把魔都给限购了。这是2016年第四季度的情况。&/p&&p&第六日，随着热点城市增加、成交量大大增加，开发商拿地投资的积极性也不断增加，房地产投资增速大大回升。央妈看着一切所造的都甚好。这是2017年第一季度的情况。&/p&&p&第七日，央妈造物的工已经完毕、就在第七日歇了他一切的工、安息了——北京限贷、常备借贷便利和中期借贷便利的利率上调，这波暂时进入喘息期。&/p&&p&用曲线图来表示就是这样：&/p&&figure&&img data-rawheight=&317& src=&https://pic4.zhimg.com/v2-44d02ca514c5cf12211ab_b.jpg& data-rawwidth=&550& class=&origin_image zh-lightbox-thumb& width=&550& data-original=&https://pic4.zhimg.com/v2-44d02ca514c5cf12211ab_r.jpg&&&/figure&&p&再对比一下前几年，更有直观的感受（年增长率是年新增额度的增长率）：&/p&&figure&&img data-rawheight=&370& src=&https://pic3.zhimg.com/v2-909b3cc40cc4ad7f46f5d7e_b.jpg& data-rawwidth=&550& class=&origin_image zh-lightbox-thumb& width=&550& data-original=&https://pic3.zhimg.com/v2-909b3cc40cc4ad7f46f5d7e_r.jpg&&&/figure&&p&&br&&/p&&p&通过上面的推演，可能你们就明白了：一二线房价只是为了让房地产重新成为GDP重要引擎而打的掩护，而且还能让居民拿出储蓄、拼命贷款来为房地产企业债务买单。高房价创造不了GDP，但是房地产投资能啊。高房价无法保护经济安全，但是去库存能啊。&/p&&p&在这盘国家下的大棋里面，一线楼市房价是最重要的标杆，是全国所有大中小城市的希望灯塔，是《自由引导人民》那副画像里面半裸上身的女神。国家为了保住一线楼市房价，可谓无所不用其极的去呵护：严控一线土地开发（放弃一线这点小GDP）；暴涨之后马上限购把价格装入冷冻柜；社会舆论集体造势，等等。&/p&&figure&&img data-rawheight=&675& src=&https://pic2.zhimg.com/v2-043bef7c303fe5d5bc45_b.jpg& data-rawwidth=&1024& class=&origin_image zh-lightbox-thumb& width=&1024& data-original=&https://pic2.zhimg.com/v2-043bef7c303fe5d5bc45_r.jpg&&&/figure&&p&&br&&/p&&p&至于那些买不起房的北大清华硕士博士，只不过是这盘大棋里面丢卒保帅的那颗卒子……上的一点木屑而已。&/p&&p&先睡，有时间接着说。下期我们会接着讲：为什么我认为APP式创业的泡沫甚至比房价都大。&/p&&p&*****************************&/p&&p&评论区有人问：国家为什么要这么强调GDP呢？&/p&&p&其实说到底就三个字：&b&保就业。&/b&&/p&&p&新增就业人口和失业率是每一个经济体都最为看重的数字。比如老美在2008年金融危机席卷而至的时候，失业率从5% biu地一下就升到了10%。我一个表妹，美国耶鲁大学法律博士毕业，正好赶上金融危机，结果一毕业就失业。所以美联储就忙不迭地连续推出三轮量化宽松（第三轮还扩大化），大幅扩张资产负债表（用人话说就等于印钱）。美国失业率就从10%慢慢降，一直降到现在只有四点几了。&/p&&p&所以国家必须维持一定的GDP增长率从而确保就业。一旦失业人口增多，社会就容易不稳定。而热火朝天的建设四个现代化呢，不管建设本身有没有效益，都能让人有事做，有事做就不会整天胡思乱想了。&/p&&p&就比如日本在上世纪60年代经济奇迹那会儿，东京的上班族几乎每天都要凌晨12点以后才下班，11点下班算是很早的了。这种局面是政府最为喜闻乐见的。而如果大家上班都很闲呢？甚至很多人整天家里蹲泡知乎看片玩游戏呢？这就说明经济萧条了（所以经济相对萧条时期，娱乐业总是会发展的比较好，比如直播这种无聊的东西）。&/p&&p&下面说正事。&/p&&p&****************************&/p&&p&&b&四、创业、融资和泡沫&/b&&/p&&p&创业最要紧的是什么？有人说是idea, 有人说是人脉资源。都错。创业最关键的是钱。很多创业者的现金流都无法维持12个月，换句话说就是我满腔热情开创新天地，结果不到一年就因为资金短缺而歇菜了。&/p&&p&那么创业的钱一般从哪里来呢？&/p&&p&1）那些能把猪吹到空中迎风飞舞的，就有能耐吸引天使投资/VC来投资A轮。现在这年头，只要你故事讲得好，商业计划写得好，A轮的钱就有可能融到。然后做出产品了，有收入了，B轮C轮才能接踵而来（但也会有风投需要看到产品才投A轮的）。&/p&&p&2）但是更多的人，其实并没有那么伟大的idea.
他们的钱主要来自自己的积蓄（但个人积蓄通常很有限，我要有钱还创个嘛业？）以及跟亲朋好友的借款；也有相当一部分人，他们的钱来自高利贷。&/p&&p&说到高利贷，你可能立刻就想到了一样东西：这两年很火的p2p理财平台。其实，还有好多线下平台（就是我们常见的路边某某金融公司）也被人误认为p2p理财，比如中晋这种；不过为了方便起见我这里统称为p2p理财平台。&/p&&p&目前社会上高利贷普遍是20到30个点。那么一些有良知的p2p理财平台，就会这么规划：给投资者10个点回报；预期违约率大概8个点，那我就提供8个点的风险拨备金；剩下的就是平台利润。&/p&&p&那么没有良知的平台呢，有的是单纯骗钱，比如e租宝这种；有的是铤而走险，通过高额回报吸引投资者，其实自己压根没有风险拨备，于是一遇到大面积违约就立马跑路了。&/p&&p&介绍了这么多，有人要问了：那你说的泡沫在哪里？&/p&&p&&b&泡沫就是，在中国，创业者的环境实在太好了，好过头了。&/b&&/p&&p&仅仅拿2015年的数据来说：&/p&&blockquote&&i&2015年的理财市场，最大亮点莫过于互联网P2P理财。尽管其占理财产品总规模的比例还很低，但增长速度却着实惊人——全年，P2P网贷成交额达到历史性的9823.04亿元，是&b&2014年成交额的近四倍&/b&。截至2015年底，P2P运营平台数达2595家，网贷贷款余额达4395亿元，&b&同比增长324%&/b&。&/i&&/blockquote&&p&2016年的数据我还没时间找，不过估计也非常惊人。&/p&&p&创业者太容易贷到钱了。在这个过程中，必然没有像银行贷款那样严格的信用审核（除了少数良心平台），也没有考虑到创业本身的盈利前景。&/p&&p&资金端过于宽松，那么资产端（就是创业本身运营）呢？&/p&&p&&b&严重过剩，严重重复。比如一个写字楼，同一层有20几家公司开发同一类app。 &/b&&/p&&p&因为中国人创业（以及几乎所有的事情）都有一个特点，那就是盯准热点，一拥而上。某类APP火了，一拥而上；外卖火了，一拥而上；共享单车火了，一拥而上。&/p&&p&而市场过于宽松的资金环境，包括无数不明来历的p2p理财平台、到处游弋的风险资本，也为这种过剩提供了融资条件。值得一提的是，这是一种相对过剩。&b&与这厢热火朝天遥相对照的是，那些传统制造业、高精尖领域、需要沉下心研究的领域，严重缺乏资金，人才也不断流失。&/b&&/p&&p&但是市场经济有一个最大的特点：&/p&&p&&b&出来混，总是要还的。&/b&&/p&&p&用术语说就是：你的EBITDA不过关，牛B吹破天也没用。而且接下来就面临着还高利贷了。还不出？那你就只能去借更黑的高利贷，直到破产那一天为止。&/p&&p&而那些靠吹猪上天吸引A轮的创业者呢？别忘了人家风险资本的最终目的是要退出的。退出时候赚不到钱，还得让你创业者赔偿。所以这个世界上，拿到A轮的有很多，拿到B轮C轮的就呈几何级数下降了。&/p&&p&但上述泡沫也有其特殊性：那就是爆破的此起彼伏性。基本不存在全社会所有泡沫同时爆破的小概率事件。每爆一个小泡沫，就倒掉一批p2p理财平台，一批投资者遭殃。&/p&&p&所以，呈现出的是一个复杂的图景：一边有人牛逼哄哄的拿到融资，一边有人悄无声息的倒掉，而前仆后继者甚众——在“万众创新全民创业”的伟大号召下。&/p&&p&联系到我前文所说，可能你就容易理解了：为了确保GDP - 维持就业 - 鼓励创业 - 后果自负（我创业失败了还能怨谁，不就只能怨我自己吗）。所以p2p理财平台的审查标准、准入标准如此姗姗来迟，还无法全面强制执行。&/p&&p&&b&结论就是：全民创业吹起一个大泡沫，但这个泡沫本身是为了XXXX（自行结合上文联想），而并不会导致一般意义上的普遍经济危机，但会不时导致局部地区局部人群的温柔型危机。 &/b&&/p&&p&其实，我更愿意看到的创业形式是德国式的：从一个家族小作坊起步，慢慢研磨自己的产品，精益求精，渐渐做到业内最好，乃至世界领先——德国有无数个这样的从家族产业发展到行业龙头的&b&百年创业公司&/b&。可惜，这种创业形式不适合中国人。&/p&&p&*********************&/p&&p&&b&五、产业转型的实质：资本的盛宴&/b&&/p&&p&中国人在玩弄概念上始终是全球领先的。新常态、供给侧改革、产业转型等等。在GDP增速单调递减的周期内，还能通过玩弄概念给人一种经济欣欣向荣、前途远大美好的感觉，也实在是一门绝活。&/p&&p&但这些嘴上热闹的东西，能够真正解决下面这些严峻的现象么？&/p&&p&&b&1）不可贸易商品对可贸易商品的挤出效应&/b&&/p&&p&不可贸易商品，指的是指不同地点的同一商品的价格差异不能通过套利活动消除的商品。其中最典型的就是房地产。除此之外还包括各种个人劳务。&/p&&p&&b&房屋是生活必需品中唯一的不可贸易商品，所以其定价只与社会中购买力最强的那部分人有关，价格是居民可以承受的极限，其本质是财富再分配的工具，是将穷人积累的积蓄搜刮到少数富人和政府手中的工具。&/b&&/p&&p&&b&中国经济高速发展促进了财产上的贫富分化，而这种分化导致住房价格高企，又进一步加剧了贫富分化，形成了一种对于中下层人民而言的恶性循环。&/b&&/p&&p&在这个过程中，住房作为不可贸易商品贪婪地吸收着可贸易商品部门的资源和养料。流动性呈现“一边是火焰，一边是冰洋”的局面，住房贷款不断创下天量，而制造业流动性紧缺。&/p&&p&另一方面，不可贸易商品中的个人劳务也与社会贫富分化形成着恶性循环。大家可能都有体会，现在各类高端服务价格，比如少儿培训、月嫂、美容、会所、高端餐饮等，其价格上涨速度要远远超过社会一般（中低端）消费品价格的上涨速度。淘宝爆款永远保持着低价，而白领则在哀叹自己无力承担高涨的子女养育和教育费用。&/p&&p&可贸易商品部门的相对低价带来的后果是什么？缺乏资源、缺乏人才，导致质量永远上不去。而产业转型的最关键一环，在我看来就是要解决可贸易商品生产的更新换代，加强技术含量，以使得国产品牌能拥有世界性地位。可目前除了依靠压榨员工的狼性华为之外，中国在国际上能拿得出手的品牌屈指可数，国人尤其是中产白领的日常生活仍然被各类洋品牌所占据。&b&而这方面的产业转型，不仅没有加强，反而由于不可贸易商品对可贸易商品的挤出效应而渐行渐远。&/b&&/p&&p&&b&2）资本对实业和内容的挤出效应&/b&&/p&&p&目前GDP当中，第三产业增速超过了第二产业增速。也许我们要凭借经验主义（比如美国的第三产业占GDP70%）对这种现象点赞；然而在此之前，你可能需要先知道一个事实（也是上文中就提到过的）：&/p&&p&&b&房地产和金融也属于第三产业。&/b&&/p&&p&而目前中国经济的最大引擎，正在从制造业转型为“房地产、金融、互联网”三驾马车。这就是我们所谓的产业转型。这对一个十三多亿人口的大国，是好事还是坏事呢？&/p&&p&我们需要明白的是：&/p&&ul&&li&历史上没有一个国家依靠发展房地产成为强国。&/li&&li&历史上所有依靠金融强国的，其依据的不是金融，而是其世界霸权。比如美国人可以通过不断举债，把美元推向全世界，剪全世界的羊毛。而如果没有这样的霸权呢？那就只能关起门来印钞，剪本国人民的羊毛了。&/li&&li&像香港这样除了地产、金融及相关服务业、旅游之外几乎没其他产业的，只能作为一个低税率自由港，是资本的一个中转站而已，而绝不应该作为中国这样一个大国的追求方向。&/li&&li&互联网确实是新兴事物，&b&但互联网提供的只是形式，真正实在的是内容。就算是用了互联网思维做出来的烧饼，只要不好吃，那就毫无价值。&/b&&/li&&/ul&&p&而我们一直说的实业实业，就是第二产业，就是制造业。制造业发展缓慢，对中国来说无论如何都不是好事。因为房地产的增值主要依靠金融泡沫和贫富分化；而金融的目的是在于调配实业的资源，金融本身并不创造任何价值。如果一个项目只有大量资本但没有拿得出手的产品，那资本只是在自我狂欢而已。&/p&&p&资本的狂欢结束后，只剩下一地鸡毛。最典型的就是滴滴打车——从一开始的疯狂让利，到后来并购Uber，再到现在打车难、打车比以前更贵，消费者搞了半天，还是被资本剪羊毛的那一方。&/p&&p&&b&3）老龄化——老年人对年轻一代的挤出效应&/b&&/p&&p&老龄化在我看来，其严峻程度不仅仅在于劳动力人口红利的减少；更在于，目前社会上拥有资本的这一代人，一旦大规模进入老龄化，那么会进一步占有社会大量资源，挤占年轻一代的资源。&/p&&p&&b&这意味着，未来年轻一代在供养这些老人方面，要付出更艰辛的努力——还高额房贷、付高额房租就是其中一个缩影。&/b&&/p&&p&如果实业进一步萎缩，那么年轻一代还能有怎样的收入来源去供养高高在上的老人呢？产业转型能否解决这个问题？&/p&&p&当然，我不否认供给侧改革和产业转型中的确也存在产品更新换代、制造业技术升级，但这些微观层次上的“点”无法影响整个宏观的“局”。&/p&&p&****************************&/p&&p&&b&六、金融危机？&/b&&/p&&p&现在，我们再回到上面第2讲提到过的一件事：&b&金融危机每十年爆发一次，那么&a href=&tel:&&&/a&会不会再次爆发？会不会轮到中国？&/b&&/p&&p&在讨论中国会不会发生金融危机之前，我们先来看看另一个国家。&/p&&p&根据这个国家某大学的一份统计，现在其国内约30%的人处于贫穷状态，6.9%的人完全赤贫。通货膨胀加上生活补贴的减少让人民很受伤；政府部门腐败盛行。&/p&&p&这就是上届世界杯亚军——阿根廷。&/p&&p&阿根廷曾经历过一系列政局动荡和危机。尽管现在有所好转，但也给国家留下了一个巨大的烂摊子，一个贫富鸿沟更为巨大的社会，一群失去希望的中产阶级。&/p&&p&我至少有一点可以肯定：中国不会沦为阿根廷那样的局面。这是因为，在中国讲任何东西，归根到底都是讲郑智。以亨廷顿在《变动社会中的政治秩序》一书中的评判标准（适应性、复杂性、自立性、凝}

久游无息网