@知识资产:从一张卡片开始积累

知识资产

知识管理

[[知识管理的误区]]:囤积癖、墙头草、工具控、输出怪

本书分享记笔记的三种方法

卡片笔记的四个特点

[[如何复盘]] 《陈云文选》关于如何才能少犯错误的主要方法可以概括为三个: {{c1 交换}}、 {{c2 比较}}、 {{c3 反复}}

  • 交换 #card
    • 交换正反两面意见,让自己的视角更全面。
    • 值得注意的是,收集反对信息后,如果这些信息正确就改进,如果错误就驳倒。
    • 只有这样,一个人的认识才能更接近客观事实。
  • 交换是为了 {{c1 更全面地认识事物}},比较则是为了更好地 {{c1 判断事物的性质}},用来了解事物的发展程度、要害和本质。
  • 重复上面两步,既是 {{c1 认识}}的过程,也是 {{c1 实践}}的过程。在此过程中,坚持 {{c2 正确的}},改进 {{c2 错误的}}。

高亮后如何自我提问,增加笔记的摩擦力

如何记录情绪 [[Life Log]]

[[记录自己的实战经验]]

精练笔记

  • Light 对邓小平时代的精练笔记
    • 什么是“实事求是”?#card
      • 摆脱意识形态的束缚;
      • 承认令人不快的事实;
      • 实践是检验真理的唯一标准。

[[Q - 笔记需要分类吗?]] 分类是让自己更容易找到信息,适合自己的分类是从笔记中生长出来的。

基于[[PARA]]设计出[[IARA]],把笔记分为个人的领域、兴趣、项目、归档四大部分。

怎样更好的回顾记录?

  • 每次记录新的笔记时,重新熟悉相关的笔记,然后再记录新的内容。#card
    • 望岳投资南添的例子,假设他要记一条有关电动车领域的笔记,正式记录前他会点开对应的标签,翻看此前关于这个领域的笔记,思考即将记录的内容和之前记录的内容是否有冲突或关联。这样回顾的好处是,他不但可以加深对相关笔记的印象,还能快速建立起笔记之间的连接。
  • 同步思考一些问题 #card
    • 这条笔记和我最近遇到的什么问题有关?#card
      • 我早期读企业家谢家华的自传《三双鞋》,做了很多笔记。某次我回顾到下面这条关于“客服”问题的笔记,同时也在想,这跟我最近遇到的什么问题有关?
    • 关于这条笔记,我可以补充什么新实践或新思考?#card
      • 下面这条关于时间管理的笔记,是我某次听播客时记录的。之前我做事总是容易失焦,导致重要的事情得不到及时解决,所以后来我干脆买了一堆便笺贴在墙上,确保自己一到办公室就能看到近期重点项目的重要节点。回顾这条笔记时,我把自己的这些实战经验补充在了后面,促进理解,加强记忆。
    • 这条笔记和其他哪条笔记有关系?

待整理


@翦商:殷周之变与华夏新生

商起源

  • 《诗经·商颂·玄鸟》对契降生的描写是:“天命玄鸟,降而生商。”
    • 玄鸟,喻指上帝(天)和商人之间的独特媒介,至于是什么鸟,则有燕子和凤凰等不同解释。
  • 《诗经·商颂·长发》则是:“有娀方将,帝立子生商。”
    • 有娀是简狄所在的部族,“有娀方将”是有娀氏将要兴起之意。

为什么需要祭祀

  • 以色列考古学家吉迪·谢拉赫认为,在“早期国家”或“复杂酋邦”阶段,社会开始变得更复杂,王权刚刚出现,统治者发现自己的统治体系还不够发达,急需借用一种强大的机制来维护权力,从而导致人祭宗教和战俘献祭行为的产生。
  • 为何战争与人祭可以铸牢新兴王权,吉迪却没有多谈。
  • 结合前文对新石器末期到中商这上千年人祭历程的梳理,本书认为可以从两方面来理解:
    • 理论层面,王的大量献祭(意味着他获得神的福佑)是王权融合神权的标志;
    • 现实层面,战争让本国族的民众团结起来一致对外,从而更巩固了王的权力。

大都无城

  • 新宫殿区坐落在洹河弯内侧,今安阳小屯村北,“殷墟博物苑”所在地。
  • 营建新宫殿时,武丁抛弃了之前的“城池”都城模式。他可能不相信商朝都城会受到外来威胁,认为与其耗费庞大的人力夯筑城墙,不如主动对外扩张。武丁规划的宫殿也不再是封闭的大院落,而是若干座彼此独立的大型建筑,皆有厚达1米的夯土地基、木柱框架结构和厚重的夯土墙,足以抵抗地震,且分散的单体结构也更利于防火。

商王朝留下了众多遗址、文物以及累累白骨,那么,这个身居华夏文明源头的王朝是如何运作的?商王如何解释自己的权力来源?他的臣民对此又是如何理解的?

  • 在商人的眼里,世界是冷酷的,充满暴力、杀戮、掠夺和不安全。他们不认为鬼神有明确的善恶观念,或者说,商人本没有明确的善恶观念,自然也不会想象鬼神能有。商人认为鬼神会随时、随意给任何人降下灾难,大到灾荒和战乱,小到生活中的各种不如意,都有鬼神在背后操纵,即便是商王也难免。

层累地造成的中国古史

  • 史学大家顾颉刚称这种现象为“层累地造成的中国古史”,意思是说,越晚产生的传说,反倒在神谱里面越古老,就像人们堆柴堆,“后来者居上”。因为时代越晚,各族群的祖先传说就越是逐渐汇总到一起,这时,各自的先祖孰先孰后以及谁比谁厉害就成了问题。因此,为了制造更大范围的身份认同,就只能创作更古老的先祖,给各族群增添一位共同的始祖。先祖诸神的关系和谐了,世间各族群的关系才能和谐。

《易经》里为何会有这么多周人生活的真实记录?这便涉及周昌创作《易经》的目的:研究各种事物背后的因果联系,最终建立一套翦商的理论和操作方法。

  • 先说最古老的所谓伏羲“八卦”。有四对卦,分别是乾和坤,坎和离,震和艮,巽和兑;各有代表图案,被称为“卦象”,由三根表示阴阳的“爻”组成,一根直线代表阳爻,两段半截的线代表阴爻。
  • 东周时的学者说,这是宇宙间的八大元素:乾代表天,坤代表地;坎代表水,离代表火;震代表雷,艮代表山;巽代表风,兑代表泽(沼泽)。(《周易正义·说卦卷九》)至于伏羲或者周昌时代的人是不是这么理解的,就不好说了。
  • 再来说六十四卦。卦象由两个八卦上下重叠组成,一共有六十四种,都有六个爻。假如是两个八卦的乾叠加,就仍叫乾卦,以此类推。但不一样的八卦互相叠加,就需要起新的卦名了,比如,震下坎上,叫屯卦。
  • 六十四卦的每个卦都有一条简短的解说词,这被称为“卦辞”;相对的,卦里的每个爻也都有一条“爻辞”。概而言之,《易经》是由六十四卦的卦名、卦象、卦辞和爻辞组成的。
  • 《易经》并非文王专门编写的算命教材,而更像是他自己的练习簿,所以内容驳杂,有大量的私人琐事。从萌生翦商之念始,文王就反复将其代入和推算,并随时验证、修订和增补,希望总结出一套最精确的占算方法,而最终目的,当然就是在消灭商朝的战争里运用这套预测技术。

从现代人的视角看,文王周昌为翦商而推演的“理论”,或许可以分为以下三个层面:

  • 一,宗教的,即他对商人“上帝”概念的重新诠释和利用。文王的身份类似犹太教的摩西、伊斯兰教的穆罕默德,身兼部族政治首领与神意传达者两重职能。
  • 二,巫术的,即他在《易经》里对商朝施展的各种诅咒、影射与禳解之术。在上古初民时代,这些行为往往和宗教混杂在一起,不易区分。
  • 三,理性的,或者说世俗的,即各种“富国强兵”的策略和行师用兵的战术。

从考古来看,商朝一直繁荣的人祭和人奠基到西周建立时却戛然而止。文献和考古两相对照,本书推测,这场重大变革发生在周公辅政时期。

  • 这场变革几乎从未被历史文献提及,甚至商代无比“繁荣”的人祭行为也没有被记录。那么,周人为何要掩盖商人的血祭宗教,以及这个宗教是如何被消灭的?
  • 商人的血祭宗教是被周公终结的,但周公所做的远不止于此,他还要抹杀关于它的记忆,防止它死灰复燃。
  • 而忘却是比禁止更根本的解决方式。为此,首先必须毁灭殷都,拆分商人族群,销毁商王的甲骨记录;其次,自古公亶父以来,周人曾经为商朝捕猎羌俘,这段不光彩的历史也应当被永久埋葬;再次,长兄伯邑考在殷都死于献祭,他的父亲和弟弟们还参与并分享了肉食,这段惨痛的经历也必须被遗忘。

成王亲政第五年,第二次东夷战争结束后,成王和母后东返,途中经过成周洛阳小住了一段时间。在这期间,有一位贵族曾获得成王的接见,之后更是专门制作了一件青铜尊,这就是因“宅兹中国”的铭文而著称于后世的“何尊”。这也是目前发现的“中国”一词的最早记录,它在当时的意思是“中原之地”。

周社会是典型的身份世袭制,周王任命朝廷高级官员(卿)的选择范围很小,基本由十几个显赫的家族世代占据着朝廷主要官职。而且,官职本身并没有薪俸,全靠自家封邑收入,做官只是可以给他们提供获得更多封邑的机会。各诸侯国内部的权力结构也类似,但规模要比镐京朝廷小很多倍。

  • 就这样,随着统治阶层的繁衍,周朝特色的贵族制度逐渐得以形成,其中,最首要的是“宗法”家族制,核心则是嫡长子一系的独尊地位。
  • 一,周朝各姬姓诸侯(被分封的王室亲属)对周王的效忠服从,是家族兄弟(及其后人)对嫡长兄(及其嫡系后人)的服从。
  • 二,在各诸侯国内部,太子之外的公子被分封为世袭大夫,大夫再繁衍和分封出“士”。
  • 三,非周族的异姓诸侯和贵族则通过婚姻关系被纳入家族结构中。周王尊称同姓诸侯国君为“伯父”,称异姓诸侯国君为“伯舅”(当然必须是曾经和周王室有过联姻关系的),伯代表排序。
  • 这套基于血缘宗法制的贵族等级和封建政治秩序,周人称之为“礼”。不同等级的贵族使用相应的车马、住宅、衣服、乐器、玉器、酒器和食器组合,丧礼和随葬品也以此类推。各种典礼仪式上,比如朝见天子、祭祀和宴会等,入场顺序以及站或坐的位置由相应的等级身份决定。
  • 典礼可以在不同层次举行,如诸侯国或大夫家,但基本原则一致。贵族的冠礼、婚礼、丧礼和祭礼也都有各等级的标准规范,几乎所有礼仪场合都有乐队伴奏,而乐队的规模和演奏的乐曲也都有相应规范。所以,周人贵族文化又被称为“礼乐文明”。

当然,春秋的人祭回潮并未成为主流,可能有以下两个原因:

  • 其一,战国时期的社会重组和政治变革。由于列国兼并战争的威胁日渐增加,各国都进行了变法运动,废除贵族制,实行君主集权和官僚制,国家的首要目的是富国强兵,在国际竞争中获胜。而这需要官僚机器用理性、功利的方式管理社会,人祭自然属于不可容忍和必须取缔的行为。
    • 战国初期魏国西门豹治邺的史事,呈现的就是新兴官僚政治和民间传统文化的碰撞。当时邺县还有“为河伯娶妇”的风俗,本质上是把少女奉献给漳河水神的人祭行为。邺县在殷墟以北15公里,所以这种风俗很可能是殷商宗教的残余。到西门豹时代,普通的邺县人已经不愿为祭祀承担如此高昂的代价,只是苦于无法对抗地方精英“三老”和女巫联手主导的民间权力结构。为此,时任邺令的西门豹表面上遵循本地宗教理念,实际却找借口把女巫及其弟子和三老先后投入了漳河,从此,这里再无人敢复兴人祭宗教。
      • 《史记·滑稽列传》褚少孙所作增补。虽然秦汉之后的王朝法律已经不允许猎俘杀祭,但人祭宗教也曾在民间迁延了较长时间。直到汉魏时期,宋襄公曾经献祭的“次睢”神社仍存在,又被称为“食人社”;也有祭祀者会花钱雇穷人充当人牲,祭祀时把人牲捆绑在神社前,如同屠宰的牲畜。不过从文献记载来看,也许汉魏时的人祭只是程序性表演,而非真正杀人、食人。参见《续汉书·地理志》注《博物记》曰:“县东界次睢有大丛社,民谓之食人社,即次睢之社。”《艺文类聚》卷五九引《从征记》:“临沂厚丘间,有次睢里社,常以人祭,襄公使邾子用鄫子处。相承雇贫人,命斋洁,祭时缚着社前,如见牺牲,魏初乃止。”
  • 其二,以孔子为代表的儒家逐渐兴起,开始提倡仁政和爱人。当时还有制作陶人俑随葬和埋入祭祀坑的习俗,结果遭到孔子诅咒:“始作俑者,其无后乎!”孟子对此的解释是,孔子讨厌这种模拟用人殉葬的行为,“为其象人而用之也”。(《孟子·梁惠王章句上》)和多数人不同,孔子的职业是整理上古史的学者,他很可能是在晚年破解了商周之际的一些隐秘往事,担心用陶俑随葬会唤起人们对人祭时代的记忆。

后世人对周公的认识,有事功和制度文化两方面:事功,主要是周公辅佐成王、平定三监之乱,为西周王朝奠定开局;制度文化,主要是周公“制礼作乐”,确立西周的政体,包括诸侯列国分封格局和贵族等级制度。在考古发现商朝的遗址与人祭文化之前,人们对周公的理解只能达到这种程度。

  • 但事实上,周公最重要的工作是消灭商人的人祭宗教,以及与之配套的弱肉强食的宗教价值体系。他不仅阻止了周人模仿和继承这种宗教文化,也在殷商遗民和东夷族群中根除了它。尤其关键的是,周公还抹除了与商朝人祭有关的记忆,甚至也隐藏了自己禁绝人祭行为的种种举措。这是为防止人祭宗教的死灰复燃和卷土重来,也是为掩盖周人曾为商朝捕俘人牲的那段不光彩的历史。

为了填补人祭宗教退场造成的真空,周公发展出了一套新的历史叙事、道德体系和宗教理念。这主要体现在《尚书》的几篇诰命中:

  • 一,淡化商人对“帝”的崇拜。在商朝末期,“帝”已经和商王身份重叠,商王具有“帝”的神性。但周灭商后,王已经不能身兼“帝”之名号,对周人来说,帝在高高的天庭之上,不会化身为世间凡人。
    • 虽然我们还不能完全确定这个原则就是由周公确立的,但从《尚书》的几篇诰命可以发现:在对殷商遗民讲话(如《多士》)时,周公会频频引用上帝的命令来威吓和诱导商人,这是因为商人格外信奉上帝,只能因势利导;但在对周族自己人讲话时,如册命弟弟周封为卫侯的三篇诰命,周公却极少谈到上帝,尤其是对族人谈论现实和规划未来时,他从不动用上帝进行论证,更不涉及其他的神灵。这显然是一种有意识地 “敬而远之”,让现实和神界保持距离。从这些迹象看,周朝人“疏远”上帝或其他诸神的传统的确是由周公奠定的。
  • 二,为减少神界对现实的干预,周公会尽量用“天”的概念来代替“帝”,因此,上帝发布的命令(“帝命”)变成了含糊的“天命”。
    • 天命的观念在后来的中国一直存在,但人们已经忘记了它的缘起。“天”无形无像,无言无行,不容易被赋予拟人化的个性。在《诗经》里,上帝曾频频给文王下达命令,如命令文王攻打崇国,武王灭商据说也是来自上帝的意旨,但后世周王已经无法接收神界的具体指示,所以改称为“天命”后,它变成了一种更为抽象的、近乎隐喻的道德规训。
      • 杜勇:《尚书·周初八诰研究》,中国社会科学出版社,1998年,第206页。另,在《尚书·盘庚》中,盘庚的发言中也有“天命”,但陈梦家认为,“商人称‘帝命’,无作天命者,天命乃周人之说法……此亦战国宋人之拟作”。参见陈梦家《尚书通论》,中华书局,1985年,第207页。本书认为,《盘庚》中的“天命”可能有西周之后的改动,但该文主体仍是盘庚时代的作品。
    • 当然,周公时代还不可能有科学主义的无神论认知,神界即使被放置得比较远,也不会和王朝政治完全绝缘。比如,西周的王就被称为“天子”,也就是天的儿子,而这是连商代甲骨文也没有的词,但无论怎样,“天”还是过于含糊,周人及其以后的历代王朝从未给“天子”增加更具体的神性定义与功能。即便秦始皇使用“皇帝”尊号,其直观用意也是强调自己和六国之王的不同,虽有强调王者尊贵的这一层神性之意,但也使“帝”落入凡尘,并不比“天子”概念更神秘。
      • 周公这方面的理论主张在《尚书·无逸》篇中体现较多。
  • 三,周公宣称,王者应当爱民、德治和勤勉,这样才会受到“天命”青睐,长寿享国;如果王者残暴对待庶民和小人,天命就会转移到更有德的候选君王身上,从而改朝换代。

因为周公掐断了神对人间的直接干预,这意味着华夏世界不会再有主导性宗教,以神的名义颁布的道德律条(如摩西十诫、佛家五戒)也无从产生,所以周人必须另行寻找一套用于世俗生活的道德原则。这种世俗道德的原理,是“推己及人”,也就是把自己放在他人的位置上考虑,从而决定自己对待他人的方式。

  • 周公的办法是对《易经》进行再解释,具体方法则是在文王创作的卦爻辞后面加上一段象传进行说明。象传不再鼓励任何投机和以下犯上的非分之想,全是君子应当如何朝乾夕惕,履行社会责任的励志说教,和文王卦爻辞的本意完全不同。 比如,乾卦的象传是“天行健,君子以自强不息”,坤卦的象传是“地势坤,君子以厚德载物”,远比文王卦爻辞清晰易懂,而且富于积极和励志的色调。

“六经”具体是指《诗经》《尚书》《仪礼》《乐经》《易经》《春秋》。其中,《诗经》《尚书》《易经》包含大量商周易代时期的史料。在“六经”成书之前,社会上传抄流行的主要是单篇文章,真伪混杂,质量良莠不齐。为此,孔子选择了最可信且符合周公精神的汇编成书,而不符合这两点的篇章就逐渐失传了

  • 《诗经》记载了周族从姜嫄、后稷以来的多篇史诗,包括周族早期历史、文王确立翦商大计、武王的灭商战争、周公平定三监叛乱以及对商文化的改造等,属于经过周公修订的官方正式版本。
  • 书是文献之意,《尚书》就是古代的文献。按时间顺序,《尚书》分为《虞书》(尧舜禹时期)、《夏书》、《商书》和《周书》。在收入“六经”之前,《尚书》中各篇都是单行本,基本规律是越古老的越不可信,内容大都是西周及之后的人按照周公重写上古历史的精神,虚构了尧舜禹和夏商时期的很多帝王故事和讲话稿,基本是周公式的道德说教,不具备史料价值。当然,也会有个别真正的商代文献,比如盘庚迁都的讲话稿,内容上和周公精神抵触不大,或者已经被周公授意删削过,所以保留了下来。总之,这些真真假假的篇章被孔子分别收入了《尚书》的《虞书》《夏书》和《商书》部分 。
  • 当然,孔子编辑“六经”的作用不止于此,其中还保存了从西周创立直到孔子时代的文化成果,这就是周人贵族社会的诗歌(《诗经》)、礼俗(《仪礼》)和历史(《春秋》)。

概而言之,周公时代变革的最大结果,是神权退场,这让中国的文化过于“早熟”;战国时代变革的最大结果,是贵族退场,这让中国的政治过于“早熟”。而在其他诸人类文明中,神权和贵族政治的退场,都发生在公元1500年之后的所谓近现代时期。


@A Consumer Compensation System in Ride-hailing Service

[[Attachments]]

代驾和货运的补贴系统

  • 价格弹性建模 ((65b1f955-417a-4457-95ef-8d223ce14b4c))
  • 预算分配 ((65b1f965-af6d-4b32-b1f0-96d4151f5f01))

系统目标:在预算范围内,通过补贴最大化平台收入。

  • ((65b1fbc2-5d19-4684-b5c7-b2424fecf57a))

难点

  • 如何用历史数据建模用户弹性 ((65b1fd34-d738-4f68-b90b-60efb3a9aca9))
  • 个保法下公平原则(不同用户相同 odt 补贴相同) ((65b1fd3d-cae0-4efa-a2d2-08d4b8919709))
  • 如何建模线上随机的发单请求 ((65b1fd6a-db88-47e3-808d-a686f6586589))

((65b1fe34-8525-479e-abd4-155b544d3fa4))

  • 常规训练 uplift 模型需要大量随机补贴下的响应数据(成本高),本文方法使用大量线上观测数据(有偏,受线上策略影响)和少量随机补贴数据训练模型。
  • DNN + GBDT:解决 ((65b2028e-75cb-4f40-8e06-22a2166cbfba))
    • 超过 90% 特征是 dense numerical feature ,需要用 GBDT建模,但是 GBDT 不好 fine-tuning 新数据以及处理稀疏特征。
    • 训练 s-learner model
      • ((65b2024f-eaa7-462c-bc11-cae352aabdfb))
      • 两个 XGB 模型分别用观测数据 observational data 和随机数据 RCT data 训练,目标是二分类(用户是否下单)。
      • 数据过两个 XGB 模型得到叶子信息,再过 embedding 层,concat 两个 embedding 过 inner 层。
        • 先用 observational data 训练整个网络 ((65b20626-d8aa-4430-83b7-7ba54215f50d))
        • RCT data 用另外一个输出层训练 ((65b20652-6366-414d-ab84-74a0d87bfed7))
        • fine-tuning 时使用 early stopping

((65b206dd-3a99-40c4-a661-54965bfd83bc))

  • 订单聚类成 OD 网格
    • 网格内历史订单平均弹性作为网格弹性 ((65b20798-d159-405c-a66e-54723386a698))
  • ((65b20804-56df-425f-a48e-5def2d17e48b)) 建模成最优化问题求解分配方案

线上系统:离线生成补贴词典供线上使用

  • ((65b20b39-aa4c-488c-8507-ec4b07edf866))

离线实验

  • Uplift 模型
    • 特征
      • ((65b20c51-20cd-44fe-b015-3ca64e225bf4))
    • 模型细节
      • ob data xgb,35 棵树,1120 个叶子节点
      • rct xgb,51 棵树,1314 叶子节点
      • embedding size 8
      • ((65b20ce2-4edc-46f4-8e7d-a1c3ee5085be))
    • 结果分析
      • T-XGB+DNN AUUC 效果比 S-XGB+DNN 效果好,说明需要两棵树去提取特征?
        • S-XGB+DNN:a single GBDT distiller DNN
        • T-XGB+DNN:two-distiller GBDT distiller DNN
      • ((65b249cb-8907-4f44-ba1d-f8ee50052f8d))
  • 优化结果评估
    • 假设 uplift 模型结果是真值,评估不同分配策略的影响。
    • ((65b253c2-2d6f-4184-8011-b8fc5c18bb53)) 不对订单聚类,考虑用户特征。
    • Open Loop 用前 14 天数据预测后 7 天
    • 新系统补贴率低但是更高利润 ((65b25475-6a4d-4878-9e0b-d3f2588ed8ef))
      image.png

一些问题?

  • 为什么不是常规构建 uplift 模型的方法(实验组 + 空白对照组)?
  • T-XGB 和 S-XGB 具体怎么训练?
  • 为什么 rct 树的数量比 ob 树多?从样本角度 ob 树样本更多
  • uplift 没有给纯 xgb 的

@DeeprETA: An ETA Post-processing System at Scale

[[Abstract]]

  • Estimated Time of Arrival (ETA) plays an important role in delivery and ride-hailing platforms. For example, Uber uses ETAs to calculate fares, estimate pickup times, match riders to drivers, plan deliveries, and more.
  • Commonly used route planning algorithms predict an ETA conditioned on the best available route, but such ETA estimates can be unreliable when the actual route taken is not known in advance.
    • route eta 无法解决偏航问题
  • In this paper, we describe an ETA post-processing system in which a deep residual ETA network (DeeprETA) refines naive ETAs produced by a route planning algorithm.
  • Offline experiments and online tests demonstrate that post-processing by DeeprETA significantly improves upon the accuracy of naive ETAs as measured by mean and median absolute error. We further show that post-processing by DeeprETA attains lower error than competitive baseline regression models.

[[Attachments]]