人是机器的经典语录,为什么说人是机器,人是机器的观点内容,豆豆语录网这里有不少,而这一篇人是机器的经典语录,为什么说人是机器,人是机器的观点的内容是我们豆豆语录网经过多次整理,最终挑选出来的人是机器的经典语录,为什么说人是机器,人是机器的观点内容,方便您的阅读与学习,希望对您有用。
人是机器的经典语录
我觉得我们大部分人没有水平评价经典书籍之间的高低。每本书涵盖的点不一样,小黄书偏统计,prml偏贝叶斯。每本书有每本书的侧重,PRML关于ensemble方法、lasso这些就讲得不多,树形分类器也没怎么讲,所以你想要了解随机森林等模型,需要看看别的书。你只用记住没写的肯定不是因为Bishop不会就是了。
除了机器学习的书,如果要做Machine Learning的理论,Jordan推荐几本书:Concentration Inequalities,Statistics for High-Dimensional Data,Introduction to Non-Parametric Estimation.
不过确实PRML向你展示了一个信仰:一切都可以用贝叶斯解释。
我认为这本书把现在的统计机器学习的思想都很大程度上概况了,因此真的能完完整整读完这本书并且有较深入的理解,那么统计机器学习的基本思想就已经比较扎实了,再学习更新、更专的一些方法时就能更加得心应手。我个人因为这本书,锻炼了生成模型的建模能力,但是私以为要真的深入机器学习理论研究,还是需要将优化的基础也打牢。这里我比较推荐convex optimization一书。
看完、看懂了PRML,再学好优化,在这样的一个基本功上通过看新的paper找到好的idea,做出好的博士水平的工作应该是会更得心应手一些的。
磨刀不误砍柴工,PRML这块磨刀石可能要花你不少时间,但是收获也是相当大的。
PRML这本书我大致理一下它的思路,原谅我水平有限,有没说清楚的地方烦请指正。
第一章是引子,用curve fitting问题(给出一系列数据点,找到能拟合它的最佳函数)给读者一个对机器学习的大概理解。对于该问题给出了频率派和贝叶斯派的两种解法,频率派在多项式函数族中寻找一个最好的对数据点的逼近,贝叶斯则对数据的生成过程做出假设,试图从一族概率模型中找到最responsible的。在这两种方法之后,介绍了关于全贝叶斯模型,也就是所有参数均有先验分布的情况下,模型的一些更加强大的能力,例如自动平衡拟合效果与模型复杂度的关系等。之后讲述了这两种方法得到的模型如何做决策(从误分率到损失,以及最大后验的点估计到基于预测分布的估计等),以及学习到的模型的泛化能力的一些分析(Bias Variance Analysis,学习理论方面的一些基础)一些信息论方面的知识,例如怎样度量两个分布的距离等。第二章主要是介绍了一下基础的统计方面的知识,包括期望方差的计算、高斯分布的参数估计与理解、高斯分布的性质(最主要的是对很多运算的封闭性,比如说乘起来仍然是高斯)、指数族分布的性质(最主要的是确定一个指数族分布只用确定一些统计量即可,并且更新的时候也只用对统计量进行加减),以及一些不进行对概率分布的假设直接估计每个区域概率密度(质量)的方法(如KNN)。第三章和第四章主要在讲最基础的线性模型,并且展示了如何将其应用在分类和回归的场景下。这里的问题其实和curve fitting相当类似,最重要的一点即如何把线性回归和分类问题进行概率建模,以及它们和高斯分布的关系。在这两章里会接触到全贝叶斯方法,即对建模后的概率模型的参数全部引入先验分布后如何处理(因为涉及到的积分往往不可计算,这两章用到了拉普拉斯近似)。贝叶斯方法是整本书的核心。第五章介绍了神经网络。在线性模型的基础上引入了多层感知机模型,即常说的BP网络。看完3、4章后就能理解,这其实是一个stacked线性模型,只是堆叠前加了非线性的activation而已。介绍了基于链式法则的后向传播算法、CNN和一些防止过拟合的手段。最后讨论了贝叶斯多层感知机,因为本质上是线性模型的推广,其贝叶斯的推导和线性模型就差一点点。第六章讲的是核方法,核是两个样本的内积,也可以理解为某个希尔伯特空间中由内积定义的“距离”。主要讲了线性模型转成核表达的方式、核的构建以及高斯过程(和线性回归很像,只是对线性模型的参数w做了高斯假设,因此预测变量y是高斯的。虽然增加了这样一个假设,但是却得到了两个好处,一个是可以自然地引入核,其次是模型的更新由于高斯的性质会变得很简单)。第七章是向量机,支持向量机就不多说了,相关向量机主要讲的是贝叶斯模型如何通过先验找到一个稀疏的模型。这里的想法在很多研究中都有应用,即用所有的观察数据的线性组合来表示一个新的数据点,通过对这个组合系数引入稀疏性,就能选择出对数据集判断有作用的数据点,这在支持向量机中被叫做支持向量。第八章是讲的图模型,从表示到推断都写得很好,细读以后对变量的独立性、隐变量和参数的区别(这个会在变分贝叶斯中体现)都会有更深的理解。利用图的性质可以很好的避免重复计算,因为推断某一节点所需要的信息可以由一些局部的计算得到,该节点每个邻居可以提供以其为根的子树的所有信息。第九章是相当重要的一章,因为此前所有章节都不涉及“隐变量”的概念。当模型中出现隐变量时,似然就不是对数凹的了(之前的很多目标都是一些指数族的分布,都是对数凹的),且直接求导也有困难,这时我们采用的方法就是EM算法。EM的方法的思想是:虽然现在的似然不是对数凹的,但是利用log函数的凹性,我们可以得到对数似然函数的一个凹的下界,对数似然函数和这个下界之间差的是一个KL散度,这个下界其实是一个双变量的泛函(变量为似然函数里的参数和我们估计的隐变量分布),对每个变量都是凹的,我们可以用坐标下降的思路,交替地优化——这就是E和M步做的事了。第十章讲的是变分推断。变分(variational)我曾经一度不知道是什么意思,在不同场合下听到了许多关于变分的talk,但是我却不知道有什么联系。最近再读这章的时候恍然大悟。变分往往意味着我们要对某个函数做近似。变分推断的出现是因为我们发现基于现在的模型的分布假设,推断参数太难了,因此从一个“变分分布族”中找到一个和现在的分布最像的,来近似我们当前的分布。这个分布族只要足够丰富,我们的近似效果应该是比较好的。变分这个名字就来自于我们从这个分布族中选择一个具体的分布(分布是个函数)来最小化和目标分布的差异(如KL散度),即优化KL这样的泛函。然后基于mean-field假设可以进一步将变分分布进行近似,得到一个类似于EM的对每个参数交替优化的过程,这叫做变分EM法。第十一章讲采样方法,变分通过假设一个变分分布来近似,计算过程是确定的,只要给定了变分分布族,近似结果是一致的,而采样方法是stochastic的,思想是利用大数定理,或者Hoeffding,将期望变成一个有限和。就简单说下最重要的是MCMC方法,其稳态分布是希望的分布,和其他的采样方法“每次采样的期望代价都相同”不一样(这句话我说的有点绕),刚开始的采样我们都舍弃(此时采样率很低),我们先等一会儿,等到它大致到稳态了,就可以获得大量的采样(高采样率)。补充:最近看过一些paper也在质疑这个burn-in phase,认为没有必要,因为渐进的来看MCMC的收敛是和初值无关的,只要ergodicity是满足的就好了。在实际中我认为和应用场景相关,如果我们更关心高概率区域,那就舍弃;如果需要方差大一些,可以保留前面的采样点。MCMC为了生成的样本是iid的,往往每隔M个样本保留一个。我也做过一些小实验,发现全部保留的话采样点分布和期望分布也差不多,所以如果是求期望等问题的MCMC近似或许不用iid。第十二章讲主成分分析,或者说连续隐变量,即寻找一个低维流形,例如手写图片可以看做是某张标准的手写图片做了平移、旋转、伸缩等变换得到的。这里这张标准的手写图片就是我们要找的低维流形的均值,我们要学习出这个均值以及方差(平移、旋转、伸缩的模和方向)。从高维投影到低维的映射我们希望是双射,所以一个最直觉的想法是最小化投影的重构误差。还有一种想法是最大化投影后的方差,即最好所有的点都投影到不同的地方,否则映射回原空间时区分补开。有趣的是这两个思路是等价的,都是PCA。概率PCA就是建模 ,z是低维空间中的变量,x是高维空间的变量,z的先验就是一个零均值高斯,最大化这个似然。这样的好处在于从对低维数据的点估计(PCA做的事情)到了一个分布(可以用贝叶斯估计出 ),并且有了生成式模型的能力,例如异常分析、补缺值等。而涉及到方差这种二阶统计量的时候就能加核,所以kernel PCA也就很自然了。第十三章讲的是序列数据,和之前章节不同的是,序列数据之间并不是独立的,这一系列数据点之间有相互依赖,例如股价的变化依赖于之前时刻的股价、政策等数据。加上马尔可夫假设以后,每个数据只依赖于之前一个数据(一阶Markov)和更早的无关。然后再假设我们观察到的数据是不完全的,例如我们只看得到股价,观察不到决定股价的变量的值,因此对每个数据点引入一个隐变量,以表示我们看不到的数据,这样就成了一条链:马尔可夫链隐马尔可夫模型即是这里的z为离散值,可以理解为GMM中生成每个样本时要考虑前一个样本取自哪个类。最后解法依旧是EM,但是求解的时候更新隐变量状态要顺着链来,因为有依赖,这就是前向算法,更新参数时是反过来的,叫后向算法(和RNN蛮像的)。
第十四章讲的是Ensemble,包括适应性的boosting最著名的adaBoost,以及一些其他的融合方法,理论上也没有更新的东西了。人是机器
为什么说人是机器
【axxzhouaxxyyflongdd】
红与黑、简爱、静静的顿河、上尉的女儿、我是猫、庭长夫人、悲惨世界、傲慢与偏见、变形记、呼啸山庄、小王子、母亲、在人间、我的大学、基督山伯爵、战争与和平、雾都孤儿、百年孤独、茶花女、小妇人、罪与罚、复活、三个火枪手、汤姆叔叔的小屋、鲁滨逊漂流记、格林童话、伊索寓言、漂亮朋友、巴黎圣母院、双城记、堂吉诃德、少年维特之烦恼、苔丝、嘉莉妹妹、浮士德、钢铁是怎样炼成的、包法利夫人、牛虻、邦斯舅舅、汤姆*索亚历险记、这里的黎明静悄悄、格列夫游记、老人与海、好兵帅克、天方夜谭、莎士比亚全集、安娜*卡列尼娜 、高老头、贵族之家、十日谈、神曲、毁灭、青年近卫队、斯巴达克思、铁流、父与子、约翰·克利斯朵夫、马丁·伊登、唐璜、钦差大臣、大卫·科波菲尔、九三年、变色龙、一千零一夜、玩偶之家、飘、一生、荆棘鸟、欧也妮*葛朗台、约婚夫妇、贝姨、恋爱中的女人、前夜、忏悔录、
不全,但我先说到这了,我想还会有人帮你补充的。
人是机器的观点
【axxzhouaxxyyflongdd】我可以推荐一本《铁流》
世界名著100部:
1.乌托邦 莫 尔
2.威尼斯商人 莎士比亚
3.简·爱 夏绿蒂·勃朗特
4.唐璜 拜 伦
5.呼啸山庄 艾米莉·勃朗特
6.鲁宾逊飘流记笛 福
7.名利场 萨克雷
8.傲慢与偏见 简·奥斯丁
9.双城记 查尔斯·狄更斯
10.恋爱中的女人 D·H·劳伦斯
11.新工具 培 根
12.政府论 洛 克
13.尤里西斯 詹姆斯·乔伊斯
14.赫克尔贝里·芬历险记 马克·吐温
15.老人与海 海明威
16.飘 玛格丽特·米切尔
17.嘉莉妹妹 德莱塞
18.小妇人 路易莎·梅·奥尔科特
19.悲惨世界 雨果
20.约翰·克里斯朵夫 罗曼·罗兰
21.幻灭 巴尔扎克
22.欧叶妮·格朗台 巴尔扎克
23.贝姨 巴尔扎克
24.邦斯舅舅 巴尔扎克
25.格兰特船长的儿女 儒勒·凡尔纳
26.漂亮朋友 莫泊桑
27.娜娜 左 拉
28.包法利夫人 福楼拜
29.基督山伯爵 大仲马
30.茶花女 小仲马
31.巴黎圣母院 雨 果
32.红与黑 司汤达
33.拿破仑法典 拿破仑
34.人是机器 拉美特里
35.社会契约论 卢 梭
36.浮士德 歌 德
37.少年维特的烦恼 歌 德
38.希腊神话故事 施瓦布
39.战争论 克劳塞维茨
40.忏悔录 奥古斯丁
41.父与子 屠格涅夫
42.罪与罚 陀思妥耶夫斯基
43.安娜·卡列宁娜 列夫·托尔斯泰
44.复活 列夫·托尔斯泰
45.上尉的女儿 普希金
46.死魂灵 果戈理
47.童年 高尔基
48.我的大学 高尔基
49.钢铁是怎样炼成的 尼·奥斯特洛夫斯基
50.白痴 陀思妥耶夫斯基
51.伊索寓言 伊索·拉封丹
52.理想国 柏拉图
53.政治学 亚里士多德
54.安徒生童话 安徒生
55.牛虻 伏尼契
56.堂·吉诃德 塞万提斯
57.汉穆拉比法典 汉穆拉比
58.论神 斯宾诺莎
59.癞皮鹦鹉 利萨尔迪
60.太阳城 康帕内拉
61.性爱与文明 弗洛伊德
62.苔丝 哈代
63.拉摩的侄儿 狄德罗
64.理智与情感 奥斯汀
65.权力意志 尼采
66.苦闷的象征 厨川白村
67.梦的解析 弗各伊德
68.资本论 马克思
69.先知 纪伯伦
70.俄罗斯的童话 高尔基
71.桃色的云 爱罗先轲
72.水晶瓶塞 莫里斯·勒布朗
73.乡村医生 巴尔扎克
74.高龙巴 梅里美
75.黄室奇案 嘉斯东·勒鲁
76.克菜采奏鸣曲 列·托尔斯泰
77.阴谋与爱情 席勒
78.快乐王子 王尔德
79.变形记 卡夫卡
80.羊脂球 莫泊桑
81.魔沼 乔治·桑
82.死魂灵 果戈里
83.希腊棺材之谜 奎恩
84.母亲 高尔基
85.被背叛的遗嘱 米兰·昆德拉
86.毁灭 法捷耶夫
87.绞刑架下的报告 伏契克
88.贵族之家 屠格涅夫
89.冷血医生 玛丽·希金斯·克拉克
90.十日谈 薄伽丘
91.女富翁的遗产 高木彬光
92.绿野仙踪 莱曼·弗兰·鲍姆
93.法国中尉的女人 约翰·福尔斯
94.汤姆·索亚历险记 马克·吐温
95.马可·波罗游记 马可·波罗
96.卡门 梅里美
97.美丽与悲哀 川端康成
98.野性的呼唤 杰克·伦敦
99.吉卜赛姑娘 塞万提斯
100.浅滩迷船 里縸
人是机器是谁的观点。
如何理解人是机器。
修竹士 - 秀才 三级 你还拉下一本 《尤利西斯》它和《红楼梦》一样都是奇书 人是机器是谁提出的。
人是机器的经典语录 。
轻轻的我走了,正如我轻轻的来人是机器。