初识机器学习
机器学习主要源于2个领域:人工智能和数据科学。
人工智能
人工智能是创造出与人类一样聪明的机器,在这个方向上,该领域又分为不同的学派,包括关注构建像人类一样思考的认知系统。
人工智能(AI)的难题:
1.所有的智能体都只有很少的计算资源、很低的处理速度和很小的内存等等。
2.所有的计算都是局部的,但是大多数AI问题都有全局约束。3.计算逻辑基本上是演绎逻辑,但是许多AI问题本质上是溯因性或归纳性4.世界是动态变化的,知识是有限的,但AI智能体必须始终从它已知道的东西开始5.解决问题、推理和学习已经足够复杂,但是解释和证明增加了这种复杂性人工智能(AI)的特征:
1.在许多AI问题中,数据是陆续出现的,而不是一开始就出现所有数据
2.问题常常会重复出现,同类问题会一再出现3.问题在许多不同的抽象层面上出现4.许多引人关注的AI问题难以通过计算来解决5.外界是动态的,是不断变化的,但是有关外界的知识是相对不变的6.外界是开放的,但有关外界的知识是相对有限的因此问题变成我们如何能设计出AI智能体来解决具有这些特征的AI问题。
数据科学家
同时掌握了多种不同技能的人,数据科学家了解数学和统计学知识,这使他们可以在海量的数据中找出引人关注的见解,他们还具备编程技能,可以通过代码建立统计模型,并从各种不同的数据源中获取数据,此外,数据科学家还知道如何提出正确的问题,并将这些问题转换为全面的分析,完成分析后,他们运用沟通技能,以人们易于理解的方式报告他们的发现,换言之,数据科学家能够对庞大的数据集执行复杂的分析,在完成分析之后,他们还能够编制信息图,以将他们的发现传递给其他人。