hua818 发表于 6 天前

深入解析机器学习:人工智能分支及核心方法与定义

机器学习的定义

机器学习()是人工智能的一个分支,也是实施人工智能的方式。

机器学习的核心是“使用算法来解析数据,从中学习,然后对新数据做出决策或预测”。

换句话说,计算机使用获得的数据获取特定模型然后使用此模型预测的方法。这个过程与人类的学习过程有些相似。例如,如果一个人获得某些经验,他可以预测新问题。例如,无需通过编程识别猫或面,可以通过使用图片来概括和识别特定目标来培训它们。

汤姆·M(Tom M M)是机器学习领域的著名学者,曾经对机器学习进行了以下定义:

如果可以通过经验E来改进计算机程序的性能(由P测得)以提高某种类型的任务T,则认为该程序将学习有关T和P。

机器学习的概念是通过输入大规模的培训数据来训练模型,以便模型可以掌握数据中包含的潜在定律,然后准确地对或预测新输入的数据。

例如,垃圾邮件过滤器是一个机器学习程序,可以通过垃圾邮件的示例(例如用户手动标记的垃圾邮件)和常规电子邮件(非垃圾邮件)来标记垃圾邮件。这些系统用于学习的示例,我们称它们为培训集。每个培训示例称为训练示例或培训样本。

任务T是为新电子邮件标记垃圾邮件,经验E是培训数据,因此我们需要定义测量性能的度量P。例如,我们可以使用正确分类的电子邮件的比率进行测量。这种特殊的性能度量称为精度。该模型是通过输入大量训练数据来训练的,使精度越来越高,然后准确地对新输入的数据进行了准确分类或预测。

发展历史

人工智能是一个更广泛的概念,机器学习是我们达到人工智能的一种方式。

https://img0.baidu.com/it/u=4219853296,3284396339&fm=253&fmt=JPEG&app=138&f=JPEG?w=760&h=500

人工智能(AI)的概念是在1955年提出的。机器学习概念(ML)是在1990年提出的。到目前为止,机器学习的发展已经经历了三个阶段:

1980年代正式形成,尚未有任何影响。

1990年代和2010年代是一个蓬勃发展的时期,许多理论和算法诞生了,它们确实朝着实用性发展。

2012年之后,深度学习,深度学习技术的诞生和发展迅速,该时期已经解决了此阶段AI的一些关键问题,并带来了行业的快速发展。

根据是否在人类监督下进行学习的问题,机器学习任务的区别如下:

监督学习:监督的学习算法依靠带有标签的培训数据来构建数学模型。例如,如果任务是确定图像是否包含实体,则训练集中的图像应同时包含图像,也不包含该实体。同时,需要标记每个图像是否包含标签。根据标签的数值特征(连续和离散),可以将监督的学习分为分类问题和回归问题。

半监督学习:在某些情况下,并非所有输入数据集都是有效注释的,即训练集包含标记和未标记的样本。实际上,未标记的样品具有与标记样品相同的分布,如果您在培训期间可以利用此样品,这可能会有所帮助。

无监督的学习:无监督的学习算法完全使用未标记的培训数据来培训模型。无监督的学习用于探索数据的分布,例如聚类点等。无监督的学习可用于发现数据的潜在模式并按组对数据进行分类,并且还可以用于功能学习和数据维度降低等。

加强学习:在动态环境中以正面或负面强化的形式提供反馈,用于驾驶车辆,或学会与人类对手一起玩游戏,等等。

机器学习过程

机器学习的过程本质上是数据准备,数据分析,数据处理和结果反馈的过程。根据这个想法,我们可以将机器学习分为以下步骤:业务场景分析,数据处理,功能工程,算法模型培训和应用程序服务。以下将详细介绍这些步骤。

1。业务场景分析

业务场景分析是将我们的业务需求和使用情况转换为机器学习需求语言的过程,然后分析数据并选择算法。这是机器学习的准备阶段,主要包括:业务抽象,数据准备和选择算法。

2。数据处理

https://img0.baidu.com/it/u=3373414399,3002486964&fm=253&fmt=JPEG&app=138&f=JPEG?w=500&h=653

数据处理是数据选择和清洁的过程。准备数据后,确定算法并确定要求,并且需要数据需求。数据处理的目的是最大程度地减少对算法的干扰。在数据处理中,我们经常使用“降级”和“归一化”。

意味着从数字中删除干扰数据,这意味着您的数据案例中有特殊或异常数据。一方面,我们的产品经理需要进行反映现实世界数据的数据,另一方面,我们可以通过算法识别干扰数据。

归一化意味着简化数据,通常将数据简化为。数据归一化主要有助于算法很好地找到最佳解决方案。

3。功能工程

在机器学习中有一个俗话说,数据和功能决定了机器学习的上限。模型和算法仅近似于此上限。数据和功能是算法模型的基础。所谓的特征工程是在处理后提取数据的功能,并将其转换为算法模型可以使用的数据。

4。算法模型培训

准备功能数据后,可以根据特定任务选择和训练适当的模型。根据所选算法,训练和评估,通过算法培训获得算法模型,并通过新的数据测试完成对模型质量的评估。如果模型不符合要求,则需要对模型进行调整,训练和重新评估,直到模型达到标准为止。

5。申请服务

调谐后获得的最佳模型通常以文件的形式保存,可以在应用时直接加载和使用。机器学习应用程序将模型文件加载,将新样本的特征数据输入模型,并通过模型预测以获得最终的预测结果。

在人工智能研究的过程中,机器学习是行业研究的核心,也是实现人工智能目标的最基本方法。目前,中国与西方在人工智能领域之间的鸿沟正在缩小,整个市场都在勘探阶段。基本层和技术层逐渐成熟。人工智能将逐渐扩展到其他领域,并继续深入发展。从未来的发展趋势来看,人工智能的发展前景非常广泛。
页: [1]
查看完整版本: 深入解析机器学习:人工智能分支及核心方法与定义