1. 主页 > 人工智能 >

数据驱动算法在机器学习中的应用

 
 
    机器学习的概念分析
 
    机器学习作为一个概念,与增强计算机使用算法和神经网络模型进行学习以及更快、更有效地执行各种任务的能力有关。机器学习或ML通过使用数据或数据集做出决策来帮助构建模型。它可用于简化组织中的决策和执行绩效。这个词是1959年由ArthurSamuel创造的,他来自人工智能和电脑游戏,来自美国。
人工智能
 
    从概念上讲,ML或机器学习模仿了人类生物学上发现的脑细胞交互模型。在大脑活动期间,当神经元相互交流时,这些反过来又使人类能够轻松执行各种功能和任务,而无需任何其他外部形式的支持。就像人脑中的神经元根据情况剖析每个任务一样,在ML中,根据各种算法利用数据进行预测、分类和表示,以解决复杂的问题并提出解决方案。
 
    机器学习中的神经网络模型也是基于DonaldHebb博士在TheOrganizationofBehavior中的理论。在制定机器学习概念方面的一些显着贡献是基于1950年代IBM的ArthurSamuel的进化工作的逐步实施,他开发了一个计算机程序。该计算机程序涉及alpha-beta剪枝,用于测量跳棋游戏中每一方获胜的机会。紧随其后的是定制机器Perceptron,由FrankRosenblatt于1957年开发,专为图像识别而构建,导致了MercelloPelillo于1967年开发的用于基本模式识别的最近邻算法。
 
    机器学习算法和模型
 
    机器学习基于算法和模型的校准功能。简单来说,算法可以被称为利用结构化或非结构化数据产生输出的简单过程。同时,机器学习模型表示使用程序达到结果以完成所需任务的程序和过程(算法)的结合。
 
    算法是进行预测的公式;机器学习模型是实现算法后产生的输出的更广泛的方面。因此,引用机器学习算法导致ML模型而不是反之亦然,在技术方面是有效的。要了解ML算法的作用,让我们先看看机器学习中的模型。
 
    机器学习模型分为三大类:
 
    监督学习:在监督学习中,在不确定的情况下,计算证据以根据已知数据集(输入)和已知数据响应(输出)进行预测,以开发新数据或数据集作为响应。监督学习进一步使用分类和回归等技术来提出其他机器学习模型。
 
    无监督学习:无监督学习涉及从输入数据得出推论,而没有来自具有内在数据集或结构的隐藏模式的标记响应。
 
    强化学习:在机器学习的强化学习模型中,基于试错法,在复杂的环境中做出一系列决策。根据做出的决定的结果,有奖励和惩罚有助于最终做出反应。
 
    现在要详细说明机器算法的作用,让我们以基于聚类的机器学习算法K-means为例。考虑了几个簇,k作为变量。识别每个集群的中心或质心,并在其基础上定义数据点。在多次迭代中,重新识别数据点和集群,一旦定义了所有中心,数据点将与每个集群对齐,并靠近集群中心。该算法在训练数据上表现出色,有助于对各种AI程序的音频检测和图像分割的复杂任务进行排序。
 
 
 
    使机器学习成为根据业务需求探索和发展的进步领域的另一个方面是它对处理数据的需求。各种形式的训练数据是机器学习的基础。从出于安全目的检测对象到预测业务趋势,高效且高性能的算法本质上都是以数据为中心的;数据集越准确,算法产生的输出就越准确。
 
    机器学习中由数据驱动的算法
 
    在物理世界中,人类交互的大部分方面都是基于与各种无形数据的动态关系,人类的大脑每天都会执行许多简单的数据驱动计算。同样,计算基于机器学习中的数据或标记训练数据,这有助于基于人工智能(AI)的程序工作增加价值。与编写程序代码以自动化流程或对大量数据进行深入调查相比,算法的使用要可靠得多,速度也快得多。
 
    机器学习算法是在所提供数据的帮助下产生一组结果的数学方法。因此,数据的重要性是机器学习过程中的核心。由ML提供支持的AI程序的效率取决于输入算法代码的训练数据的质量。不准确的数据集也会降低性能。
 
    对于产生高价值输出的ML算法来说,高质量训练数据集的可用性是必须的。训练数据集是根据AI应用程序的目标开发的带注释或阐明的数据。
 
 
 
    首先,两种类型的数据决定了机器学习算法的工作方式。
 
    手动数据标注
 
    自动数据标记
 
    AI辅助数据标注
 
    自动与手动和人工智能辅助数据标记存在一些关键差异。在手动数据标记中,群众力量根据共享指南或定义来附加标签的技术来标记原始数据。而在自动数据标记中,训练数据由程序标记,并在加载执行之前检查其准确性。而且,人工智能辅助数据标记需要自动化程序和人工来生成高质量的训练数据。
 
    基于数据的算法在现实世界中的应用
 
    这些算法和技术适用于各个行业和经济部门。在数字技术和数据驱动的生态系统时代,面对高效数据创建和开发挑战的复杂要求,在智慧城市、网络安全、智慧医疗、社交媒体和商业等领域,机器学习也正在使数据结构化和发展成为可能。处理可用数据以做出更好的决策、提高绩效和增强业务可持续性。
 
    在卫生部门,人工智能程序正在执行由高度可用的训练数据驱动的任务。这些数据使诸如二十亿等健康应用程序通过检测对象、动作、属性、视听输入、语音输入、神经网络、语音输出、身体控制等来帮助客户跟踪他们的健康训练计划的进度。,正在帮助支持AI的应用程序解码复杂的任务,例如:
 
    了解场景
 
    理解口语
 
    理解对象和动作
 
    通过聊天机器人生成口语
 
    控制助手的身体
 
    了解人体姿势
 
    将视觉概念与文字等联系起来。
 
    行为
 
    在金融等领域,机器学习算法正在帮助企业发现未来的投资机会;同时,对于政府部门,ML算法通过简单地处理来自多个来源的复杂数据,帮助处理欺诈、身份盗窃和提高公共工程的效率。此外,随着数据量增加到海量,机器学习或机器学习通过使用复杂的数据集并帮助垂直业务解决未来的众多挑战来增加价值。
 
    尾注
 
    理想情况下,机器学习用于处理涉及大量数据的复杂计算任务,并且没有静态公式来得出结果。多年来,随着机器学习研究和演进的不断深入,医疗、能源生产、汽车、航空航天、制造和金融等业务部门都从其模型中受益。机器学习模型和算法正在帮助解决特定行业的问题,并通过对象检测、信用评分、贸易预测、DNA测序和预测性维护提供未来的全行业解决方案。
 
    在未来几年,随着数据的持续增长和对可变数据的需求进一步攀升,我们希望看到使用由机器学习算法提供支持的人工智能程序执行许多其他任务,其中模型有助于读取和处理数据并平衡燃料全球企业部门的可持续性。

本文由网上采集发布,不代表我们立场,转载联系作者并注明出处:http://www.34iot.com//a/peixun/371.html

联系我们

在线咨询:点击这里给我发消息

微信号:weixin888

工作日:9:30-18:30,节假日休息