• 1
  • 2
  • 3
  • 4

首页 / 行业

人工智能最流行的机器学习算法

2023-06-07 23:18:00

机器学习是该行业的一个创新和重要领域。根据我们想要实现的目标,我们选择了机器学习程序的算法类型。现在,机器学习有很多算法。因此,对于初学者来说,这么多算法可能是相当不堪重负的。今天,我们将简要介绍10种最受欢迎的机器学习算法,让您适应这个令人兴奋的机器学习世界!

让我们言归正传!

1.线性回归

线性回归(LinearRegression)也许这是最受欢迎的BAV99RWT1机器学习算法。线性回归是找到一条直线,尽可能拟合散点图中的数据点。它试图通过拟合直线方程和数据来表示自变量(x值)和数值结果(y值)。然后你可以用这条线来预测未来的价值!

最常用的算法是最小二乘法(Leastofsquares)。这种方法计算出最佳拟合线,以最大限度地减少直线上每个数据点的垂直距离。总距离是所有数据点的垂直距离(绿线)的平方和。其思想是通过将平方误差或距离降到最低来拟合模型。

2.逻辑回归

逻辑回归(Logisticregression)它类似于线性回归,但用于输出二进制(即当结果只有两个可能值时)。对最终输出的预测是一个叫做logisticfunction的非线性S型函数。

这个逻辑函数将中间结果值映射到结果变量Y,其值范围从0到1。然后,这些值可以解释为Y的概率。S逻辑函数的性质使逻辑回归更适合分类任务。

3.决策树

决策树(DecisionTrees)可用于回归和分类任务。

在这个算法中,训练模型通过学习树表示(Treerepresentation)学习决策规则来预测目标变量值。树木由具有相应属性的节点组成。

在每个节点上,我们根据可用的特点询问相关数据。左右分支代表可能的答案。最终节点(即叶节点)对应于预测值。

每个特征的重要性都是由自上而下决定的。节点越高,其属性就越重要。

4.简单的贝叶斯

朴素贝叶斯(NaiveBayes)它是基于贝叶斯定理的。它测量每个类别的概率,并给出每个类别的条件概率X的值。该算法用于分类问题,并得到二进制“是非”的结果。请查看以下方程。

QQ截图20230329104145.webp

简易贝叶斯分类器是一种流行的统计技术,可用于过滤垃圾邮件!

5.支持向量机(SVM)

支持向量机(SupportVectorMachine,SVM)它是一种用于分类问题的监督算法。支持向量机试图在数据点之间绘制两条线,边距最大。因此,我们将数据项绘制到n维空间中的点,其中n是输入特征的数量。在此基础上,支持向量机找到最佳边界,称为超平面(Hyperplane),最好将可能的输出与类标签分开。

超平面与最近类点之间的距离称为边距。最佳超平面有最大的边界,可以对点进行分类,以最大限度地发挥最新数据点与这两类之间的距离。

6.K-最近邻算法(KNN)

K-最近邻算法(K-NearestNeighbors,KNN)很简单。在整个训练中,KNN搜索了K最相似的例子,即K邻居,并为所有这些K例子分配了一个公共输出变量来分类对象。

k的选择非常重要:较小的值可能会产生大量的噪音和不准确的结果,而较大的值是不可行的。它最常用于分类,但也适用于回归问题。

欧几里之间的距离可以用来评估实例之间的相似性(Euclideandistance)、曼哈顿距离(Manhattandistance)或明氏距离(Minkowskidistance)。欧几里得的距离是两点之间的普通直线距离。事实上,这是一个平方根,点坐标之间的差异。

7.K-均值

K-均值(K-means)它是通过对数据集进行分类来聚类的。例如,该算法可以用来根据购买历史对用户进行分组。这是在数据集中发现的K类。K-平均值用于无监督学习,所以我们只需要使用训练数据X和我们想要识别的聚类数K。

根据每个数据点的特点,该算法迭代地将每个数据点分配给K组中的一个组。它为每个K聚类(称为纹理)选择K点。在相似性的基础上,在最近的纹理聚类中添加新的数据点。这个过程一直持续到纹理停止变化。

8.随机森林

随机森林(RandomForest)它是一种非常流行的集成机器学习算法。该算法的基本思路是,许多人的意见比个人意见更准确。在随机森林中,我们使用决策树集成(见决策树)。

为了对新对象进行分类,我们对每棵决策树进行投票,并结合结果,然后根据大部分投票做出最终决定。

9.降维

因为我们今天可以捕捉到很多数据,机器学习的问题变得更加复杂。这意味着训练非常缓慢,很难找到好的解决办法。这个问题通常被称为“维数灾难”(Curseofdimensionality)。

降维(Dimensionalityreduction)试图将特定的特征组合成更高层次的特征来解决这个问题,而不会丢失最重要的信息。主要成分分析(PrincipalComponentAnalysis,PCA)最受欢迎的是降维技术。

通过将数据集压缩到低维线或超平面/子空间,主要成分分析可以减少数据集的维数。这样,原始数据的显著特征就可以尽可能保留。

降维的例子可以通过将所有数据点接近一条直线来实现。

10.人工神经网络(ANN)

人工神经网络(ArtificialNeuralNetworks,ANN)它可以处理大型和复杂的机器学习任务。神经网络本质上是一组由权重边缘和节点组成的相互连接的层,称为神经元。我们可以在输入层和输出层之间插入多个隐藏层。人工神经网络使用两个隐藏层。此外,还需要处理深度学习。

人工神经网络的工作原理类似于大脑的结构。一组神经元被赋予随机权重,以确定如何处理输入数据。通过输入数据来训练神经网络,我们可以学习输入和输出之间的关系。在训练阶段,系统可以访问正确的答案。

如果网络不能准确识别输入,系统将调整权重。经过充分的训练,它将始终识别正确的模式。每个圆节点代表一个人工神经元,箭头代表从一个人工神经元输出到另一个人工神经元输入的连接。


机器学习算法人工智能输入节点算法训练

  • 1
  • 2
  • 3
  • 4

最新内容

手机

相关内容

  • 1
  • 2
  • 3

猜你喜欢