Machine Learning
1、基础知识
1.1 机器学习方式
1.2 模型评估
1.2.1 错误率与精度
1.2.2 查准率与查全率
2、分类-基本算法
2.1 决策树
2.1.1 决策树的基本原理
2.1.2 决策树的三要素
2.1.3 决策树算法的优缺点
2.1.4 熵和信息增益的区别
2.1.5 剪枝处理的作用及策略
2.1.6 决策树算法-id3
2.1.7 决策树算法-c4.5
2.1.8 决策树算法-cart
3、分类-组合算法
3.1 集成学习概述
3.2 个体学习器
3.3 结合策略
3.4 Bagging和Boosting的联系与区别
3.5 Bagging
3.5.1 随机森林原理
3.6 Boosting
3.6.1 AdaBoost原理
-
+
tourist
register
Sign in
机器学习方式
根据数据类型的不同,对一个问题的建模有不同的方式。根据不同的学习方式和输入数据,机器学习主要分为以下四种学习方式。 * **有监督学习:** * 有监督学习是使用已知正确答案的示例来训练网络。 * 已知数据和其一一对应的标签,训练一个预测模型,将输入数据映射到标签的过程。 * 常见的应用场景有**分类**和**回归**。 * 常见的算法包括: * **支持向量机(SVM)** * **朴素贝叶斯** * **逻辑回归** * **K 近邻** * **决策树** * **随机森林** * **AdaBoost** * **线性判别分析(LDA)** * **大多数深度学习算法** * **无监督学习:** * 在无监督学习中,数据并不被特别标示,适用于有数据集但无标签的情况。 * 学习模型是为了推断出数据的一些内在结构。 * 常见的应用场景有**关联规则的学习**以及**聚类**等。 * 常见的算法包括: * **Apriori 算法** * **K-Means 算法** * **半监督学习:** * 在半监督学习中,输入数据部分被标记,部分没有被标记,这种学习模型可以用来进行预测。 * 常见的应用场景有分类和回归,算法包括一些对常用有监督学习算法的延伸,通过对已标记数据建模,在此基础上,对未标记数据进行预测。 * 常见的算法包括: * **图论推理算法(Graph Interface)** * **拉普拉斯支持向量机(Laplacian SVM)** * **弱监督学习:** * 弱监督学习可以看作是有多个标记的数据集合,次集合可以是空集、单个元素、或包含多种情况(没有标记、有一个标记和有多个标记)的多个元素。 * 数据集的标签是不可靠的,这里的不可靠可以是标记不正确、多种标记、标记不充分、局部标记等。 * 已知数据和其一一对应的弱标签,训练一个智能算法,将输入数据映射到一组更强的标签的过程。 * 例如,给出一张包含气球的图片,需要得出气球在图片中的位置及气球和背景的分割线,这就是已知弱标签学习强标签的问题。
ricear
March 29, 2021, 6:41 p.m.
©
BY-NC-ND(4.0)
转发文档
Collection documents
Last
Next
手机扫码
Copy link
手机扫一扫转发分享
Copy link
Markdown文件
share
link
type
password
Update password