分类: Machine Learning

Machine Learning

Anaconda 和 Jupyter的一些小技巧

在机器学习的各类教程中,都会提到Anaconda,这是一个集中式安装机器学习各类环境和类库的工具,能简化机器学习环境的部署,对小白来说尤其方便。 只要装了Anaconda,一系列包括Python、pip、Numpy、Scikit-learn、Tensorflow、Jupyter Notebook等等海量的Library…

阅读全文 »

Anaconda 和 Jupyter的一些小技巧

在机器学习的各类教程中,都会提到Anaconda,这是一个集中式安装机器学习各类环境和类库的工具,能简化机器学习环境的部署,对小白来说尤其方便。 只要装了Anaconda,一系列包括Python、pip、Numpy、Scikit-learn、Tensorflow、Jupyter Notebook等等海量的Library…

阅读全文 »

Numpy与Pandas

Numpy简介 Numpy(Numerical Python)是一个开源的Python科学计算库,包含很多实用的数学函数,涵盖线性代数、傅里叶变换、随机数生成等功能,在机器学习这个科学范畴内,Numpy与Pandas、Matplot、Scikit-learn等一系列工具配合,实现高效的矩阵运算、机器学习模型运算等。在绝…

阅读全文 »

SVM VS. Logistic Regression

二者都是经典的分类器,SVM更强调最优化的可分,并且有严密的数学模型支撑。 网上搜了二者的优缺点对比,最终说实话还是一知半解。可能还需要真实场景实践,也许能够深入理解二者区别吧。 支持向量机的优势在于: 在高维空间中非常高效. 在线性可分的低维空间,SVM得到的比Logistic Regression更加健壮 即使在数…

阅读全文 »

SVM SMO算法的实现

SVM通过拉格拉日对偶等最终形成了一套数学模型,最终可以通过SMO(Sequential Minimal Optimization)的方法可以解出最佳值alpha值。当然,可以通过经典的libsvm这样的slover实现计算,诸如此类的solver也是通过SMO算法来计算SVM的最优化参数,但是作为小白,确实有必要理解…

阅读全文 »

Linear Algebra in Machine Learning

ML中用到大量的矩阵运算,Linear Algebra是一个重要的部分,有助于理解样本、数据的格式,甚至神经网络多层的数值计算和传输。譬如通过矩阵运算求和相比于for循环等更加高效直接。因此Linear Algebra是机器学习基础之一。 3blue1brown出品的线性代数介绍,十几个章节。B站加了中文字幕,如果英文…

阅读全文 »

Precision and Recall,F1 Score

评价一个ML模型的优劣,常用到准确率(Precision)、召回率或全面率(Recall)和F1 Score分数三个概念,经过整理,总算是有清晰的理解。准确率高的模型不一定最优,有可能覆盖不全面,因此用F1 Score来Trade Off二者之间的关系。 以预测cancer为例,malignant为positive,b…

阅读全文 »

Ubuntu 18.0.4搭建深度学习平台

创建虚拟机,选择Ubuntu 64bit CPU:4core,不打开IOMMU【有些文档提到要打开,实际上不需要,否则虚拟机无法启动】 Memory:32GB Reserved Disk:100GB Thin provision 引导方式选择:EFI 此时不能分配显卡,否则虚拟机无法启动!!! 虚拟机配置参考:http…

阅读全文 »

Ubuntu 18.0.4搭建深度学习平台

创建虚拟机,选择Ubuntu 64bit CPU:4core,不打开IOMMU【有些文档提到要打开,实际上不需要,否则虚拟机无法启动】 Memory:32GB Reserved Disk:100GB Thin provision 引导方式选择:EFI 此时不能分配显卡,否则虚拟机无法启动!!! 虚拟机配置参考:http…

阅读全文 »