作者归档:Fidum

【机器学习基础算法】之线性回归

  通过相关分析可以得到两个或两个以上变量之间相关程度及其大小,但对于彼此相关比较紧密的变量,人们总希望建立变量之间具体的数字关系,以便变量之间能够互相推测。回归分析是寻找存在相关关系的变量间的数学表达式并进行统计推断的一种统计方法。相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。

继续阅读

【机器学习基础算法】之SVM支持向量机

  SVM 源于统计学理论,基于 VC 维理论和结构风险最小原理,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折中,以期获得最好的推广能力(或称泛化能力)。统计机器学习能够精确地给出学习效果以 及解答需要的样本数等一系列问题。所谓 VC 维是对函数类的一种度量,可以简单地理解为问题的复杂程度。VC 维越高,问题越复杂。SVM 的基本模型是二类分类模型,属于有监督学习,是在特征空间中找出一个超平面作为分类边界,对数据进行正确分类,且使每一类样本中距离分类边界最近的样本到分类边界的距离尽可能远,使分类误差最小化。

继续阅读

【前置知识】04.pandas模块的基本使用

Pandas是基于Numpy的一套数据分析工具,该工具是为了解决数据分析任务而创建的。Pandas纳入了大量标准的数据模型,提供了高效地操作大型数据集所需的工具。Pandas提供了大量能使我们快速便捷地处理数据的函数和方法。 它是使Python 成为强大而高效的数据分析环境的重要因素之一

继续阅读