
Python 使用numpy实现PCA降维
PCA降维,即主成分分析 主要过程为:先将数据标准化,然后求协方差矩阵,接着对协方差矩阵求特征向量和特征值,这些特征向量组成了新的特征空间。 标准化的方法一般有: min-max 均值 o-score 通过方差和均值来进…
Simple And Naive
PCA降维,即主成分分析 主要过程为:先将数据标准化,然后求协方差矩阵,接着对协方差矩阵求特征向量和特征值,这些特征向量组成了新的特征空间。 标准化的方法一般有: min-max 均值 o-score 通过方差和均值来进…
实在没找到当条件子树的数据类似[[‘A’],[‘A’],[‘B’],[‘A’,’B’],[̵…
Apriori algorithm是关联规则里一项基本算法。是由Rakesh Agrawal和Ramakrishnan Srikant两位博士在1994年提出的关联规则挖掘算法。关联规则的目的就是在一个数据集中找出项与项…
C4.5 在 ID3的基础上使用信息增益率代替信息增益,减少了信息数量对优先级的影响 gain_rate(X,A) = gain(X,A) / split_in_word(A) 其中split_in_word是分裂信息度…
造轮子上瘾ing 果然只有自己从0撸算法才会理解的比较透彻 ID3决策树是基于信息增益和贪心法来递归建树 对于每一个节点选取信息增益最大的属性进行划分,当某个子数据集中仅存在一种分类时,则将其作为一个叶子节点 信息增益 …
写KD树的时候没把类别考虑进去。。。所以先用KD算出最近的k个点,然后找到对应分类最后输出占比最大的 KD树是一种二叉树,用来分割空间上得点 一个树节点的结构如下: class TreeNode: index = -1 …
使用数据集: # outlook temperature humidity windy play train = [ ('sunny', 85.0, 85.0, False, 'no'), ('rainy', 75.0,…
TensorBoard是Tensorflow自带的一个可视化学习插件 通过TensorBoard 可以记录学习过程中的参数变化以及将网络结构以图的方式展现 要使用Tensorboard 在构建网络的过程中需…
很多时候一个单位的各个属性数值的单位都是不同的,在聚类以及多维分析,或者训练神经网络的时候很可能会带来不便 以下是几种数据标准化方法: 线性函数转化 最常用的数据标准化方法 可以将数据范围内的点映射到【0,1】范围中 缺…
输入是类似于: [[ 0. 0. 0. 0. 0. 0. 0. ], [ 0. 0. 0. 0. 0. 0. 0. ], ...... [ 0. 0. 0. 0. 0. 0. 0. ]] 的数组,设数组变量名为 X 则有…