Python实现oneR分类算法
oneR算法,简单解释就是在一个Unit的所有属性中选择一个误差最小或者是最稳定的属性进行评判 同样在这个属性的每个属性值的对应结果中,对于每个属性值选取占比最大的结果作为该属性值的结果(语文不好…̷…
Simple And Naive
oneR算法,简单解释就是在一个Unit的所有属性中选择一个误差最小或者是最稳定的属性进行评判 同样在这个属性的每个属性值的对应结果中,对于每个属性值选取占比最大的结果作为该属性值的结果(语文不好…̷…
只包含了对微博内容的信息提取而不包含爬虫 中文分词使用了jieba,安装: pip3 install jieba 这些是用在微博数据预测数据集中得一个分析模块,不过总感觉还可以拿来做些什么 import re from …
本书中第一次介绍神经网络(单隐层前馈神经网络) 使用tanh为激活函数,类似的有 双极S曲线函数 等等 网络算法使用前馈法,即每个神经元接受前一层的所有输入并输出该神经元结果 训练方法为反向传播法,即使用真实数据(在这里…
应该算是第一个根据自己思路叭出来的Tensorflow 代码 好好地记录一下 首先导入需要的库 import tensorflow as tf import numpy import pylab as pl…
并不是标准的极大似然法…是魔改的而且效果并比不上人工拟合 因为如果使用标准平均值作为高斯分布的μ,对于中心不在平均点的数据不能很好的拟合 所以改用加权平均 μ = ∑(i=1 to n)(Ai * P(Ai)…
最近搞事情的有点多….都不能好好学习了 省略了原文中的爬虫部分直接使用了对应的数据集 所以吧PR算法的生成函数写在了searcher里 数据集在此:searchindex-db 原文的地址早就废了 幸好有我大…
修改了部分代码以适应上一张的数据集 K-means聚类效果不佳 估计是数据量不够和维度不足 Python3的PIL库已经万年不更新了 pip里也米有所以画图部分的均没有实现 from math import sqrt i…
改了下他的小数据集…只用了MovieLens的大数据集: from math import sqrt critics = { '用户A': { '集体智慧编程': 2.5, '机器学习': 3.5, '数据之…
在看《集体智慧编程》的时候跟着书顺手写的 欧几里得距离 # 返回person1 与 person2 基于欧几里得距离的相似度评价 # sum_of squares = 所有 p1 与 p2 共同评价的物品的分数差的平方之…