注册 登录
    • 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

最新发布 第5页

算法之道机器学习、Python和算法爱好者

spark决策树API分析

此版本是ml版本,区别于mllib版本的决策树api输入Param nameType(s)DefaultDescriptionlabelColDouble“label”标签featuresColVector“features”特征向量 输出……

spark shell运行模式小记

集群经常会增加相应的node节点,但是相应的环境有没有及时更新,有的时候因为某个节点环境没有配置好导致程序跑挂了,所以有的时候需要本地模式仅在driver跑相应的测试代码,记录一下当前的几种运行模式本地模式Spark单机运行,一般用于开发测试。Standalone模式构建一个由Master+Slave构成的Spark集群,Spark运行在集群……

spark随机森林算法

spark随机森林算法由多个决策树构成的森林,算法分类结果由这些决策树投票得到,决策树在生成的过程当中分别在行方向和列方向上添加随机过程,行方向上构建决策树时采用放回抽样(bootstraping)得到训练数据,列方向上采用无放回随机抽样得到特征子集,并据此得到其最优切分点,这便是随机森林算法的基本原理。图 1给出了随机森林算法分类原理,从图中可以看到,随……

BluePrint概念

Blueprints先备份下这篇文章,这篇文章解释了我当前web app架构的疑惑,算是对flask又有了一点了解What is a blueprint?A blueprint defines a collection of views, templates, static files and other elements that can be ……

pandas之series小记

Series is a one-dimensional labeled array capable of holding any data type (integers, strings, floating point numbers, Python objects, etc.). The axis labels are collectively refer……

numpy广播机制

The term broadcasting describes how numpy treats arrays with different shapes during arithmetic operations. Subjectto certain constraints, the smaller array is “broadcast” across ……

scipy统计模块stats翻译

Statistics (scipy.stats)介绍在这个教程我们讨论一部分scipy.stats模块的特性。这里我们的意图是提供给使用者一个关于这个 包的实用性知识。我们推荐reference manual来介绍更多的细节。注意:这个文档还在发展中。随机变量有一些通用的概率分布类被封装在continuous random varia……

hive专题(1)-数据表创建

数据库的基本操作很多都是相差不大,从mysql到hive,基本上大部分语法都是相同的,除了一部分本质上的差异,其他语法可以通用,今天就先学习下hive数据表的创建CREATE TABLE pokes (foo INT, bar STRING);hive> CREATE TABLE pokes (foo INT, bar STRING);OK……

mathjax 测试

本博客支持mathjax操作数据学公式啦!具体使用可以看以下两个实例(1)第一种是一行显示公式,就是不与文字在同一行使用语法规范$$sum_{i=1}^n a_i=0$$效果如下$$\sum_{i=1}^n a_i=0$$(2)第二种是行内公式使用语法规范\(ax^2 + bx + c = 0\)这句话是行内测试\(ax^2 + b……

simrank算法

1. SimRank推荐算法的图论基础SimRank是基于图论的,如果用于推荐算法,则它假设用户和物品在空间中形成了一张图。而这张图是一个二部图。所谓二部图就是图中的节点可以分成两个子集,而图中任意一条边的两个端点分别来源于这两个子集。一个二部图的例子如下图。从图中也可以看出,二部图的子集内部没有边连接。对于我们的推荐算法中的SimRank,则二部图中的两……

Python None小记

None是一个特殊的常量None和False不同None不是0None不是空字符串None和任何其他的数据类型比较永远返回FalseNone有自己的数据类型NoneType你可以将None复制给任何变量,但是你不能创建其他NoneType对象。Python代码 >>> type(None) <class �……

AWS之hive单机版环境安装

今晚终于在aws上把hive单机版的环境终于安装好了,现在记录一下安装环境的所有步骤,以后学习hive可以直接在aws上面测试在hive专题可以看到更多的学习资料哦hive需要依赖于hadoop环境,因此我们先安装hadoophadoop安装java环境安装yum search java|grep jdk首先查找先当前的所有jdk版本,默认……