• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

最新发布 第5页

算法之道机器学习、Python和算法爱好者

cart树ccp剪枝详细介绍

cart树ccp剪枝详细介绍

代价复杂度剪枝 Cost-Complexity Pruning(CCP)设初始\(k=0\),\(T=T_{0}\),\(\alpha\)为正无穷自上而下的计算\begin{align}g(t)&=\frac{R(t)-R(T_{t})}{|N_{T_{t}}|-1}\\\alpha&=min(\alpha,g(t))\end{a……

hive sql执行顺序以及相关例子

hive sql执行顺序以及相关例子

日常使用的数据查询工具都是 hive,了解一下 hive sql 执行顺序,其实与 mysql 之间的差异不是太大,参考 mysql 的执行顺序,hive 的执行顺序如下fromonjoinwheregroup byhavingselectdistinctunionorder by举例explainselectcity,ad_t……

一次小失误记录sql count

一次小失误记录sql count

这篇文章会出现是因为在统计一个数据的时候随手写了 count,一时忘记 count 对 null 的处理,类似其他的空字符串也是不涵盖的,所以 copy 一篇过来记录一下SQL COUNT() 函数COUNT() 函数返回匹配指定条件的行数。SQL COUNT() 语法SQL COUNT(column_name) 语法COUNT(column……

机器学习gridsearchcv(网格搜索)和kfold validation(k折验证)

机器学习gridsearchcv(网格搜索)和kfold validation(k折验证)

网格搜索算法和K 折交叉验证法是机器学习入门的时候遇到的重要的概念。网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。以决策树为例,当我们确定了要使用决策树算法的时候,为了能够更好地拟合和预测,我们需要调整它的参数。在决策树算法中,我们通常选择的参数是决策树的最大深度。于是我们会给出一系列的最大深度的值,比如 {‘max_dep……

概率密度函数

在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。概率密度函数一般以大写“PDF”(Probability Density Func……

seaborn小试牛刀-数据可视化

View the code on Gist.……

seaborn小试牛刀-颜色设置

View the code on Gist.……

seaborn小试牛刀-样式设置

View the code on Gist.……

pandas删除列

方法一:直接 del DF[‘column-name’]方法二:采用 drop 方法,有下面三种等价的表达式:1. DF= DF.drop(‘column_name’, 1);2. DF.drop(‘column_name’,axis=1, inplace=True)3. DF.……

mac命令行ipython显示matplotlib问题

本机上安装了 anaconda,在 notebook 上可以正常使用 matplotlib,但是在命令行却不行在命令行 ipython 下输入%matplotlib 提示需要 pyqt4,但是当前的安装的版本是 5.X,因此可以通过以下设置方法可以实现图像的显示……

HIVE与null判断相关函数

HIVE与null判断相关函数

1.NVL 函数NVL 函数的格式如下:NVL(expr1,expr2)含义是:如果 oracle 第一个参数为空那么显示第二个参数的值,如果第一个参数的值不为空,则显示第一个参数本来的值。例如:SQL> select ename,NVL(comm, -1) from emp;ENAME NVL(COMM,-1)——- &……

hive日志

hive日志

Hive 中的日志分为两种1. 系统日志,记录了 hive 的运行情况,错误状况。2. Job 日志,记录了 Hive 中 job 的执行的历史过程。系统日志存储在什么地方呢 ?在 hive/conf/ hive-log4j.properties 文件中记录了 Hive 日志的存储情况,默认的存储情况:hive.root.logger=WARN,……

HIVE错误return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask解决方法

HIVE错误return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask解决方法

今天在执行一个 hive 查询语句报下面错误:MapReduce Total cumulative CPU time: 0 days 1 hours 0 minutes 8 seconds 970 msecEnded Job = job_1511596090231_19002 with errorsError during job, obtaining……

hive regexp_extract函数

hive regexp_extract函数

函数描述:regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp字符串正则表达式解析函数。— 这个函数有点类似于 substring(str from ‘regexp’)  ..参数解释:其中:str 是被解析的……

python 你不知道的“else”

文章来自 fluntpython ……

Python中super的用法(新式类与经典类(旧式类)的区别)

在 python2.2 版本之前,直接调用超类的方法,后来改成通过 super 来调用,原因是为了解决多重继承中的钻石形状问题。Python 里的 super 只能用在新式类中,不能用于以前的经典类,如果基类是经典类则会出现这个错误。解决的方法是 FatherClass 只要有一个超类是 Object 就 OK 了。当时我就很蒙蔽,于是再次寻找新式类与经典类……

libsvm文件格式

libsvm文件格式

libsvm 数据格式libsvm 使用的训练数据和检验数据文件格式如下: [label] [index1]:[value1] [index2]:[value2] … [label] [index1]:[value1] [index2]:[value2] …label 目标值,就是说 class(属于哪一类),就是你要分类的种类,通常是一些整数。……