注册 登录
    • 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

2017年12月的内容

cart树ccp剪枝详细介绍

代价复杂度剪枝Cost-Complexity Pruning(CCP)设初始\(k=0\),\(T=T_{0}\),\(\alpha\)为正无穷自上而下的计算\begin{align}g(t)&=\frac{R(t)-R(T_{t})}{|N_{T_{t}}|-1}\\\alpha&=min(\alpha,g(t))\end{al……

hive sql执行顺序以及相关例子

日常使用的数据查询工具都是hive,了解一下hive sql执行顺序,其实与mysql之间的差异不是太大,参考mysql的执行顺序,hive的执行顺序如下fromonjoinwheregroup byhavingselectdistinctunionorder by举例explainselectcity,ad_type,devi……

一次小失误记录sql count

这篇文章会出现是因为在统计一个数据的时候随手写了count,一时忘记count对null的处理,类似其他的空字符串也是不涵盖的,所以copy一篇过来记录一下SQL COUNT() 函数COUNT() 函数返回匹配指定条件的行数。SQL COUNT() 语法SQL COUNT(column_name) 语法COUNT(column_name) ……

机器学习gridsearchcv(网格搜索)和kfold validation(k折验证)

网格搜索算法和K折交叉验证法是机器学习入门的时候遇到的重要的概念。网格搜索算法是一种通过遍历给定的参数组合来优化模型表现的方法。以决策树为例,当我们确定了要使用决策树算法的时候,为了能够更好地拟合和预测,我们需要调整它的参数。在决策树算法中,我们通常选择的参数是决策树的最大深度。于是我们会给出一系列的最大深度的值,比如 {‘max_dept……

概率密度函数

在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。概率密度函数一般以大写“PDF”(Probability Density Func……

seaborn小试牛刀-数据可视化

View the code on Gist.……

seaborn小试牛刀-颜色设置

View the code on Gist.……

seaborn小试牛刀-样式设置

View the code on Gist.……

pandas删除列

方法一:直接del DF[‘column-name’]方法二:采用drop方法,有下面三种等价的表达式:1. DF= DF.drop(‘column_name’, 1);2. DF.drop(‘column_name’,axis=1, inplace=True)3. DF.dro……

mac命令行ipython显示matplotlib问题

本机上安装了anaconda,在notebook上可以正常使用matplotlib,但是在命令行却不行在命令行ipython下输入%matplotlib 提示需要pyqt4,但是当前的安装的版本是5.X,因此可以通过以下设置方法可以实现图像的显示……

HIVE与null判断相关函数

1.NVL函数NVL函数的格式如下:NVL(expr1,expr2)含义是:如果oracle第一个参数为空那么显示第二个参数的值,如果第一个参数的值不为空,则显示第一个参数本来的值。例如:SQL> select ename,NVL(comm, -1) from emp;ENAME NVL(COMM,-1)——- ̵……

hive日志

Hive中的日志分为两种1. 系统日志,记录了hive的运行情况,错误状况。2. Job 日志,记录了Hive 中job的执行的历史过程。系统日志存储在什么地方呢 ?在hive/conf/ hive-log4j.properties 文件中记录了Hive日志的存储情况,默认的存储情况:hive.root.logger=WARN,DRFAhive……

HIVE错误return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask解决方法

今天在执行一个hive查询语句报下面错误:MapReduce Total cumulative CPU time: 0 days 1 hours 0 minutes 8 seconds 970 msecEnded Job = job_1511596090231_19002 with errorsError during job, obtaining d……

hive regexp_extract函数

函数描述:regexp_extract(str, regexp[, idx]) - extracts a group that matches regexp字符串正则表达式解析函数。— 这个函数有点类似于 substring(str from ‘regexp’)  ..参数解释:其中:str是被解析的字……