Xgbfi 用于训练好的xgboost模型分析对应特征的重要性,当然你也可以使用fmap来观察 What is […]
简单介绍一下吧,lightgbm是微软推出的gbdt相关的机器学习库,一开源就受到很多开发者的喜爱吧,主要是运 […]
序列预测是当前深度学习最火热的应用之一。从搭建推荐系统到语音识别再到自然语言处理,序列预测有着广泛的应用前景。 […]
一般情况下对于推荐输出的召回的候选集进行排序,ltr排序这个也是大家经常使用的。 lr+gbdt 这个组合在c […]
最近需要做一个国家区域的聚类分析,使用的是kmeans聚类方法,构造接近900维特征来进行聚类。使用sklea […]
最近在极客时间上买了一个推荐三十六式的课程,作为一个推荐系统方面的新手,在这个课程上还是可以学习不少推荐方面的 […]
声明: manifold:可以称之为流形数据。像绳结一样的数据,虽然在高维空间中可分,但是在人眼所看到的低维空 […]
Coursera深度学习教程中文笔记 课程概述 https://mooc.study.163.com/univ […]
先举个例子 上面的二部图表示user A对item a和c感兴趣,B对a b c d都感兴趣,C对c和d感兴趣 […]
其实吧这篇文章可写可不写,因为这个偏差和方差的问题在机器学习中算是经常遇到,大家根据不同的业务场景来做相应的取 […]
数据科学家花了大量的时间清洗数据集,并将这些数据转换为他们可以处理的格式。事实上,很多数据科学家声称开始获取和 […]
在之前的有一篇文章给出了pointwise之prank算法说明以及实现,这一篇文章会讲解pairwise。 写 […]
:mrgreen:博主今天跑完微马拉松,回来之后躺在沙发上就睡着了,醒来洗个澡开始学习了,网易云课堂的视频最近 […]
修改记录: 2017/3/22修改代码中的部分BUG 核心代码 https://github.com/zhus […]
先给出一个例子抛出最大熵的问题。。 掷骰子,骰子总共有6个点数,现在你觉得每个点数掷到的概率多大? 你毫不犹豫 […]
kd 树的结构 kd树是一个二叉树结构,它的每一个节点记载了【特征坐标,切分轴,指向左枝的指针,指向右枝的指针 […]
最近一些列的博客尽量使用口语化的方式来把问题说明白,一般情况下能把事情说的明明白白也可以变相的说明你对问题有一 […]
随机森林的介绍在这篇文章中就不多介绍了,核心思想就是双随机过程:随机样本采样和随机特征采样 特征选择下面介绍两 […]