• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下
loglikelihood ratio 相似度理解

loglikelihood ratio 相似度理解

摘要:在机器学习中常用到各种距离或者相似度,今天在看美团推荐系统重排序的文章时看到了 loglikelihood ratio 相似度,特总结起来。以后有时间再把常用的相似度或者距离梳理到一篇文章。背景:记录 loglikelihood ratio 相似度概念总结:下表表示了 Event A 和 Event B 之间的相互关系,其中:k11 :……

kd树基本描述

kd树基本描述

kd 树的结构kd 树是一个二叉树结构,它的每一个节点记载了【特征坐标,切分轴,指向左枝的指针,指向右枝的指针】。其中,特征坐标是线性空间\(R^n\)中的一个点\(x_1,x_2,…,x_n\)。切分轴由一个整数\(r\)表示,这里\(1 \le r \le n \),是我们在 n 维空间中沿第 r 维进行一次分割。节点的左枝和右枝分别……

数据归一化必要性

数据归一化必要性

为什么要进行归一化处理,下面从寻找最优解这个角度给出自己的看法。例子假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。那么可以得到的公式为:\[y=\theta _{1}x_{1} +\theta _{2}x_{2} \]\(x_{1}\) 代表房间数,\(\theta _{1}\)代表\(x_{1}\)变量前面的系数\(x_{2}\……

概率密度函数

概率密度函数

在数学中,连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。当概率密度函数存在的时候,累积分布函数是概率密度函数的积分。概率密度函数一般以大写“PDF”(Probability Density Func……

scipy统计模块stats翻译

scipy统计模块stats翻译

Statistics (scipy.stats)介绍在这个教程我们讨论一部分 scipy.stats 模块的特性。这里我们的意图是提供给使用者一个关于这个 包的实用性知识。我们推荐 reference manual 来介绍更多的细节。注意:这个文档还在发展中。随机变量有一些通用的概率分布类被封装在 continuous random ……

稀疏矩阵表示方法

稀疏矩阵表示方法

在科学与工程领域中求解线性模型时经常出现大型的稀疏矩阵。在使用计算机存储和操作稀疏矩阵时,经常需要修改标准算法以利用矩阵的稀疏结构。由于其自身的稀疏特性,通过压缩可以大大节省稀疏矩阵的内存代价。更为重要的是,由于过大的尺寸,标准的算法经常无法操作这些稀疏矩阵。三元组表示法按照压缩存储的概念,只存储稀疏矩阵的非零元素。因此,除了存储非零元的值之外,还必……

深入浅出傅立叶变换

深入浅出傅立叶变换

傅里叶分析不仅仅是一个数学工具,更是一种可以彻底颠覆一个人以前世界观的思维模式。但不幸的是,傅里叶分析的公式看起来太复杂了,所以很多大一新生上来就懵圈并从此对它深恶痛绝。老实说,这么有意思的东西居然成了大学里的杀手课程,不得不归咎于编教材的人实在是太严肃了。(您把教材写得好玩一点会死吗?会死吗?)所以我一直想写一个有意思的文章来解释傅里叶分析,有可能的话高中……

SVD–矩阵奇异值分解

SVD–矩阵奇异值分解

概述线性代数方法使我们可以将数据分解为很多分量,然后分析其中的主要分量,奇异值分解(SVD)就是其中的一种矩阵分解技术,它是一种有效的代数特征提取方法,深刻揭示了矩阵的内部结构。目前,奇异值分解在信息检索方面的应用主要是隐含语义检索(Latent Semantic Indexing,LSI)。潜在语义索引可以将文档在向量空间模型中的高维表示,投影到低维的潜……

高斯与黑天鹅

高斯与黑天鹅

博主半个多月都没有更新博客了,这段时间需要忙的事比较多,初到新的城市需要自己去折腾的事很多!今晚在空间看到一篇文章觉得有点意思转载过来~本文受到 Nassim Nicola Taleb 《黑天鹅》 启示—-作者 :  许铁。我有一个外号叫“理论家”,这可能也是人们对书呆子的戏称,因为我的确非常呆,偏好个从一大堆事物中总结个原理什么。甚至每次和……