• 为了保证你在浏览本网站时有着更好的体验,建议使用类似Chrome、Firefox之类的浏览器~~
    • 如果你喜欢本站的内容何不Ctrl+D收藏一下呢,与大家一起分享各种编程知识~
    • 本网站研究机器学习、计算机视觉、模式识别~当然不局限于此,生命在于折腾,何不年轻时多折腾一下

最新发布 第4页

算法之道机器学习、Python和算法爱好者

深度学习关键词

batch: batch 是批。深度学习每一次参数的更新所需要损失函数并不是由一个{data:label}获得的,而是由一组数据加权得到的,这一组数据的数量就是[batch size]。batch 的思想,至少有两个作用,一是更好的处理非凸的损失函数,非凸的情况下, 全样本就算工程上算的动, 也会卡在局部优上, 批表示了全样本的部分抽样实现, 相当于人……

spark实现gbdt和lr

spark 对 python 开放的接口实在是有限,只有 scala 是亲生的。查了下 scala 的包和函数,发现提供的真全,博主从零开始撸 scala 代码,边写边查的节奏,给出以下 example 代码给大家参考import org.apache.spark.mllib.classification.LogisticRegressionWit……

mac配置spark本地开发环境

网上的资料一大堆都是很早以前版本的教程,干脆自己写一个最新版的。此处有一定要强调,类似环境的安装一定要去官网看说明,不然你本地哗哗哗搞定程序一跑报错,懵逼了DownloadingGet Spark from the downloads page of the project website. This documentation is for Sp……

mac下编译安装TensorFlow

前言如果直接通过pip install tensorflow安装 Tensorflow 的话,在运行时可能会有这种警告W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instruction……

最大熵理论推导

最大熵理论推导

先给出一个例子抛出最大熵的问题。。掷骰子,骰子总共有 6 个点数,现在你觉得每个点数掷到的概率多大?你毫不犹豫的说 1/6,此时你就使用了最大熵模型来解决这个问题,只是你自己不知道。在没有任何约束的情况下,你认为等概率事件是最好的结果,如果现在继续告诉你 1 点和 2 点的概率占比 1/2,那么剩下的四个点数的总规律是 1/2,此时你又要做均分了……

技术篇-每日一篇0x3-Keras 发布官方中文文档

今年 1 月,Keras 作者、谷歌 AI 研究员 François Chollet 在推特上发出召唤:讲中文的 Keras 用户们,是否有人愿意帮忙一起搞个 Keras 文档的中文版?一个多月后,官方中文文档来了。Keras 是 Google 的一位工程师 François Chollet 开发的一个框架,它能够以 TensorFlow, CN……

技术篇-每日一篇0x2

技术篇-每日一篇0x2

简单实用的 pandas 技巧:如何将内存占用降低 90%文章选自 DATAQUEST,作者:Josh Devlin,机器之心编译,原文链接点此跳转。pandas 是一个 Python 软件库,可用于数据操作和分析。数据科学博客 Dataquest.io 发布了一篇关于如何优化 pandas 内存占用的教程:仅需进行简单的数据类型转换,就能够将一……

kd树基本描述

kd 树的结构kd 树是一个二叉树结构,它的每一个节点记载了【特征坐标,切分轴,指向左枝的指针,指向右枝的指针】。其中,特征坐标是线性空间\(R^n\)中的一个点\(x_1,x_2,…,x_n\)。切分轴由一个整数\(r\)表示,这里\(1 \le r \le n \),是我们在 n 维空间中沿第 r 维进行一次分割。节点的左枝和右枝分别……

Kmean计算优化

Kmean计算优化

最近一些列的博客尽量使用口语化的方式来把问题说明白,一般情况下能把事情说的明明白白也可以变相的说明你对问题有一定的了解。此处十一点四十多了码子有点困了。。。。continuekmean 聚类被使用的机会还是很多,计算比较简单,实现也简单。简单的方法也容易排查问题,kmean 自身也有局限性,比如初始聚类中心点的选择对算法的影响以及聚类的个数 k 值的选择……

随机森林之特征选择

随机森林之特征选择

随机森林的介绍在这篇文章中就不多介绍了,核心思想就是双随机过程:随机样本采样和随机特征采样特征选择下面介绍两种方式(1)基尼系数(2)oob(out of bag) Error 袋外误差基尼系数在决策树中 cart 树就是使用基尼系数来进行节点划分,在每一个节点划分的时候,计算每一个特征的基尼系数,选择基尼系数较小的特征,基尼系数越小,反应得……

网易云课堂-深度学习笔记0x1

深度学习目前基本上已经被很多行业使用,博主每天也会逛技术论坛或者 sf 等网站都会对此有有很多的文章讨论,从工作以来由于接触的平台原因,深度学习暂时使用不到,但是技术一直在持续的发展。之前看过吴恩达教授斯坦福的机器学习课程,现在在网易的云课堂上也有了深度学习的课程,正好也当是入门,对这个技术有入门的了解,现在从事的大数据行业也会用得上。今天快速学习了神……

技术篇-每日一篇0x1

前言在大数据计算领域,Spark 已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark 的功能涵盖了大数据领域的离线批处理、SQL 类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作,应用范围与前景非常广泛。在美团•大众点评,已经有很多同学在各种项目中尝试使用 Spark。大多数同学(包括笔者在内),最初开始尝试使用 Spark 的原……

Office2016零售版转化为vl版本

32 位@echo off:ADMINopenfiles >nul 2>nul ||(echo Set UAC = CreateObject^("Shell.Application"^) > "%temp%\getadmin.vbs"echo UAC.ShellExecute "%~s0", "", "", "runa……

常见优化方法的梳理

常见优化方法的梳理

今天主要要说一下常见的几个优化方法分别是梯度下降、随机梯度下降、牛顿法和拟牛顿法NO1 梯度下降从字面意思理解就是沿着梯度下降的方向做些事情,做的啥事情?就是求解最优参数的事情。从二维的角度来看梯度,注意我们在计算梯度的时候是关注我们计算的那个的梯度,只涉及到点,二维平面可以用切线,三维可以用切面描述,高维另说。所以接下来的讨论都是关注在某一个点相关。……

数据归一化必要性

为什么要进行归一化处理,下面从寻找最优解这个角度给出自己的看法。例子假定为预测房价的例子,自变量为面积,房间数两个,因变量为房价。那么可以得到的公式为:\[y=\theta _{1}x_{1} +\theta _{2}x_{2} \]\(x_{1}\) 代表房间数,\(\theta _{1}\)代表\(x_{1}\)变量前面的系数\(x_{2}\……

MAC 压测工具Webbench   

MAC 压测工具Webbench   

webbench 安装brew install ctags # 依赖安装wget http://blog.zyan.cc/soft/linux/webbench/webbench-1.5.tar.gztar -zxvf webbench-1.5.tar.gzcd webbench-1.5mkdir -pv /usr/local/man/……

机器学习参数模型与非参数模型

机器学习参数模型与非参数模型

一个参数机器学习算法是什么,与非参的机器学习算法又有什么不同呢?机器学习可以归结为学习一个函数(f),把输入变量(X)映射到输出变量(Y)算法可从训练数据中学习这样的目标映射函数。函数的形式是未知的,我的工作正为机器学习从业人员评估不同的机器学习算法,从而看一看哪一个算法更接近潜在的函数。不同的算法对函数的形式有不同的假设或者偏见,以及如何学习目标函……

本站开启https啦!

安装Since it doesn’t seem like your operating system has a packaged version of Certbot, you should use our certbot-auto script to get a copy:wget https://dl.eff.org/certbo……