使用SJTU的Anaconda镜像

清华的Anaconda镜像在华东地区是好是坏,好的时候一切顺利,坏的时候一个24K的包下5分钟;Anaconda的官方源则更惨,连repo.json都下不下来;
今天又是清华的源大姨妈的一天:Pytorch下载到100MB就超时,折腾了三个小时也装不上。而同在华东的SJTU的镜像就很稳定,这次全线换成SJTU啦。

支持向量机

前言

支持向量机(Support Vector Machine,SVM)是一个能求解通用二元分类问题的模型。SVM使用Kernel trick,使得自己在能够表示非线性函数的同时Loss是有闭式解的Convex function。也有人把SVM当作线性模型向神经网络过渡的中间阶段。

主成分分析

前言

主成分分析(Principal component analysis,PCA)是一种常用的无监督学习算法。经过PCA后的数据会在它所处理的维度上会不相关(decorelation)。 而PCA所选的维度又通常比本来的维度要小,因此也可以用来做降维处理。

卷积神经网络

任何一个机器学习的任务都可以被拆解为三步

  1. 找到一组函数(model)
  2. 找到评价函数好坏的标准(loss)
  3. 找出最好的函数(optimization)

这三步在神经网络中同样成立。但在神经网络中,要找的不是一组函数,而是一种网络架构(architecture)。本文中的卷积神经网络(CNN)就是一种网络架构

神经网络中的Regularization

Deep learning algorithms are typically applied to extremely complicated domains where the true generation process essentially involves simulating the entire universe… Controlling the complexity of the model is not a simple matter of finding the model of the right size, with the right number of parameters. Instead, we might find—and indeed in practical deep learning scenarios, we almost always do find—that the best fitting model (in the sense of minimizing generalization error) is a large model that has been regularized appropriately