CSDN攻克机器学习硕士学位，我的那些年与必备技能！( 二 )

PCA（Principal Component Analysis）：一种降维的算法。通过将数据点从较高的维度投影到较低的平面，但仍保持信息并最大程度地减少信息丢失，可以减小维度。

其他的还有：线性插值、无监督聚类（K均值）、视觉搜索等等。
一开始学习我就希望自己能开发出基于计算机视觉的App ，对象分类又比较受欢迎，这样相对来说就更容易实现既学知识又能实际应用。另外我的研究过程中是在Matlab上开发视觉搜索系统的。
Matlab是为高效的数值计算和矩阵处理而开发的一种编程语言，并且Matlab库配备了一套算法和可视化工具。
之前JavaScript、Java和Python的编程经验帮我很快搞定了Matlab编程语法，所以我就可以全神贯注的研究计算机视觉。
更多视觉搜索系统的信息
要实现的视觉系统很简单，它就是通过查询图像传递给系统，之后系统将生成一组图像结果，这些结果与传递到系统中的匹配相似图像。要补充一点，该系统有一个存储图像的数据库，是用于从中提取结果图像（先查询图像，然后输出结果图像）。
视觉系统没有使用任何花哨的深度学习技术，就是用了前面提到的一些传统机器学习技术。只需传递转换为灰度的RGB图像，然后在图像上添加特征提取器即可，之后，提取图像描述符并将其表示在N维特征空间上。在此特征空间内，就可以通过计算两个N维点之间的欧式距离来得出相似的图像。
更深层次的应用
计算机视觉的理解不仅局限于图像上，还会涉及到视频中使用的算法和技术。要明白，视频可以理解为图像序列，所以收集和处理输入数据上就不需要学习新的内容。
如果使用诸如YOLO、RCNN等对象检测框架，那在一系列图像中进行对象跟踪似乎就变得非常琐碎。但要认识到，研究计算机视觉不仅是使用预训练的网络和微调。基于我个人在该领域的发展角度来看，扎实学习的最佳方法是随着时间推移，在研究中慢慢积累这些传统技术。
与计算机视觉的相关性
老实说，我目前没有使用任何传统机器学习中的分类器，而且我觉得我不会很快使用它。但是值得注意的是，自动驾驶汽车、车牌读取器、车道检测器均采用了上述所提及到了一到两种方法。
深度学习
深度学习是计算机视觉研究的自然发展成果。计算机视觉与我的计算机视觉研究类似的方法，即在转向高级主题和应用程序开发之前，对领域的基础有了深入的了解。
深度学习研究始于对图像、像素的基本构建块的理解。数字图像是包含像素集合并以网格的形式呈现。了解了图像的基础之后，就要继续学习如何将图像存储在系统内存中。帧缓冲区是在系统内存中存储像素的位置的名称（很少有MOOC课程会教你这一点）。
另外，在还不了解卷积神经网络（CNN）的情况下，你是无法学习深度学习的，因为它们是紧密相连的。
我的研究介绍了过去20年（从LeNet-5到RCNN）引入和开发CNN的时间表，以及它们在替代传统管道中完成诸如对象识别之类的典型计算机视觉任务的作用。
在我的研究期间，介绍了深度学习早期提出的不同CNN架构的探索。 AlexNet、LeNet和GoogLeNet是案例研究，用于对卷积神经网络的内部知识及其在解决诸如目标检测，识别和分类等任务中的应用的理解。
另外，我学会的一项重要技能是如何阅读研究论文。阅读研究论文并不是直接学习的技能。如果真的想要研究一下深度学习，那么就要选择好信息和研究的来源。
利用深度学习框架提供的预训练模型相当容易。尽管如此，一项高级研究仍希望了解所提出的每种体系结构的技术和组件的内在细节，当然这些信息仅在研究论文中会提出。
在这总结了一些深度学习模块的议题（还是跳过了定义，感兴趣的同学可以看一下）：