首页 - 技术栈

网站建设常见问题及解决办法seo 培训教程

作者: 五速梦信息网
时间: 2026年06月19日 07:57

当前位置：首页 > news >正文

网站建设常见问题及解决办法,seo 培训教程,深圳制作网站流程,网页版梦幻西游10月五行斗法攻略“目标检测”任务基础认识 1.目标检测初识目标检测任务关注的是图片中特定目标物体的位置。目标检测最终目的#xff1a;检测在一个窗口中是否有物体。 eg:以猫脸检测举例#xff0c;当给出一张图片时#xff0c;我们需要框出猫脸的位置并给出猫脸的大小#xff0c;如…“目标检测”任务基础认识 1.目标检测初识目标检测任务关注的是图片中特定目标物体的位置。目标检测最终目的检测在一个窗口中是否有物体。 eg:以猫脸检测举例当给出一张图片时我们需要框出猫脸的位置并给出猫脸的大小如下图所示。 2.一个检测任务包含两个子任务一个是分类任务输出这一目标的类别信息分类标签另一个是定位任务输出目标的具体位置信息用矩形框表示包含矩形框左上角或中间位置的x、y坐标和矩形框的宽度与高度。 3.算法发展历程与计算机视觉领域里大部分的算法一样目标检测也经历了从传统的人工设计特征加浅层分类器的方案到基于深度学习的端到端学习方案的演变。而在深度学习中很多任务都是采用端到端(end-to-end)的方案即输入一张图输出最终想要的结果算法细节和学习过程全部交给神经网络这一点在目标检测领域体现得非常明显。 4.目标检测步骤不管是用清晰的分步骤处理还是用深度学习的end-to-end方法完成一个目标检测任务一个系统一定会遵循3个步骤。如图5.1所示。第一步选择检测窗口第二步提取图像特征第三步设计分类器 4.1检测窗口选择方法当在不同的距离下检测不同大小的目标时最简单也最直观的方法就是用图像金字塔各种尺度比例的框进行暴力搜索从左到右从上到下滑动窗口然后利用分类方法对目标框进行识别。问题如图5.3所示在一个像素点处选择了长宽比例不同的框。这种利用窗口滑动来确定候选框的方法可以实现我们的预期目标但是不难想到这种方法在使用过程中会产生大量的无效窗口浪费了很多计算资源而且无法得到精确的位置。目标检测想要得到发展必须优化这个步骤。 4.2特征提取有了候选窗口后需要提取图像的特征进行表达传统的有监督方法和以CNN为代表的无监督特征学习方法都可以派上用场。仍然以人脸检测算法为例在传统的人脸检测算法中有几类特征是经常被使用的。 Haar特征LBP特征HOG特征定位是经典的V-J框架使用的基本特征是传统人脸检测算法中广泛使用的纹理特征在物体检测领域应用非常广泛表达表征的是局部的明暗对比关系可以表达物体丰富的纹理信息特点由于Haar 特征提取速度快能够表达物体多个方向的边缘变化信息并且可以利用积分图进行快速计算因此得到了广泛应用采用中心像素和边缘像素的灰度对比可以表达物体丰富的纹理信息同时因为使用的是相对灰度值因此对均匀变化的光照有很好的适应性。通过对物体边缘进行直方图统计来实现编码相对于Haar 和LBP 两个特征HOG 的特征表达能力更强、更加通用被广泛用于物体检测、跟踪和识别等领域除了以上常用的特征外还有其他非常优秀的传统特征描述包括SIFT 和SURF等这些都是研究人员通过长时间的学术研究和实际项目验证得来的虽然在比较简单的任务中可以取得很好的结果但是设计成本很高。传统的检测算法通过对不同的特征进行组合调优从而增加表达能力。其中以ACF为代表的行人检测方法组合了20多种不同的传统图像特征。 4.3分类器分类器是目标检测的最后一步,经常使用的分类器有Adaboost、SVM 和Decision Tree等。接下来对这些分类器进行简要介绍。

Adaboost分类器 Adaboost是一种迭代的分类方法在OpenCV开源库中使用的人脸检测框架的分类器正是Adaboost 分类器。核心思想在很多情况下一个弱分类器的精度并不高Adaboost算法的核心思想就是在很多分类器中自适应地挑选其中分类精度更高的弱分类器并将其进行组合从而实现一个更强的分类器。 Eg 目标当我们要检测一个纯红色的物体时它的颜色为(25500)但是现在只有3个灰度级别的分类器各自对应RGB的3种颜色。我们知道所要检测的物体必须满足3个条件R 通道灰度值为255G、B的通道灰度值为0。问题此时使用任何一个灰度级别的分类器都无法完成这个任务同时会出现很多的误检。例如红色分类器在最理想的情况下就是学习到了R 的通道必须为255但是G、B通道学习不到因此它会检测到1×256×256种颜色,其中,256×256-1种为误检,检测精度为1/(256×256),等于0.0000152。解决当我们组合3种分类器并使其各自达到最好的学习状态时就可以完全学习到R255、G0、B0这样的特征。我们在实际使用这3个分类器的时候可以使用串联的方法让图片依次经过3个分类器进行分类过滤如图5.4所示。结果这样虽然每一个弱分类器的检测精度不到万分之一但最终的检测精度可以是100%这就是Adaboost算法的核心思想。总结Adaboost通过弱弱联合实现了强分类器在使用的时候通常采用顺序级连的方案。在级联分类器的前端是速度较快、性能较弱的分类器它们可以实现将大部分负样本进行过滤。在级联的后端是速度较慢、性能较强的分类器它们可以实现更大计算量精度也更高的检测。 2. SVM分类器简略介绍支持向量机(Support Vector Machine,SVM)是贝尔实验室的Vapnik 等研究人员在对统计学习理论进行了三十多年研究的基础上提出来的机器学习算法它让统计学习理论第一次对实际应用产生了重大影响具有非常重要的意义。 SVM 是基于统计学习VC理论与结构风险极小化原理的算法它将基于最大化间隔获得的分类超平面思想与基于核技术的方法结合在一起通过部分数据构建模型对新的数据进行预测并作出分类决策表现出了很好的泛化能力。 SVM还可以通过引入核函数将低维映射到高维从而将很多线性不可分的问题转化为线性可分问题这在图像分类领域中的应用非常广泛。以SVM 为分类器和HOG 为特征的行人检测系列算法是其中非常经典的算法。 3.Decision Tree决策树决策树是一种树形结构每个内部节点都表示一个属性测试每个分支都会输出测试结果每个叶子节点代表一种类别。 Eg:以图5.6所示的二叉树为例从树根开始分叉区分是人脸或者非人脸左边是人脸右边是非人脸。当进入第一个二叉树分类器节点判断为非人脸时则直接输出结果结束任务如果是人脸则进入下一层再进行判断。二叉树通过学习每个节点的分类器来构造决策树最终形成一个强分类器总体的思路与级联分类器非常相似。改进为了提升决策树的能力我们可以对决策树进行集成也就是将其组合成随机森林。假设刚刚提到的决策树是一棵树对于人脸检测这样的任务分别学习10棵树每棵树采用不同的输入或者特征最终以10棵树的分类结果进行投票获取多数表决的结果将作为最终的结果这是一种非常简单但行之有效的方法。在使用深度学习来完成各项任务尤其是参加各类比赛的时候一定会使用不同的模型和不同的输入进行集成。例如常见的是使用不同裁剪子区域进行预测或者使用不同的基准模型进行预测最后取平均概率的方法测试结果相比之前可以得到很大的提升。参考文献《深度学习之图像识别核心算法与实战案例全彩版》言有三著出版社清华大学出版社出版时间2023年7月第一版第一次印刷 ISBN978-7-302-63527-7