本文共 4532 字,大约阅读时间需要 15 分钟。
| |
左图中的绿色框为一个基本模块,对应右图。
| |
// An highlighted blockvar foo = 'bar';
参考:
V1、V2 总结
2.https://blog.csdn.net/alibabazhouyu/article/details/81150479V3
⑴ Bounding box Prediction
- YOLOv3 predicts an objectness score for each bounding box using logistic regression. This should be 1 if the bounding box prior overlaps a ground truth object by more than any other bounding box prior.
- If the bounding box prior is not the best but does overlap a ground truth object by more than some threshold we ignore the prediction, following [17]. We use the threshold of 0.5.
- Unlike [17] our system only assigns分配 one bounding box prior for each ground truth object. If a bounding box prior is not assigned to a ground truth object it incurs招致 no loss for coordinate or class predictions, only objectness.
| |
⑵ Loss Function
在YOLOV3中,Loss分成三个部分:
一个是目标框位置x, y, w, h(左上角和长宽)带来的误差,也即是box带来的loss。而在box带来的loss中又分为 x, y 带来的BCE Loss以及w, h 带来的MSE Loss。
一个是目标置信度带来的误差,也就是obj带来的loss(BCE Loss)。 最后一个是类别带来的误差,也就是class带来的loss(类别数个BCE Loss)。
⑶ Output
- YOLOv3 predicts boxes at 3 different scales.
- The last of these predicts a 3-d tensor encoding bounding box, objectness, and class predictions. In our experiments with COCO we predict 3 boxes at each scale so the tensor is NN[3+(4 + 1 + 80)] for the 4 bounding box offsets, 1 objectness prediction, and 80 class predictions.
非极大值抑制算法(non maximum suppression, NMS),这个算法不单单是针对Yolo算法的,而是所有的检测算法中都会用到。NMS算法主要解决的是一个目标被多次检测的问题。流程是:首先从所有的检测框中找到置信度最大的那个框,然后挨个计算其与剩余框的IOU,如果其值大于一定阈值(重合度过高),那么就将该框剔除;然后对剩余的检测框重复上述过程,直到处理完所有的检测框。Yolo预测过程也需要用到NMS算法。
**Problem 1: **
Problem 1: Yolov3 输入图片是对图片进行缩放,还是补充???
Problem 1: YOLO和滑窗算法的区别?
滑窗算法利用不同大小和比例的滑动窗口对图片中每个滑动框图片进行一次图像分类, 是一种先滑框再预测的方法(two-stage),由于清楚目标的尺寸,需设置不同大小比例的窗口去滑动,还要选择合适的步长。因此产生很多的子区域,并且都要经过分类器预测,需要大量的计算量;yolo算法直接将原始图片分割成互不重合的小方块,每个格子负责中心点落在其对象的边框,将定位分类问题转化成回归问题一次性解决(one-stage),极大提高效率,同时由于yolo是对整张图做卷积,所以其在检测目标有更大的视野,不容易对背景误判。
Problem 1: 请简要描述一下K-Means算法要点?
K-Means是常用的无监督学习方法,算法实现要点为:
1.首先输入k的值,即我们希望将样本集经过聚类得到k个分组。 2.从样本集中随机选择k个样本点作为初始聚类中心 3.对集合中每一个样本,计算与聚类中心的距离(欧式距离、余弦相似度等),哪个距离最小归为哪一类 4.根据步骤2中的聚类结果,更新聚类中心(每一类中所有样本各坐标的平均值) 5.如果新聚类中心与上一步迭代的聚类中心之间的距离小雨某一设置的阈值(收敛),或达到最大迭代次数算法终止,返回聚类结果。否则重复步骤3-5
我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:
撤销:Ctrl/Command + Z
重做:Ctrl/Command + Y 加粗:Ctrl/Command + B 斜体:Ctrl/Command + I 标题:Ctrl/Command + Shift + H 无序列表:Ctrl/Command + Shift + U 有序列表:Ctrl/Command + Shift + O 检查列表:Ctrl/Command + Shift + C 插入代码:Ctrl/Command + Shift + K 插入链接:Ctrl/Command + Shift + L 插入图片:Ctrl/Command + Shift + G直接输入1次#,并按下space后,将生成1级标题。
输入2次#,并按下space后,将生成2级标题。 以此类推,我们支持6级标题。有助于使用TOC
语法后生成一个完美的目录。 强调文本 强调文本
加粗文本 加粗文本
标记文本
删除文本
引用文本
H2O is是液体。
210 运算结果是 1024.
链接: .
图片:
带尺寸的图片:
居中的图片:
居中并且带尺寸的图片:
当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。
去页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片
.
// An highlighted blockvar foo = 'bar';
一个简单的表格是这么创建的:
项目 | Value |
---|---|
电脑 | $1600 |
手机 | $12 |
导管 | $1 |
使用:---------:
居中
:----------
居左 使用----------:
居右 第一列 | 第二列 | 第三列 |
---|---|---|
第一列文本居中 | 第二列文本居右 | 第三列文本居左 |
SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:
TYPE | ASCII | HTML |
---|---|---|
Single backticks | 'Isn't this fun?' | ‘Isn’t this fun?’ |
Quotes | "Isn't this fun?" | “Isn’t this fun?” |
Dashes | -- is en-dash, --- is em-dash | – is en-dash, — is em-dash |
一个具有注脚的文本。
Markdown将文本转换为 HTML。
您可以使用渲染LaTeX数学表达式 :
Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n−1)!∀n∈N 是通过欧拉积分
Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=∫0∞tz−1e−tdt.
你可以找到更多关于的信息 LaTeX 数学表达式.
可以使用UML图表进行渲染。 . 例如下面产生的一个序列图::
这将产生一个流程图。:
我们依旧会支持flowchart的流程图:
如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。
如果你想加载一篇你写过的.md文件或者.html文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,
继续你的创作。
注脚的解释