博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
YOLOV-4
阅读量:2049 次
发布时间:2019-04-28

本文共 4532 字,大约阅读时间需要 15 分钟。

目录

环境安装

CSPNet

Pytorch 实现

图1 Darknet 53
图2 Darknet 53

左图中的绿色框为一个基本模块,对应右图。

图1 Darknet 53
图2 CSPDarknet 53
// An highlighted blockvar foo = 'bar';

附录:Yolo-前传

1. 史上最全 yolov3 网络结构图

在这里插入图片描述

2. 史上最全 yolov4 网络结构图

在这里插入图片描述

参考:

2. 整体流程

V1、V2 总结

2.https://blog.csdn.net/alibabazhouyu/article/details/81150479

V3

⑴ Bounding box Prediction

  1. YOLOv3 predicts an objectness score for each bounding box using logistic regression. This should be 1 if the bounding box prior overlaps a ground truth object by more than any other bounding box prior.
  2. If the bounding box prior is not the best but does overlap a ground truth object by more than some threshold we ignore the prediction, following [17]. We use the threshold of 0.5.
  3. Unlike [17] our system only assigns分配 one bounding box prior for each ground truth object. If a bounding box prior is not assigned to a ground truth object it incurs招致 no loss for coordinate or class predictions, only objectness.
图1 Bounding boxes with dimension priors and location prediction.
图2 ....................................................................................

⑵ Loss Function

Alt

在YOLOV3中,Loss分成三个部分:

一个是目标框位置x, y, w, h(左上角和长宽)带来的误差,也即是box带来的loss。而在box带来的loss中又分为 x, y 带来的BCE Loss以及w, h 带来的MSE Loss。

一个是目标置信度带来的误差,也就是obj带来的loss(BCE Loss)。
最后一个是类别带来的误差,也就是class带来的loss(类别数个BCE Loss)。

⑶ Output

  1. YOLOv3 predicts boxes at 3 different scales.
  2. The last of these predicts a 3-d tensor encoding bounding box, objectness, and class predictions. In our experiments with COCO we predict 3 boxes at each scale so the tensor is NN[3+(4 + 1 + 80)] for the 4 bounding box offsets, 1 objectness prediction, and 80 class predictions.

非极大值抑制算法(non maximum suppression, NMS),这个算法不单单是针对Yolo算法的,而是所有的检测算法中都会用到。NMS算法主要解决的是一个目标被多次检测的问题。流程是:首先从所有的检测框中找到置信度最大的那个框,然后挨个计算其与剩余框的IOU,如果其值大于一定阈值(重合度过高),那么就将该框剔除;然后对剩余的检测框重复上述过程,直到处理完所有的检测框。Yolo预测过程也需要用到NMS算法。

3. 实施细节

**Problem 1: **

Problem 1: Yolov3 输入图片是对图片进行缩放,还是补充???

Problem 1: YOLO和滑窗算法的区别?

滑窗算法利用不同大小和比例的滑动窗口对图片中每个滑动框图片进行一次图像分类, 是一种先滑框再预测的方法(two-stage),由于清楚目标的尺寸,需设置不同大小比例的窗口去滑动,还要选择合适的步长。因此产生很多的子区域,并且都要经过分类器预测,需要大量的计算量;yolo算法直接将原始图片分割成互不重合的小方块,每个格子负责中心点落在其对象的边框,将定位分类问题转化成回归问题一次性解决(one-stage),极大提高效率,同时由于yolo是对整张图做卷积,所以其在检测目标有更大的视野,不容易对背景误判。

Problem 1: 请简要描述一下K-Means算法要点?

K-Means是常用的无监督学习方法,算法实现要点为:

1.首先输入k的值,即我们希望将样本集经过聚类得到k个分组。
2.从样本集中随机选择k个样本点作为初始聚类中心
3.对集合中每一个样本,计算与聚类中心的距离(欧式距离、余弦相似度等),哪个距离最小归为哪一类
4.根据步骤2中的聚类结果,更新聚类中心(每一类中所有样本各坐标的平均值)
5.如果新聚类中心与上一步迭代的聚类中心之间的距离小雨某一设置的阈值(收敛),或达到最大迭代次数算法终止,返回聚类结果。否则重复步骤3-5

新的改变

我们对Markdown编辑器进行了一些功能拓展与语法支持,除了标准的Markdown编辑器功能,我们增加了如下几点新功能,帮助你用它写博客:

  1. 全新的界面设计 ,将会带来全新的写作体验;
  2. 在创作中心设置你喜爱的代码高亮样式,Markdown 将代码片显示选择的高亮样式 进行展示;
  3. 增加了 图片拖拽 功能,你可以将本地的图片直接拖拽到编辑区域直接展示;
  4. 全新的 KaTeX数学公式 语法;
  5. 增加了支持甘特图的mermaid语法 功能;
  6. 增加了 多屏幕编辑 Markdown文章功能;
  7. 增加了 焦点写作模式、预览模式、简洁写作模式、左右区域同步滚轮设置 等功能,功能按钮位于编辑区域与预览区域中间;
  8. 增加了 检查列表 功能。

功能快捷键

撤销:Ctrl/Command + Z

重做:Ctrl/Command + Y
加粗:Ctrl/Command + B
斜体:Ctrl/Command + I
标题:Ctrl/Command + Shift + H
无序列表:Ctrl/Command + Shift + U
有序列表:Ctrl/Command + Shift + O
检查列表:Ctrl/Command + Shift + C
插入代码:Ctrl/Command + Shift + K
插入链接:Ctrl/Command + Shift + L
插入图片:Ctrl/Command + Shift + G

合理的创建标题,有助于目录的生成

直接输入1次#,并按下space后,将生成1级标题。

输入2次#,并按下space后,将生成2级标题。
以此类推,我们支持6级标题。有助于使用TOC语法后生成一个完美的目录。

如何改变文本的样式

强调文本 强调文本

加粗文本 加粗文本

标记文本

删除文本

引用文本

H2O is是液体。

210 运算结果是 1024.

插入链接与图片

链接: .

图片: Alt

带尺寸的图片: Alt

居中的图片: Alt

居中并且带尺寸的图片: Alt

当然,我们为了让用户更加便捷,我们增加了图片拖拽功能。

如何插入一段漂亮的代码片

去页面,选择一款你喜欢的代码片高亮样式,下面展示同样高亮的 代码片.

// An highlighted blockvar foo = 'bar';

生成一个适合你的列表

  • 项目
    • 项目
      • 项目
  1. 项目1
  2. 项目2
  3. 项目3
  • 计划任务
  • 完成任务

创建一个表格

一个简单的表格是这么创建的:

项目 Value
电脑 $1600
手机 $12
导管 $1

设定内容居中、居左、居右

使用:---------:居中

使用:----------居左
使用----------:居右

第一列 第二列 第三列
第一列文本居中 第二列文本居右 第三列文本居左

SmartyPants

SmartyPants将ASCII标点字符转换为“智能”印刷标点HTML实体。例如:

TYPE ASCII HTML
Single backticks 'Isn't this fun?' ‘Isn’t this fun?’
Quotes "Isn't this fun?" “Isn’t this fun?”
Dashes -- is en-dash, --- is em-dash – is en-dash, — is em-dash

创建一个自定义列表

Markdown
Text-to-
HTML conversion tool
Authors
John
Luke

如何创建一个注脚

一个具有注脚的文本。

注释也是必不可少的

Markdown将文本转换为 HTML

KaTeX数学公式

您可以使用渲染LaTeX数学表达式 :

Gamma公式展示 Γ ( n ) = ( n − 1 ) ! ∀ n ∈ N \Gamma(n) = (n-1)!\quad\forall n\in\mathbb N Γ(n)=(n1)!nN 是通过欧拉积分

Γ ( z ) = ∫ 0 ∞ t z − 1 e − t d t   . \Gamma(z) = \int_0^\infty t^{z-1}e^{-t}dt\,. Γ(z)=0tz1etdt.

你可以找到更多关于的信息 LaTeX 数学表达式.

新的甘特图功能,丰富你的文章

  • 关于 甘特图 语法,参考 ,

UML 图表

可以使用UML图表进行渲染。 . 例如下面产生的一个序列图::

这将产生一个流程图。:

  • 关于 Mermaid 语法,参考 ,

FLowchart流程图

我们依旧会支持flowchart的流程图:

  • 关于 Flowchart流程图 语法,参考 .

导出与导入

导出

如果你想尝试使用此编辑器, 你可以在此篇文章任意编辑。当你完成了一篇文章的写作, 在上方工具栏找到 文章导出 ,生成一个.md文件或者.html文件进行本地保存。

导入

如果你想加载一篇你写过的.md文件或者.html文件,在上方工具栏可以选择导入功能进行对应扩展名的文件导入,

继续你的创作。


  1. 注脚的解释

你可能感兴趣的文章
CentOS 8 都发布了,你还不会用 nftables?
查看>>
一点也不流氓的搜狗输入法皮肤
查看>>
Grafana 6.4 正式发布!
查看>>
etcd 性能测试与调优
查看>>
Docker 大势已去,Podman 万岁
查看>>
Podman 使用指南
查看>>
国内 2018 年 12 月 XX 站访问百强榜单
查看>>
Linux Capabilities 入门教程:概念篇
查看>>
Linux Capabilities 入门:让普通进程获得 root 的洪荒之力
查看>>
为什么我会了SOA,你们还要逼我学微服务?
查看>>
Linux Capabilities 入门:如何管理文件的 capabilities?
查看>>
Linux Capabilities 入门教程:基础实战篇
查看>>
如何向纯洁的女朋友解释并发与并行的区别?
查看>>
一名云原生搬砖师的自白
查看>>
红帽宣布发布企业容器仓库开源项目 Quay
查看>>
跨平台构建 Docker 镜像新姿势,x86、arm 一把梭
查看>>
k8s v1.17 新特性预告: 拓扑感知服务路由
查看>>
彻底理解矩阵乘法
查看>>
使用 buildx 构建多平台 Docker 镜像
查看>>
Kubelet 中的 “PLEG is not healthy” 到底是个什么鬼?
查看>>