MrD's Blog

我干了什么 究竟拿了时间换了什么

【深度学习】ImVoxelNet: Image to Voxels Projection for Monocular and Multi-View General-Purpose 3D Object Detection

Abstract 这篇文章介绍了基于多视图 RGB 的3D目标检测作为端到端优化问题的任务。 为了解决这个问题,作者提出了ImVoxelNet,这是一种基于 posed monocular 或多视图 RGB 图像的3D目标检测的新型全卷积方法。 在训练和推理过程中,每个多视图输入中的单目图像数量可能会发生变化;事实上,每个多视图输入的弹幕图像数量可能都不一样。 ImVoxelNet...

【深度学习】DAIR-V2X: A Large-Scale Dataset for Vehicle-Infrastructure Cooperative 3D Object Detection

Abstract 由于缺乏全局视角和远程感知能力受到限制,自动驾驶面临巨大的安全挑战。 人们普遍认为,实现 L5 级自动驾驶需要车辆-基础设施合作。 然而,仍然没有来自真实场景的数据集可供计算机视觉研究人员研究与车辆-基础设施合作相关的问题。 为了加快车辆-基础设施合作自动驾驶(VICAD)的计算机视觉研究和创新,作者发布了 DAIR-V2X 数据集,这是VICAD真实场景中第一个大...

【深度学习】Fast R-CNN

Abstract 本文提出了一种快速的基于区域的卷积网络方法(Fast R-CNN)用于目标检测。 Fast R-CNN以之前的工作为基础,使用深度卷积网络对目标提议进行高效分类。 与之前的工作相比,Fast R-CNN采用了几项创新来提高训练和测试速度,同时提高检测精度。 Fast R-CNN 训练非常深的 VGG16 网络比 R-CNN 快9倍,测试时速度快 213 倍,并在PA...

【Geek之路】Programing Enhancement Proposals

Python Enhancement Proposals (PEPs) PEP7 PEP8 PEP20 Reference

【深度学习】OHEM:Training Region-based Object Detectors with Online Hard Example Mining

Abstract 在卷积网络的浪潮上, 目标检测领域取得了显著的提高,但是他们的训练过程包含很多难以调整的启发式设计和超参数。 这篇文章提出了一种简单但出人意料地有效的在线困难样本挖掘(OHEM)算法,用于训练基于区域的卷积检测器。 作者的动机一如既往——检测数据集包含大量简单的样本和少量困难样本。 自动选择这些困难示例可以使训练更有效、更高效。 OHEM是一种简单直观的算法,消除了...

【深度学习】DiffusionDet: Diffusion Model for Object Detection

Abstract 作者提出了DiffusionDet,这是一个新的框架,用于将目标检测模拟为从噪声边界框到目标边界框的去噪扩散过程。 在训练阶段,目标边界框从真实边界框扩散到随机分布,模型学会了扭转这个噪声过程。 在推理中,模型以渐进的方式将一组运行随机生成的边界框细化为输出结果。 对标准 benchmark(包括 MS-COCOCO 和 LVIS )的广泛评估表明,与之前成熟的检测...

【机器学习】FISTA:A Fast Iterative Shrinkage-Thresholding Algorithm for Linear Inverse Problems

Abstract 作者考虑了一类迭代收缩阈值算法(ISTA),用于解决信号/图像处理中出现的线性逆问题。 这类方法可以被视为经典梯度算法的拓展,由于其简单性而具有吸引力,因此即使使用密集的矩阵数据,也足以解决大规模问题。 然而,众所周知,这些方法的收敛速度也相当缓慢。 这篇文章提出了一种新的快速迭代收缩阈值算法(FISTA),该算法保持了ISTA的计算简单性,但全局收敛速度在理论和实...

【Research & Writing】上传arXiv

要选择的 License 许可选 arXiv.org perpetual, non-exclusive license 就可以了 报错 不能再大目录下 / 图表使用相对路径 Reference Arxiv 论文提交流程——看这篇就够了 no .bbl file for submission to ArXiV

【深度学习】DPM-Solver:A Fast ODE Solver for Diffusion Probabilistic Model Sampling in Around 10 Steps

Abstract 扩散概率模型(DPM)正在出现强大的生成模型。 尽管DPM具有高质量的生成性能,但它们的采样仍然缓慢,因为它们通常需要数百或数千个大型神经网络的顺序函数评估(步骤)来绘制样本。 从 DPM 的采样可以被看作是解决相应的扩散常微分方程(ODE)。 在这项工作中,作者提出了扩散ODE解的精确公式。 该公式分析计算了解的线性部分,而不是像以前的工作那样将所有项留给黑盒O...

【深度学习】DPM-SOLVER++: Fast Solver for Guided Sampling of Diffusion Problistic Models