MrD's Blog

我干了什么 究竟拿了时间换了什么

【Research & Competition】CVPR2023 Workshop 竞赛汇总

Vision-Centric Autonomous Driving (VCAD) http://www.vcad.site/#/challenge Workshop on Autonomous Driving (WAD) https://cvpr2023.wad.vision/ Workshop on End-to-end Autonomous Driving https://op...

【深度学习】DDIM:Denoising Diffusion Implicit Models

Abstract 去噪扩散概率模型(DDPM)在没有对抗训练的情况下实现了高质量图像生成,但它们需要模拟马尔可夫链的许多步骤才能生成样本。 为了加速采样,我们提出了去噪扩散隐式模型(DDIM),这是一类更有效的迭代隐式概率模型,其训练过程与DDPM相同。 在DDPM中,生成过程被定义为特定马尔可夫扩散过程的反向。 我们通过一类非马尔科夫扩散过程来推广DDPM,从而实现相同的训练目标。...

【深度学习】Taming Transformers for High-Resolution Image Synthesis

Abstract Transformer 旨在学习顺序数据上的远程依赖,其在各种任务上显示最先进的结果。 与CNN不同,它们不包含优先考虑本地交互的归纳偏置。 这使得它们具有表现力,但在高分辨率图像等长序列中计算复杂度过高。 我们展示了如何将CNN的归纳偏置的有效性与 Transformer 的表达性相结合,使他们能够建模并合成高分辨率图像。 我们展示了如何(i)使用CNN学习上下...

【深度学习】IR-SDE: Image Restoration with Mean-Reverting Stochastic Differential Equations

Abstract 这篇文章提出了一种用于通用图像恢复的随机微分方程(SDE)方法。 关键结构包括 mean-reverting SDE,将高质量图像转换为对应的退化图像, 其是固定高斯噪声的平均状态。 然后,通过模拟相应的反向时间SDE,我们能够恢复低质量图像的原图像,而无需依赖任何特定于任务的先验知识。 关键的是,所提出的均值 mean-reverting SDE 有一个闭式解,允...

【深度学习】Three Ways of Storing and Accessing Lots of Images in Python

为什么你想知道更多关于Python中存储和访问图像的不同方法?如果您正在使用OpenCV根据颜色分割少量图像或逐个检测人脸,那么您无需关心它。即使您正在使用Python图像库(PIL)绘制几百张照片,也不需要这样做。将图像存储在磁盘上更合适,如.png或.jpg文件。 然而,给定任务所需的图像数量越来越大。像卷积神经网络(也称为卷积网络或cnn)这样的算法可以处理庞大的图像数据集。 Im...

【深度学习】A Two-branch Neural Network for Non-homogeneous Dehazing via Ensemble Learning

Abstract 最近,在图像去雾方面取得了快速而重大的进展。 许多基于深度学习的方法在处理去雾问题方面表现出了卓越的性能。 然而,我们观察到,即使精心设计的卷积神经网络(CNN)可以在大规模去雾基准上表现良好,该网络通常也会在NTIRE挑战引入的非均匀去雾数据集上失效。 原因主要有两方面。 首先,由于其非均匀性,分布不均匀的雾比均匀的雾更难去除。其次,研究挑战只提供了有限的数据(...

【深度学习】NH-HAZE: An Image Dehazing Benchmark with Non-Homogeneous Hazy and Haze-Free Images

Abstract 图像去雾是一个病态的问题,近年来得到了广泛研究。由于缺乏参考数据集,去雾方法的客观性能评估是主要障碍之一。 合成数据集表现出局限性,而最近引入的少数真实数据集在整个场景中假设为均匀的雾。 由于在许多真实情况下,雾分布不均匀,这篇文章引入了 NH-HAZE,这是一个非均匀的真实数据集,具有一对真正的朦胧和相应的无雾图像。 这是第一个非均匀的图像去雾数据集,包含55个户...

【深度学习】IM2ELEVATION: Building Height Estimation from Single-View Aerial Imagery

Abstract 从单视图航空图像估计数字表面模型(DSM)和建筑高度是一个具有挑战性的病态的问题,作者在本文中通过使用机器学习来解决。 作者提出了一种端到端可训练的卷积-反卷积深度神经网络架构,该架构可以学习从单个航空图像到DSM的映射,以分析城市场景。我们执行航空光学和航空光检测和测距(激光雷达)数据的多传感器融合,为我们的流程准备训练数据。数据集质量是估算的关键。 通常,由于地理...

【深度学习】Detectron2 代码解读

Config CfgNode 这段代码定义了一个名为 CfgNode 的类,它继承自 fvcore.common.config.CfgNode,并添加了一些新的功能和特性。以下是对这段代码的详细解释: 类定义 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 class CfgNode(_CfgNode): """ The...

【深度学习】MMdet 代码解读

Detectors BaseDetector BaseDetector 具有如下方法: __init__ with_neck with_shared_head with_bbox with_mask extract_feat 单/多张图为张量时提取特征 extract_feats 单/多张图为列表时提取特征 forward_train 要返回 loss...