MrD's Blog

我干了什么 究竟拿了时间换了什么

【深度学习】COCO Datasets

Overview 应该下载哪些 dataset splits? 每年的图像都与不同的任务相关联。具体地说: 如果你要提交2017年、2018年、2019年或2020年的任务,你只需要下载2017年的图片。你可以忽略之前的 split 。注: split 年份是指 image splits 发布的年份,而不是标注发布的年份。 2020 Update: 所有挑战的所有数据保持不变。 ...

【深度学习】Diffusion Model

条件概率公式与高斯分布的KL散度 条件概率的一般形式 \[P(A, B, C) = P(C \mid B, A) P(B, A) = P(C \mid B, A) P(B \mid A) P(A)\] \[P(B, C \mid A) = P(B \mid A) P(C \mid A, B)\] 基于马尔科夫假设的条件概率 如果满足马尔科夫链关系 $A \rightarrow B ...

【深度学习】Diffusion Model:Deep Unsupervised Learning using Nonequilibrium Thermodynamics

Abstract 机器学习的一个核心问题涉及使用高度灵活的概率分布对复杂的数据集进行建模,其中学习、采样、推理和评估在分析或计算上仍然可以处理。 在这里,作者开发了一种同时实现灵活性和可操作性的方法。 受非平衡统计物理学的启发,本质思想是通过迭代正向扩散过程系统地缓慢地破坏数据分布中的结构。 然后,作者学习了一个反向扩散过程,该过程恢复了数据中的结构,产生了一个高度灵活和易于处理的数...

【深度学习】DDPM:Denoising Diffusion Probabilistic Models

Abstract 这篇文章使用扩散概率模型提出了高质量的图像合成结果,这是一类受非平衡热力学考虑启发的隐变量模型。 作者的最佳结果是通过根据扩散概率模型和与 Langevin dynamics 的去噪分数匹配之间的联系设计的加权变分界训练获得的,可以解释为自回归解码的推广。 在无条件的CIFAR10数据集中,作者获得了9.46的 Inception 分数和 3.17 的最先进的FID分...

【深度学习】ATSS:Bridging the Gap Between Anchor-based and Anchor-free Detection via Adaptive Training Sample Selection

Abstract 几年来,基于先验框的检测器一直主导目标检测。 最近,由于 FPN 和 Focal Loss 的提出,无先验框的检测器变得流行起来。 在这篇文章中,作者首先指出,基于先验框的检测和无先验框检测之间的差异实际上是如何定义正负训练样本,这导致它们之间的性能差距。 如果它们在训练期间对正负样本采用相同的定义,那么无论从边界框还是从点回归,最终表现都不会有任何明显的差异。 ...

【深度学习】光谱图像数据集合集

CAVE CAVE数据集又名 Columbia 数据集。 CAVE数据集的作者使用 tunable filter(VariSpec Liquid Crystal Tunable Filter) 和 cooled CCD 相机 (Apogee Alta U260, 512 x 512 pixels) 捕获了几个静态场景的31波段多光谱图像(400-700纳米,间隔10纳米)。捕获了各种物体...

【深度学习】ICVL:Sparse Recovery of Hyperspectral Signal from Natural RGB Images

Abstract 高光谱成像是一种重要的视觉模式,具有越来越大的兴趣和应用范围。 然而,后者源于这样一个事实,即现有设备在空间、光谱和/或时间分辨率方面都有限,同时既复杂又昂贵。 作者提出了一种低成本和快速的方法,可以直接从RGB中恢复高质量高光谱图像。 该方法首先利用高光谱先验,以便创建一个稀疏的高光谱签名及其相应的RGB投影词典。 然后,通过后者描述新的RGB图像有助于通过前者...

【机器学习】Harvard:Statistics of Real-World Hyperspectral Images

Abstract 高光谱图像通过在可见光谱中一些波长的窄带中包含每个像素 irradiance measurements,比典型的RGB图像提供更高的光谱分辨率。 额外的光谱分辨率可能对许多视觉任务有用,包括分割、识别和 relighting。 寻求捕获和利用高光谱数据的视觉系统应该受益于自然高光谱图像的统计模型,但目前对其结构知之甚少。 使用新收集的50张室内和室外场景的高光谱图像...

【机器学习】Generalized Assorted Pixel Camera(CAVE):Postcapture Control of Resolution, Dynamic Range, and Spectrum

Abstract 作者提出了 generalized assorted pixel(GAP)相机的概念,它使用户能够捕获场景的单个图像,并在事后控制空间分辨率、动态范围和光谱细节之间的权衡。 GAP相机使用复杂的 color filters 阵列(或马赛克)。 使用这种阵列的一个主要问题是,至少一些 filter 类型对捕获的图像采样严重不足。 这导致了具有 strong alia...

【深度学习】From compressive sampling to compressive tasking: retrieving semantics in compressed domain with low bandwidth

Abstract 在计算机视觉任务的智能分析中,高吞吐量成像很好。在传统设计中,吞吐量受到物理图像捕获和数字后期处理分离的限制。计算成像通过图像捕获流程混合模拟和数字处理来增加吞吐量。然而,计算成像的最新进展侧重于“压缩采样”,这阻碍了在实际任务中的广泛应用。这篇文章对基于快照压缩成像(SCI)和语义计算机视觉(SCV)任务的计算成像的下一步进行了系统分析,这些任务在过去十年中作为基本的计...