MrD's Blog

我干了什么 究竟拿了时间换了什么

【深度学习】Restormer:Efficient Transformer for High-Resolution Image Restoration

Abstract 由于卷积神经网络(convolutional neural networks, CNNs)能够很好地从大规模数据中学习广义的图像先验,这些模型被广泛应用于图像恢复和相关任务中。 最近,另一类神经网络结构——Transformers——在自然语言和高级视觉任务上表现显著提高。 虽然 Transformer 模型缓解了CNNs 的缺点(即感受野有限和不适应输入内容),但其计...

【深度学习】MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications

Abstract 这篇提出了一类高效的模型,称为mobilenet,用于移动和嵌入式视觉应用程序。 mobilenet基于流水线型架构,使用深度可分离卷积来构建轻量级的深度神经网络。 这篇文章引入了两个简单的全局超参数,可以有效地权衡延迟和准确性。 这些超参数允许模型构建者根据问题的约束选择合适大小的模型。 在资源和准确性权衡方面进行了大量的实验,与其它的ImageNet分类模型相...

【Research & Writing】draw.io Tutorial - Exerciese 1:添加 draw.io diagram 到 Confluence page

我们培训课程的第一部分涵盖了在Confluence(云、服务器或数据中心)中使用draw.io的基础知识:向页面添加图表并编辑现有图表。 要做到这一点,您需要知道如何向 Confluence 页面添加空白和模板图,并更改当有人查看您的页面时它们的显示方式。

【深度学习】MixFormer:Mixing Features across Windows and Dimensions

Abstract 局部窗口自注意力在视觉任务中表现突出,但存在感受野有限和建模能力弱的问题。 这主要是因为它在非重叠窗口中执行自注意力,并共享通道维度上的权重。 这篇文章提出 MixFormer 解决该问题。 首先,将局部窗口自注意力与深度卷积并行设计相结合,建跨窗口连接,以扩大感受野。 其次,这篇文章提出跨分支的双向交互,在通道和空间维度上提供互补线索。 这两种设计集成在一起,...

【深度学习】KAIST:High-quality hyperspectral reconstruction using a spectral prior

Abstract 这篇文章提出了一种新的高光谱图像重建算法,它克服了现有压缩成像方法中长期存在的光谱精度和空间分辨率之间的折衷。 该方法包括两个步骤:首先,从真实的高光谱数据集学习非线性光谱表示; 为此构建了一个卷积自编码器,它允许通过其编码器和解码器网络重构自己的输入。 其次,引入了一种新的优化方法,该方法利用新的保真先验,将学习到的 nonlinear spectral repres...

【深度学习】BIRNAT:Recurrent Neural Networks for Snapshot Compressive Imaging

Abstract 传统的高速光谱成像系统造价昂贵,通常需要消耗大量内存和带宽来保存和传输高维数据。 相比之下,快照压缩成像(SCI),多个连续帧被不同的 mask 编码,然后汇总为一个单一的 measurement,使用二维相机捕获三维场景, 是一个很有前途的想法。 这篇文章考虑了 SCI 中的重构问题,从压缩 measurement 中恢复一系列场景。 具体地说, measurem...

【深度学习】SRDiff: Single Image Super-Resolution with Diffusion Probabilistic Models

Abstract 单图像超分辨率(SISR)是将给定的低分辨率(LR)图像重建为高分辨率(HR)图像,这是一个病态问题,因为一个LR图像对应多个HR图像。 近年来,基于学习的SISR方法的性能大大超过了传统的方法,但面向PSNR的方法、GAN驱动的方法和基于Flow的方法分别存在过平滑、模式崩溃或模型占用过大的问题。 为了解决这些问题,这篇文章提出了一种新的单图像超分辨扩散概率模型(SR...

【深度学习】Deep Tensor ADMM-Net:Deep Tensor ADMM-Net for Snapshot Compressive Imaging

Abstract 快照压缩成像(SCI)系统已被开发用于使用低维 off-the-shelf 传感器捕捉高维(>=3)信号,即将多个视频帧映射到单个 measurement 帧。 SCI系统的一个关键模块是一个准确的解码器,可以恢复原始视频帧。 然而,现有的基于模型的解码算法需要利用先验知识进行彻底的参数调优,由于运行时间过长,无法支持实际应用。 这篇文章提出了一种用于视频SC...

【深度学习】HDNet:High-resolution Dual-domain Learning for Spectral Compressive Imaging

Abstract 深度学习的快速发展为高光谱图像的端到端重建提供了更好的解决方案。 然而,现有的基于学习的方法有两个主要缺陷。 首先,自注意力的网络通常会牺牲内部分辨率来平衡模型性能和复杂性,失去细粒度的高分辨率(HR)特征。 其次,即使以空间-光谱域学习(SDL)为重点的优化算法收敛到理想解,重构的HSI与真实值之间仍然存在显著的视觉差异。 因此,这篇文章提出了一个高分辨率 dua...

【深度学习】λ-net:Reconstruct Hyperspectral Images from a Snapshot Measurement

Abstract 这篇文章提出了λ-net,它可以从单个 measurement 中重建高光谱图像(例如,24个光谱通道)。 该任务通常被称为快照压缩光谱成像(SCI),它具有低成本、低带宽和高速传感速率,利用二维快照对三维(3D)信号即(x, y, λ)进行捕获。 SCI虽然已有十多年的历史,但重构算法的质量较差、速度较慢,阻碍了其广泛应用。 为了解决这一问题,这篇文章开发了一个两...