본문 바로가기

Unsupervised Surface Anomaly Detection with Diffusion Probabilistic Model 3줄 요약direct copy 문제와, missalignment 문제를 해결하고자 한다. ; missalignment 문제는 normal region이 온전히 reconstruct 되지 못하고, 살짝 다르게 복구된 상황을 말한다.LDM과 latent space interpolation을 통해 위 문제를 해결한다.다른 논문과의 차이점은 DDPM base method에서 LDM을 처음 사용한 논문이고, 다른 AE, VAE 기반의 method 대비 direct reconstruct를 방지하였다. 다른 디퓨전 대비 강점은, LDM은 이용한 reconstruction 성능 향상과 latent space interpolation을 통해 false positive를 억제하였다는 점이다. Limitation of P..
Anomaly Detection with Conditioned Denoising Diffusion Models 3줄 요약image-guidance reconstruction based IAD를 진행한다.다른 비슷한 방법과의 차이점은, feature-wise anomaly score + pixel-wise anomaly score를 계산한다.pixel-wise 연산은 픽셀의 미세한 밝기의 차이에도 Anomaly score가 올라가고 결국 False positive가 증가하여 성능에 영향을 준다Limitation of Previous Studies/Motivations기존의 reconstruction 기반의 연구들과 비슷한 문제를 겪는다. '정상' 이미지를 똑바로 reconstruct 하지 못하여, 잘못된 이상치 탐지를 해결하고자 한다.FP(false positive)가 AUROC에 미치는 영향 개인적 생각 : 모델..
DiffusionAD: Norm-guided One-step Denoising Diffusion for Anomaly Detection P. Dhariwal and A. Nichol, “Diffusion models beat gans on imagesynthesis,” in NeurIPS, 2021 X. Liu, D. H. Park, S. Azadi, G. Zhang, A. Chopikyan, Y. Hu, H. Shi,A. Rohrbach, and T. Darrell, “More control for free! image synthesiswith semantic diffusion guidance,” in WACV, 2023 위 내용은 image guidance에 대한 내용이고, 사실 위 내용은 아래의 수식만 보아도 이해가 편하다. 부호가 햇갈리는데 이는 샘플링 과정을 생각하면 명쾌해진다.새롭게 예측할 노이즈는, t시점에서는 likelyh..
IAD 관련 아직 안 읽은거 ECCV 2024 A Unified Anomaly Synthesis Strategy with Gradient Ascent for Industrial Anomaly Detection and Localization Follow the Rules: Reasoning for Video Anomaly Detection with Large Language Models GLAD: Towards Better Reconstruction with Global and Local Adaptive Diffusion Models for Unsupervised Anomaly Detection Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection TransF..
LISA: Reasoning Segmentation via Large Language Model 3줄 요약reasoning segmentation을 가능케 한다.LLM의 vocaburary를 확장하여 SEG 토큰을 추가하고 해당 토큰 임베딩을 expantion하여 mask를 만든다.위 과정을 통해 LLM의 언어 능력을 보존하면서, segmentation 능력을 얻게 된다. LLM의 능력이 보존되기에 reasoning에서 높은 성능을 보인다.Limitation of Previous Studies/Motivations기존 존재하는 모델은 유저와의 상호작용이 부족했다.특히, 모델이 세그멘테이션을 진행할 때 reasoning이 되지 않았다. (referring segmentation의 문제) 특히 산업 군에서 reasoning은 많은 활용성을 갖는다. 예를 들어 defect에 대한 설명을 활용할 수 있다...
SAM : Segment Anything 3줄 요약foundation model을 활용한 segmentation을 진행한다. 해당 모델은 모호한 프롬프트에도 높은 referring segmentation 성능을 보인다.해당 모델은 다중 프롬프트를 활용하여 segmentation이 가능하다.SAM을 활용하여 데이터를 만들고, 해당 결과를 수정하여 iterative하게 데이터 생성과 학습을 진행한다.Limitation of Previous Studies이미지-텍스트 멀티모달은 CLIP과 같은 foundation 모델로 인해 큰 발전을 이루었다. 특히 zero-shot 성능에서 또한 큰 발전을 이루었다. 이는 여러 다운스트림 테스크에 적용되었고, 그 성능 또한 준수하였다.이미지-텍스트 세그멘테이션 모델은 기존에 이미 존재하였다. 그러나 이를 다운스트..
Dinomaly: The Less Is More Philosophy in Multi-Class Unsupervised Anomaly Detection 논문을 읽은 후 소감 : 상당히 간단한 방법으로 UAD를 향상시켰지만, 여전히 zero-shot/few-shot과 같이 데이터가 부족한 시나리오에 대해서는 부족함.3줄 요약multi-class UAD와 one-class UAD의 성능 GAP을 줄인다.reconstruction based UAD를 진행하는데, abnormal 이미지를 normal 이미지로 재구성 하는 것을 효율적으로 학습시키기 위해 bottel neck(MLP)에 drop out을 적용한다.'약한' 재구성을 위해 pixel to pixel로 reconstruction 될 것 같은 부분은 학습을 막는다.abstract하나의 클래스에 맞춤으로 모델을 학습하는 방법은 여전히 다중 클래스 모델보다 높은 점수를 보인다.다중 클래스 모델을 개선하여,..
Unsupervised Continual Anomaly Detection with Contrastively-learned Prompt 3줄 요약 class-wias하게, class에 맞춤으로 모델을 훈련시키면, 새로운 class가 들어왔을 때 다시 학습을 진행해야 하고 이는 컴퓨팅 자원의 남비와 비 효율성으로 이어진다. 이를 continual learning으로 해결한다.learnable query를 vision encoder에 concat한다. 이후 SAM을 통해 이미지의 주요 element를 추출하여 element wise 하게 contrastive learning을 하고, 이를 통해 query bank를 구성한다.테스트 이미지가 들어오면, 해당 테스트 이미지의 identity key를 추출하여(index 처럼 작용) query bank에 해당 identity key에 해당하는 부분을 사용하여 AD를 진행한다.Limitation o..