MetaUAS: Universal Anomaly Segmentation with One-Prompt Meta-Learning 핵심: non-train,프롬프트와 쿼리 이미지 간 기하학적 변화처리를 위해 soft feature alignment 모듈을 도입함.why : vision model만 사용해서 one-shot anomaly segmentationchange segmentation (변화한 부분만 segmentation)what : mental-model based model - 사람처럼 지금까지 봐오던 것과 다른 (썩은 사과, 사과) 시각 정보를 접하면 그 차이를 인지한다. - 이런 사람과 같은 anomaly 인지를 모델링하고 싶다. how : Feature Alignment Module을 이용한 pair image difference train.anomaly segmentation 말고, change segmenta.. inCTRL:Toward Generalist Anomaly Detection via In-context Residual Learning with Few-shot Sample Prompts why : domain adaptation없이 여러 도메인에서 non-train-few-shot-AS를 하고싶다.what : domain adaptation을 대응하는 layerhow : domain adaptation layer를 통해 adaptation 능력을 학습하고, 이를 기반으로 few-shot-AS를 한다. 기존 모델들은 사전 학습이 필요했다. 근데 생각해보자. real-world에서 사용하려는 전제로 모델을 구성한다면, 여러 문제에 직면한다.그중 한 가지를 특정하자면, 개인정보다 어떤 이슈로 인해 사전 학습 데이터가 없는 상황에서 어떡할것인가?특정 데이터에 의존적인 모델을 만들지 말고, Generalist Anomaly Detection을 달성하자. -> 하나의 모델을 만드는데 해당 모델은 .. Towards Training-free Anomaly Detection with Vision and Language Foundation Models why : logical defect와 spatial defect를 동시에 처리하고 싶다.what : MOT 기반 Segmentation foundation model을 이용한 관심사 분할how : 이미지레벨, 관심사 레벨을 이용한 spatial defect, MOT를 이용한 matching을 통한 logical defect 처리. 이전 논문의 한계는 다음과 같다. local defect에 집중한다. 논리적인 defect, 그리고 조합간의 defect는 무시한다.조합간의 이상을 무시한다? -> 밀키트에는 A, B, C가 필수적으로 들어가야 한다. 근데 non-defect A, B, D가 들어있다 가정하자. 이전 논문에서는 이런걸 잘 감지하지 못했다.-> LogSAD를 통해 해결하자-> non-traini.. Text-Guided Variational Image Generation for Industrial Anomaly Detecti Text-Guided Variational Image Generation for Industrial Anomaly Detection and Segmentation 핵심 : anomaly detection에 사용될 깨끗한 이미지를 얻고싶다.why : NFM-AD를 위한 깨끗한 이미지를 얻고싶다.what : GAN 기반 이미지 생성how : gan기반으로 이미지를 생성하고, 생성 이미지를 prompt-image-align을 통해 검수함. 해당 모델의 역할 : We propose a text-guided variational image generationmethod to address the challenge of getting clean data foranomaly detection in industrial.. A Survey on Foundation-Model-Based Industrial Defect Detection A Survey on Foundation-Model-Based Industrial Defect Detection A Survey on Foundation-Model-Based Industrial Defect Detectionrecently, the emergence of foundation models has brought visual and textual semantic prior knowledgeVISUAL defect detection : To enhance the model’s ability to identify anomalous patterns, some methods further explore contrastive learning mechanisms between normal and abn.. Triad: Empowering LMM-based Anomaly Detection with Vision Expert-guided Visual Tokenizer and Manufacturing Process 더 읽을거리 Myriad, patch coreabstractllm은 specific한 defects들을 감지하지 못함. 그 성능이 떨어짐 그래서 llava의 anyres를 수정한 모듈을 제안.기존의 방식은 왜 그 defect 들이 생겼는지 알지 못해 -> manufacturing-driven IAD paradigm -> COT를 활용해서 모델이 산업 프로세스를 이해하게 함.COT, EVTintroductionlm은 general-purpose task에서는 성능이 훌륭한데, IAD에서는 성능이 기대치를 만족하지 못함. 이유는 아래와 같음llm은 VL의 광범위한 쌍을 학습하는데 이게 전반적인 사전지식학습에서는 좋은데 defect region를 구체적으로 이해하는 능력은 부족함 -> EG-ROI-> high.. WinCLIP: Zero-/Few-Shot Anomaly Classification and Segmentation setting : one-class unsupervised anomaly detection abstract : anomaly detection에서는 다양한 모양, 성질의 defect가 존재한다. anomal 데이터 또한 부족한데, 이는 학습 데이터에서 anomal 데이터를 잘 표현하지 못하게 된다. IntroductionAD에서 defects는 부족함. 이전에는 One-class AD, unsupervised를 주로 사용함OCAD -> 정상 데이터로만 학습하고, 비정상 데이터가 들어오면 정상과 데이터 분포가 다를거잖아 그걸 발견함unsupervised -> kmean 등을 사용해서 정말 anomaly한 픽셀들을 찾아내는 것해당 논문에서는 long-tail 작업에서 & fully-supervision이 불.. AnomalyGPT: Detecting Industrial Anomalies UsingLarge Vision-Language Models 더 읽어볼 거리 : decoder : patchcore, winclip, april-gan 요약 : 정상데이터를 이용하여, cut-paste를 이용하여 비정상 이미지를 만들고 포아송 필터를 이용하여 smoothing. 해당 데이터를 비정상 이미지로 사용한. step1. 이미지의 anomaly mask map을 만든다. step2. 이미지의 마스크맵을 prompt learner에 입력으로 넣는다. 해당 입력은 llm이 이해할 수 있게 변환된다. step3. 사용자의 text query와 combine하여 llm에 입력한다.- step3에 사용자의 쿼리와 combine 한다 적혀있지만, 내 생각에는 concat이 더 맞는 표현 같다.- step2에 anomaly mask map이라 적었지만 논문에서는 "pi.. 이전 1 2 3 4 다음