본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그
Club|Project/졸업 연구 | 멀티모달 AI를 이용한 은하 병합 단계 분류

🔭 LSST with AI : day 2

by 정람지 2025. 5. 14.

싸인받았따!!

소은이 알바 사장님이 부탁하셧다고 A4용지 묶음 가져옴ㅋㅋㅋㅋ

나도 껴서 받음

밥...

오늘도 맛잇음...

챱챱


🔭 Practical application tutorial session II: machine learning with survey images

 

 

GitHub - csabiu/KAML-2025: AI with LSST workshop - KAML 2025

AI with LSST workshop - KAML 2025. Contribute to csabiu/KAML-2025 development by creating an account on GitHub.

github.com

 

이미지 처리!


🔭 Autoencoder-Based Galaxy Image Search: A New Approach to Morphological Classification and Galaxy Research Methods
(Podcasts: en_version  kr_version)

 

🧠 오토인코더란?

 

입력 데이터를 압축했다가 다시 복원하는 자동 인코딩(auto-encoding) 구조의 신경망

즉, 입력 = 출력이 되도록 학습시켜서, 그 과정에서 데이터의 본질적인 표현(latent representation)을 학습하게 함

 

 

🔧 기본 구조

입력 X
  ↓
[ 인코더 ]   →   Z (잠재 표현, latent vector)
  ↓
[ 디코더 ]   →   X' (재구성된 출력)

목표: X ≈ X'

 

1. Encoder (인코더)

  • 입력을 저차원 벡터(Z)로 압축 (차원 축소)
  • 정보의 핵심만 남김

 

2. Latent Space (Z)

  • 은닉 표현(잠재 공간)
  • 데이터의 의미 있는 요약이 이 위치에 저장됨

 

3. Decoder (디코더)

  • Z로부터 원래 입력을 최대한 비슷하게 복원하려 함

 

 

🎯 학습 목표

  • Loss Function (손실 함수): 보통 Mean Squared Error (MSE)
L = || X - X' ||²
  • 입력 X와 재구성된 X’의 차이를 최소화하는 방식으로 학습

 

 

🧪 오토인코더 활용 분야

🔍 차원 축소 PCA보다 비선형 구조를 잘 학습함
🧠 특징 추출 Latent vector를 다른 모델의 입력으로 사용
🧬 이상치 탐지 재구성 오차가 큰 샘플 → 이상치로 간주
🧼 노이즈 제거 Denoising Autoencoder
🧪 생성 모델 Variational Autoencoder (VAE) 등 확장

 

 

 

🛰️ 오토인코더 기반 은하 이미지 분석 및 유사 은하 탐색 시스템

 

💡 개요

  • 은하 이미지를 오토인코더로 인코딩하여 잠재 벡터(latent vector) 생성
  • 이를 통해:
    • 은하의 핵심 특징 추출
    • 비슷한 은하 이미지 탐색
    • 자동 분류 및 노이즈 제거

🧪 실험 방식

 

  •  10만 개의 은하 이미지를 수집하여 학습 (train: 60%, val: 20%, test: 20%)
  • 오토인코더가 입력 이미지를 점점 더 정확히 복원하게 됨
  • 결과:
    • 입력 ≈ 출력 → 오토인코더가 은하의 구조적 특징 학습 성공
    • 각 은하 이미지는 압축된 잠재 특징 공간에 위치
    • 유사 은하 검색 시, 가장 가까운 잠재 벡터를 가진 은하를 반환

 

 

🎯 주요 목표

  1. 유사한 은하 이미지 자동 검색
  2. 은하 자동 분류
  3. 이미지 생성 시 노이즈 제거 (denoising)

 

 

🌌 유사 은하 검색 예시

  • 입력 은하와 매우 닮은 은하를 찾는 데 성공
  • 단, 색상 정보에 의존도가 높아 일부 스파이럴 은하를 잘못 분류
  • 향후 해결과제로는 “색상의 가중치 감소”, “구조 중심 유사도 계산” 등이 있음

 

 

🔁 시뮬레이션-관측 데이터 연결

  • 시뮬레이션에서 생성된 은하와 관측 데이터를 매칭하여 유사 은하를 탐색할 수 있음
  • 이 방식은 관측 데이터와 시뮬레이션 간 브리지 역할 가능

🔭 Detection and classification of dwarf galaxies using deep learning

기엽자나

 

네?


🔭 How Accurate are Transient Spectral Classification Tools? - A Study Using 4646 SEDMachine Spectra

새로운 노트-2.txt
0.03MB

 

 

 

 

 

 

🌌 저표면광도 은하 탐색과 초신성 분류 자동화

 

💡 저표면광도 은하 탐색 (LSB Galaxy Detection)

  • 문제: 일반 은하보다 수천 배 어두운 은하를 기존 탐색기로는 감지하기 어려움
  • 해결책:
    • 머신러닝 기반 확률 맵(probability map) 생성
    • Bounding Box, Feature Map 예측하여 은하 가능성 높은 영역 자동 탐지
    • 다중 분해능 탐색 가능

 

📉 분류 정확도 분석

  • CNN, MobileNet 등 여러 분류기를 실험
  • False Negative, False Positive율 분석
  • 결과:
    • MobileNet은 false negative 감소, 다만 false positive 증가
    • 최종 목표: 최소 누락(Miss)과 최소 오탐(False Alarm)의 균형

 

💥 초신성 스펙트럼 분류 성능 평가

 

🎯 목적

  • 기존 분류 툴(SNID, DASH 등)의 정확도, 순도, 지표의 의미를 정량적으로 평가

 

🔧 실험 세부

  • ZTF의 Builder 데이터 사용 (총 4,646개 분광 자료)
  • SNID / DASH / Superfit 기반 결과 비교
  • 2종 분류 (1A vs. non-1A)와 5종 분류로 평가

 

🧪 주요 결과

  • DASH가 평균적으로 가장 높은 정확도 (~87.6%)를 보임
  • 하지만 특정 유형 (superluminous SN 등)에서는 성능 저하
  • 조합된 판단(예: 세 가지 툴이 모두 같은 분류를 내릴 때)의 신뢰도가 가장 높음
  • 스펙트럼의 신호대잡음비(SNR)보다 델 내부 지표(metric)가 더 중요한 요인으로 작용함

 

 

🔍 제안 사항

  • dash 확장 시, non-SN class나 희귀 SN class 추가는 어렵지만 보완 필요
  • supernova 분류의 경우, photometric + spectroscopic 통합 활용이 향후 중요

 

 


영어 열심히 공부해야겠다..

다들 영어 넘잘함

질문도 영어로 넘잘함

 

 

 

그리고...

영어 사투리..?

그런 느낌의 영어 쓰시는 분들 다 잘 알아듣는 걸까 사람들..? 

쉽지않다

과자시체

호호 합법적 결석 

출석처리하러 총총