본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

Club401

🇫🇷 프랑스 파리 Epita : 교환학생 교내 합격 저번에 갑자기 UCPC 대회 후원사 jumpTrading 리크루터들이랑 저녁 먹고 나니해외로 나가고 싶은 마음이 생겨서 엄청 뒤늦게 교환학생 준비생각해보면 학교라는 울타리 안에서 해외에서 살아보는 경험 할 수 있는 게 너무 좋은 기회 아니었나 하는 생각이 들었끼 럭키!!!!!!!4학년에 교환 가는 사람 나뿐일 듯 가서 공부도 열심히 하고 영어도 늘리고 프랑스어도..! 🇫🇷 TODO 전공학점 인정 여부 소속 학과(전공)에 사전 문의프랑스 학생비자 신청숙소 EPITA, l'école des ingénieurs en intelligence informatiqueL'école EPITA prépare ses étudiants passionnés aux métiers de l'ingénierie en .. 2025. 10. 17.
🥼 Agile 12차 랩실 미팅 모델·튜닝디폴트 파라미터가 이미 꽤 최적이라 드라마틱한 튜닝 이득은 제한적일 가능성 높음.Boost 횟수 증가 → 성능 개선 해석부스팅은 “틀리는 샘플에 더 집중”하는 절차를 반복 → 흔한(제너럴) 패턴뿐 아니라 희소·특이 패턴까지 학습하려는 효과.따라서 전체 성능 상승을 “롱테일/희귀 패턴까지 예측력 확장”으로 해석 가능.액션부스팅 반복 증가 효과를 “희귀 패턴 커버리지 확대” 관점에서 논문에 해석·서술. 결측치 대치 전략(MICE/단순대치/KNN 등)KNN 대치 권장: 단일 대치는 ‘가짜 값’ 주입 성격이 강함. KNN은 근접 이웃의 ‘진짜 분포’를 반영해 의미 있음.DBSCAN 등 클러스터링 기반은 이번 맥락에선 덜 적합/활용 어려움.MICE의 기본 회귀모델은 보통 선형회귀로 충분.RandomFo.. 2025. 10. 14.
🌌 Imputation 유효성 검사 실험 Imputation: 데이터에서 비어 있는(결측된) 값을 통계적 방법으로 채워 넣는 과정 다른 칼럼 값을 이용해 학습한 회귀 모델로 결측 칼럼의 값을 채우는 MICE 방식을 쓰기로 했고,이를 천문학계에서 용인할 수 있도록 검증 실험을 진행한다~ A. 단순 대체 (Single Imputation)평균값 채우기: SimpleImputer(strategy="mean")중앙값 채우기: SimpleImputer(strategy="median")최빈값 채우기: SimpleImputer(strategy="most_frequent")상수값 채우기: SimpleImputer(strategy="constant", fill_value=0 or -1)B. 최근접/행렬기반 대체KNN 대체: KNNImputer(n_nei.. 2025. 10. 13.
🌌Image-Exclusive 모델 - 보고서/introduction 초안 🌌 보고서문제 정의은하 병합은 단순히 두 은하의 물리적 결합을 넘어, 가스 밀도, 별 형성률, 중심 블랙홀의 성장 등 은하의 물리·화학적 진화 전반에 중대한 영향을 미친다. 따라서 병합 여부뿐 아니라 그 시점을 파악하는 것은 은하의 물리적 특성과 우주 진화 맥락을 해석하는 데 중요한 의미를 갖는다.기존 은하 병합 분류 연구는 이미지 기반 딥러닝 모델에 의존해 왔다. 그러나 뚜렷한 형태학적 흔적이 남는 ongoing merger와 달리, pre-merger와 post-merger 단계는 형태적 특징이 약하거나 일시적이어서 이미지 기반 판별이 본질적으로 어렵다. 또한, 학습용 시뮬레이션 이미지를 생성·전처리하는 과정 자체가 막대한 연산 자원과 시간을 요구하며, 모델 학습과 추론 단계 또한 고성능 GPU와 .. 2025. 10. 13.
MICE 성능 검증 실험 보호되어 있는 글 입니다. 2025. 10. 2.
🥼 Agile 11차 랩실 미팅 9월 다섯째 주 미팅 정리 | Notion🌟 Achievementshinyflight.notion.site 테이블러(이미지 배제) 접근의 당위성: 단순히 “빠르고 효율적”이라는 주장만으론 부족. CPU-only 환경(인공위성/우주 망원경 온보드 처리 등)처럼 GPU가 없거나 지연이 치명적인 실시간·대량 스트리밍 분류 시나리오를 구체적으로 제시하면 설득력↑.자료 신뢰도: 시민과학 라벨(관측)은 대량이지만 정답 신뢰성 낮음 → 시뮬레이션 데이터로 학습·검증후, 관측 데이터로 외부 검증(transfer/inference) 계획 합리적. 데이터 결측 해결 방안 → “모두 실험해봐야 한다” 단일 방법(MICE만 사용 등)에 의존하지 말고, 다음을 모두 비교해야 한다:MICE 다중대치단순 대치(평균·중앙값 등)결.. 2025. 10. 1.
🌌Image-Exclusive 모델 - ML:Tree-based 실험 Tree-based맡았다실험해보장 데이터는 RAW / standard스케일러->MICE 한 기본 버전 허깅페이스 업로드이후 robust스케일러 , 칼럼별스케일러 적용 / 파인튜닝한 MICE 실험 후 다양한 데이터 적용 실험하기로 K-Fold 교차검증(Stratified K-Fold Cross Validation) 도입 기본 구조 허깅페이스 데이터 받기 -> 모델 구조 선언 -> k-fold 이용 학습 -> 결과 출력 / 결과,모델 파일 저장 학습 시학습시간 출력하기 (전체 학습 시간, epoch별 시간)loss curve (train, valid)early stopping 5번test 시테스트시간 출력하기confusion matrix (파란색으로)이런 형식으로 (소수점 4자리까지 출력)Test .. 2025. 9. 26.
🌌 SYNERGI 9/25 전체회의 데이터/피처 현황 & 최근 결과예진님이 전달한 최신 데이터로 재학습: Macro-F1 ≈ 0.7372 달성(테이블러 전용).TNG 기반 파라미터 다수 추가(관측에서 구할 수 있는 값 위주). “많이 넣었지만 구하기 어려운 값은 아님”이라는 의견.목표의 특수성(merger 시점/타임스케일까지 구분)에 비춰 파라미터 다수 사용 정당화. 이상치/결측/INF 처리일부 피처에서 ±inf 1–2개 발견(과거엔 Total Mass 의심). 최근 데이터에는 없었음.INF는 행 제거로 처리하는 방안 합의(물리적으로 불합리/에러일 가능성 높음).결측치 처리는 MICE(Iterative Imputer) 사용: 과거 비교(중앙값/평균/행‧열 삭제) 대비 성능 우수. MICE 신뢰성 검증 계획“천문학 심사자 설득”을 위해 .. 2025. 9. 25.
🌌 Tabular 모델 성능 향상 실험 : +SpecificAngMom 실제 관측값 7개로만 줄였더니 0.81 -> 0.61로 떨어진 F1 스코어..난관을 타개하자 천문학자 분들이 반대하시겠지만.. ( 7개 피처로 7개 생성하기 보여드렸더니 정말 떨떠름해하심 ㅎㅎㅎㅎㅠㅠ)한 개는 괜찮지 않을까 마인드~ (컴공 교수님들이 결과로 승부하면 괜찮다고 하심)SHAP 2위를 기록했던 실제 관측 불가 칼럼 SpecificAngMom을 시뮬레이션 데이터로 학습시킨 회귀 모델로 채워서 실험할 수 있게 모델을 만들어 보자.(몰래ㅎ) 허깅페이스 데이터셋 (v4)의 SpecificAngMom / 예진언니 최신 실제관측제한피처 csv 파일결합 후 FT-Transformer 학습 📍1 inner join : SpecificAngMom 값이 없으면 제외- SpecificAngMom 값이 없는 .. 2025. 9. 18.
🥼 Agile 10차 랩실 미팅 오늘 비가 엄청!! 왔다연구실메이트 예영이한테 옷을 빌려줬다!오늘의 뿌듯한 일 전처리 순서 교체: Scaler → MICE로 변경해 재실험.생성 피처 최소화 파일럿: SpecificAngMom 등 1~2개만 생성해 BL-2 개선 효과 확인(“몰래” 파일럿 후 결과 좋으면 채택).실험 우선순위: 관측 적용 전, TNG(시뮬) 7~9개 관측가능 피처만으로 테이블러/이미지/멀티모달 성능을 0.8 근처까지 회복 시도.도메인 적응 후보: TENT(배치정규화만 적응), SHOT(마지막 선형층 적응) 1순위. 필요 시 스타일 변환(CycleGAN 등) 검토.피처 확장: 천문학팀이 관측에서 가능한 추가 물리량 리스트 제공 → 관측가능 피처 위주로 확장.학회/논문: 급하면 시뮬 전용 결과로 1차 제출, 관측 .. 2025. 9. 16.