본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

hamstersAreCute1299

🌌 Imputation 유효성 검사 실험2 - MICE 검증 실험(개선하기) 🌌 TODOMICE 검증 실험 (ing)평균치, 중앙값 등 다른 기법 실험과 비교제일 잘 복원하는 전처리 기법의 데이터 가지고 모델 전부 다시 돌리기최고 성능 모델로 추론 코드 돌리기+ 논문 쓰기 MICE 검증 실험 : 개선하기로버스트스케일러와 스탠다드스케일러 차이 보기분포 정규화 과정 빼 보기칼럼별로 적합한 회귀 모델 끼우기(스케일러도 빼 보기..?) 개선해 보자 1) Heavy-tail 변수(SFR, StellarMass)에서 선형 MICE가 한계에 부딪히는 이유조건부 평균(Conditional Mean)으로의 수축: 현재 MICE의 기본 설정(BayesianRidge 등 선형 회귀)은 “조건부 평균”을 예측해 대치Heavy-tail(꼬리가 두껍고 극단값이 드문 분포)에서는 극단값이 평균 쪽으로.. 2025. 11. 4.
🌌 Imputation 유효성 검사 실험2 - MICE 검증 실험 🌌 TODOMICE 검증 실험(ing)평균치, 중앙값 등 다른 기법 실험과 비교제일 잘 복원하는 전처리 기법의 데이터 가지고 모델 전부 다시 돌리기최고 성능 모델로 추론 코드 돌리기+ 논문 쓰기 🌌 MICE 검증 실험1) 결측치 만들기 - MCAR 방식- 각 칼럼별로 테스트- 데이터의 10퍼센트씩 결측을 만들어서, 10회 반복하여 전체 데이터에 대해 결측 복원을 수행하기2) 분포 변환- 비율형 변수 ( B_T, AxisRatio ) : logit 변환- 큰 양수 값 ( EffectiveRadius, StellarMass, StellarVelDispersion, StellarMetallicity ) : log1p 변환3) 스케일링 - standard scaler 또는 Robust scaler 적용4).. 2025. 11. 3.
📊 대치 정확도, 분포 보존 검증법 정리 : MAE, RMSE, R², NMAE / KS, CDF, Wasserstein distance(EMD), Q–Q plot, Energy distance 끝나고 위블레갈거잉~ 위블렝본가 갈 때 선물~ 📊대치 정확도 : 점추정 점추정(point estimate) 지표 값의 오차를 수치적으로 평가지표식이상치 민감도단위해석 초점특징MAE평균 절대오차낮음원 단위평균적 오차 크기안정적, 직관적RMSE제곱평균오차 루트높음원 단위큰 오차 영향분산 평가R²설명된 분산 비율중간무단위모델 설명력직관적 비율NMAEMAE / IQR 또는 Range낮음무단위상대적 오차단위 비교 가능 1️⃣ MAE (Mean Absolute Error, 평균 절대 오차) 의미: 실제값과 대치값의 차이의 절댓값 평균.특징:오차의 방향(±)을 무시하고, 크기만 평가.이상치(outlier)에 비교적 덜 민감.해석: “평균적으로 이 정도만큼 틀렸다.”단위: 원 데이터와 동일 (ex. 반지름[kp.. 2025. 11. 3.
📊 데이터 전처리 기법 정리 : StandardScaler, RobustScaler , MinMaxScaler / log1p(sigmoid), logit(exmp1) 임퓨테이션 검증하다가 지식의 한계 느낌 📊데이터 전처리 “값의 크기를 맞추는 것(스케일링)”데이터의 “형태(분포)”를 바꾸는 게 아니라, “크기(범위)”만 맞추는 변환각 방법은 평균·중앙값·최소값을 기준으로 스케일을 맞추는 점이 다름StandardScaler → 통계적으로 정규화 (정규분포 가정 시 최적)RobustScaler → 이상치 강인 (중앙값 기준)MinMaxScaler → 단순한 범위 정규화 (0~1)“분포를 조정하는 것(변환)”데이터의 “크기(범위)”통일이 아니라, “형태(분포)”를 바꾸는 변환log1p ↔ expm1 : “양수 데이터의 로그-스케일 압축과 복원”logit ↔ sigmoid : “확률/비율 데이터의 선형화와 복원”⚙️ Scaler1️⃣ StandardScaler평균을 0, .. 2025. 10. 31.
🌸 이화여대 프로그래밍 대회 출제 문제 아이디어 - 2 보호되어 있는 글 입니다. 2025. 10. 30.
🇫🇷 프랑스 파리 Epita : ISIC국제학생증 발급, 인정과목 확인, 여행자 보험 가입 🇫🇷 TODO- ISIC국제학생증 발급하기- 가서 쓸 결제 수단? 교통카드?- 국제보험 ✅- Revolut / Wise 계좌 개설 🇫🇷 인정과목 확인- Big Data Infrastructure & Cloud Computing (4) + Digital Marketing and Social(1) → 클라우드 컴퓨팅- Kaggle week(5)-> ??- Mathematics for Data Science(2) + Data Exploration & Preparation(2) -> 데이터 엔지니어링- Foundations of Statistical Analysis & Machine Learning(4) + Data Science in Production (1) -> 인공지능 인정되는지 교수님들께 메.. 2025. 10. 29.
🇫🇷 프랑스 파리 Epita : 교환학생 교환교 서류 제출, 비자, 항공편, 숙소, 친구들 꼬시기 🇫🇷 교환학생 교환교 서류 제출 MSc - Computer Science : Data Science and Analytics 신청영어 CV, 여권사본, 사진, 학업계획서, TOEFL성적표, 영문성적부 제출. ??국제보험??🇫🇷 프랑스 학생비자 학생비자 신청 절차 | Campus France주한 프랑스대사관 홈페이지 https://kr.ambafrance.org/ 에 안내되어 있는 프랑스 비자 공식 사이트 France-Visas를 통해 단계별로 절차를 이행한 후, 주한 프랑스 대사관 비자과에 비자 신청 방문. 주한www.coree.campusfrance.org 캠퍼스 프랑스 1) 온라인 서식 입력 메뉴 작성등록된 기관의 입학 허가서/ (가)등록증 필요11월 -12월 2) Campus Fran.. 2025. 10. 29.
기계학습 오세은굣 중간/기말족보 보호되어 있는 글 입니다. 2025. 10. 26.
컴퓨터구조 윤명국굣 기말 족보 보호되어 있는 글 입니다. 2025. 10. 18.
컴퓨터구조 윤명국굣 중간 족보 보호되어 있는 글 입니다. 2025. 10. 18.