전체 글1293 ❇️ [BLIP: Bootstrapping Language-Image Pre-training forUnified Vision-Language Understanding and Generation] 논문 리뷰 므엥✳️ 논문 리뷰 1. 🧾 논문 개요이 논문은 다양한 비전-언어(Vision-Language) 태스크에 범용적으로 활용 가능한 통합 사전학습 프레임워크인 BLIP을 제안한다. 기존 VLP(Vision-Language Pretraining) 모델들은 주로 이해 기반 또는 생성 기반 태스크 중 하나에만 특화되어 있었던 반면, BLIP은 양쪽 모두를 효과적으로 처리할 수 있도록 설계되었다. BLIP은 두 가지 핵심 기여를 통해 이를 달성한다: 모델 측면: 새로운 아키텍처인 Multimodal Mixture of Encoder-Decoder (MED).데이터 측면: 웹 이미지-텍스트 쌍의 품질을 개선하는 CapFilt (Captioning + Filtering).2. 🎯 주요 기여다운스트림 태스크: COC.. 2025. 5. 26. 📑 Stanford CS229 : Advice for applying Machine Learning 1 https://cs229.stanford.edu/materials/ML-advice.pdf머신러닝 공부하기유명한 스탠포드 강의 의 선수공부용ppt 📌 강의 목적머신러닝 알고리즘을 다양한 실제 문제에 어떻게 적용할지에 대한 조언 제공.수학적으로 복잡하지 않지만 이해하기 어려운 핵심 개념들을 다룸.일부 내용은 논쟁의 여지가 있으며, 새로운 알고리즘 연구에는 적절하지 않을 수 있음. 🧠 주요 주제학습 알고리즘 디버깅을 위한 진단 방법오류 분석 (Error analysis) 및 제거 분석 (Ablative analysis)새로운 머신러닝 문제에 접근하는 방법 핵심 경고: 조기 통계 최적화(premature optimization) 를 피하라. 머신러닝 모델이 기대한 성능을 내지 못할 때 어떤 식으로 문제를 .. 2025. 5. 23. 🏆 이그 - SDSS 데이터 다운,전처리 ✴️ 연구 설계이렇게 하면 되지 않을까?! ㅠㅠ근데 안 되면 넘 슬플 듯 ✴️ 데이터 가져오기SDSS : 은하 이미지 + 은하 이름?라벨? + 위치✴️ 데이터 전처리중심 정렬 (Centering) - 은하 중심 좌표(예: 광도 중점)를 계산하여 잘라흑백 변환 후 대비 조정노이즈 제거 및 정규화- 가우시안 블러로 / 로컬 콘트라스트 필터입력 정규화 (평균 0, 표준편차 1 스케일링)를 통해 밝기 범위를 통일크기 및 해상도 통일: 모델 입력 크기에 맞춰 모든 이미지를 동일 해상도로 리사이즈✴️ 데이터 증강소폭 회전 (Rotation)✴️ 자기지도 학습 (SimCLR / DINO / VAE 등)✴️ 2D 임베딩 모델 사용하여 임베딩으로 변환 / 벡터DB저장 ✴️ 클러스터링 - DBSCAN, KMeans .. 2025. 5. 22. 🌌 [Determining the time before or after a galaxy merger event] - 경쟁 논문 Aims: This work aims to reproduce the time before or after a merger event of merging galaxies from the IllustrisTNG cosmological simulation using machine learning. Methods: Images of merging galaxies were created in the u, g, r, and i bands f" data-og-host="ui.adsabs.harvard.edu" data-og-source-url="https://ui.adsabs.harvard.edu/abs/2024A%26A...687A..45P/abstract" data-og-url="https://ui.adsabs.. 2025. 5. 22. 🌌 SpaceAI 천문연구원 킥오프 미팅 - 날짜: 5/23(금) 오전 10시 ~ 오후 2시- 장소: 한국천문연구원 장영실홀 331-1호- 일정10:00 ~ 10:10 / 환영인사 및 SpaceAI 프로그램 소개 10:10 ~ 10:20 / SpaceAI 2025 Scientist 트랙 진행 경과 보고 및 추진 계획 발표 10:20 ~ 10:50 / 연구제안서 발표 (총 3건, 각 10분 발표 및 Q&A 포함)10:50 ~ 11:00 / 팀 구성11:00 ~ 12:00 / 팀별 논의 I (향후 계획, 임무 분장, 데이터세트 준비, 베타 버전의 모델 개발 등 관련하여) 12:00 ~ 13:00 / 점심식사 (천문연 구내식당)13:00 ~ 14:00 / 팀별 논의 II (향후 계획, 임무 분장, 데이터세트 준비, 베타 버전의 모.. 2025. 5. 20. 🏆 SYENERGI 이그노벨상용 사이드프로젝트 Sejong-Yonsei-Ewha NEtwork for Research on Galactic Interactions 재밌겠다..공부 겸 하는 것도 나쁘지 않을 듯🏆 은하 알파벳 분류 모델 개발 1. 공개된 대규모 은하 이미지 데이터셋 (및 접근 방법과 라이선스) 알파벳처럼 보이는 은하를 많이 확보하려면 대용량의 은하 이미지 데이터가 필요대표적인 공개 천문 데이터셋 Galaxy Zoo – 시민과학 프로젝트로 전 세계 자원봉사자들이 SDSS, Hubble 등 망원경으로 촬영된 약 100만 개의 은하 이미지에 대해 형태 분류에 참여한 데이터셋이다 . 은하 형태(나선, 타원 등) 분류 결과와 이미지 ID를 제공하며, 데이터는 Galaxy Zoo 공식 사이트에서 다운로드 가능하다 . 이미지 자체는 Sloan .. 2025. 5. 20. 🌌 충돌 은하 분류 연구 : 지웅배 교수님 진행 계획 정리 보호되어 있는 글 입니다. 2025. 5. 20. 👻 선배의 수상한 다이어리: 캠퍼스 적응 공포 AR 체험 중간발표 조원들 다 짱짱..🚌 승객으로 잘 가는 중더 열심히 해야 댐👻 PPT한나랑 민경 님이 담당한 ppt👻 UI/UX나랑 김한나님이 ui ux귀신 선배 캐릭터를 그렸다담요 컴공에 비치된 털담요임현실고증 한나님 영상 2025. 5. 20. 🛡️ UCPC 5차 회의 보호되어 있는 글 입니다. 2025. 5. 19. ❇️ [Masked Autoencoders Are Scalable Vision Learners] 논문 발표 준비 에그타르트(big), 곤약젤리, 티즐, 삼김, 단백이, ❇️ 발표문 #1-1. 컴퓨터 비전에서의 표현 학습 한계 CNN을 기반으로 한 컴퓨터 비전의 대표적인 성공은 ImageNet 사전학습입니다.하지만 그 성공은 라벨링된 수백만 장의 이미지에 기반하고 있습니다.이제는 ViT 같은 대형 모델들이 등장했는데, 이런 모델은 ImageNet만으로는 부족합니다.실제로, 기존 연구들은 수억 장 규모의 비공개 데이터셋(JFT 등)에 의존하고 있고,일반 연구자나 기업 입장에서 접근이 어렵습니다.그러면 어떻게 해야 할까요?NLP처럼, 라벨 없이도 표현을 학습할 수는 없을까요? >여기 보시는 그래프는 모델 크기에 따른 성능 비교입니다.기존의 Vision Transformer는 JFT-300M과 같은 거대한 라벨링 .. 2025. 5. 19. 이전 1 ··· 15 16 17 18 19 20 21 ··· 130 다음