본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

전체 글1217

🛡️ UCPC 6차 회의 보호되어 있는 글 입니다. 2025. 6. 2.
🤑 Colab pro+ 구독 / 은하 분류 멀티모달 데모 코드 🤑 Colab pro+ 구독연구비 있는 녀자댓츠 미 브로 거금 투자 Making the Most of your Colab SubscriptionRun, share, and edit Python notebookscolab.research.google.com✅ 1. 더 강력한 하드웨어 자원GPU 성능 향상: A100, V100, T4 같은 고성능 GPU 제공. 특히 A100은 딥러닝 학습 시 속도 차이가 매우 큼.TPU 제공: TPU도 사용 가능하며, TensorFlow 기반 모델에서 특히 유리함.RAM 용량 증가: 최대 52GB 이상의 고용량 RAM 환경 사용 가능 (Pro는 약 25GB, Free는 12GB).✅ 2. 더 긴 런타임 & 연결 유지세션 유지 시간 증가: Free는 수십 분에서 1시간 내.. 2025. 5. 31.
👻 선배의 수상한 다이어리: 중앙도서관 씬 제작 🧭 챕터 2-중앙도서관챕터 2중앙도서관도서관으로 이동, 배터리 부족 → 시청각실로 이동하여 00 인식 → 충전기 대여 후 다이어리 수집 (다이어리에 자정 이후 잠김 내용)시청각실 - 학생증 보여주면 핸드폰 충전기랑 헤드셋 대여 가능자정 이후 자동 잠김 → 24시 이전 퇴실 필요휴대폰을 충전, 어두워지는 연출 (Auditorium01 진행)- 도서관에서 집중하니까 시간 가는 줄 모르겠네..(휴대폰 드는 사진이 뜨며)- 앗..! 배터리가 없잖아?- 학교에서 충전기를 대여할 수 있다던데..(arScene 활성화)시청각실로 이동하여 00를 인식하시오 >(인식 후)🧩 꿀팁 정보 요약: 중앙도서관은 자정(24:00) 이후 출입 통제되며, 잔류 시 자동 잠김{ "PageID": 1, "Date": "4월 6일",.. 2025. 5. 30.
❇️ [GPT-3: Language Models are Few-Shot Learners] 인트로 리뷰 Abstract최근 연구들은 대규모 텍스트 코퍼스에 대한 사전 학습(pre-training) 후 특정 태스크에 대한 파인튜닝(fine-tuning)을 수행함으로써 다양한 자연어처리(NLP) 과제에서 큰 성능 향상을 이루었다. 이러한 방식은 보통 태스크에 독립적인 아키텍처를 사용하지만, 여전히 수천에서 수만 개의 예시가 포함된 태스크 전용 데이터셋이 필요하다는 한계가 있다. 반면, 인간은 보통 단 몇 개의 예시나 간단한 지시만으로도 새로운 언어 과제를 수행할 수 있다. 현재의 NLP 시스템은 이러한 능력을 대부분 갖추지 못하고 있다. 본 논문에서는 언어 모델의 규모를 확장하면 태스크에 특화되지 않은(few-shot) 상황에서도 성능이 크게 향상된다는 것을 보인다. 우리는 1,750억 개의 파라미터를 가진 .. 2025. 5. 26.
❇️ [BLIP: Bootstrapping Language-Image Pre-training forUnified Vision-Language Understanding and Generation] 논문 리뷰 므엥✳️ 논문 리뷰 1. 🧾 논문 개요이 논문은 다양한 비전-언어(Vision-Language) 태스크에 범용적으로 활용 가능한 통합 사전학습 프레임워크인 BLIP을 제안한다. 기존 VLP(Vision-Language Pretraining) 모델들은 주로 이해 기반 또는 생성 기반 태스크 중 하나에만 특화되어 있었던 반면, BLIP은 양쪽 모두를 효과적으로 처리할 수 있도록 설계되었다. BLIP은 두 가지 핵심 기여를 통해 이를 달성한다: 모델 측면: 새로운 아키텍처인 Multimodal Mixture of Encoder-Decoder (MED).데이터 측면: 웹 이미지-텍스트 쌍의 품질을 개선하는 CapFilt (Captioning + Filtering).2. 🎯 주요 기여다운스트림 태스크: COC.. 2025. 5. 26.
📑 Stanford CS229 : Advice for applying Machine Learning 1 https://cs229.stanford.edu/materials/ML-advice.pdf머신러닝 공부하기유명한 스탠포드 강의 의 선수공부용ppt 📌 강의 목적머신러닝 알고리즘을 다양한 실제 문제에 어떻게 적용할지에 대한 조언 제공.수학적으로 복잡하지 않지만 이해하기 어려운 핵심 개념들을 다룸.일부 내용은 논쟁의 여지가 있으며, 새로운 알고리즘 연구에는 적절하지 않을 수 있음. 🧠 주요 주제학습 알고리즘 디버깅을 위한 진단 방법오류 분석 (Error analysis) 및 제거 분석 (Ablative analysis)새로운 머신러닝 문제에 접근하는 방법 핵심 경고: 조기 통계 최적화(premature optimization) 를 피하라. 머신러닝 모델이 기대한 성능을 내지 못할 때 어떤 식으로 문제를 .. 2025. 5. 23.
🏆 이그 - SDSS 데이터 다운,전처리 ✴️ 연구 설계이렇게 하면 되지 않을까?! ㅠㅠ근데 안 되면 넘 슬플 듯 ✴️ 데이터 가져오기SDSS : 은하 이미지 + 은하 이름?라벨? + 위치✴️ 데이터 전처리중심 정렬 (Centering) - 은하 중심 좌표(예: 광도 중점)를 계산하여 잘라흑백 변환 후 대비 조정노이즈 제거 및 정규화- 가우시안 블러로 / 로컬 콘트라스트 필터입력 정규화 (평균 0, 표준편차 1 스케일링)를 통해 밝기 범위를 통일크기 및 해상도 통일: 모델 입력 크기에 맞춰 모든 이미지를 동일 해상도로 리사이즈✴️ 데이터 증강소폭 회전 (Rotation)✴️ 자기지도 학습 (SimCLR / DINO / VAE 등)✴️ 2D 임베딩 모델 사용하여 임베딩으로 변환 / 벡터DB저장 ✴️ 클러스터링 - DBSCAN, KMeans .. 2025. 5. 22.
🌌 [Determining the time before or after a galaxy merger event] - 경쟁 논문 Aims: This work aims to reproduce the time before or after a merger event of merging galaxies from the IllustrisTNG cosmological simulation using machine learning. Methods: Images of merging galaxies were created in the u, g, r, and i bands f" data-og-host="ui.adsabs.harvard.edu" data-og-source-url="https://ui.adsabs.harvard.edu/abs/2024A%26A...687A..45P/abstract" data-og-url="https://ui.adsabs.. 2025. 5. 22.
🌌 SpaceAI 천문연구원 킥오프 미팅 - 날짜: 5/23(금) 오전 10시 ~ 오후 2시- 장소: 한국천문연구원 장영실홀 331-1호- 일정10:00 ~ 10:10 / 환영인사 및 SpaceAI 프로그램 소개 10:10 ~ 10:20 / SpaceAI 2025 Scientist 트랙 진행 경과 보고 및 추진 계획 발표 10:20 ~ 10:50 / 연구제안서 발표 (총 3건, 각 10분 발표 및 Q&A 포함)10:50 ~ 11:00 / 팀 구성11:00 ~ 12:00 / 팀별 논의 I (향후 계획, 임무 분장, 데이터세트 준비, 베타 버전의 모델 개발 등 관련하여) 12:00 ~ 13:00 / 점심식사 (천문연 구내식당)13:00 ~ 14:00 / 팀별 논의 II (향후 계획, 임무 분장, 데이터세트 준비, 베타 버전의 모.. 2025. 5. 20.
🏆 SYENERGI 이그노벨상용 사이드프로젝트 Sejong-Yonsei-Ewha NEtwork for Research on Galactic Interactions 재밌겠다..공부 겸 하는 것도 나쁘지 않을 듯🏆 은하 알파벳 분류 모델 개발 1. 공개된 대규모 은하 이미지 데이터셋 (및 접근 방법과 라이선스) 알파벳처럼 보이는 은하를 많이 확보하려면 대용량의 은하 이미지 데이터가 필요대표적인 공개 천문 데이터셋 Galaxy Zoo – 시민과학 프로젝트로 전 세계 자원봉사자들이 SDSS, Hubble 등 망원경으로 촬영된 약 100만 개의 은하 이미지에 대해 형태 분류에 참여한 데이터셋이다 . 은하 형태(나선, 타원 등) 분류 결과와 이미지 ID를 제공하며, 데이터는 Galaxy Zoo 공식 사이트에서 다운로드 가능하다 . 이미지 자체는 Sloan .. 2025. 5. 20.