본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

전체 글1217

🎇 은하 병합 image-only 모델 진행 계획 🎇 계획 🎇 데이터 희수 언니가 image only 데이터를 넘겨줬다이렇게 되어 있구 이렇게 정리해 봤다 우리 허깅페이스 스페이스에도 업데이트 HamCaDor/GalaxyMergerRawImage · Datasets at Hugging FaceSearch is not available for this datasethuggingface.co 🎇 이미지 모델 테스트 계획 지금까지 읽었던 선행 논문들을 대상으로따라해 보기로 결정 마미 피어슨 씨 논문 zoobot 정기 회의는 다음주부터 격주 수요일이 될 것 같다 한국천문연 협업 캠프..!설렘 2025. 7. 8.
TOEFL writing : paraphrasing Techniques TOEFL Writing의 통합형 문제에서는 주어진 글을 요약하거나 재진술(paraphrasing)하는 능력이 매우 중요 🎬 1. Synonym Replacement 유의어 사용으로 어휘 다양성 증가단어의 의미를 바꾸지 않으면서 표현을 달리하는 방법단어 대 단어 ㄴㄴ 문장 대 문장 ㅇㅇ 예시Original: The experiment was very important for the study.Paraphrased: The experiment was crucial for the research. 🎬 2. It as a Formal Subject (가주어 It 사용) 문장의 주어를 ‘It’으로 바꾸어 더 공식적인 톤 유지 예시Original: To understand the data is essenti.. 2025. 7. 7.
🛡️ UCPC 9차 회의 보호되어 있는 글 입니다. 2025. 7. 7.
[Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation] 논문 Semantic Image Segmentation을 위한 Atrous Separable Convolution 기반 Encoder-Decoder 구조 초록(Abstract)딥러닝 기반의 Semantic Segmentation(의미론적 분할) 과제에서는 공간 피라미드 풀링 모듈(Spatial Pyramid Pooling)이나 인코더-디코더 구조가 자주 사용된다. 전자는 다양한 비율과 receptive field로 필터링 또는 풀링을 수행해 다중 스케일의 컨텍스트 정보를 인코딩할 수 있으며, 후자는 점차 공간 정보를 복원함으로써 보다 선명한 객체 경계를 포착할 수 있다. 이 논문에서는 두 방식의 장점을 결합한 DeepLabv3+ 모델을 제안한다. 이는 기존 DeepLabv3에 간단하지만 효과적인 디코더 모듈을.. 2025. 7. 5.
[U-Net: Convolutional Networks for Biomedical Image Segmentation] 논문 U-Net: 생물의학 영상 분할을 위한 합성곱 신경망 초록(Abstract) 딥러닝 모델의 성공적인 학습에는 일반적으로 수천 개의 주석이 달린 학습 샘플이 필요하다는 것이 정설이다. 본 논문에서는 제한된 수의 라벨링된 샘플을 보다 효율적으로 활용하기 위해 강력한 데이터 증강 전략을 활용한 네트워크 구조와 학습 방식을 제안한다. 이 네트워크는 컨텍스트를 포착하기 위한 수축 경로(contracting path)와 정확한 위치 추정을 위한 대칭적 확장 경로(expanding path)로 구성된다. 제안된 네트워크는 소수의 이미지로도 end-to-end 학습이 가능하며, 기존 최상위 성능(슬라이딩 윈도우 기반 CNN)을 능가했다.또한, 동일한 구조를 사용하여 광학 현미경 이미지(위상차 및 DIC)에 대해 학습.. 2025. 7. 5.
[SegFormer: Simple and Efficient Design for Semantic Segmentation with Transformers] 논문 Abstract 우리는 SegFormer라는 간단하고 효율적이면서도 강력한 의미론적 분할 프레임워크를 제안한다. 이 프레임워크는 Transformer 기반 인코더와 경량 MLP 디코더를 통합한 구조다. SegFormer는 다음과 같은 두 가지 주요 특징을 가진다: SegFormer는 계층적 구조의 Transformer 인코더를 도입하여 멀티스케일 피처를 출력한다. 이 인코더는 포지셔널 인코딩을 필요로 하지 않기 때문에, 테스트 시 해상도가 학습 시와 다를 경우 발생할 수 있는 성능 저하를 피할 수 있다.SegFormer는 복잡한 디코더를 피한다. 제안된 MLP 디코더는 다양한 레이어에서 정보를 집계하며, 이를 통해 로컬 어텐션(local attention)과 글로벌 어텐션(global attention).. 2025. 7. 5.
[컴퓨터비전 2025] Lecture 18. Multimodal Learning 강의 정리 안락한 쓰레기통 생활 이후..계절/토플/우주연구 개강.. 오랜만에 소은한나 만나서 멀모 강의 듣기데이터를 저장하는 형식이 여러 가지형식이 다른 데이터들을 종합적으로 활용하는 방식 오토매틱 스피치 리코그네이션 ASR (받아쓰기)VQA : 이미지를 보고 질문을 텍스트로 주면은 그거에 대한 답을 텍스트로 생성하는 문제 로컬라이제이션 이제 그냥 거의 다 트랜스포머쌍데이터 구하기 BERT트랜스포머 인코더를 이용해서 워드 임베딩을 학습하는 모델인풋으로 두 개의 문장을 받 VL-BERT이미지 한 장과 문장 하나 VQA질문에 대한 문장, 답에 대한 문장 MLM+ 이미지 임베딩 하나 더 (비주얼적 토큰들도 적용 VilBERTCo - TRM 상대방을 참조하는 그 크로스 모델 어텐션 Transformer-based .. 2025. 6. 30.
✳️ 유런 방학 프로젝트 : 자율주행 차량 시점 영상에서 도로/차선/보행자 Segmentation 예지가 준비한 프로젝트를 하게 됐다. 예지가 정리해준 내용!주제 : 자율주행 차량 시점 영상에서 도로/차선/보행자 Segmentation: 자율주행 차량의 전방 카메라 영상에서 도로, 차선, 사람 같은 요소들을 픽셀 단위로 분류하는 AI 모델을 구현해보기1. 주제 선정했던 이유: 자율주행에서는 주변 환경을 인식하는 게 아무래도 가장 중요한 부분인데, 특히 운전할 때 도로 위 물체들을 정확하게 분류하는 게 안전하게 주행하고, 위험 요소들은 회피하게 하는 판단에 직접적으로 영향을 주게 된다. YOLO처럼 클래스 박스로 감지하는 객체 인식보다 픽셀 단위로 훨씬 더 정밀하게 인식할 수 있는 게 Semantic Segmentation이고, 실제 ADAS(자율주행) 기술에서도 많이 활용되는 기술이다.2. 활용할 수.. 2025. 6. 25.
✈️ 교환학생 알아보기! 26 - 1학기 or26 봄방학지원자격 ※ 기 선발된 2025학년도 2학기 파견 교환학생 지원 불가 가. 본교에서 최소 한 학기 이상을 이수한 자로서 정규 학기(8학기) 이내인 학부생 (휴학생도 지원 가능) - 정규 학기 중에만 해외 대학 수강 가능하며, 추가(초과) 학기에는 파견 불가 나. 지원 시 7학기 이하인 학부생 - 일부 학과의 경우, 수업연한이 다르므로 사전에 정규 학기 내인지 확인 필수 - 이수 학기별 지원 가능 프로그램(예시)7학기 이수 중교환(1년) 지원 불가교환(1학기) 지원 가능, 파견 후 9학기 추가 등록 후 졸업방문(1학기) '재학 중 유학' 또는 '휴학 중 유학' 선택 가능 단, '재학 중 유학'으로 파견 시, 9학기 추가 등록 후 졸업6학기 이하 이수 중교.. 2025. 6. 25.
❇️ [EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks] 리뷰 아래는 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks 논문에 대한 요청하신 형식의 리뷰다: 1. 🧾 논문 개요 이 논문은 ConvNet(Convolutional Neural Network)을 효과적으로 스케일링하는 방법을 체계적으로 분석하고, 폭(width), 깊이(depth), 해상도(resolution)를 균형 있게 동시에 확장하는 새로운 복합 스케일링(compound scaling)방식을 제안한다. 이를 기반으로 NAS(Neural Architecture Search)로 설계한 경량 베이스라인 네트워크(EfficientNet-B0)를 출발점으로 EfficientNet-B7까지 모델 계열을 확장하고, ImageNe.. 2025. 6. 24.