본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그
Club|Project/졸업 프로젝트 연구 트랙

🔭 서울대학교 물리천문학부 Sascha Trippe 교수님 연구 면담

by 정람지 2025. 4. 3.

🔭 사전 준비


🔭 면담 시작

두근두그 떨림

 

들어오심...!

우리를 잊지 않으셨군요..!

4시간 자고 1교시 수업 한 후에 공도에서 노숙하다 일어나서 좀 부음

 


🔭 면담 

 

와 소으니 댑악임

외고는 달라

소으니 없었으면 망햇어~

 

 

국어책읽기.

영어공부합니다


🔭 면담 내용

면담 내용 raw데이터

면담.txt
0.02MB

 

 

 

참석자 1

좋은 아침입니다.

먼저, 이렇게 만나게 되어 반갑고요. 여러분이 준비하신 어떤 질문이든 답변할 준비가 되어 있습니다.

 

참석자 2

감사합니다. 혹시 저희 목소리 잘 들리시나요?

 

참석자 1

네, 연결 상태 아주 좋습니다.

 

참석자 2

감사합니다. 본격적으로 시작하기 전에 저희를 간단히 소개하겠습니다.

저희는 이화여자대학교 컴퓨터공학과 4학년 학생들이고, 시간 내주셔서 정말 감사드립니다.

현재 저희는 졸업 연구 프로젝트를 진행 중이며, 주어진 주제들 중에서 멀티모달 AI, 그중에서도 생성형 AI를 이용한 누락된 modality 생성이라는 주제를 선택했습니다.

 

참석자 2

이 주제를 위해 적합한 도메인을 탐색하던 중 우주 데이터를 타겟 도메인으로 선택하게 되었고, 천문학에 익숙하지 않기 때문에 Gentsee 대학교의 천문학 전공 학생들과 함께 협업하고 있습니다.

 

참석자 2

또한 이 프로젝트는 한국천문연구원(KASI)이 주관하는 Space AI 프로그램의 일환이기도 합니다.

오늘 교수님께 연락드린 이유는 저희 주제에 대해 조언을 구하고, 혹시 다른 가능성 있는 연구 주제에 대한 아이디어도 여쭙고 싶어서입니다. 현재 저희 상황은 이렇습니다.

 

참석자 1

소개 감사합니다. 최대한 도움 드릴 수 있도록 하겠습니다.

저나 저희 그룹은 AI 기반 분석을 직접적으로 다루고 있진 않지만, 멀티모달 AI가 어떤 방식으로 활용될 수 있는지를 이해하게 되면, 비슷한 주제를 다루고 있는 천문학 쪽 연구자들과 연결해드릴 수 있습니다.

 

참석자 1

여러분은 컴퓨터공학 측면에서 접근하고 있고, 천문학 쪽에서도 이와 비슷한 주제를 연구하는 분들이 있어요.

그래서 먼저 여러분의 접근 방식과 연구 목표를 이해한 후, 관련 분야의 전문가들과 연결해 드릴 수 있습니다. 그리고 천문학 전반에 대한 정보도 제공해 드릴 수 있습니다.

 

참석자 3

저희가 집중하고 있는 주제는 멀티모달 AI를 활용한 은하 병합 이력 분류입니다.

TNG 시뮬레이션 데이터에서 병합 시점을 라벨로 활용해 Jubal 모델을 파인튜닝하는 예비 실험을 진행하고 있습니다.

이후에는 이미지와 은하의 다양한 물리적 지표를 결합하여 병합 여부를 예측하는 멀티모달 AI를 설계할 예정입니다.

 

참석자 3

이미지와 수치 데이터를 융합함으로써 분류 성능을 높이고, 실제 관측 데이터에도 잘 적용될 수 있도록 하려 합니다.

하지만 어떤 물리적 속성을 feature로 사용할지에 대해 아직 고민 중이라, 멀티모달 AI로 은하 병합을 감지할 때 어떤 modality나 feature가 가장 유용하다고 보시는지 의견을 듣고 싶습니다.

 

참석자 1

일단 하나 질문할게요. 여러분은 은하 이미지에 익숙하신가요?

은하 이미지를 분석하셔야 하니까요. 혹시 Galaxy Zoo 프로젝트에 대해 알고 계신가요?

제가 채팅으로 링크도 보내드릴 수 있어요.

 

 

Zooniverse

The Zooniverse is the world’s largest and most popular platform for people-powered research.

www.zooniverse.org

 

참석자 1

Galaxy Zoo는 자원봉사자들에게 수백만 장의 은하 이미지를 보여주고, 이게 별인지 은하인지, 나선형인지 타원형인지, 아니면 왜곡된 은하인지 등을 사람들이 분류하도록 하는 프로젝트입니다.

이 프로젝트를 통해 “꼬리가 있는가?”, “긴 구조가 있는가?” 등 은하의 상호작용 징후를 파악할 수 있어요.

이런 파라미터들은 AI 분석에 매우 유용한 출발점이 될 수 있다고 생각해요.

 

참석자 1

여러분이 다루는 주제는 사실 천문학에서 오래된 문제 중 하나입니다.

수백만 장의 은하 이미지가 있지만, 최근까지는 이를 자동으로 분류하거나 카탈로그화하는 것이 거의 불가능했죠.

하지만 이제는 강력한 AI 도구들이 등장했고, 여러분은 그 첫 세대 중 하나입니다.

따라서 이런 분류 작업을 AI 모델로 자동화할 수 있을 것으로 기대됩니다.

 

참석자 2

너무 유익했어요. 하나 더 여쭤보고 싶은데요.

시뮬레이션 데이터와 실제 관측 데이터는 차이가 꽤 클 것 같은데, 시뮬레이션으로 학습된 모델을 실제 데이터에 적용해도 괜찮을까요?

 

참석자 1

여러분이 특히 은하 병합이나 상호작용에 관심이 있는 걸로 보이는데, 다행히 우리가 가진 고해상도 시뮬레이션은 실제 관측과 매우 유사한 모습을 보여줍니다.

다만 시뮬레이션의 해상도가 중요한 변수입니다. 예를 들어 TNG 시뮬레이션은 우주론적 규모의 시뮬레이션이기 때문에, 개별 은하가 얼마나 잘 분해되어 있는지가 중요하죠.

 

참석자 3

어제 데이터를 확인했는데 병합된 은하 데이터는 아주 적었고, 대부분 병합이 없는 데이터였어요.

실제로 병합은 드문 현상인가요?

 

참석자 1

그렇진 않습니다. 우주의 역사 전체를 보면 병합은 매우 흔한 현상입니다.

약 130억 년 전부터 은하가 존재했기 때문에 병합은 오랜 시간 동안 자주 일어났어요.

관측되는 은하 중 약 50%는 나선 은하고, 50%는 타원 은하입니다.

이 중 타원 은하의 대부분은 과거의 병합으로부터 생성된 것으로 추정되죠.

 

참석자 1

기초적인 계산으로도 병합이 얼마나 자주 일어나는지 알 수 있어요.

예를 들어 은하 집단(Cluster)에서 평균 속도를 기반으로 mean free path(평균 자유 경로)를 계산하면, 은하 간 충돌 주기는 대략 10~30억 년입니다.

이는 우주의 수명보다 짧기 때문에, 평균적으로 은하 병합은 자주 일어납니다.

 

참석자 1

물론 우리 은하(은하수)는 클러스터에 속해 있지 않고, 안드로메다 및 몇몇 왜소은하와 함께 국부 은하군에 속해 있어요.

그래서 대규모 병합은 없었지만, 왜소은하를 흡수한 흔적은 있습니다.

미래에는 안드로메다와 병합할 예정이죠.

 

참석자 4

은하 병합 이력을 식별하는 것이 어떤 장점이 있고, 그 연구가 어떤 방식으로 응용될 수 있는지 궁금합니다.

 

참석자 1

좋은 질문입니다.

은하 진화(Galaxy Evolution)는 천문학의 핵심 연구 주제 중 하나입니다.

은하는 시간이 흐름에 따라 병합하고 성장합니다.

10~8억 년 전에는 대부분 나선 은하였고, 타원 은하는 드물었습니다.

하지만 현재는 거의 반반이죠.

 

참석자 1

그리고 제가 주로 연구하는 분야이기도 한데요,

모든 은하 중심에는 초대질량 블랙홀이 존재하고, 이 블랙홀이 활발히 물질을 흡수하면 활동성 은하(AGN)가 됩니다.

이때 방출되는 에너지는 은하 내부 물질의 이동, 별 생성 억제 등 다양한 변화를 유발합니다.

 

참석자 4

교수님께서 AGN이나 블랙홀 관련 연구를 하신다고 들었는데, 혹시 멀티모달 AI로 확장 가능한 관련 연구 주제를 제안해주실 수 있을까요?

 

참석자 1

그 역시 매우 흥미로운 주제예요.

예를 들어, 수많은 은하 중에서 어떤 은하가 활동성 은하인지 식별하는 건 쉬운 일이 아닙니다.

이미지만 봐서는 알기 어려우니까요.

그래서 스펙트럼이나 색상 정보를 활용하게 됩니다.

멀리 있는 은하의 경우 스펙트럼 확보가 어렵기 때문에, 다중 색상 필터를 활용한 분석이 현실적이죠.

 

참석자 1

색상 정보는 은하의 나이, 별의 온도, 활동성 블랙홀의 존재 여부 등에 대한 중요한 단서를 줍니다.

예전에 제가 대만 연구팀과 함께 색상 정보를 이용해 AGN을 자동 분류하는 프로젝트에 참여한 적도 있어요.

그 논문을 나중에 찾아서 보내드릴게요.

 

 

참석자 1

사실 이 질문에 대한 답이 될 수도 있을 것 같아요. 다시 말하지만, 수백만 개의 은하 이미지 중에서 활동성 은하(Active Galaxy) 를 식별하는 것은 자동 분류 분야에서 큰 과제 중 하나입니다.

 

참석자 2

감사합니다.

 

참석자 4

저희가 원래 설정했던 주제는 멀티모달 데이터에서 누락된 modality를 생성하거나 복원하는 것이었습니다.

하지만 천문학에서는 데이터를 생성하는 데 있어 조심해야 한다는 점을 알게 되었고, 그래서 현재는 주제를 재고하고 있는 중입니다.

그래서 궁금한 점은, 불완전한 관측 데이터셋의 결측을 채우는 것이 이 분야에서 생성 모델의 유망한 활용 예가 될 수 있을지입니다.

 

참석자 1

그건 꽤 위험한 질문이에요.

왜냐하면 천문학은 실험이 아니라 관측 기반의 학문이기 때문이죠.

예를 들어 어떤 은하 이미지가 이상하게 보인다면, 그것이 관측 장비의 문제일 수도 있고, 실제로 물리적으로 특이한 현상이 있는 것일 수도 있습니다.

 

그래서 지금 이야기하고 있는 결측 보완은, 결국 일종의 보간(interpolation) 또는 **외삽(extrapolation)**이 되는데, 이건 매우 조심해야 해요.

왜냐하면, 순환 논리(circular reasoning)에 빠질 수 있기 때문이죠.

데이터 일부가 빠진 상태에서 그 결측값을 생성 모델로 채운 뒤, 그 결과를 근거로 결론을 내리면, 생성된 데이터를 기반으로 결론을 내리는 꼴이 되니까요.

 

참석자 1

그래서 주의가 필요합니다.

실제로 이와 관련된 연구는 많이 진행되고 있지만, 대부분은 데이터 분석이 아니라, 데이터 보정(calibration) 쪽에 집중되어 있어요.

 

예를 들어, 이미지에 이상한 흰 점이 보이면, 다른 이미지와 비교해서 같은 위치에 반복적으로 나타나는지 확인합니다.

그럴 경우, 이는 은하의 특성이 아니라 CCD 센서의 결함일 가능성이 높아요.

 

또는, 은하 이미지에 수직선이 보인다면, 관측 당시 위성이 지나갔거나, 유성이나 우주선(cosmic ray)이 카메라 칩을 때렸을 수도 있어요.

그래서 우리는 같은 대상을 여러 번 관측해서 실제 존재하는 은하의 특징만을 확인하려고 합니다.

 

참석자 1

하지만 이미지 보정(calibration)이나 에러 제거(error correction)의 경우라면, 생성 모델은 매우 유용하게 쓰일 수 있습니다.

왜냐하면 지금 우리는 너무 많은 데이터를 수집하고 있기 때문이죠.

하늘 전체를 매일 밤 관측하는 대규모 서베이 프로젝트가 있고, 날씨만 괜찮다면 테라바이트급 이미지가 매일 쏟아집니다.

각 이미지에는 수백만 개의 픽셀이 있고, 수천 장의 이미지가 생성되는데, 이걸 사람이 전부 확인할 수는 없습니다.

 

그래서 결국엔 자동 분류나 자동 보정 시스템이 필요하게 되고,

에러 수정이나 검증(verification) – 예를 들어 “이 이미지가 진짜인가? 센서 오류인가? 위성이 지나갔던 건가?” 등을 판단하는 것이

이 분야에서 생성 모델이 가장 효과적으로 쓰일 수 있는 분야라고 생각해요.

 

참석자 1

따라서, 과학적 분석 자체보다는 보정, 보완, 검증을 위한 응용에 더 적합할 수 있습니다.

 

참석자 1

혹시 이후에 추가 질문이 생기면 언제든지 연락 주세요.

제가 드릴 수 있는 조언은 계속 드릴게요.

 

그런데 혹시 이미 다른 천문학자 분들에게도 연락을 하셨나요?

 

참석자 1

어떤 분인지 여쭤봐도 될까요?

사실 한국에 천문학자 수가 그렇게 많지는 않기 때문에, 아마 다 알고 있을 거예요.

 

참석자 2

네, 저희는 세종대학교의 지웅배 교수님과 연락했고,

아마 그분과 함께 Space AI 프로젝트에도 참여하게 될 것 같아요.

 

참석자 5

맞아요.

 

참석자 1

좋습니다.

그렇다면 제가 제안할 수 있는 건 다음과 같아요.

몇 분 후에 제가 아까 말씀드린 대만 연구팀과의 프로젝트 논문을 찾아서 보내드릴게요.

데이터베이스에서 찾기만 하면 됩니다.

 

그리고 제 지인 중 Solair 소속 두 분의 연락처도 드릴게요.

 

참석자 1

이분들은 대규모 데이터베이스 분석, 즉 빅데이터 분석을 중심으로 연구를 하고 있고, 머신러닝 기법에도 관심이 많습니다.

정확히 현재 어떤 주제를 하고 있는지는 제가 모르지만, 아마 여러분의 주제와 유사한 방향의 프로젝트도 하고 있을 가능성이 높아요.

 

그래서 이분들과도 한번 비슷한 논의를 해보시는 걸 추천드립니다.

더 구체적인 기술적 조언이나 아이디어를 얻을 수 있을 거예요.

 

참석자 1

그래서 제 제안은 이렇습니다.

먼저, 제가 아까 언급했던 프로젝트 논문을 곧 찾아서 보내드릴게요. 데이터베이스 어딘가에 있을 텐데 조금만 시간이 걸릴 것 같습니다.

 

그리고 아까 말씀드렸듯이, Solair에 있는 제 동료 두 명의 연락처도 함께 보내드리겠습니다.

이분들은 대규모 데이터셋 분석, 특히 천문학 데이터의 머신러닝 기반 처리에 관심이 많습니다.

 

참석자 1

이 분야에서 “빅데이터(Big Data)“라는 말이 요즘 유행처럼 쓰이고 있죠.

이 동료들은 실제로 대규모 천문 데이터셋을 머신러닝 기법으로 분석하는 작업을 하고 있고,

제가 정확히 지금 그들이 어떤 주제를 연구 중인지는 모르지만, 여러분의 주제와 유사한 프로젝트에 참여하고 있을 가능성이 높습니다.

 

그래서 제 제안은, 이 두 분과 직접 연락해서 지금 저와 나눈 논의를 다시 한번 이어가 보는 것입니다.

그분들은 훨씬 더 기술적인 수준의 조언이나, 실제 연구 주제에 관련된 정보, 모델 설계에 관한 구체적인 피드백 등을 줄 수 있을 거예요.

 

 

(그 후에 감사합니다! 좋은 하루 보내세요! 하고 끗) 녹화 잘림


A study on galaxy classification using neural networks:
In addition, this is a (somewhat random) list of AI / ML / NN applications to astronomical data:
https://tinyurl.com/yc8xsrke

🔭 면담 정리

 

1. 프로젝트 방향에 대한 이해 및 긍정적 평가

 은하 병합 이력 분류는 천문학 내에서도 전통적이고 중요한 문제.

 Galaxy Zoo 같은 대규모 이미지 기반 분류 프로젝트 사례는 매우 유의미한 출발점.

 멀티모달 AI를 활용한 자동 분류 시스템은 현재 천문학에서 실제로 필요한 기술.

 여러분은 강력한 AI 도구를 사용할 수 있는 첫 세대이며, 이 분야의 개척자 역할을 할 수 있음.  므에에ㅔ

 

2. 시뮬레이션 데이터 vs 실제 관측 데이터

 TNG 시뮬레이션은 해상도 측면에서 실제 은하 구조와 유사함.

 다만 우주론적 시뮬레이션은 스케일이 크기 때문에 개별 은하의 병합 여부 판별에는 해상도 한계 존재.

 병합 현상 자체는 우주 역사에서 매우 빈번하게 발생한 자연적 현상이며, 시뮬레이션에선 표본 수가 적어보일 수 있음.

 

3. 생성 모델로 결측값 보완 시 주의점

 천문학은 실험이 불가능하고 관측만 가능한 학문이므로, 데이터 생성을 통한 해석에는 항상 주의가 필요함.

 보간/외삽으로 생성된 데이터에 의존해 결론을 내리면, 순환 논리(circular reasoning)에 빠질 수 있음.

 따라서 과학적 분석보다는 보정(calibration), 검증(verification), 에러 탐지에 생성 모델을 사용하는 것이 더 적절.

 

4. 활동성 은하(AGN) 분류에서 멀티모달 AI 활용 가능성

 은하 색상 정보(RGB, IR, UV 등)는 AGN 존재 여부 및 별 형성 속도, 은하의 구성 등을 추정하는 데 중요한 피처가 됨.

 과거에는 대만 연구진과 함께 색상 기반 AGN 분류 프로젝트를 수행한 경험 있음. 해당 논문 공유 예정.

 해당 주제에 멀티모달 AI가 효과적으로 적용 가능하며, 향후 연구 주제로 확장 가능성 있음.

 


💡 교수님의 제안 및 후속 조치

 Solair 소속 연구자 2분과의 연결 제안: 머신러닝 기반 대규모 천문 데이터 분석을 진행 중이며, 구체적인 기술 조언 가능.

 Galaxy Zoo 관련 자료 및 AGN 분류 논문 링크!

 향후 궁금한 점이 있다면 언제든지 이메일을 통해 추가 질문 가능!

 


ㅠㅠ아무것도 모르는 우리를 도와주시고

체고다

조앙!