본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

Club|Project454

✳️[ Playing Atari with Deep Reinforcement Learning ] 논문 리뷰 (Mnih et al., 2013, DeepMind) Playing Atari with Deep Reinforcement LearningWe present the first deep learning model to successfully learn control policies directly from high-dimensional sensory input using reinforcement learning. The model is a convolutional neural network, trained with a variant of Q-learning, whose input is rawarxiv.org ✳️ 논문 읽기시간 부족으로 제대로 못 일금..ㅜㅜ✳️ 논문 정리🎮 Abstract딥러닝 기반의 강.. 2025. 3. 30.
📊 뀨업 : 2차 릴리즈 준비 - 밤샘끝내기 (실패) 다들 바빠서 다른 거 하느라 시간 내기/맞추기 힘들어서해커톤식으로 하루 밤새서 2차 릴리즈 끝내기로 결정!📊 TODO다음주 TODO ✅정은체프론트단 쿠키 생성 / 리프레시 로직 다시 만들기랭킹 수식 구현 순위 api 연결 ( 동시성 문제 처리 히언VPC 돈나가는 이유 알아내기랭킹 db 만들기다이너모 db 구축소은랭킹 수식 구현 순위 api 만들기끝내!!!!!📊 refresh : front cookie백엔드 쿠키 사용 잘 안 됨서드파티 쿠키를 쓰는 추세래 프론트에서 생성해야 한다는 말..✅ 목표 흐름1. 사용자가 버튼을 누른다.2. 쿠키에 handle이 없다면 → 사용자에게 입력 받기 → loginApi로 유효성 검증3. 성공하면 handle을 쿠키에 저장4. 다음에 리프레시 버튼을 누르면 쿠키에서 h.. 2025. 3. 29.
🪼 강화 학습-마르코프 결정 과정 : 딥러닝 파이토치 교과서 딥러닝 파이토치 교과서 - 서지영 12장. 강화 학습🪼강화 학습이란머신러닝 / 딥러닝의 한 종류어떤 환경에서 어떤 행동을 했을 때 그것이 잘 된 행동인지 아닌지 판단하고 보상/벌칙을 주는 과정을 반복하여 스스로 학습하게 하는 분야 환경 environment에이전트 agent => 환경과 상호 작용하는 에이전트를 학습시키는 것  상태 state (다양한 상황) 에서 행동 action을 취하며 그에 대한 응답으로 보상 reward를 받으며 학습상태 State : 에이전트가 관찰 가능한 상태의 집합 시간 T에서 에이전트의 상태 s행동 Action: 에이전트가 상태 S에서 가능한 행동시간 T에서 특정 행동 a 🪼마르코프 결정 과정강화 학습의 문제들은 마르코프 결정 과정으로 표현됨마르코프 결정 과정은 모두 마.. 2025. 3. 28.
멀티 모달 기초 [Multimodal Machine Learning: A Survey and Taxonomy] 논문 리딩 보호되어 있는 글 입니다. 2025. 3. 28.
🪼 강화 학습 - MDP를 위한 벨만 방정식 : 딥러닝 파이토치 교과서 보호되어 있는 글 입니다. 2025. 3. 28.
Generative Adversarial Nets : 발표 정리 보호되어 있는 글 입니다. 2025. 3. 25.
🧠 multi-model AI 공부 계획 이형준 굣님과 면담 날짜 잡기 ✅황호성 굣님과 면담 날짜 잡기지웅배 굣님과 면담 날짜 잡기(제안서 제출이 4/11까지라 얼른 한번 봬야 할 듯)경희대 아이돌 문용재 교수님 문답날짜 기초 → 유명 논문 → 응용 연구 논문 흐름✅ 1. 멀티모달의 개념을 잡는 기초 논문 “Multimodal Machine Learning: A Survey and Taxonomy” (Baltrušaitis et al., 2018)📎 링크: https://arxiv.org/abs/1705.09406 - 멀티모달 머신러닝의 정의, 문제 유형 (representation, translation, alignment, fusion, co-learning), 데이터 종류(LiDAR, 텍스트, 이미지 등)까지 전반적으로 다룸- 입문 논문.. 2025. 3. 25.
🛰️ 천문우주과학 팀원 합류 TODO[x] 🚨 윤용민 교수님 답장[x] 🚨 논문 읽기 (지웅배 교수님)[x] 🚨 지웅배 교수님께 받은 논문을 읽고 연락 드리기 ← 오늘!!!!!!!!!!!SPACEai 트랙 지원? 처리~ 3/23[x] 생성형 AI 공부 ( 3/24까지 리뷰 ) - 완전 상세[x] 천문학 연구자 모집[x] 이형준 교수님과 면담 일자 잡기 (4/7 ) ← 3/27전까지 연락 드릴 계획[x] 황호성 교수님 메일 내용 이해 / 제시 주제 이해, 정리~ 3/31[ ] 멀티모달 공부[ ] 천문학 분들과의 미팅[ ] 황호성 교수님께 논문을 읽고 대략적인 의견을 들고 면담 신청 (다음주 이후 천문학 분들이랑 면담 날짜 맞추기4월[ ] 황호성 교수님 면담[ ] 경희대 아이돌 전화 (월화수 15시[ ] 이형준 교수님 면담 (4/.. 2025. 3. 25.
🛡️ UCPC 1차 회의 보호되어 있는 글 입니다. 2025. 3. 25.
🛡️ UCPC 2차 회의 보호되어 있는 글 입니다. 2025. 3. 24.