본문 바로가기
  • 컴공생의 공부 일기
  • 공부보단 일기에 가까운 것 같은
  • 블로그

🤖 AI90

태 대학 보내기 - 📐 embedding 우리 태 기하 보고서 쓰셔야 한다고소재 여쭈시길래NLP에서 쓰이는 임베딩(텍스트 벡터 변환)을 소개해줬다.비슷한 단어 묶음끼리의 벡터 값 유사성이 궁금하시다고 뽑아 볼 것을 요청하시는 모습이다.📐 임베딩하기임베딩 : 텍스트 데이터를 컴퓨터가 이해할 수 있는 수치형 데이터, 즉 벡터로 변환하는 과정 벡터는 해당 텍스트 유닛의 의미를 수치적으로 표현하며, 이러한 표현을 통해 컴퓨터는 텍스트 간의 유사성을 계산하거나, 텍스트 데이터를 기반으로 다양한 머신러닝 모델을 학습시킬 수 있음 ## 구조  ragMain가 메인 파이썬 코드 files에 동물/음식 텍스트 .cache 안에 각각의 벡터 저장값  secret안에 api는 유출하면 안 돼서 빼놓  ## 목적  임베딩(문서 내의 각 부분에 대한 벡터 표현)들의.. 2024. 6. 15.
🦜 풀스택 GPT - Quiz GPT ing 보호되어 있는 글 입니다. 2024. 5. 28.
✅ Viuron - 5/25 박사님 미팅 보호되어 있는 글 입니다. 2024. 5. 25.
💬 챗지피티 더 잘 쓰기 💬  4o 출시https://openai.com/index/hello-gpt-4o/  ‘o’는 “모든”, “전체의”라는 뜻을 전달하는 접두사인 ‘Omni’의 약자텍스트뿐만 아니라 이미지, 음성 등 ‘모든’ 형태의 입력을 이해하고 처리할 수 있는 능력이 있다는 걸 강조 핸드폰 카메라를 통해서 사람의 표정을 읽을 수 있고, 사람과 대화하는 것과 유사한 속도로 대화를 할 수 있음 GPT-4 Turbo보다 응답 속도 :   2배 빠름컴퓨팅 비용 : 50% 정도 더 저렴지능 : 비슷 1.7 배! 한국어 능력 상승 확실히 streaming이 내 눈으로 쫒아갈 수 없을 정도로 빨라졌다💬  맞춤 설정 넣기NEVER mention that you're an AI. You are rather going to play .. 2024. 5. 25.
🦜 풀스택 GPT - DOCUMENT GPT(Streamlit) 🎀 DOCUMENT GPT문서 내용을 파악하는 gpt 도구 만들어보기!🎀 Streamlit Streamlit • A faster way to build and share data appsStreamlit is an open-source Python framework for machine learning and data science teams. Create interactive data apps in minutes.streamlit.io머신 러닝과 데이터 과학을 위한 아름답고 사용자 정의 가능한 웹 앱을 쉽게 만들고 공유할 수 있게 해주는 오픈 소스 Python 라이브러리 pip install streamlit streamlit run 문서명하면 딴바로 페이지 만들어짐  https://docs.str.. 2024. 5. 21.
🦙LlamaIndex 써보기 LLM 활용을 위한 데이터 프레임워크다~ 랭체인은 써 봤는데박사님이 라마인덱스도 써보라고 하셨다🦙TODO- 박사님 깃허브 코드 보기- 공식문서 보고 기본 세팅해보기- 뭐든 한번 돌려보기🦙박사님 깃허브 코드 보기엥 분명 애플리케이션 레포가 있었던 것 같은데없어진건가?🦙 공식문서 보고 기본 세팅해보기 + 뭐든 한번 돌려보기 LlamaIndex - LlamaIndexWelcome to LlamaIndex 🦙 ! LlamaIndex is a framework for building context-augmented LLM applications. Context augmentation refers to any use case that applies LLMs on top of your private or do.. 2024. 5. 18.
🌷구축형 AI 환경 세팅하기2 🌷 저번에 이상하게 계속 npm/docker/nodejs가 안 깔려서ㅠㅠ 우분투 삭제하고 처음부터 다시 아빠랑 했따🌷우분투 설치 ⭕️ 🌷apt 업데이트 ⭕️🌷gcc 컴파일러 설치 ⭕️🌷kernel headers 설치 ⭕️🌷엔비디아 드라이버 설치 ⭕️🌷CUDA 설치 ⭕️🌷cuDNN 설치 🌷miniConda 설치  ⭕️🌷docker 설치 ⭕️🌷npm 설치 ⭕️🌷node.js 설치 ⭕️🌷크롬 설치 ⭕️  cuDNN 설치가 안 된다!sudo cp cudnn-linux-x86_64-8.9.6.50_cuda12-archive/include/cudnn*.h /usr/local/cuda/include이게 안 되는데 cudnn-linux-x86_64-8.9.6.50_cuda12-archive 디렉터리는.. 2024. 5. 16.
🦠신촌 GPT - GoogleDrive연결.ver 자꾸 경로 문제가 난다=> 절대경로 지정으로 해결🪺 Google Drive API를 사용하기 - 애플리케이션 기본 자격 증명(Application Default Credentials)을 설정하기  와 이게 뭐지??자꾸 오류나서 보니까 langchain_google_community에 document_loaders가 없는데??아니 공식문서에 일케 나와있거든?   How to build a ChatGPT + Google Drive app with LangChain and PythonHow to use ChatGPT with your Google Drive in 30 lines of Python.www.haihai.ai갓갓 haihai님! 보고 성공했습니다! 감사합니다 공식문서보다낫네요  🪺 RAG 시작!.. 2024. 5. 15.
🦙 LlamaIndex - RAG 정리 High-Level Concepts (RAG) - LlamaIndexHigh-Level Concepts (RAG) This is a quick guide to the high-level concepts you'll encounter frequently when building LLM applications. Retrieval Augmented Generation (RAG) LLMs are trained on enormous bodies of data but they aren't trained on your data. Redocs.llamaindex.ai RAG에서는 여러분의 데이터가 로드되어 쿼리를 위해 준비되거나 "인덱싱"됨사용자 쿼리는 인덱스에서 작동하여 데이터를 가장 관련 있는 맥락으로 필터링이 맥.. 2024. 5. 10.
🦜langchain - RAG 정리 Retrieval | 🦜️🔗 LangChainMany LLM applications require user-specific data that is not part of the model's training set.python.langchain.comLLM applications require user-specific data that is not part of the model's training set.=> Retrieval Augmented Generation (RAG)  랭체인에서 RAG를 하기 위한 요소들 🦜Document loaders다양한 출처에서 문서(user-specific data)를 로드- 100개가 넘는 다양한 문서 로더 보유- LangChain은 모든 유형의 문서(HTML, P.. 2024. 5. 10.