🦜카부캠 앵무말(Parrotalk) : 파인튜닝 모델 성능 측정

언니오빠들도 다 안 간다고 하고

ㅠ 가지말까

자

- 파인튜닝된 모델에 정제한 validation data를 보내서 답변을 얻은 후

- data 안에서 context랑 question, 답변을 answer으로 준비한 프롬프트에 넣어서 gpt 4.o에 쏘고

- 평가용 json을 context, question, answer, evaluation_score(llm 성능 측정 숫자)으로 구성해서 반환

의 계획!

바텀 업 디바이드앤컨커 간다

222

평가 json 반환기랑 LLM 평가 점수 반환기는 재활용

튜닝 모델 답변 반환기

from transformers import AutoTokenizer, AutoModelForQuestionAnswering
import torch
from transformers import AutoTokenizer

# 베이스 모델에서 토크나이저 로드
fine_tuned_tokenizer = AutoTokenizer.from_pretrained("microsoft/deberta-v3-base")

fine_tuned_model_path = "results/checkpoint-12771" 

# 모델 로드
fine_tuned_model = AutoModelForQuestionAnswering.from_pretrained(fine_tuned_model_path)

def get_fineTuning_model_answer(context, question):
    
    # 입력 데이터 토큰화
    inputs = fine_tuned_tokenizer(question, context, return_tensors="pt")
    
    # 대답받기
    outputs = fine_tuned_model(**inputs)
    answer_start_index = torch.argmax(outputs.start_logits)
    answer_end_index = torch.argmax(outputs.end_logits) + 1
    
    # 답변 토큰 문자열로 변환
    answer = fine_tuned_tokenizer.convert_tokens_to_string(
        fine_tuned_tokenizer.convert_ids_to_tokens(inputs["input_ids"][0][answer_start_index:answer_end_index])
    )
    
    return answer

잠깐...

토크나이저가 없는데

그냥 베이스 모델 거 쓰기

잠깐!!!!

개망했다

어디서부터잘못된걸까

애기야....

해 달라는 거 다 해 줬잖아

취향인 토크나이저 맞춰주고 고급gpu도 태워줬잖아!!!

어떡하냐

어쩔수없지

차차 고쳐보는것으로하고

시간이 임박했으니

꼼수 gpt로 일단 돌려보기!

끼얏호

https://platform.openai.com/docs/models/continuous-model-upgrades

음..

와라 터보 녀석

from langchain_openai import ChatOpenAI
from langchain_core.output_parsers import StrOutputParser
import LLMEvaluationPrompt
import os,sys

sys.path.append(os.path.abspath(os.path.join(os.path.dirname(__file__), "../../")))

import secret

AI_model = ChatOpenAI(
    model="gpt-3.5-turbo",
    temperature=1, 
    max_tokens = 1024,
    openai_api_key = secret.openai_api_key
)


def get_gpt_model_answer(context, question):
    
    formatted_messages = "'"+ context+"' 의 상황에서 '" + question + "' 뒤에 올 말을 한 줄로 말하세요."
    response = AI_model.invoke(formatted_messages)
        
    parser = StrOutputParser()
    gpt_model_answer = parser.parse(response)
    
    return gpt_model_answer.content

일단 아름다운극적그래프 이걸로 통계를 내본 후에

저 파인깅이랑 면담을..

요금 확인의 시간

아이거해보까?

념년ㅁ훔

아빠가준걸루?

저작자표시

'Club|Project > 카카오테크 부트캠프 | AI' 카테고리의 다른 글

🦜카부캠 앵무말(Parrotalk) : 선후행 투두 기능 개발 (2)	2024.12.05
🦜카부캠 앵무말(Parrotalk) : 성능 통계 (2)	2024.12.03
🦜카부캠 앵무말(Parrotalk) : 베이스 모델 성능 측정 (2)	2024.12.02
🦜카부캠 앵무말(Parrotalk) : 검증 데이터 정제 (1)	2024.12.01
🦜카부캠 앵무말(Parrotalk) : 화면 피그마 (2)	2024.11.28

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

은체공부

🦜카부캠 앵무말(Parrotalk) : 파인튜닝 모델 성능 측정

튜닝 모델 답변 반환기

요금 확인의 시간

'Club|Project > 카카오테크 부트캠프 | AI' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

🦜카부캠 앵무말(Parrotalk) : 파인튜닝 모델 성능 측정

튜닝 모델 답변 반환기

요금 확인의 시간

'Club|Project > 카카오테크 부트캠프 | AI' 카테고리의 다른 글

관련글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역