본문 바로가기

과정감독

챗GPT의 환각문제를 개선하기 위한 OpenAI의 새로운 방법? AI & IT 이야기 2023. 6. 5. 오픈AI가 챗GPT의 환각(Hallucination) 문제를 개선하는 새로운 방법을 공개했다고 합니다(2023.05.31 현지시간). OpenAI에서 사용자의 의도에 맞는 답변을 생성하기 위해 ChatGPT/GPT-4에 도입한 방법은 인간 피드백 기반 강화 학습(RLHF)를 도입하고 있습니다. RLHF는 거대 언어 모델(Large Language Model, LLM)에 입력/질의(Prompt)를 제공하고 여러 출력을 생성하도록 한 다음 인간 평가자에게 생성된 텍스트의 순위를 최고에서 최악까지 우선순위를 매기도록 하는 방법입니다. 그런 다음 LLM 텍스트에서 점수를 예측하도록 보상 모델을 학습하는 것이 기존의 ChatGPT/GPT-4에 도입한 방법입니다. 그리고 이때 보상 모델은 추론에 따른 최종 결과를 ..

이전 1 다음

728x90

티스토리툴바