AI & 딥러닝

LLM 용어 정리 - 온도(Temperature)

teon98 2025. 2. 26. 16:05
728x90

1️⃣ 언어 모델(Language Modelling)에서 다음 토큰의 확률 예측

  • 언어 모델링(Language Modelling)에서 다음 토큰의 예측은 단어 집합(Vocabulary)에 존재하는 단어들에 대한 Softmax Regression 값이 된다.
    • Softmax Regression: 언어 모델이 단어 집합(Vocabulary)에서 다음 단어를 선택할 때 확률을 계산하는 방식, 모델이 각 단어에 대한 점수를 계산한 후, Softmax를 적용해 확률이 가장 높은 단어를 예측함.
  • 이를 수식으로 나타내면 아래와 같다.

  • 온도(Temperature)는 Softmax Regression의 각 다음 토큰이 샘플링시에 뽑힐 확률을 뾰족하게 만들어 주거나 평평하게 만들어준다.
    1. 온도(Temperature) 값이 작을 경우 → 가장 확률값이 높은 토큰의 예측 확률이 증폭된다. → 가장 그럴듯한 토큰이 뽑힐 확률이 높아진다.
    2. 온도(Temperature) 값이 클 경우 → 모든 토큰의 확률값이 평평해진다. → 더욱 다양성 있는 텍스트가 생성될 확률이 높아진다.

2️⃣ 온도(Temperature) 변화에 따른 다음 토큰 예측 확률의 변화

[링크] What is Temperature in NLP?

temperature: 50.2
temperature 0.1
temperature 100.0

728x90