AI model

LLM ทำนายคำถัดไปตามการกระจายความน่าจะเป็น ให้ 𝑃 ( 𝑤 1 , 𝑤 2 , … , 𝑤 𝑁 ) P(w 1 ,w 2 ,…,w N ) เป็นความน่าจะเป็นของลำดับคำ ความสับสนถูกกำหนดเป็น: 𝑃 𝑃 ( 𝑊 ) = 𝑃 ( 𝑤 1 , 𝑤 2 , … , 𝑤 𝑁 ) − 1 𝑁 PP(W)=P(w 1 ,w 2 ,…,w N ) − N 1 หรือใช้กฎลูกโซ่ของความน่าจะเป็น: 𝑃 𝑃 ( 𝑊 ) = ∏ 𝑖 = 1 𝑁 1 𝑃 ( 𝑤 𝑖 ∣ 𝑤 1 , … , 𝑤 𝑖 − 1 ) 𝑁 PP(W)= N ∏ i=1 N P(w i ∣w 1 ,…,w i−1 ) 1 เครื่องมือตรวจจับมองหาความสับสนต่ำ (ความน่าจะเป็นสูง) คำสั่งพรอมต์ "อย่าเลือกโทเค็นถัดไปที่มีความน่าจะเป็นทางสถิติสูงสุด" บังคับให้โมเดลเลือกโทเค็นจากตำแหน่งที่ต่ำกว่าในการกระจายความน่าจะเป็น (เช่น คำที่มีความเป็นไปได้สูงเป็นอันดับ 3 หรือ 4 แทนที่จะเป็นอันดับ 1) ทำให้ค่า 𝑃 𝑃 PP สูงขึ้นเทียมเพื่อให้ตรงกับระดับของมนุษย์