指標
HumanEval
OpenAI 提出的程式碼基準測試,164 道手寫 Python 題,用模型生成的 code 能否通過隱藏單元測試評分(pass@k)。
指標
OpenAI 提出的程式碼基準測試,164 道手寫 Python 題,用模型生成的 code 能否通過隱藏單元測試評分(pass@k)。
We use cookies
Anonymous analytics help us improve the site. You can opt out anytime. Learn more