Parameter Golf

🏷️ 벤치마크 머신러닝

OpenAI에서 공개한 오픈소스 ML 엔지니어링 벤치마크. 에이전트가 학습 코드를 직접 수정하고, 훈련을 실행하고, 로그를 확인하며 다음 실험을 자율적으로 결정하는 과정을 테스트한다.

특징

Andrej Karpathyautoresearch 프로젝트와 유사한 구조로, 자가 수정 루프 성능을 측정하는 데 활용된다.