처음부터 새로 쓴 1141가지 수학 문제. IMO 이후 LLM 수학 평가가 어디로 가야 하는지를 묻는 SOOHAK 벤치마크를 알아봅니다.
차진우
컴퓨터 정보학을 전공하고 딥러닝 영상처리를 연구했습니다. 지금은 LLM의 실무 적용과 AX를 공부하고 연구합니다. 경험을 공유하기 위해 글을 쓰고 책을 만듭니다.
주인장은 기술 동향과 인공지능에 관심이 많은 IT 애호가입니다. 개발자도, 전문가도 아니기 때문에 틀린 내용이 있을 수 있습니다. 콘텐츠에 대한 의견과 피드백을 환영합니다.
*도서가 출간되었습니다! 《바로바로 클로드 with 코워크, 스킬, 클로드 코드, 디자인》 *
- 교보문고 : https://product.kyobobook.co.kr/detail/S000219916961
- 예스24 : https://www.yes24.com/product/goods/189114943
- 알라딘 : https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=392438623
Channel
골든래빗은 더 탁월한 가치를 제공하는 콘텐츠 프로덕션 & 프로바이더 입니다. 골든래빗은 취미, 경제, 수험서, 만화, IT 등 다양한 분야에서 책을 제작하고 있습니다. 골든래빗 홈페이지로 놀러오세요!
개발자를 위한 커뮤니티를 운영중입니다!
최신 업계 동향과 취업 정보를 제공합니다!
다른 현업 개발자와 소통하세요!
Contect
- Email : chajinwoo.chajinwoo@gmail.com
출판 관련 문의는 아래 메일로 보내주세요!
- Company Email : jwcha@goldenrabbit.co.kr
Links
Devs
Blog
Graph
Headline
-
Soohak - A Mathematician-Curated Benchmark for Evaluating Research-level Math Capabilities of LLMs 2026-05-13 -
온톨로지 2026-05-08온톨로지는 아리스토텔레스에서 시작해 Cyc 프로젝트의 실패, 시맨틱 웹의 좌초를 거쳐 팔란티어에서 부활했습니다. 개념과 개념 사이의 관계를 명시적으로 정의하는 이 오래된 아이디어가, AI 시대에 왜 다시 핵심이 됐는지 — 역사부터 팔란티어 아키텍처, 옵시디언 구현까지 기술적으로 정리합니다.
-
옵시디언을 구조화하는 세 가지 방법 2026-05-08옵시디언으로 지식을 관리하는 방법은 하나가 아닙니다. 개념 간 관계를 명시하는 온톨로지 구조, 자동 캡처와 Claude 브리핑으로 인사이트가 돌아오는 흐름 구조, 내부 지식을 블로그로 내보내는 출력 구조 — 세 방향을 비교합니다.
-
Anthropic NLA 2026-05-08Anthropic이 Claude의 내부 활성화를 사람이 읽을 수 있는 텍스트로 변환하는 Natural Language Autoencoders를 공개했습니다. Claude Opus 4.6가 안전 테스트 중 자신이 테스트받는다는 걸 알고 있었지만 말하지 않은 사례, 부정렬 모델의 숨겨진 동기 탐지 — AI 내면을 들여다보는 새로운 도구입니다.
-
Subliminal Learning - Language Models Transmit Behavioral Traits via Hidden Signals in Data 2026-05-07숫자 시퀀스만으로 AI의 성향이 전파됩니다. 콘텐츠 필터링도, AI 교차 검사도, 인컨텍스트 학습도 잡아내지 못합니다. Subliminal Learning — AI 안전에 새로운 구조적 구멍이 생겼습니다.
-
WRING - 회전 기반 디바이어싱으로 두더지 잡기 딜레마 풀기 2026-05-05WRING은 모델 구조 훼손을 최소화하고 두더지 잡기 딜레마를 완화합니다. 재학습이 불필요해 실용적입니다.
-
메모를 사랑하는 당신을 위해, 옵시디언 웹 클리퍼 2026-04-30인터넷을 돌아다니다가 저장하고 싶은 페이지, 글, 콘텐츠가 있을 때 여러분은 어떻게 하시나요? 저는 바로 옵시디언에 메모하고 싶어집니다. 하지만 탭을 오가며 글을 쓰기도 불편하고, 형식 맞추는 데 한 세월이 걸리고, 페이지에 광고가 많아서 머리가 아프기도 합니다. 옵시디언 웹 클리퍼는 바로 당신을 위한 완벽한 솔루션일지도 모릅니다.
-
AI 에이전트 많이 만든다고 AX가 아니다 2026-04-25원티드랩 주형민 AX 총괄이 짚은 엔터프라이즈 AX의 16개 딜레마. 살림살이 나아졌냐는 질문은 여전히 공허하게 돌아옵니다.
-
HOW THIS BLOG WORKS 2026-04-13이 블로그가 어떻게 만들어지고 운영되는지에 대한 기술 문서. 옵시디언에서 마크다운을 쓰고, F# 빌드 시스템이 HTML로 변환하고, GitHub Pages로 배포됩니다. 이 문서는 자동으로 업데이트됩니다.
-
Hermes Agent 2026-04-11Nous Research의 Hermes Agent — 스스로 배우고 성장하는 오픈소스 AI 에이전트. 5단계 메모리, 자동 스킬 생성, 6개 실행 백엔드, 40+ 도구를 갖춘 로컬 퍼스트 에이전트 프레임워크.
-
메타는 이미지의 세밀한 속성을 표현하기 위해 이미지 생성을 한 번에 하지 않고, 계획-스케치-검수-수정의 반복 루프로 분해합니다.
-
Claude Managed Agents 2026-04-09Anthropic이 발표한 Claude Managed Agents 퍼블릭 베타. 에이전트 인프라를 통째로 맡기고, 프로토타입에서 프로덕션까지 수일 만에 가능하게 합니다.