LAB NOTICE

more
[LinkedIn] 마이크로소프트의 충격적 논문 - 자기진화 AI 에이전트
https://www.linkedin.com/posts/suk-hyun-k-31ba9b369_ai%EC%97%90%EC%9D%B4%EC%A0%84%ED%8A%B8-%EB%A7%88%EC%9D%B4%ED%81%AC%EB%A1%9C%EC%86%8C%ED%94%84%ED%8A%B8-%EC%9E%90%EA%B8%B0%EC%A7%84%ED%99%94ai-ugcPost-7465186655478374401-jt4I  -Accelerating scientific discovery with Co-Scientist (Nature, 2026)-A multi-agent system for automating scientific discovery (Nature, 2026) ---------------------------------------------------------------------마이크로소프트의 충격적 논문 - 자기진화 AI 에이전트 AI 업계에는 오래된 환상이 하나 있었다. 더 강력한 모델만 만들면 에이전트도 자연스럽게 똑똑해질 것이라는 믿음이다. 그래서 사람들은 GPU를 더 쌓고, 파라미터를 더 키우고, 프롬프트를 더 길게 늘어뜨렸다. 그러나 정작 현실의 에이전트는 여전히 불안정했다. 같은 문제를 두 번 시키면 다른 결과를 내놓고, 환경이 조금만 바뀌어도 무너졌으며, 인간이 밤새 손으로 다듬은 ‘스킬 문서’는 몇 번의 업데이트만 지나면 낡은 유물처럼 변해버렸다. 마이크로소프트의 SkillOpt 논문이 흥미로운 이유는 바로 이 문제점을 정면으로 마주했기 때문이다. 이 논문은 “모델 자체를 계속 바꾸려 하지 말고, 에이전트의 스킬 자체를 학습 가능한 상태로 다뤄라”는 급진적인 전환을 제안한다. 다시 말해 AI의 미래는 단순히 거대한 두뇌를 만드는 것이 아니라, 그 두뇌 위에서 작동하는 ‘행동 운영체제’를 어떻게 진화시키느냐에 달려 있다는 것이다. SkillOpt의 작동 방식은 놀라울 정도로 단순하다. 에이전트도 모델도 그대로 둔다. 대신 스킬 문서를 훈련한다. 지금까지 대부분의 AI 엔지니어들은 일종의 장인처럼 행동했다. 직접 프롬프트를 쓰고, 시행착오를 반복하며, 경험적으로 “이 문장이 잘 먹힌다”는 감각을 축적했다. 그러나 SkillOpt는 그것을 인간의 감각 영역에서 떼어내 최적화 문제로 바꿔버린다. 에이전트가 작업을 수행하면, 별도의 옵티마이저 모델이 그 실행 궤적을 분석한다. 무엇이 성공했고 무엇이 실패했는지 평가한 뒤 스킬 문서에 문장을 추가하거나 삭제하거나 교체한다. 하지만 중요한 것은 여기서 끝이 아니라는 점이다. 수정된 스킬은 반드시 검증 게이트를 통과해야 한다. 성능이 실제로 개선된 경우에만 업데이트가 승인된다. 마치 딥러닝에서 gradient descent가 무작정 움직이지 않고 validation loss를 보며 조심스럽게 이동하듯, SkillOpt는 텍스트 공간에서 에이전트의 행동을 천천히 진화시킨다. 이 개념이 무서운 이유는, 그것이 AI 에이전트를 “프로그램”이 아니라 “학습하는 조직”처럼 만들기 시작하기 때문이다. 기존 소프트웨어는 코드가 바뀌어야 진화한다. 그러나 SkillOpt에서는 모델 자체가 변하지 않아도 외부의 스킬 문서만으로 행동 체계가 계속 개선된다. 인간 기업으로 치면 직원은 그대로인데 운영 매뉴얼과 의사결정 프로세스가 스스로 진화하는 셈이다. 그리고 이 방식은 엄청난 경제적 의미를 가진다. 거대 모델 재학습은 천문학적 비용이 든다. 하지만 SkillOpt는 추가 추론 비용 없이 성능을 개선한다. 본 논문에 따르면 GPT-5.5 기반 환경에서 direct chat 기준 +23.5 포인트, Codex 환경에서는 +24.8, Claude Code에서는 +19.1의 성능 향상을 기록했다. 더 흥미로운 것은 이 스킬들이 특정 모델에만 묶이지 않는다는 점이다. 학습된 스킬 문서는 다른 모델과 다른 실행 환경으로도 전이된다. 즉 미래의 경쟁력은 단순한 모델 파라미터가 아니라, 축적된 ‘행동 데이터베이스’와 ‘운영 스킬 자산’이 될 가능성이 높다. 이 흐름은 AI 산업 전체의 새 방향성을 암시한다. 지금까지 AI 경쟁은 누가 더 거대한 모델을 갖고 있는가의 싸움이었다. 그러나 앞으로는 누가 더 뛰어난 “에이전트 문화”를 축적하는가의 싸움으로 변할 가능성이 높다. 단순히 똑똑한 모델이 아니라, 실패를 기억하고, 검증을 거쳐 행동 규칙을 개선하며, 장기적으로 안정적인 전략을 유지하는 시스템 말이다. 인간 조직이 수백 년 동안 축적해온 경영학과 관료제의 원리가 이제 AI에게도 적용되기 시작한 셈이다. 결국 SkillOpt가 우리에게 진정으로 보여주는 것은 기술적 트릭이 아니다. 그것은 AI 에이전트가 앞으로 걸어가야 할 길 그 자체다. 미래의 에이전트는 더 이상 고정된 도구일 수 없을 것이다. 그들은 경험을 통해 자신의 행동 프로토콜을 수정하고, 실패한 전략을 폐기하며, 검증된 규칙만 살아남게 하는 일종의 디지털 시스템으로 변모해 나갈 것이다. 그리고 그 순간부터 AI 경쟁은 “누가 더 큰 모델을 만들었는가”가 아니라, “누가 더 잘 진화하는 에이전트를 만들었는가”의 문제가 된다.​ 
2026-06-01
[Book] Building LLM and AI Agent-Based Applications for the Process Industry
Building LLM and AI Agent-Based Applications for the Process Industryhttps://leanpub.com/llm-agent-apps-for-process-industry ​
2026-05-25

PUBLICATIONS

more
PROFESSORmore
경희대 환경관리시스템공학 연구실
교수님을 소개합니다.

icon

RESERACHmore
경희대 환경관리시스템공학 연구실
연구내용을 소개합니다.

icon

LECTUREmore
경희대 환경관리시스템공학 연구실
강의을 소개합니다.

icon

MEMBERSmore
경희대 환경관리시스템공학 연구실
구성원을 소개합니다.

icon