공동 AI 학습 환경에서는 데이터 주권을 유지할 수 있으나, 참여 기업 탈퇴 시 데이터 제거가 어려운 한계가 존재함
- 여러 기업이 데이터를 공동으로 활용해 AI 모델을 학습할 경우 데이터 다양성이 증가하여 결과의 품질과 신뢰성이 향상됨
- 기업들은 데이터 주권을 유지하기 위해 중앙 서버가 아닌 분산된 환경에서 학습하는 연합학습을 활용. 이 방식에서는 각 기업이 로컬 모델에 데이터를 입력하고, 실제 데이터 대신 추상화된 파라미터만 공유함으로써 데이터 유출을 방지
- 그러나 협력 프로젝트에서 특정 기업이 탈퇴할 경우, 해당 기업의 데이터와 파라미터가 여전히 모델에 남아 있는 문제가 발생
- 기존에는 이러한 데이터를 AI 모델에서 제거하는 것이 거의 불가능했으며, 제거 시 모델 성능 저하 문제가 발생하는 한계가 존재
프라운호퍼 소프트웨어·시스템공학 연구소(ISST)와 후지쯔 연구소(Fujitsu Research)는 협력을 통해 분산 AI 환경에서 특정 데이터만 제거하는 ‘federated unlearning’ 방법을 개발
- 해당 기술은 AI 학습 과정을 단계별로 추적하여 특정 기업의 데이터가 반영되기 이전 시점으로 되돌린 후, 해당 데이터를 제외하고 학습을 재개하는 방식으로, 협력에서 탈퇴한 기업의 데이터와 정보가 모델에서 완전히 제거되도록 함
- 저장된 파라미터를 활용하여 재학습을 수행하기 때문에 초기부터 다시 학습하는 것보다 효율적으로 모델을 복원 가능
- 일부 데이터 제거에 따라 일정 수준의 성능 저하는 발생할 수 있으나, 이후 추가 학습을 통해 점진적으로 보완 가능
- 해당 기술은 제조업에서 여러 기업이 제공한 다양한 고장 데이터를 기반으로 기계의 과열 위험이나 부품 한계 도달 시점을 사전에 예측하는 데 활용 가능
- 기존 방식은 참여 기업 탈퇴 시 모델을 완전히 재학습해야 해 성능 저하가 발생했으나, federated unlearning 방식은 이를 최소화하며 빠르게 성능을 회복할 수 있음
새로운 기술은 데이터 보호를 보장하면서 기업 간 협력을 확대함으로써 산업 전반에서 AI 활용을 촉진
- 해당 기술은 기업이 데이터 유출 우려 없이 협력 프로젝트에 참여할 수 있도록 지원하는 동시에, 필요시 데이터 흔적을 남기지 않고 프로젝트에서 탈퇴할 수 있는 환경을 제공하여 GDPR 등 규제 준수 요구가 있는 기업에도 적용 가능
- 연구진은 해당 기술이 기업 간 협력 네트워크에서 AI 활용을 확대하고, 산업 전반의 기술 경쟁력 및 데이터 주권 확보에 기여할 것으로 전망
- 관련 기술은 2026년 4월 개최되는 Hannover Messe 에서 시연될 예정
