안녕하세요? 현대자동차 기초소재연구센터에서 재료 개발을 맡고 있는 박상인 연구원입니다. 자동차의 부품은 수만 가지에 달하며, 부품에 사용되는 재료 또한 셀 수 없이 많습니다. 더 좋은 자동차를 만들기 위해서는 재료 분야도 같이 발전해야 하는 이유입니다. 따라서 현대자동차 기초소재연구센터는 부품에 따른 소재의 적용 방안, 소재의 개선 방향 등 여러 분야를 다양한 방법으로 연구하고 있습니다. 이번에는 연구 사례 중 고분자 재료 개발이라는 ‘도메인(Domain, 해결하고자 하는 문제 영역)’에서 인공지능(AI, Artificial Intelligence)을 도구로 활용한 문제해결 과정을 공유하고자 합니다.
현재 인공지능은 다양한 분야에 도입되고 있습니다. 관련 교육 및 콘텐츠가 많아지면서 접근이 쉬워졌기에 특정 분야의 전문성을 갖춘 도메인 엔지니어들 또한 일정 수준의 전문성을 갖고 인공지능 기술을 업무에 도입하고 있습니다. 하지만 현장에서 업무를 수행하는 엔지니어에게 모델을 구성하는 ‘아키텍처(Architecture), 요소 기술(Elementary technology)’의 상세한 원리, 효과, 발전 과정 등의 이론적인 지식은 상대적으로 중요도가 떨어질 수 있습니다. 도메인 엔지니어는 인공지능을 또 하나의 도메인이 아닌, ‘담당하는 도메인을 개선하는 수단’으로 바라보는 경향이 있기 때문입니다.
일반적으로 현업에서 가장 빠르게 인공지능을 개발하는 방식은 해결하고자 하는 문제 영역(도메인)에서 *SOTA(State of the art)를 달성한 ‘사전 학습 모델(Pre-Trained Model)’을 활용해 **전이학습(Transfer Learning)을 하는 것입니다. 이 경우 학계와 현장의 수많은 실험을 통해 학습된 최적의 변수(Parameter)가 이미 도출되어 있습니다. 따라서 앞서 검증된 모델에 미세 조정(Fine-Tuning)을 하는 것이 성능이나 효율성 측면에서 유리한 경우가 많습니다.
*SOTA: 인공지능을 적용할 분야에서 가장 성능이 뛰어난 알고리즘
**전이학습: 기존의 학습 모델을 다른 작업에 이용하는 것
특히 분류, 회귀, 분할 등 특정 영역에 특화된 사전 학습 모델을 사용하면 모델 구현에 필요한 요소 기술에 대한 상세한 이해가 없어도 실전에 적용할 수 있습니다. 비 전문가도 특정 영역의 전문가에 준하는 높은 성능을 구현할 수 있다는 특징 때문에 ‘심층학습(Deep Learning)’ 기술이 인공지능 분야 중 특히 많이 사용되고 있습니다.
기계학습 전문가 앤드류 응(Andrew Ng)의 정의에 따르면 인공지능은 데이터와 모델로 구성되어 있습니다. 구성 요소에 경중은 없지만, 현업에서는 어떤 프로젝트를 시작하기 전에 타당성 확인을 위해 다양한 사전 학습 모델을 베이스라인(Baseline) 모델로 고정하고 현업의 데이터를 활용해 우선적으로 결과를 출력하는 것을 추천합니다. 어떠한 문제는 이미 해결되어 있을 수 있으며, 비교적 적은 노력으로 인공지능을 개발할 수도 있기 때문입니다. 일례로 사내에서 독일의 교통 신호를 분류하는 모델 개발을 하며 직접 겪은 경험을 소개하고자 합니다.
사전 학습된 모델(Resnet-18)의 *특징 추출(Feature Extractor) 층을 활용하여 해당 데이터셋에서 출력되는 2차원 벡터(Vector) 값을 확인했을 때, 학습을 전혀 하지 않았음에도 불구하고 클래스 간의 명확한 선형 분리가 되는 것을 볼 수 있었습니다. 이는 이미 해결된 문제의 사례 중 하나라고 할 수 있습니다.
*특징 추출(Feature Extractor): 데이터 별로 특징을 찾아내고 분류에 활용되는 벡터 값을 만드는 것
또한, 다양한 사전 학습 모델을 활용해 데이터에 대한 전이학습을 진행한 결과를 확인하니 사전 학습 모델의 구조와 요소 기술에 따른 성능 차이가 크지 않다는 점을 확인할 수 있었습니다. 따라서 학습 모델의 고도화보다는 입력 데이터의 질을 높이는 것이 해결 방안이라는 점을 확인할 수 있었습니다.
특히, 2차원 벡터 값에 대한 데이터 분석을 시행한 결과 그래프에 구분된 43개 클래스의 원주를 줄이면 각 클래스 사이의 마진이 넓어질 수 있어 선형 분리가 더 잘 될 것이라고 가정할 수 있었습니다. 원주는 입력 데이터의 분산을 의미하기 때문에 양질의 자료를 입력해 입력 데이터의 분산을 줄여야 한다는 해법을 낼 수 있었습니다.
해당 사례에서 저는 다양한 컴퓨터 비전(시각 데이터 처리) 기술을 활용했습니다. 입력 데이터의 분산을 줄이는 전처리로 성능을 높였고, 추가로 전이학습과 미세조정을 실행해 성능을 개선했습니다. 추가 개선을 위해서는 인공지능 모델을 구성하는 다양한 기술을 이해하고 구현해야 합니다. 하지만 모델 개발은 인공지능 전문가에게 요청하고, 도메인 엔지니어는 자신의 전문성을 활용해 데이터 전/후 처리처럼 입력 데이터의 특성을 잘 표현할 수 있는 방법을 찾는 것이 더욱 효율적일 것입니다.
인공지능을 사용한 개발 과정에서 데이터와 해당 도메인의 기술과 지식 기반으로 문제를 해결하는 것을 ‘도메인 중심의 인공지능 개발’이라 표현하고자 합니다. 인공지능의 모델 구조와 요소 기술에 대한 개발을 하는 ‘모델 중심의 개발’에서는 정해진 데이터와 도메인을 가장 잘 해결할 수 있는 솔루션(모델)을 제안하는 것이 중요할 것입니다. 하지만 벤치마크 데이터가 없는 특수한 문제를 해결하는 경우에는 해당 도메인에서 발생하는 데이터에 대한 고찰을 중심으로, 최적의 사전 학습 모델을 선정하는 것이 더 효과적일 수 있습니다. 원론적으로는 도메인 중심의 개발과 모델 중심의 개발 두 가지 개발 방법을 적절하게 사용해야 최선의 결과를 얻을 수 있지만, 목표 성능과 접근 대상의 순위에 따라 개발 방향을 구분해야 합니다.
지금부터는 제가 담당하는 재료 개발 분야에서 인공지능 모델을 적용한 경험을 공유하겠습니다. 재료 개발 분야에서도 탄소 중립과 같은 친환경성, 지속 가능한 개발 등에 대한 수요가 높아지고 있습니다. 특히 소재 관점에서 탄소 중립을 달성하기 위한 최적의 해결책은 재활용입니다.
재활용 소재로 흔히 손꼽히는 페트병, 플라스틱 등은 고분자 재료에 속합니다. 고분자 재료는 낮은 분자량의 단량체(Monomer)가 반복 연결되어 높은 분자량을 형성한 것입니다. 또한, 개발 사례의 대상 소재인 열가소성 고분자 고유의 성질 중 하나는 열에 대한 가역성(Reversibility)입니다. 가역성은 반응 시 초기 상황으로 돌아오는 것의 여부를 뜻합니다. 열을 가했을 때 녹는 열가소성을 가진 해당 고분자 소재는 충분히 재활용이 가능합니다.
하지만, 고분자 소재는 재활용 과정에서 분자량이 줄어듭니다. 예측 불가능한 분자량 감소는 물성(物性, 물건의 고유 성질)을 바꿉니다. 따라서 품질 문제를 우려해 당사에서는 해당 소재에 대한 재활용을 허용하지 않았습니다. 하지만 고분자 소재의 물성은 여러 단량체의 반복으로 인해 발현되는 것이기에, 일정 수준의 단량체나 *분자쇄(Molecule Chain)가 절단되더라도 바로 파손되지 않습니다. 따라서 차량용 부품으로 사용 가능한 수준을 정확하게 측정할 수 있다면 고분자 소재를 재활용해 차량용 부품으로 사용할 수도 있을 것입니다.
*분자쇄(Molecule Chain): 분자가 연속해 연결된 모습, 연결된 형태에 패턴이 있어야 분자쇄라고 한다.
도메인 엔지니어는 해결하고자 하는 문제, 데이터, 목적 함수 등을 모두 스스로 정의해야 합니다. 이번에 해결하고자 하는 문제는 재활용으로, 제품 생산 시 성형 공정상 사용하지 않고 버려지는 부분을 원재료와 섞어 재활용하는 것입니다. 따라서 허용 가능한 수준의 재활용 재료를 사용해 버려지는 재료를 줄이고, 전반적인 재료 사용량을 절감하는 것을 해결하고자 하는 문제로 정의했습니다. 그리고 재활용 가능 여부의 측정 척도(Metric)는 분자량의 가늠자인 인장 특성(재료를 당길 때의 특성)으로 설정했습니다. 첫 번째 개발 목표는 인장 특성을 기반으로 물성 저하 수준을 예측해 재활용 가능 지점을 찾는 것이며, 두 번째 개발 목표는 재활용 가능 여부를 정확하게 분류하는 인공지능 모델을 개발하는 것으로 설정했습니다.
활용할 데이터인 인장 특성은 재료를 강제로 변화시켜 파손 시점까지의 반발력을 측정한 *시퀀스 데이터(Sequence Data)입니다. 이 중 인장강도(Tensile Strength)는 분자 결합의 총량을 대표할 수 있는 값입니다. 재활용 과정에서 분자 간 결합이 끊어지고 인장강도가 변화하는 것을 확인할 수 있습니다. 따라서 일반적인 재료의 경우 물성 예측을 위한 반응 변수로 인장강도를 활용할 수 있습니다.
*시퀀스 데이터: 데이터 내의 각 요소에 순서를 두고 배열한 데이터
하지만 개발 대상 소재인 열가소성 고분자는 인장 특성 내에서도 *항복점을 중심으로 인장 특성의 거동이 달라집니다. 따라서 인장강도만으로 소재를 표현하는 것이 적절하지 않습니다. 데이터 원형을 제대로 표현하려면 더 높은 차원에서 고려해야 합니다. 항복점을 표현하는 동시에 원형 또한 잘 표현할 수 있는 형태로 입력 데이터를 변환해야 합니다.
*항복점(Yield Point): 물체의 탄성 한도를 넘어 외력 대비 영구 변형이 급격히 늘어나는 지점
일반적으로 시퀀스 데이터는 LSTM으로 대표되는 RNN(Recurrent Neural Network) 계열의 딥러닝 네트워크를 활용해 모델을 개발합니다. 해당 네트워크를 활용하면 데이터 원형 전체를 입력해 사용할 수 있습니다. 하지만 변형에 대한 열가소성 고분자의 비선형성(Nonlinear)과 *결정성(Crystalline)이 인장 특성에 **지역성(Locality)을 부여합니다. 결론적으로 데이터 원형(시퀀스)에 지역성을 부여하는 일부분만 있으면 문제를 치환해 분류 문제를 해결할 수 있습니다.
*결정성: 분자가 규칙적인 구조를 가지려 하는 성질
** 지역성: 각 값들 사이에 강한 지역적 연관성이 있는 것, 가령 이미지 상 인접한 두 개의 픽셀은 같은 컬러값을 가질 확률이 매우 높은 것과 비교할 수 있다
또한, 데이터에 지역성이 있는 경우에는 CNN(Convolutional Neural Network) 계열의 네트워크를 사용해 문제를 해결하는 방법이 여러 사례를 통해 증명된 바 있습니다. CNN 계열의 네트워크를 사용하기 위해서는 입력 데이터를 변형해야 합니다. 해당 데이터 원형은 1D-Grid 시퀀스 2개가 쌍으로 하나의 데이터를 구성하기 때문에 X-Y축 그래프 이미지 1장으로 표현하면 네트워크에 적합한 데이터 변환이 가능하고, 데이터 원형의 손실도 전혀 발생하지 않습니다.
더불어, 이미지 생성 시 실제 데이터에 해당되는 곡선 이외의 영역은 모두 제거해 학습에 불필요한 연산이 들어가지 않도록 강도 기반의 영상 분할(Intensity Segmentation)을 수행하여 학습 이력의 수렴성을 향상시키고 학습 시간을 단축할 수 있었습니다. 이후 전처리 완료된 데이터를 활용하여 다양한 사전 학습 모델을 대상으로 최적의 베이스라인(Baseline) 네트워크를 선정했고, 미세조정을 통해 최종 성능을 도출했습니다.
도메인 중심으로 인공지능을 개발하기 위해서는 ‘모델이 잘 작동해야 한다’는 전제 조건이 붙습니다. 따라서 원하는 수준의 성능을 달성했다고 개발이 완료되는 것이 아닙니다. 모델이 의도한 대로 잘 작동하는지 반드시 확인해야 합니다. 해당 인공지능 모델은 큰 사이즈의 입력 데이터가 수많은 Convolution Layer(특정 특징을 추출하는 레이어)를 지나며 차원이 축소되고, 축소된 차원으로 분류를 하는 기능을 정상적으로 수행해야 개발 의도에 맞는 작동을 하는 것이라 볼 수 있습니다.
개발 의도에 맞는 작동을 확인하기 위해 Activation MAP 기술을 활용하여 인장 특성 이미지에서 학습의 대상인 곡선에 대한 활성화 여부를 확인했습니다. 여러 Convolution Layer를 지나가며 줄어드는 차원의 출력을 2차원으로 축소하여 깊은 Convolution Layer로 갈수록 OK/NG 클래스 간의 선형 분리가 잘 되는 것을 확인했습니다. 또한, ‘설명 가능한 인공지능(Explainable AI, Grad-CAM)’ 기술을 활용해 동일 클래스 데이터의 공통점과 상이한 클래스를 분류하는 판단 근거를 파악하여 재활용에 따른 입력 데이터의 지역성을 확인했습니다. 이는 재활용의 누적에 따라 고분자의 인장 특성이 변화한다는 도메인 지식과 동일한 결과로 해석할 수 있습니다.
정리하자면, 도메인 지식을 기반으로 입력 데이터의 특성이 잘 나타나는 형태로 입력 값을 변환하고, 심층 학습에 유리한 전처리 작업을 통해 입력 데이터의 분산을 줄였습니다. 또한 다양한 사전 학습 모델을 활용해 인공지능 모델을 개발하기 위한 시간을 줄였습니다. 물론 도메인 중심의 개발을 통해 더 개선할 점을 발견할 수 없는 경우에는 모델 개발을 통해 성능을 끌어올려야 합니다. 어떤 방식의 접근이 더 뛰어나다기 보다는 인공지능 모델 개발자와 도메인 지식을 가진 전문가가 각각 잘할 수 있는 영역에 집중하는 것이 중요하다고 생각합니다.
초창기 딥러닝 기술은 주로 텐서 플로우(TensorFlow)를 프레임 워크(Framework, 소프트웨어 개발 기반)로 사용했지만, 지금은 선택지가 다양합니다. 주변 동료들도 딥러닝과 관련하여 어떤 프레임 워크를 선택할지 질문을 하곤 하지만, 인공지능의 파이프 라인(Pipeline, 일련의 실행 과정)은 어떤 프레임 워크에서도 거의 동일하게 작동합니다.
굳이 추천할 경우에는 “특정 도메인에 특화된 일부 프레임 워크를 제외하고 자신이 사용하기 가장 쉬운 언어로, 가장 빠르고 손쉽게 구현할 수 있는 프레임 워크를 선택하면 된다”고 조언하고 있습니다. 다양한 프레임 워크에 대한 숙련도를 높이기 위해서는 시간이 많이 소모되지만, 결과적으로는 큰 차이가 없기 때문입니다.
인공지능 개발의 결과물인 모델은 ‘ONNX(Open Neural Network Exchange, 기계학습 알고리즘 및 소프트웨어 도구의 공개 표준)’로 프레임 워크 간 호환성이 있습니다. 따라서 단 하나의 프레임 워크만 다룰지라도, 능숙하게 사용하는 것이 가장 중요하다고 생각합니다.
HMG 저널 운영팀
group@hyundai.comHMG 저널에서 제공되는 정보는 크리에이티브 커먼즈(CCL) 2.0 정책에 따라 콘텐츠의 복제와 배포, 전송, 전시 및 공연 등에 활용할 수 있으며, 저작권에 의해 보호됩니다. 단, 정보 사용자는 HMG 저널에서 제공하는 정보를 개인 목적으로만 사용할 수 있습니다.
HMG 운영정책 알아보기