과학기술정보통신부가 지난 1월 제1차 혁신성장전략회의에서 발표한 '데이터·AI경제 활성화 계획'에 따르면 오는 2023년까지 국내 데이터 시장을 30조원 규모로 키우고, 인공지능(AI) 분야 유니콘기업을 10개까지 육성한다고 한다. 그러나 아직까지 AI 학습용 데이터의 수집·가공은 기업이 직접 수행하는 것이 일반적으로, 사실 국내에서 이를 대행해주는 업체를 찾기가 힘든 실정이다.

정부의 '데이터·AI경제 활성화 계획'으로 관심이 고조되고 있는 가운데, 국내 데이터 시장에 대해 민간 AI 학습용 데이터 수집·가공 서비스를 전문적으로 제공하는 업체로서 인피닉이 관심을 모으고 있다.

다음은 인피닉 데이터 관리 서비스(Data Management Service) 담당 강진규 부장과의 일문일답이다.

Q) 어떻게 AI 학습용 데이터 수집·가공 서비스를 시작하게 되었나요?

A) 2005년에 설립된 인피닉은 14년간 소프트웨어(software) 품질관리 서비스를 전문적으로 제공하고 있습니다. 그렇기에 품질 서비스에 대한 수준 높은 이해도를 보유하고 있습니다. 이러한 이해도를 바탕으로 지난 2016년도부터 품질에 대한 사업분야를 소프트웨어(software)에서 데이터까지 넓혀, 인공지능이 잘 학습할 수 있는 데이터를 수집·가공하는 서비스를 제공하고 있습니다.

Q) 가장 기억에 남는 프로젝트를 꼽자면?

A) 수집과 가공 분야로 나누어 말씀드려야 할 것 같네요. 먼저 수집 서비스는 SK텔레콤에 납품한 음성 데이터(Data) 수집 프로젝트가 가장 먼저 생각납니다. 성별, 나이, 지역, 억양 등 다양한 발화 데이터를 수집하기 위해 학습에 적합한 발화문구 설계부터 발화자 섭외 및 스튜디오 녹음까지 진행했던 건으로 영상이나 이미지가 아닌 음성 데이터를 처음 취급했던 프로젝트입니다.

그리고 가공 쪽은 현재 사업의 발판이 된 퀄컴의 자율주행용 영상 가공 서비스입니다. 주행영상 속 차량, 차선, 교통 표지판 등 12백만개가 넘는 객체에 대해 태깅(Tagging)과 레이블링(Labeling) 작업을 진행하고 있으며, 데이터 품질(Data Accuracy)은 99% 이상 나오고 있습니다.

Q) 인피닉만의 차별화 포인트는 무엇인가요?

A) 먼저 인프라 구조(Infra-structure) 부분은 고객에게 효율성 증대와 효과적인 모니터링을 제공하기 위해 직접 개발한 데이터 가공 툴(Annotation Tool)과 실시간 작업현황 모니터링 Tool을 제공하고 있습니다. 그리고 가장 중요한 건 현재까지 약 150만개 영상, 음성 데이터의 수집·가공업무를 경험해온 약 2천명의 국내외 데이터 품질 전문가, 즉 인적 구조(Human Infra)가 되겠네요.

Q) 앞으로의 계획은 어떻게 되나요?

A) 대다수의 기업들이 비용문제로 인해 AI에 충분한 학습용 데이터를 제공하는데 어려움을 겪고 있습니다. 현재 우리는 다양한 분야의 데이터를 합리적인 금액으로 제공하기 위한 데이터 센터 오픈을 계획하고 있습니다. 이로 인해 좀 더 많은 기업들이 충분히 학습할 수 있는 환경을 만들고자 합니다. 또한 납품기간과 비용 측면에서 고객 만족도를 높이기 위한 가공 자동화 툴(Auto Annotation Tool)도 개발 중으로 곧 서비스에 적용시킬 계획입니다.

저작권자 © 스포츠한국 무단전재 및 재배포 금지