학술지 논문 1건 5분 만에 XML 데이터로 자동 변환, 인식률 98%
자체 개발한 AL 모델을 기반으로 문서, 도서의 고품질 데이터화 및 DB 구축 자동화 솔루션을 제공하는 (주)오르비스 파브리카는 최근 학술지 논문 JATS XML(국제표준) 자동 변환 솔루션을 개발 완료하였다고 밝혔습니다.XML 자동 변환 솔루션의 개발 배경은 증가하고 있는 XML 데이터 변환 수요에 대응하여 획기적인 비용 절감과 시간 절약의 기회를 제공하고자 함이었으며, 최근 국립중앙도서관을 대상으로 XML 데이터 자동 변환 핵심기술 시연을 통해 기술에 대한 검증과 신뢰성을 인정받았습니다.
(주)오르비스 파브리카의 국제표준 XML 데이터 자동 변환 기술은 AI 기반 자동화 알고리즘을 바탕으로 학술 논문 1건(10 페이지 기준)당 5분 이내에 XML 데이터로 자동 변환하고, 인식률과 관련된 전체적인 정확도는 98%(텍스트 인식률은 99%) 이상을 보입니다.
특히, 기존의 XML 데이터 변환 방식이 전문인력에 의한 수작업 위주로 진행되어 논문 1건 당 2~3일 이상 소요되는 것에 비해 획기적인 시간의 절감이 가능하며 학술지 논문의 XML 출판 확대에 공헌할 수 있을 뿐 아니라 자동화로 인해 상당한 인건비 절감 효과를 얻을 수 있을 것으로 기대됩니다.
이어, (주)오르비스 파브리카는 국립중앙도서관으로부터 100건의 학술 논문을 제공받아 XML 데이터 자동 변환 기술의 고도화를 진행 중이며, 동시에 글로벌 서비스가 가능한 '웹 기반 XML 데이터 변환 플랫폼'을 24년 12월까지 개발 완료를 목표로 추진 중이라고 전했습니다.
이 플랫폼은 구독형 모델 형태, 자동 결제 시스템이 탑재되어 웹을 통한 파일 업로드와 최종결과물 다운로드가 가능하며 사용자 편의성 증대와 대용량 처리 시스템과 프로세스를 구축할 예정입니다.
(주)오르비스 파브리카의 창업자이며 핵심 개발자인 조남제 대표는 당사의 시스템은 현재 영어와 한국어를 근간으로 개발되었으나, 사용 언어의 확장 가능 범위는 전 세계 170여 개 언어까지 구현할 수 있기에 글로벌 서비스를 하는데 아무런 문제가 되지 않는다“라고 전했습니다.
학술 논문의 XML 변환은 공공성과 개방성을 기반으로 누구든지 자유롭게 학술정보 에 접근할 수 있도록 공개하자는 세계적인 오픈 액세스(Open Access) 운동과 더불어 빠르게 확산하는 하나의 추세가 되었습니다.
일반적으로 학술 논문을 이용할 때 인터넷 키워드 검색을 통해 제목 또는 전문(논문 초록, 개요 등)을 확인하고 PDF 원문을 내려받아 필요한 내용을 발췌 또는 인용합니다.
이러한 PDF 원문은 논문 속 상세 내용 검색이 어려워 일일이 읽어봐야 하는 불편 함이 존재하고 필요한 정보 발췌 및 활용에 많은 시간이 요구됩니다.
이를 XML로 변환하게 되면, 굳이 PDF 원문을 내려받을 필요없이, 텍스트, 표, 그래, 그림 등 데이터 중심 검색이 가능하여 필요한 정보를 더욱 효율적으로 확인하고 활용할 수 있게 됩니다.
문서 호환성도 뛰어나 글로벌 학술정보 유통의 표준으로 자리 잡고 있습니다.
이에, (주)오르비스 파브리카 조남제 대표는 "매년 국내에서 발표되는 학술 논문의 총 수는 10만여 건에 달하며 전 세계적으로 3백4십만 건을 웃돈다”며 “이러한 학술 논문 의 디지털 출판 시장에서 XML 출판은 거스를 수 없는 대세이며, 그동안 수작업 위주의 아날로그적 작업 방식에 따른 시간적, 비용적 비효율성을 극복하고 과월호 논문들의 XML 데이터 변환에도 빠르게 적용 또는 지원함은 물론 연구자들이 자신의 연구 성과를 손쉽게 공유할 수 있는 신지식 생태계를 여는 데 이바지할 수 있기를 기대한다"라고 전했습니다.
[ 이성식 기자 mods@mbn.co.kr ]
기사에 대해 의견을 남겨주세요.