기사 메일전송
ETRI, 사람처럼 문서 이해하는 AI 기술 개발
  • 김만석
  • 등록 2021-09-07 09:43:25

기사수정



국내 연구진이 사람처럼 똑똑하게 문서를 이해하고 원하는 정보를 찾을 수 있는 기술을 개발했다. 이로써 필요한 내용을 빠르게 파악해 업무 생산성을 높이고 정보 공유와 활용도를 대폭 높이는 데 큰 도움이 될 전망이다.

한국전자통신연구원(ETRI)은 오피스 문서로부터 사용자의 질문에 정답을 알려주고 두 문장이 같은 의미인지 이해하는 API ’2종을 개발했다고 밝혔다. 

ETRI는 인공지능 SW를 이용해 원하는 정보를 검색할 수 있을 뿐 아니라 사용자가 하는 질문에 정답과 근거까지 확인할 수 있는 기술을 개발했다. 

먼저 행정문서 질의응답(QA) API 기술은 딥러닝 언어모델을 이용해 단락과 표를 인식하여 정답 및 근거 문장을 인식하는 기술이다. 

예를 들어 ‘출장 경비가 100만 원 들 때, 결재를 어느 선까지 받아야 할까요?’라는 질문을 입력하면,‘100만 원 이하인 경우, 실장 전결’과 같은 사내 규정 정보를 담은 문서와 그 근거 부분까지 찾아 주는 셈이다.

본 기술은 공동연구기관인 한글과컴퓨터에서 블라인드 평가로 정확도를 측정했다. 

그 결과 단락을 대상으로 검색해 나온 상위 5개 결과의 정확도는 89.65%, 표를 대상으로 진행한 검색에서는 81.5%로 높은 정확도를 보였다.

또한, 패러프레이즈(Paraphrase) 인식 API는 사람처럼 똑똑하게 문서를 보고 다른 형태의 문장이 같은 뜻을 지니는지 파악하는 기술이다. 

앞서 나온 행정문서QA API와 다른 한국어 AI 개발에도 쓰일 수 있는 원천 기술이다.

인공지능과 딥러닝 기술은 사람과 달리 문장이 조금만 달라져도 의미 관계를 올바르게 인식하지 못하는 견고성(robustness) 문제가 있었다. 

예를 들어 ‘그는 빨간 자전거를 샀다.’와‘그가 산 자전거는 빨간색이다’라는 문장은 사람과 기계가 쉽게 구분하지만, ‘그는 빨간 자전거를 안 샀다.’라는 문장과는 구분을 잘하지 못한다. 

ETRI는 딥러닝 기술의 견고성 한계를 개선하여 다양한 유형의 문장에서 의미 관계를 인식하도록 본 기술을 개발했다. 

견고성 평가셋 대상 평가 결과, 96.63% 정확도를 보이며 기존 오픈소스 딥러닝 기술보다 성능을 크게 개선할 수 있었다.

개발된 기술은 표준인 XML 기반으로 문서 서식을 처리한다. 

현재는 한글 문서 대상으로만 서비스를 제공하지만, 개발 기술 자체는 워드, PDF 등 다른 문서에도 범용적으로 쓰일 수 있다. 

덕분에 사내 규정, 메뉴얼, 온라인 공고 등 다양한 문서와 분야에 적용될 전망이다.

연구진은 오피스 문서 서식이 다양하고 정형화되지 않아 인공지능 기술을 적용하기 어려웠지만, 견고성이 높은 데이터를 구축하고 무엇이 문제인지 판단하는 알고리즘 성능을 높이면서 본 성과를 낼 수 있었다고 밝혔다.

향후에는 GPT-3에 대응하여 언어이해와 생성을 동시에 학습한 딥러닝 언어모델을 개발하고 관련 기술을 공개하면서 AI 기술력을 고도화하고 플랫폼 개발에도 기여한다는 계획이다. 

ETRI 언어지능연구실 임준호 박사는 “본 기술로 한국어 인공지능 서비스 시장이 더욱 활성화되어 외산 인공지능 솔루션의 국내시장 잠식을 막고 국민들이 유용한 지식 정보를 쉽고 빠르게 습득할 수 있는데 도움이 되기를 기대한다.”라고 밝혔다.

한편 본 기술은 ETRI 공공 인공지능 오픈 API‧데이터 서비스 포털(https://aiopen.etri.re.kr/)에 공개되어 누구나 쉽게 이용할 수 있다.


0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 제천 빨간오뎅 축제 뒤 ‘혈세 공회전’ 논란… 단속차량 수시간 무인 시동 지난달 28일부터 3월 2일까지 충북 제천역 광장에서 열린 ‘빨간오뎅 축제’가 수많은 인파 속에 진행되고 있다. 제천의 겨울 대표 먹거리로 육성하겠다며 제천시가 야심 차게 추진한 행사다.그러나 축제의 화려한 겉모습과 달리, 행사장 주변에서는 이해하기 어려운 행정 운영이 포착되며 ‘혈세 낭비’ 논란이 불거지고 있다....
  2. [단독] 구리시 어르신 행사서 ‘80대 노인 사망’ … 백경현 시장 행보 논란 [구리=전형진·서민철 기자] 구리시 지역 사회를 위해 마련된 어르신 식사 대접 행사가 끝내 인명 사고로 얼룩졌다. 특히 현장에 머물던 백경현 구리시장의 당일 행적과 최근 연이어 터진 고발 사건들이 맞물리며 시장의 시정 운영 능력을 우려하는 목소리가 커지고 있다.지난 2월 27일 낮 12시경, 구리시 수택2동에서 새마을부녀회가 주관...
  3. 미 국방부, 엔트로픽을 '공급망 리스크'로 지정…군 계약업체도 사용 금지 [뉴스21 통신=추현욱 ] 미국 국방부가 AI 기업 엔트로픽(Anthropic)을 "공급망 리스크(supply-chain risk)"로 공식 지정하고, 군 계약업체 전체의 엔트로픽 기술 사용을 즉시 금지했다. 트럼프 대통령이 연방 전 기관에 엔트로픽 사용 중단을 지시한 직후 나온 이 조치는, AI 이용약관을 둘러싼 정부와 민간 기업 간 갈등이 계약 단절이라는 결과...
  4. [전북 지방선거 기획] "전북 선거 이대로 괜찮은가" 2026년 6월 3일 치러질 지방선거를 앞두고 전북 정치권이 예상보다 이른 시점부터 격한 공방에 휩싸였다. 더불어민주당 전북도지사 경선 구도 속에서 촉발된 ‘계엄 대응’ 논란이 정치권을 넘어 공직사회까지 확산되면서 지역 정치판 전반에 파장을 일으키고 있다. 선거가 수개월 앞으로 다가온 상황에서 정치권의 갈등이 정책 경쟁보...
  5. 제천시 로고 무단 사용 논란…관리·감독은 어디에 있었나 충북 제천에서 열릴 예정인 ‘2026 제3회 제천연예예술신년음악회’를 둘러싼 제천시 후원 표기 논란이 단순 우발사건을 넘어 행정 신뢰 문제로 번지고 있다.공연 홍보 포스터에는 ‘제천시 후원’ 문구와 함께 제천시 공식 마크가 선명하게 표기됐지만, 제천시는 “후원 승인이나 상징물 사용 허가를 한 사실이 없다”고 ...
  6. [속보]트럼프 "하메네이 죽었다"...사망 공식 발표 [뉴스21 통신=추현욱 ] 도널드 트럼프 미국 대통령이 이란 최고지도자인 아야톨라 세예드 알리 하메네이가 사망했다고 28일(현지시간) 알렸다.트럼프 대통령은 이날 사회관계망서비스(SNS) 트루스소셜에 올린 글에서 "역사상 가장 사악한 사람 중 한 명인 하메네이가 사망했다"고 적었다.하메네이는 미국과 이스라엘이 이날 대대적으로...
  7. 북구, 보육정책위원회 개최 [뉴스21 통신=최병호 ](사진출처=울산북구청) 북구는 27일 구청 상황실에서 교육경비보조심의위원회를 열고, 각급 학교 지원사업을 심의·의결했다.
역사왜곡
모바일 버전 바로가기