기사 메일전송
SK텔레콤, 국립국어원과 AI 한국어 모델 개발 협력
  • 안남훈
  • 등록 2021-04-08 09:45:31

기사수정



SK텔레콤(대표이사 박정호)이 7일 국립국어원(원장 소강춘)과 업무 협약을 체결하고, 국립국어원의 언어 정보를 활용해 한국어에 최적화된 차세대 인공지능(AI) 언어 모델을 개발하기로 했다.
 
차세대 AI 한국어 모델은 사람의 능력 수준으로 평가되는 GPT-3*와 유사한 성능을 발휘하는 한국어 범용 언어 모델(이하 GLM, General-Purpose Language Model)로 언어 관련 문제 풀이, 글짓기, 번역 및 주어진 문장에 따라 간단한 코딩을 수행할 수 있는 GPT-3의 기능을 한국어에도 구현할 수 있게 했다.

GLM은 일상의 감성 대화, 다양한 업종의 고객센터 대화뿐만 아니라 시사, 문학, 역사, 게임에 이르기까지 다양한 영역의 언어 활동에 적용될 수 있으며 이를 기반으로 새로운 산업 분야에 추가 활용될 수 있을 것으로 기대한다.
 
SKT가 개발하는 GLM은 1500억개의 매개변수*를 가진 거대 언어 모델로 개발될 예정이다. 최신 언어 모델인 GPT-3가 1750억개의 매개변수를 가지고 있어 이전 버전인 GPT-2보다 100배 이상 크고 더욱더 높은 정확도와 넓은 활용도를 가진 점을 고려하면 GLM은 한국어 AI 언어 모델의 결정판이 될 것으로 예상된다.

SKT는 올해 말까지 GLM을 개발해 내부 서비스를 통해 모델 성능을 검증한 후 상용화를 진행할 예정이며, 다양한 서비스에도 적용할 계획이다. 또한 한국어 언어 모델 성능 평가 방법 개발 및 한국어 데이터 품질 평가 연구도 추진할 예정이다.
 
SKT는 2018년부터 AI 언어 모델을 개발해 왔으며, 2019년 KoBERT를 개발해 챗봇 등에 활용하고 있다, 2020년 4월 KoGPT-2를 개발 완료해 챗봇의 대화를 더욱더 자연스럽게 발전했으며, 2020년 10월에는 뉴스나 문서를 고품질 요약문으로 만들어내는 능력 등 텍스트 처리 역량이 뛰어난 KoBART를 개발해 자연어 이해/처리 영역의 기술력을 강화해 왔다.
 
이와 함께 국립국어원은 ‘2021년 국어 정보처리 시스템 경진대회’를 SKT의 AI 언어 모델을 활용해 AI의 언어소통 능력을 겨루는 방식으로 개편해 한글 주간에 개최하기로 했다.
 
SKT 데이비스 에릭 하트먼 Language Superintelligence Labs장은 “SKT는 한국어에 최적화된 인공지능 언어 모델을 선제적으로 개발해 한국어의 정보화에 이바지하고 있다”며 “이번 국립국어원과의 협력을 계기로 한국어의 과학화, 세계화에도 이바지할 계획”이라고 밝혔다.
 
국립국어원 정희원 어문연구실장은 “앞으로도 인공지능 개발에 필요한 언어 정보자원을 지속해서 발굴해 관련 산업계와 학계에서 유용하게 활용될 수 있도록 시스템을 구축해 나가겠다”고 말했다.

0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 의왕시 사근행궁, 의로운 왕의 도시가 잊지 말아야 할 자리 [뉴스21 통신=홍판곤 ]정조는 '의로운 왕(義王)'이었다. 그는 백성을 사랑했고, 아버지를 그리워했으며, 무너진 나라의 기강을 세우려 했다. 사근행궁에 들렀을 때마다 마음속에 품었던 건 단 하나였다."아버지를 배알하고, 백성을 돌보는 그 길이 곧 임금의 도리다."그 길 위에 오늘의 의왕(義王)이 있다. 그러나 지금, 그 이름의 ...
  2. '리얼시그널' 웹사이트...부동산, 예금, 주식, 가상자산 보유 현황 확인 (사진=네이버db)[뉴스21 통신=추현욱 ]고위 공직자들의 실제 부동산 보유 현황을 보여주는 웹사이트가 등장해 눈길을 끈다. 공개된 고위공직자 재산공개 자료를 기반으로 만들어진 온라인 서비스 '리얼시그널'이 그것이다.리얼시그널에는 대통령, 국회의원, 장·차관, 고위 법관 및 검사, 군 장성 등 약 7000명의 자산 내역이 담겨 있..
  3. 단양 강풍 속 패러글라이딩 비행 중 추락…탑승자 1명 중상 지난 22일 오후 3시 34분께 충북 단양군 단양읍 노동리 양방산 전망대 인근에서 패러글라이딩 비행 중이던 50대 남성 2명이 추락하는 사고가 발생했다.단양소방서에 따르면, 사고 당시 조종사 A 씨와 동승 고객 B 씨는 이륙 직후 강풍에 중심을 잃고 인근 야산으로 추락했다. 현장에 있던 패러글라이딩 업체 직원이 즉시 119에 신고했으며, 소방..
  4. 제천시, 초고압 송전선로 ‘1년 전부터 인지’하고도 침묵… 충북 제천시가 초고압 송전선로(345kV 신 평창–신 원주) 건설사업이 지역을 통과할 가능성을 지난해 11월부터 알고 있었던 것으로 드러났다.하지만 시는 이 사실을 시민에게 단 한 차례도 공식적으로 알리지 않아 ‘행정의 무책임’과 ‘정보 은폐’ 논란이 거세지고 있다.한국전력공사는 지난해 11월 제천시를 포함한 해당 구...
  5. 매크로로 프로야구 티켓 10만장 싹쓸이한 40대 검거 프로야구 티켓을 매크로 프로그램으로 10만 장 넘게 예매해 되팔아 거액의 수익을 챙긴 40대 남성이 경찰에 붙잡혔다. 해당 프로그램을 제작·유포한 20대 2명도 함께 검거됐다.대전경찰청 사이버수사대는 암표 판매 혐의로 A씨(42)를, 매크로 프로그램을 제작해 유포한 20대 2명을 정보통신망법 및 국민체육진흥법 위반 등 혐의로 입건했다...
  6. 김꽃임 도의원 “제천은 전력 수혜지 아닌 희생양… 송전선로 노선 전면 재검토하라” 충북도의회 산업경제위원장 김꽃임 의원(제천1·국민의힘)이 정부와 한국전력공사가 추진 중인 ‘345kV 신 평창~신 원주 송전선로 건설사업’의 제천 경유 노선 계획을 전면 재검토하라고 촉구했다.김 의원은 21일 열린 제429회 충북도의회 임시회 제2차 본회의 5분 자유발언에서 “이번 사업은 강릉발전소 전력을 강원 영서와 용...
  7. 태백 라마다 호텔 충격 증언 "1,910명 등기는 껍데기, '무제한 멤버십' 판매가 본질" 태백 라마다 호텔 사태가 1,910명의 '지분 쪼개기' 등기 분양 문제로 알려진 것과 달리, 실제로는 '무제한 멤버십 회원권' 판매를 통한 변칙적 수익 창출이 더 심각한 문제의 본질이라는 내부 관계자의 충격적인 증언이 나왔다.과거 태백 라마다 호텔의 내부 관계자 A씨는 "기사화된 1,910명의 등기 문제는 전체 사기 규모의 100분..
역사왜곡
모바일 버전 바로가기