기사 메일전송
하이퍼커넥트, ‘WSDM 2023’서 콘텐츠 모더레이션 기술 논문 발표
  • 김만석
  • 등록 2023-01-20 09:57:56

기사수정
  • 머신러닝 기반 ‘다중 서브 태스크 접근 방식’, ‘트러스트 스레시’ 기술
  • 소셜 미디어의 부적절한 콘텐츠 탐지 효율 향상
  • 변화하는 콘텐츠 모더레이션 정책 맞춰 효율적 콘텐츠 리뷰 기술 제안


▲ 사진=하이퍼커넥스의 글로벌 영상 메신저 ‘아자르(Azar)’



글로벌 영상 기술 기업 하이퍼커넥트(대표 안상일)가 세계적 데이터 마이닝 학회 ‘WSDM(Web Search and Data Mining) 2023’에서 부적절한 콘텐츠를 탐지하는 ‘콘텐츠 모더레이션’ 관련 기술 논문을 발표한다고 20일 밝혔다.


올해로 16회를 맞은 WSDM은 웹, 소셜 웹의 검색과 데이터 마이닝을 주제로 한 정보 검색 및 자연어 처리 분야의 국제학회다. WSDM 2023은 2월 27일부터 3월 3일까지 싱가포르에서 개최된다.


하이퍼커넥트는 3월 1일(현지 시각) ‘임계값 최적화를 통한 여러 하위 작업의 신뢰할 수 있는 결정: 실제 서비스 상황에서의 콘텐츠 모더레이션(Reliable Decision from Multiple Subtasks through Threshold Optimization: Content Moderation in the Wild)’ 논문을 발표한다. 특히 이번 연구는 논문 선정뿐만 아니라 채택된 논문의 약 30%만 받을 수 있는 ‘오랄 프레젠테이션(oral presentation)’의 영예까지 안았다.


소셜 미디어 플랫폼은 부적절한 콘텐츠로부터 사용자를 보호하고자 콘텐츠 모더레이션 정책에 따라 머신러닝 모델을 활용해 매일 방대한 양의 콘텐츠를 처리한다. 콘텐츠 모더레이션 정책은 국가와 서비스 유형에 따라 상이하기 때문에 플랫폼에서는 각 정책에 맞춰 머신러닝 모델을 교육하고 활용해야 한다. 정책이 변경될 경우 플랫폼은 변화한 데이터 분포에 대해 데이터 세트 레이블을 다시 지정하고, 머신러닝 모델을 재학습시키는 과정에서 발생하는 비효율적인 비용을 감당해야 한다.


효율성 문제를 해결하기 위해 소셜 미디어 플랫폼은 그동안 콘텐츠 모더레이션을 미성년자 사용자 노출 여부, 부적절한 행동 등으로 세분화하고, 각 서브 태스크(sub task)에 대한 예측점수를 제공하는 타사 모더레이션 서비스를 사용해왔다. 다만, 각 서브 태스크의 예측점수에서 특정 정책에 대해 신뢰할 수 있는 최종 결정을 내리는 콘텐츠 모더레이션 기술에 대해서는 그동안 심도 있는 연구가 진행되지 않았다.


하이퍼커넥트의 이번 논문은 끊임없이 변화하는 콘텐츠 모더레이션 정책에 맞춰 콘텐츠 리뷰를 효율적으로 자동화할 수 있는 머신러닝 기반의 기술을 제안한다.


콘텐츠에 대한 객관적 사실들을 서브 태스크로 학습하는 ‘다중 서브 태스크 접근 방식(Multiple Subtask Approach)’과 학습한 서브 태스크를 각 콘텐츠 모더레이션 정책에 유연하게 적용해 신뢰할 수 있는 결정을 내리는 임계값 최적화 방법인 ‘트러스트 스레시(TruSThresh)’가 그것이다. 콘텐츠 모더레이션의 실제 시나리오를 공식화하고, 여러 서브 태스크의 최적 임계값을 검색해 비용 효율적인 방식으로 콘텐츠 모더레이션 결정을 내릴 수 있는 임계값 최적화 방법이다.


하이퍼커넥트는 광범위한 실험을 통해 해당 기술이 콘텐츠 모더레이션에서 기존 방식 대비 더 나은 성능을 보인 것을 확인했다. 이 기술은 국내에서 특허 출원을 마쳤으며, 향후 미국을 포함해 글로벌 특허 출원 및 등록을 시도할 예정이다.


하성주 하이퍼커넥트 AI랩 총괄 디렉터는 “하이퍼커넥트는 사용자가 안전한 환경에서 우리의 서비스를 이용할 수 있도록 다방면으로 힘써오고 있으며, WSDM 2023에서 발표할 콘텐츠 모더레이션 기술 또한 그 일환”이라며 “이번 연구 결과를 통해 소셜 미디어 플랫폼 기업들이 보다 효과적으로 어뷰징을 방지하고, 부적절한 콘텐츠에 대한 효율적인 대응이 가능할 것으로 기대한다”고 말했다.


한편, 하이퍼커넥트는 자체 AI랩 운영을 통해 실제 서비스 개발·운영 단계에서 활용할 수 있는 혁신 기술을 개발하기 위해 노력하고 있다. 또 AI, 딥러닝 등 다양한 기술을 개발하고 발표함으로써 세계적으로도 연구 성과와 기술력을 인정받고 있다. 특히 현재까지 국내를 비롯해 미국과 일본, 유럽 등 전 세계에서 약 280건의 글로벌 출원과 120건의 글로벌 특허를 등록하며 독자적인 기술 경쟁력을 입증했다.



0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. '리얼시그널' 웹사이트...부동산, 예금, 주식, 가상자산 보유 현황 확인 (사진=네이버db)[뉴스21 통신=추현욱 ]고위 공직자들의 실제 부동산 보유 현황을 보여주는 웹사이트가 등장해 눈길을 끈다. 공개된 고위공직자 재산공개 자료를 기반으로 만들어진 온라인 서비스 '리얼시그널'이 그것이다.리얼시그널에는 대통령, 국회의원, 장·차관, 고위 법관 및 검사, 군 장성 등 약 7000명의 자산 내역이 담겨 있..
  2. 의왕시 사근행궁, 의로운 왕의 도시가 잊지 말아야 할 자리 [뉴스21 통신=홍판곤 ]정조는 '의로운 왕(義王)'이었다. 그는 백성을 사랑했고, 아버지를 그리워했으며, 무너진 나라의 기강을 세우려 했다. 사근행궁에 들렀을 때마다 마음속에 품었던 건 단 하나였다."아버지를 배알하고, 백성을 돌보는 그 길이 곧 임금의 도리다."그 길 위에 오늘의 의왕(義王)이 있다. 그러나 지금, 그 이름의 ...
  3. 단양 강풍 속 패러글라이딩 비행 중 추락…탑승자 1명 중상 지난 22일 오후 3시 34분께 충북 단양군 단양읍 노동리 양방산 전망대 인근에서 패러글라이딩 비행 중이던 50대 남성 2명이 추락하는 사고가 발생했다.단양소방서에 따르면, 사고 당시 조종사 A 씨와 동승 고객 B 씨는 이륙 직후 강풍에 중심을 잃고 인근 야산으로 추락했다. 현장에 있던 패러글라이딩 업체 직원이 즉시 119에 신고했으며, 소방..
  4. 제천시, 초고압 송전선로 ‘1년 전부터 인지’하고도 침묵… 충북 제천시가 초고압 송전선로(345kV 신 평창–신 원주) 건설사업이 지역을 통과할 가능성을 지난해 11월부터 알고 있었던 것으로 드러났다.하지만 시는 이 사실을 시민에게 단 한 차례도 공식적으로 알리지 않아 ‘행정의 무책임’과 ‘정보 은폐’ 논란이 거세지고 있다.한국전력공사는 지난해 11월 제천시를 포함한 해당 구...
  5. 매크로로 프로야구 티켓 10만장 싹쓸이한 40대 검거 프로야구 티켓을 매크로 프로그램으로 10만 장 넘게 예매해 되팔아 거액의 수익을 챙긴 40대 남성이 경찰에 붙잡혔다. 해당 프로그램을 제작·유포한 20대 2명도 함께 검거됐다.대전경찰청 사이버수사대는 암표 판매 혐의로 A씨(42)를, 매크로 프로그램을 제작해 유포한 20대 2명을 정보통신망법 및 국민체육진흥법 위반 등 혐의로 입건했다...
  6. 태백 라마다 호텔 충격 증언 "1,910명 등기는 껍데기, '무제한 멤버십' 판매가 본질" 태백 라마다 호텔 사태가 1,910명의 '지분 쪼개기' 등기 분양 문제로 알려진 것과 달리, 실제로는 '무제한 멤버십 회원권' 판매를 통한 변칙적 수익 창출이 더 심각한 문제의 본질이라는 내부 관계자의 충격적인 증언이 나왔다.과거 태백 라마다 호텔의 내부 관계자 A씨는 "기사화된 1,910명의 등기 문제는 전체 사기 규모의 100분..
  7. 김꽃임 도의원 “제천은 전력 수혜지 아닌 희생양… 송전선로 노선 전면 재검토하라” 충북도의회 산업경제위원장 김꽃임 의원(제천1·국민의힘)이 정부와 한국전력공사가 추진 중인 ‘345kV 신 평창~신 원주 송전선로 건설사업’의 제천 경유 노선 계획을 전면 재검토하라고 촉구했다.김 의원은 21일 열린 제429회 충북도의회 임시회 제2차 본회의 5분 자유발언에서 “이번 사업은 강릉발전소 전력을 강원 영서와 용...
역사왜곡
모바일 버전 바로가기