기사 메일전송
하이퍼커넥트, ‘WSDM 2023’서 콘텐츠 모더레이션 기술 논문 발표
  • 김만석
  • 등록 2023-01-20 09:57:56

기사수정
  • 머신러닝 기반 ‘다중 서브 태스크 접근 방식’, ‘트러스트 스레시’ 기술
  • 소셜 미디어의 부적절한 콘텐츠 탐지 효율 향상
  • 변화하는 콘텐츠 모더레이션 정책 맞춰 효율적 콘텐츠 리뷰 기술 제안


▲ 사진=하이퍼커넥스의 글로벌 영상 메신저 ‘아자르(Azar)’



글로벌 영상 기술 기업 하이퍼커넥트(대표 안상일)가 세계적 데이터 마이닝 학회 ‘WSDM(Web Search and Data Mining) 2023’에서 부적절한 콘텐츠를 탐지하는 ‘콘텐츠 모더레이션’ 관련 기술 논문을 발표한다고 20일 밝혔다.


올해로 16회를 맞은 WSDM은 웹, 소셜 웹의 검색과 데이터 마이닝을 주제로 한 정보 검색 및 자연어 처리 분야의 국제학회다. WSDM 2023은 2월 27일부터 3월 3일까지 싱가포르에서 개최된다.


하이퍼커넥트는 3월 1일(현지 시각) ‘임계값 최적화를 통한 여러 하위 작업의 신뢰할 수 있는 결정: 실제 서비스 상황에서의 콘텐츠 모더레이션(Reliable Decision from Multiple Subtasks through Threshold Optimization: Content Moderation in the Wild)’ 논문을 발표한다. 특히 이번 연구는 논문 선정뿐만 아니라 채택된 논문의 약 30%만 받을 수 있는 ‘오랄 프레젠테이션(oral presentation)’의 영예까지 안았다.


소셜 미디어 플랫폼은 부적절한 콘텐츠로부터 사용자를 보호하고자 콘텐츠 모더레이션 정책에 따라 머신러닝 모델을 활용해 매일 방대한 양의 콘텐츠를 처리한다. 콘텐츠 모더레이션 정책은 국가와 서비스 유형에 따라 상이하기 때문에 플랫폼에서는 각 정책에 맞춰 머신러닝 모델을 교육하고 활용해야 한다. 정책이 변경될 경우 플랫폼은 변화한 데이터 분포에 대해 데이터 세트 레이블을 다시 지정하고, 머신러닝 모델을 재학습시키는 과정에서 발생하는 비효율적인 비용을 감당해야 한다.


효율성 문제를 해결하기 위해 소셜 미디어 플랫폼은 그동안 콘텐츠 모더레이션을 미성년자 사용자 노출 여부, 부적절한 행동 등으로 세분화하고, 각 서브 태스크(sub task)에 대한 예측점수를 제공하는 타사 모더레이션 서비스를 사용해왔다. 다만, 각 서브 태스크의 예측점수에서 특정 정책에 대해 신뢰할 수 있는 최종 결정을 내리는 콘텐츠 모더레이션 기술에 대해서는 그동안 심도 있는 연구가 진행되지 않았다.


하이퍼커넥트의 이번 논문은 끊임없이 변화하는 콘텐츠 모더레이션 정책에 맞춰 콘텐츠 리뷰를 효율적으로 자동화할 수 있는 머신러닝 기반의 기술을 제안한다.


콘텐츠에 대한 객관적 사실들을 서브 태스크로 학습하는 ‘다중 서브 태스크 접근 방식(Multiple Subtask Approach)’과 학습한 서브 태스크를 각 콘텐츠 모더레이션 정책에 유연하게 적용해 신뢰할 수 있는 결정을 내리는 임계값 최적화 방법인 ‘트러스트 스레시(TruSThresh)’가 그것이다. 콘텐츠 모더레이션의 실제 시나리오를 공식화하고, 여러 서브 태스크의 최적 임계값을 검색해 비용 효율적인 방식으로 콘텐츠 모더레이션 결정을 내릴 수 있는 임계값 최적화 방법이다.


하이퍼커넥트는 광범위한 실험을 통해 해당 기술이 콘텐츠 모더레이션에서 기존 방식 대비 더 나은 성능을 보인 것을 확인했다. 이 기술은 국내에서 특허 출원을 마쳤으며, 향후 미국을 포함해 글로벌 특허 출원 및 등록을 시도할 예정이다.


하성주 하이퍼커넥트 AI랩 총괄 디렉터는 “하이퍼커넥트는 사용자가 안전한 환경에서 우리의 서비스를 이용할 수 있도록 다방면으로 힘써오고 있으며, WSDM 2023에서 발표할 콘텐츠 모더레이션 기술 또한 그 일환”이라며 “이번 연구 결과를 통해 소셜 미디어 플랫폼 기업들이 보다 효과적으로 어뷰징을 방지하고, 부적절한 콘텐츠에 대한 효율적인 대응이 가능할 것으로 기대한다”고 말했다.


한편, 하이퍼커넥트는 자체 AI랩 운영을 통해 실제 서비스 개발·운영 단계에서 활용할 수 있는 혁신 기술을 개발하기 위해 노력하고 있다. 또 AI, 딥러닝 등 다양한 기술을 개발하고 발표함으로써 세계적으로도 연구 성과와 기술력을 인정받고 있다. 특히 현재까지 국내를 비롯해 미국과 일본, 유럽 등 전 세계에서 약 280건의 글로벌 출원과 120건의 글로벌 특허를 등록하며 독자적인 기술 경쟁력을 입증했다.



0
  • 목록 바로가기
  • 인쇄


이전 기사 보기 다음 기사 보기
가장 많이 본 뉴스더보기
  1. 제천문화원, 내부 제보로 ‘보조금 부당 집행·직장 내 괴롭힘’ 의혹 폭발… 제천시는 민원 취하만 기다렸나 충북 제천문화원이 보조금 부당 집행·근무 불성실·직장 내 괴롭힘 의혹에 휩싸였다. 내부 기간제 근로자인 A 씨가 국민신문고를 통해 구체적 정황을 제출하며 공식적으로 문제를 제기했지만, 제천시가 이를 성의 없는 조사와 민원 취하 종용으로 무마하려 했다는 비판이 거세다.A 씨는 신고서에서 문화원 내부에서 ▲ 각종 사업 보...
  2. 중부소방서·드론전문의용소방대·CPR전문의용소방대·태화파출소 [뉴스21 통신=최세영 ]▲ 사진제공=중부소방서 드론전문의용소방대울산중부소방서 구조대와 드론전문의용소방대, CPR전문의용소방대, 태화파출소는 12월 13일(토) 오전 10시부터 오후 1시까지 태화연 호수공원 일대에서 겨울철 생활안전 및 화재예방 강화를 위한 합동 안전 캠페인을 성공적으로 마무리했다.이번 캠페인은 동절기 산불 위험 증...
  3. “We Serve” 실천 60년…울산라이온스클럽이 미래 100년을 향하다 [뉴스21 통신=최세영 ]▲ 사진제공=울산라이온스클럽2025년 12월 11일(목) 오후 6시 30분, 울산 보람컨벤션 3층에서 울산라이온스클럽 창립 60주년 기념식이 성대하게 개최됐다. 이번 행사에는 지역사회 인사뿐 아니라 울산 무궁화라이온스클럽을 포함한 30개 라이온스클럽의 회장단과 라이온들이 참석해 울산라이온스클럽의 60년 역사를 함께 축...
  4. [신간소개]악마의 코드넘버 새디즘 신은 나를 버렸으나, 나는 12미터의 종이 위에 나만의 신을 창조했다." 18세기 가장 위험한 작가, 마르키 드 사드의 충격적 실화 바탕 팩션! '사디즘(Sadism)'이라는 단어의 기원이 된 남자, 마르키 드 사드 백작. 그는 왜 평생을 감옥에 갇혀야 했으며, 잉크가 마르자 자신의 피를 뽑아 글을 써야만 했을까? 전작 《지명의 숨겨진 코드》...
  5. “염화칼슘에 가로수가 죽어간다”… 제천시,친환경 제설제 782톤’ 긴급 추가 확보 충북 제천시가 겨울철마다 반복돼 온 염화칼슘 과다 살포로 인한 도심 가로수 피해 논란 속에, 뒤늦게 친환경 제설제 782t을 추가 확보했다.환경 단체와 시의회의 강한 문제 제기가 이어지자, 시가 올해 겨울철 제설 정책을 전면 수정한 것이다.지난 9월 19일 열린 ‘제설제 과다 살포에 따른 가로수 피해 실태 간담회’에서는 “인도 ...
  6. 한국공인중개사협회 익산시지회, 청소년 주거안전 지킴이로 나서 한국공인중개사협회 익산시지회(지회장 김남철)가 지역 청소년의 주거 안전을 위한 공익 활동에 적극 나서며 지역사회에 모범적인 사회적 역할을 수행하고 있다.익산시지회는 사회 진출을 앞둔 고등학교 3학년 학생들을 대상으로 부동산 기초 이해 및 전세사기 예방교육을 실시했다. 이번 교육은 대학 진학, 자취, 독립 등으로 처음 주거 계...
  7. 철도노조 총파업…"출근시간 전철 운행률 90%" 비상대책 [뉴스21 통신=추현욱 ]  전국철도노동조합이 임금교섭 결렬에 따라 11일 오전 9시부터 무기한 총파업에 돌입하겠다고 밝히면서 정부와 한국철도공사(코레일)가 즉각 비상수송대책을 가동했다. 철도노조는 성과급 정상화, 고속철도 통합, 안전대책 마련을 핵심 요구로 제시했다.국토교통부는 10일 비상수송대책 점검회의를 열고 파업 종료 ...
역사왜곡
모바일 버전 바로가기