스마일게이트 AI센터, 악플·혐오 발언 데이터셋 공개

이석호 / 기사승인 : 2022-01-20 16:26:18
  • -
  • +
  • 인쇄

스마일게이트 AI센터가 악플 및 혐오 발언 데이터셋을 공개한다고 20일 밝혔다.

스마일게이트 AI센터는 최근 온라인 공간에서 혐오 표현이 광범위하게 증가하고 있고, 사회적 문제로 이어질 수 있다는 점을 고려해 이를 선제적으로 감지하고 대응할 수 있도록 악플 및 혐오 발언 데이터셋을 구축했다. 

 

▲ 스마일게이트 제공


이번 프로젝트는 지식 콘텐츠 스타트업 언더스코어와 협업을 통해 이뤄졌다.

악플 및 혐오 발언 데이터는 2019년 1월 1일부터 지난해 7월 1일까지 포털 사이트, 커뮤니티 등 다양한 웹사이트의 게시글에서 수집됐다. 이 과정에서 혐오 관련 데이터의 시의성과 편향성 등을 감안해 55만여 개의 데이터를 기반으로 1만 개 데이터셋을 구축했다.

특히 '여성·가족' '성소수자' '남성' '인종·국적' '연령' '지역' '종교' '기타혐오' 등 8개의 대상으로 범주화했다. 또 혐오 발언 분류를 위한 기준 모델을 공개해 혐오 발언 추출이 가능하도록 했다.

이 데이터셋은 향후 게임 커뮤니티 내 댓글, 고객 응대 상담 챗봇, 여론 조사 등 다양한 영역에서 활용될 수 있을 것으로 예상된다.

스마일게이트는 앞으로 지속적인 연구개발(R&D)을 실시하면서 확보된 기술력을 바탕으로 혐오 표현을 높은 정확도로 정확하게 찾아낼 수 있는 기술을 고도화할 계획이다.

이번에 수집된 데이터는 스마일게이트 AI센터 깃허브 페이지를 통해 이달 중 공개 예정이다.

스마일게이트 AI 센터 한우진 센터장은 “이번에 공개된 데이터가 혐오 표현이나 인공지능의 윤리성이 사전에 분류·예방돼 좀 더 안전하게 인공지능을 활용하는 데 밑거름이 되기를 바란다"이라고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

엔씨소프트, ‘호연’·‘블레이드 앤 소울2’ 서비스 종료
[메가경제=이상원 기자] 게임 업계에서 드문 사건이 벌어졌다. 엔씨소프트가 하루 만에 두 개의 주요 타이틀을 서비스 종료하다고 발표했다. 아이온2의 성공으로 적자를 기록하는 타이틀을 정리하고 포트폴리오를 재편하겠다는 전략적 판단으로 풀이된다.엔씨소프트는 17일 공지를 통해 호연과 블레이드 앤 소울2를 순차적으로 서비스 종료한다고 공시했다. 회사 측은

2

KIND-현대로템, ‘해외사업 공동 발굴’ · ‘상호교류’ 위한 업무협약
[메가경제=문기환 기자] 한국해외인프라도시개발지원공사(이하 KIND)는 글로벌 철도 전문기업 현대로템주식회사(이하 현대로템)와 해외 철도사업 공동발굴 및 상호교류 강화를 위한 업무협약을 지난 16일 체결했다고 밝혔다. 이번 협약은 세계 각국의 철도 인프라 수요 증가와 신규 노선 발주 추진 움직임에 따라 KIND의 해외 인프라 사업개발 역량과 현대로템의 철

3

국토부,철도공단·철도연·건설協, ‘디지털 원팀’ … ‘디지털 전환 로드맵’ 실행력 강화
[메가경제=문기환 기자] 국가철도공단은 국회의원회관 제3세미나실에서 국회 국토교통위원회 손명수·엄태영 의원이 주최하고, 철도기술연구원·(사)한국철도건설협회와 공동 주관하는 ‘2025 철도정책세미나’를 개최했다고 17일 밝혔다. 이번 행사는 국토교통부가 추진하는 ‘스마트 건설 활성화’ 정책을 적극적으로 이행하기 위해 사업을 총괄하는 철도공단과 원천 기술을

HEADLINE

더보기

트렌드경제

더보기