엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

이석호 / 기사승인 : 2022-04-15 02:33:43
  • -
  • +
  • 인쇄

엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 8000여 개의 광범위한 주제를 다룬 1만 5000개 이상 대화로 구성돼 있다. 

 

▲ ‘FoCus Dataset’ 대화 참고 이미지 [엔씨소프트 제공]


이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

또 포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용을 소요해도 실시간 지식과 개인의 경험을 반영하는 데 한계를 나타내고 있다는 게 엔씨 측 설명이다.

앞서 공동연구팀은 지난 2월 'AAAI 2022' 학회에서 연구 논문을 발표했다.

엔씨는 오는 10월 국제전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회와 함께 연구 성과를 공유하는 워크숍을 고려대와 공동 개최한다.

이연수 엔씨 랭귀지 AI 랩 실장은 "최근 NLP 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했다"고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

고려아연 주총 전 영풍과 '의결권 분쟁' 격화… '사칭 의혹'에 형사 고소까지 번져
[메가경제=박제성 기자] 고려아연이 오는 24일 정기 주주총회(주총)를 앞두고 의결권 확보를 둘러싼 영풍·MBK파트너스 연합 간 갈등이 격화되는 가운데 경쟁 주주 측 인사들을 상대로 형사 고소에 나섰다. 특히 의결권 위임장 확보 과정에서 ‘회사 사칭’ 의혹까지 불거지면서 자본시장 질서 훼손 논란이 양측간의 대립이 격화되는 양상이다. 22일 업계에 따르면

2

SKT, 광화문 일대 AI 기반 네트워크 운영…"공연 안정적 통신 지원"
[메가경제=황성완 기자] SK텔레콤은 지난 21일 서울 광화문 일대에서 열린 대형 K-팝 공연에서 인공지능(AI) 기반 네트워크 운영을 통해 안정적인 통신 서비스를 제공했다고 22일 밝혔다. SK텔레콤은 이번 공연이 도심 내 제한된 공간에 관람객이 밀집되면서 순간적으로 트래픽이 집중되는 특성이 있어 네트워크 운영 난도가 높았음에도, 평시 수준의 양호한 통신

3

삼성전자, 주한미국상공회의소 행사서 2026년형 '비스포크 AI 스팀' 로봇청소기 시연
[메가경제=황성완 기자] 삼성전자는 지난 20일 그랜드 하얏트 서울 호텔에서 열린 주한미국상공회의소(AMCHAM, 이하 암참) 연례행사에서 2026년형 '비스포크 AI 스팀' 로봇청소기를 전시했다고 22일 밝혔다. 암참의 2026년 신임 이사진을 처음 소개하는 이번 '2026 암참 이사진 취임식(AMCHAM Inaugural Ball

HEADLINE

더보기

트렌드경제

더보기