엔씨·고려대, AI 대화 데이터셋 공개…"외부지식 세계 첫 결합"

이석호 / 기사승인 : 2022-04-15 02:33:43
  • -
  • +
  • 인쇄

엔씨소프트는 고려대학교 임희석 교수 연구팀과 공동연구를 통해 구축한 AI 대화 데이터셋 '포커스 데이터셋(FoCus Dataset)'을 공개했다고 14일 밝혔다.

포커스 데이터셋은 사용자 개인의 배경지식인 페르소나(Persona)와 외부 지식을 모두 활용하는 세계 최초의 AI 대화 데이터셋으로, 8000여 개의 광범위한 주제를 다룬 1만 5000개 이상 대화로 구성돼 있다. 

 

▲ ‘FoCus Dataset’ 대화 참고 이미지 [엔씨소프트 제공]


이를 적용한 AI는 대화하고 있는 사용자의 경험, 선호, 소유, 흥미 등을 파악하고 위키피디아에서 이야기 주제에 대한 최신 지식을 실시간으로 습득해 자연스러운 대화가 가능하다.

또 포커스 데이터셋은 초거대 언어 모델을 사용하지 않고도 같은 성능의 대화 기술 구현이 가능한 것이 특징이다.

현재 일반적인 대용량 언어모델은 학습과 추론에 많은 비용을 소요해도 실시간 지식과 개인의 경험을 반영하는 데 한계를 나타내고 있다는 게 엔씨 측 설명이다.

앞서 공동연구팀은 지난 2월 'AAAI 2022' 학회에서 연구 논문을 발표했다.

엔씨는 오는 10월 국제전산언어학회인 'COLING 2022'에서 데이터 활용 경진 대회와 함께 연구 성과를 공유하는 워크숍을 고려대와 공동 개최한다.

이연수 엔씨 랭귀지 AI 랩 실장은 "최근 NLP 학계에서는 비용, 환경 문제로 초거대 언어모델 기반의 대화 기술에 필적할 수 있는 새로운 대화 기술들이 제안되고 있다"며 "이러한 연구 방향에 공감하는 차원에서 데이터 공개를 결정했다"고 말했다.

 

[메가경제=이석호 기자]

 

[저작권자ⓒ 메가경제. 무단전재-재배포 금지]

이석호
이석호

기자의 인기기사

뉴스댓글 >

최신기사

1

"월드컵이 전범기 무대인가"…생중계 탄 욱일기, FIFA 관리 부실 도마
[메가경제=주영래 기자] 2026 FIFA 북중미 월드컵 조별리그 일본과 튀니지 경기에서 일본 응원단이 욱일기를 펼친 장면이 중계 화면과 경기장 전광판에 노출되면서 국제 스포츠 무대의 관리·감독 책임론이 불거지고 있다.특히 이번 경기는 1930년 우루과이 월드컵 개막전 이후 월드컵 역사상 통산 1000번째 경기로 기록된 상징적인 무대였다. 전 세계 축구팬의

2

한국투자증권, 글로벌 운용사 CEO 초청행사 개최…투자상품 협력 확대
[메가경제=정태현 기자] 한국투자증권이 글로벌 자산운용사들과 손잡고 투자상품 공급 확대와 협력 강화에 나섰다. 글로벌 운용사의 투자 전문성과 한국투자증권의 리테일 자산관리 역량을 결합해 국내 투자자들의 선택지를 넓힌다는 구상이다.한국투자증권은 19일 서울 여의도 63빌딩에서 글로벌 자산운용사 13곳의 대표 및 주요 임원을 초청해 '글로벌 운용사 CE

3

삼성물산, 개포우성4차 재건축 수주…'래미안 도곡 팰리스' 제안
[메가경제=정태현 기자] 삼성물산 건설부문이 서울 강남구 도곡동 개포우성4차 재건축 사업의 시공사로 최종 선정됐다. 삼성물산은 신규 단지명으로 '래미안 도곡 팰리스'를 제안하고 차별화된 설계와 커뮤니티 시설을 선보일 계획이다.개포우성4차 재건축 조합은 20일 총회를 열고 삼성물산을 시공사로 선정하는 안건을 가결했다고 21일 밝혔다. 이 사업

HEADLINE

더보기

트렌드경제

더보기