User Defined Trigger Word Detection

 

소개

User Defined Trigger Word Detection (UTWD, 사용자 정의 기동어 검출) 엔진은 ETWD (Edge Trigger Word Detection) 엔진과 동일하게 사용자가 발화하는 음성 중에서 사전에 지정된 단어가 존재하는지 여부를 판단하여 알려주는 기능을 제공합니다. 다만, 사전에 지정된 단어가 아닌 사용자가 원하는 단어를 텍스트 입력 및 사용자 발화를 통해 등록하고 사용할수 있도록 제공하는 엔진입니다.

예를 들어, "댕댕아" 라는 표현을 등록하였다면, 사용자가 "댕댕아" 로 발화하였을 때 엔진에서 해당 단어 검출 유무를 판단하여 결과 (있다, 없다)를 알려줍니다. 스마트 스피커나 가전에서 기동어로 "하이엘지"와 같이 정해진 어휘가 아니라 나만의 애칭을 사용하고자 한다면 유용하게 사용할 수 있습니다.​

음성 데이터를 입력할 때에는 사용자 발화를 총 4회 진행해야 합니다.

 

LG AI Platform에서 제공하는 UTWD 엔진은 다음과 같은 특징을 가지고 있습니다.

HTWD 엔진의 특징
특징 설명
기동어 존재 여부 판별

사용자가 입력한 음성데이터에 미리 지정한 기동어 존재 여부를 판별하는 기능을 제공합니다.

사용자가 원하는 기동어 입력 지원

사용자가 원하는 기동어를 자유롭게 입력할 수 있습니다. 단, 한글로만 입력되어야 합니다.

기동어 입력 방법 다양화

기동어가 정확히 입력되도록, 사용자 발화를 통한 등록 뿐만 아니라 텍스트 입력도 함께 진행됩니다.

 

엔진 구조

UTWD 엔진은 아래와 같은 구조를 가지고 있습니다.  

UTWD Structure

활용하기

UTWD 엔진은 나만의 애칭을 사용하여 음성 인식 기능이 탑재된 모든 디바이스에 적용할 수 있습니다. 해당 기능을 사용하면 디바이스를 터치하지 않고 음성 인식을 시작할 수 있습니다.

 

  • 음성 비서 시스템이 탑재된 디바이스 제어

음성 비서 시스템이 탑재된 모바일 기기, 인공지능 스피커에서 음성으로 기기를 제어할 수 있습니다.

UTWD usecase 1

  • 음성 인식이 가능한 가전제품 제어

음성 인식이 가능한 가전제품에 적용하여 음성으로 가전제품을 제어할 수 있습니다.

 

UTWD usecase 2.png

  • 로봇 제어

기동어를 통해 로봇을 동작시키고 제어할 수 있습니다.

 

UTWD usecase 3