Multi-device Arbitration for Seamless ASR

 

소개

MASA (Multi-device Arbitration for Seamless ASR) 서비스는 여러 기기가 있을 때, 사용자의 의도에 적합한 기기를 선택하여 구동합니다. 또한, Seamless ASR 기능이 적용되어 기동어와 명령어를 구분하지 않고 발화해도 동작 가능합니다.

기동어 (Keyword, Trigger-word, Hotword, Wakeup-word)는 음성인식 (Automatic Speech Recognition, ASR)을 구동하는 방법으로 널리 사용되고 있습니다. 최근에는 기동어가 단순히 음성 인식을 구동하기 위한 기능을 넘어, 사용자가 음성인식 경험을 향상시킬 수 있는 다양한 기능을 할 수 있도록 개발하여 제품에 적용되고 있습니다.

 

ThinQ AI MWA_01.png

 

LG AI Platform에서 제공하는 MASA 서비스는 다음과 같은 특징을 가지고 있습니다.

MWA 엔진의 특징
특징 설명

Seamless ASR

기존에는 사용자가 기동어를 발화하면 Display나 알람음을 통해 기동어가 인식되었음을 인지한 후에 명령어를 발화하였습니다. 그러나 Seamless ASR은 기동어와 명령어를 연속해서 발화하면 기동어와 명령어를 구분하여 인식할 수 있습니다.

선택적 알람 (Selective Trigger-word Alarm, STA)

기존의 음성인식 방법과 Seamless ASR에 따라 기기의 알람음을 선택적으로 재생할 수 있습니다.

서버 기동어 거절

Application에서 인식한 기동어를 서버에서 한번 더 검증합니다. 기동어 오인식으로 판단되면, 서버에서 해당 기동어에 대한 거절 결과를 전송하여 기기 오작동을 방지합니다.

하나의 기기 선택

동일한 기동어를 사용하는 여러 기기에서 동시에 기동어를 인식한 경우, 사용자의 의도를 파악하여 하나의 기기를 선택하여 동작할 수 있도록 합니다.

 

구조

MASA 서비스의 모든 기능은 서버에서 구현 및 동작합니다. MASA 서비스는 PCM 데이터 및 JSON 데이터를 입력값으로 받아 결과를 전달합니다.

ThinQ AI MWA_03-2.png

 

활용하기

MASA 서비스는 일상생활에서 다양하게 활용할 수 있는 기능입니다.

예를 들어, ’하이엘지’ 라는 기동어를 인식하는 가전제품들이 모여 있는 공간에서 사용자가 ’하이엘지’ 라고 말을 하면 모든 가전제품이 해당 기동어를 인식합니다.

기동어 인식 후, MASA 서비스는 사용자의 방향, 거리 등을 측정해서 사용자와 가까이에 있는 가전제품을 선택하고 그 제품의 피드백을 받습니다.

MWA 엔진이 적용된 가전제품 중 사용자와 가까이에 있는 제품이 사용자의 키워드에 반응하는 그림