Target Speech Enhancement

 

소개

TSE (Target Speech Enhancement, 음성 전처리) 엔진은 차량용 인포테인먼트 시스템에서 음성 인식 성능 향상을 위한 필수적인 요소입니다.

차량 내에서 입력되는 음원은 주변에서 발생한 여러 잡음이 포함되어 있어 품질이 좋지 않습니다.

낮은 품질의 음원은 음성 통화나 음성 인식 프로그램에서 그대로 사용할 수 없기 때문에 TSE 엔진을 사용하여 잡음을 제거하여 음원의 품질을 향상시켜야 합니다.

 

TSE 엔진의 동작 과정

 

LG AI Platform에서 제공하는 TSE 엔진은 다음과 같은 특징을 가지고 있습니다.

TSE 엔진 특징
특징 설명
음성 인식 전처리 과정에 적합한 알고리즘 탑재

TSE 엔진은 성능이 뛰어난 Acoustic Echo Cancellation (AEC)과 Noise Reduction (NR) 알고리즘을 탑재해서 음성 인식을 위한 전처리로써 매우 적합합니다.

뛰어난 AEC 성능

TSE 엔진의 AEC는 스피커에서 출력되는 다양한 신호의 에코를 효과적으로 제거합니다.

뛰어난 NR 성능

TSE 엔진의 NR은 Beamforming(BF)과 Source Separation(SS) 기술을 모두 갖추고 있어 multi-mic 사용 환경에서도 최고의 성능을 제공합니다.

자유로운 Gain 조절

음성 인식의 신뢰도를 높이기 위해 Auto Gain Control, Dynamic Level Control, Limiter, Parametric EQ 등으로 다양하게 Gain 값을 조절할 수 있습니다.

원거리 음성 인식

소리가 작은 원거리의 음성까지 인식할 수 있습니다.

잡음 제거율 조절

주변 잡음이 심한 환경에서도 잡음을 효과적으로 처리하며 사용자의 취향에 맞게 잡음 제거율과 보존 정도를 조절할 수 있습니다.

에코 제거율 조절

에코가 심한 환경에서도 에코를 효과적으로 제거하며 사용자의 취향에 맞게 에코 제거율과 음성 보존 정도를 조절할 수 있습니다.

다양한 동작 모드 지원

Handsfree, CarPlay, Telematiccs, Speech Recognition 등 다양한 동작 모드를 지원함으로써 통화 및 음성 인식 솔루션에 적합합니다..

 

엔진 구조

TSE 엔진은 TSE Core와 Config Data로 구성되어 있으며, PCM 데이터를 입력값으로 받고 음질이 개선된 PCM 데이터를 생성하여 출력합니다.

 

TSE 엔진 아키텍쳐

 

성능 지표

차량에서 측정한 TSE 엔진과 타사 엔진의 성능 지표입니다.

 

실험 환경

  • 실제 차량 환경
  • ITU-T P.1100/1110 표준 준수
  • IDLE 상태와 120 km/h 주행 상태에서 측정한 성능지표

 

실험 결과

항목 자사 TSE 엔진 타사 (Q사)
3QUEST Scene1 4.02 3.9
3QUEST Scene2 3.27 2.74
3QUEST Scene3 2.86 2.54
3QUEST Scene4 2.76 2.54
Receive TOSQA 3.28 3.23
Sending TOSQA 2.99 2.81
TCLW 58.2 53.7

 

활용하기

TSE 엔진은 차량용 인포테인먼트 시스템에서 음성, 통화, 음성 인식 성능 개선을 위해 다양하게 활용할 수 있습니다.

 

  • 차량 내에서의 음성 인식을 위한 음질 향상

차량 내/외부에서 발생하는 다양한 소음을 제거하여 음성 인식 품질을 향상시킬 수 있습니다.

TSE 엔진이 적용된 차량