Speech Signal Processing

 

소개

SSP (Speech Signal Processing, 음성 신호 처리) 엔진은 음성 통신, 음성 인식과 같은 애플리케이션을 위한 필수 기능입니다.

일반적으로 마이크에 입력되는 음원은 주변에서 발생한 여러 잡음이 포함되어 있어 품질이 좋지 않습니다.

낮은 품질의 음원은 음성 통화나 음성 인식 프로그램에서 그대로 사용할 수 없기 때문에 SSP 엔진을 사용하여 잡음을 제거하고 음원의 품질을 향상시켜야 합니다. 

 

SSP 엔진의 동작 과정

 

LG AI Platform에서 제공하는 SSP 엔진은 다음과 같은 특징을 가지고 있습니다.

SSP 엔진의 특징
특징 설명
다채널 PCM 데이터 지원

SSP 엔진은 단일 또는 다채널 마이크를 지원합니다. 또한, 참조 신호로 1, 2 채널 PCM 데이터 파일을 사용해서 다양한 기기에 SSP 엔진을 적용할 수 있습니다.

음성 인식 전처리 과정에 적합한 알고리즘 탑재

SSP 엔진은 성능이 뛰어난 Acoustic Echo Cancellation (AEC)과 Noise Reduction (NR) 알고리즘을 탑재해서 음성 인식을 위한 전처리 과정에 매우 적합합니다.

뛰어난 AEC 성능

SSP 엔진의 AEC는 스피커에서 출력되는 다양한 신호의 에코(Echo)를 효과적으로 제거합니다.

뛰어난 NR 성능

SSP 엔진의 NR은 Beamforming과 Source Separation 기술을 모두 갖추고 있어 다채널 마이크 사용 환경에서도 최고의 성능을 제공합니다.

자유로운 Gain 조절

음성 인식의 신뢰도를 높이기 위해 Auto Gain Control, Dynamic Level Control, Limiter, Parametric EQ 등으로 다양하게 Gain 값을 조절할 수 있습니다.

원거리 음성 인식

소리가 작은 원거리의 음성까지 인식할 수 있습니다.

잡음 및 에코(Echo)제거율 조절

주변 잡음/에코가 심한 환경에서도 잡음/에코를 효과적으로 처리하며 사용자의 기호에 맞게 잡음/에코 제거율과 음성 보존 정도를 조절할 수 있습니다.

다양한 동작 모드 지원

Keyword, Recognition, Beamforming 모드를 제공하기 때문에 다양한 음성 인식 기기에 적용할 수 있습니다.

WNR (Wind Noise Reduction) 적용

Wind Noise, 도로 노면, 그 외의 Non-linear 한 환경에서 발생하는 돌발성 잡음을 선택적으로 제거할 수 있는 WNR 가 적용되어 있습니다.

튜닝 툴

UI 기반의 SSP 엔진 튜닝 툴을 이용하여 각 모듈의 인자를 튜닝하고 시뮬레이션할 수 있습니다.

 

엔진 구조

SSP 엔진은 SSP Core와 Config Data로 구성되어 있으며 PCM 데이터를 입력값으로 받고 음질이 개선된 PCM 데이터를 생성하여 출력합니다.

 

SSP 엔진 아키텍쳐

 

활용하기

SSP 엔진은 음성 기반의 서비스가 필요한 다양한 분야에서 활용할 수 있습니다.

 

  • 로봇 플랫폼의 음성 인식을 위한 음질 향상

주변 잡음 및 소음을 제거하여 로봇 플랫폼에서 인식하는 음성의 품질을 향상시킵니다.

 

SSP 엔진 활용 방법

  • 가전제품의 음성 인식을 위한 음질 향상

가정에서 발생하는 주변 잡음 및 소음을 제거하여 음성 인식 품질을 향상시킬 수 있습니다.

SSP 엔진은 가전제품의 음성 인식을 위해 음질을 향상시킵니다.