(주)센텍정보기술

페이지 정보

작성자 관리자
댓글 0건 조회 2,924회 작성일 23-05-08 15:50

음성AI 국내 선두 기업 파워보이스!

당사와 전략적 협업파트너인 파워보이스는 음성인식과 화자인식이라는 기술 분야에서 국내 1위의 기업이며

관련분야에 40여종의 특허를 보유하고 있으며 당사와 전략적으로 기술, 영업을 협업하고 있습니다.

화자인식

등록된 여러개의 목소리를 비교하여 지금 말하는 화자가 누구인지를 알아내는 화자 인식(Speaker Recognition)

즉, 화자 인증이다. 예를 들어 AI스피커는 등록된 여러개의 목소리와 화자의 목소리를

목소리 패턴과 음색 등을 인식 비교하여 가장 유사도가 높은 목소리의 주인공을 추정하고, 주인공 핸드폰에 블루투스를 연결하는 명령을 수행합니다.

화자분리

여럿이 함께 얘기를 나눌때 필연적으로 대답을 하는 화자가 동시에 여러명이 생긴다거나, 혹은 말 끼어들기 등이 벌어지는데

화자 분리는 여러 화자의 목소리가 겹칠 때 이를 따로 따로 떼어내어 인식할 수 있도록 분리해주는 기술을 칭한다.

이 기술을 보이스 필터(Voice Filter)라고도 부르는데, 보이스 필터는 화자 분리와 달리 이미 등록된 목소리만을 남겨서

음성 인식의 정확도를 높이기 위한 도구로 활용된다.

파워보이스의 대표적인 기술로

1. STT (비정형 무제한 자연어 음성인식 :

• DNN-HMM hybrid STT (kaldi nnet3) : 딥러닝 기반 자체엔진, 학습모델링(base line 음성인식율 94%), 실시간 자동전사

• DNN End-to-End STT : 음향모델과 언어모델의 구분없이 딥러닝 모델링

• 16KHz 음성데이터 5000여 시간 학습용데이터 자체구축, 8KHz 전화음성데이터 1700여 시간 학습용데이터 자체구축

• 음향모델(AM), 언어모델(LM) 강화학습을 통한 Fine-Tunning 지원

2. TTS (딥러닝기반 자연어 음성합성) :

• End-to-End 학습 기술에 의해 딱딱한 기계음성이 아닌 사람처럼 자연스러운 합성음성 제공

• Transfer learning based End-to-End TTS : 소용량 적응 음성 DB 학습 기술

• 다양한 언어처리 기술과 음성 신호처리 기술 및 DNN기반 인공지능 기술을 바탕으로 사람과 같은 자연스러운 합성 음성을 제공

• 고도화된 경량화, 고속화 기술로 다양한 문장의 음성합성을 실시간으로 제공

3. SV (화자인증) :

• Adaptive component weighting을 이용한 화자별 음성 특징 파라미터 추출 알고리즘을 통해 화자간 변별력을 최대화

• 음성정보를 최소화하고 생체 정보를 최대화하는 혼합모델 VQ/HMM 화자 판별 알고리즘을 개발

• 다양한 언어처리 기술과 음성 신호처리 기술 및 DNN기반 인공지능 기술을 바탕으로 사람과 같은 자연스러운 합성 음성을 제공

• 화자 적응 기술과 Signal bias removal 알고리즘을 적용하여 소량의 학습 데이터만으로도 잡음에 강인한 화자인식 시스템을 개발