모질라의 '공통 음성'– 음성 인식 개선을위한 크라우드 소싱 데이터베이스


스코틀랜드의 깊은 억양에 대해 많은 칭찬을 받았지만 Siri 및 Alexa와 같은 음성 앱의 경우 내 목소리는 자산 이상의 책임입니다. 애플과 아마존이 음성 어시스턴트를 만들었을 때, 그들은 단축 다이얼에 대한 스코틀랜드의 억양 컨설턴트를 갖고 있지 않은 것 같았다.

음성 인식이 미래의 길로 생각된다면 – 아마도 검색 엔진과 음성 도우미는 어려운 악센트를 이해하는 데 도움이되는 작업을 시작해야합니다. 우리 모두에게 공개 영어 남학생 억양이있는 것은 아닙니다.

Mozilla (Firefox 브라우저 제작자)는 사람들에게“일반적인 목소리 “라는 데이터베이스에 자신의 목소리를 자발적으로 요청하여 문제를 해결하려고 시도하고 있습니다. 모질라는 문구를 설정하기 위해 음성을 일치시킴으로써, 음성 인식에 따라 미래에 데이터베이스가 모든 앱에서 귀중한 도구가되기를 희망합니다.

'공통 음성'에 가입

우리가 더 나아 가기 전에 프라이버시 문제를 먼저 해결해 보겠습니다. 이미 들어온 소리를들을 수 있습니다.

Firefox 계정, Github 계정 또는 Google 계정을 사용하여 가입 할 수 있지만 대신 이메일을 통해 가입 할 수 있습니다 . 익명의 일회용 이메일 계정을 개설하면 아무도 더 현명한 사람이 될 수 없습니다.

계정을 만들고 로그인하면 대시 보드 참조 이됩니다.

두 섹션이 있습니다 – 듣기. 말하기섹션은 자신의 목소리를 낼 것을 요구하는 곳입니다. 듣기는 다른 사람들의 목소리를 듣고 그들이 말하는 문구와 비교하는 곳입니다. 그런 다음 올바른지 표시합니다.

말하기

말하기 섹션에 참여하려면 음성을 선명하게들을 수있는 작동 마이크가 필요합니다. 또한 Mozilla 사이트에 해당 마이크에 대한 액세스 권한을 부여해야합니다.

말하기섹션을 클릭하면 말할 수있는 5 개의 무작위 문구가 제공됩니다. 지침은 화면에 매우 명확하고 따르기 쉽습니다.

아래의 마이크 아이콘을 클릭 한 다음 일반적인 음성 톤으로 문장을 읽으십시오. 부 자연스러운 악센트를 입거나 너무 천천히 말하지 마십시오.

연습의 요점은 데이터베이스가 사람들이 일반적으로 말하는 방식을 이해하는 법을 배우는 것입니다. 다른 방법으로 말하면 모든 것이 무의미 해집니다.

첫 번째 문구가 끝나면 오른쪽 상단 모서리에 클립을 재생하고 클립을 다시 기록 할 수있는 옵션이 표시됩니다 당신은 그것에 만족하지 않습니다.

만약 마음에 드신다면 다음 문구로 넘어 가서 5 개의 문구가 모두 끝날 때까지 계속합니다. 그런 다음 파란색 제출 버튼을 클릭하여 클립을 Mozilla로 보내 확인하십시오.

이제 대시 보드로 로 돌아 가면 해당 문구에 대한 크레딧이 부여되었음을 알 수 있습니다.

그런 다음 간단한 헹굼 및 반복 사례입니다. 모질라가 데이터베이스에 더 많은 기여와 액센트를 더 많이 넣을수록 프로젝트는 더 성공적 일 것입니다.

듣기

사람들이 모질라에 문구를 제출하면 확인해야합니다 음성 클립이 문구와 일치하는지 확인하십시오. 이것은 또한 자원 봉사자들에게 크라우드 소싱되는 것입니다.

뒤로 대시 보드에서, 오른쪽에 듣기섹션이 있습니다. Top Contributors (최고 기여자)섹션에서 심각한 통계가 쌓여 있음을 확인할 수 있습니다.

음성 문구를 확인하려면 그만큼 들리다 로 이동하십시오.  부분 그러면 문구와 재생 버튼이 제공됩니다.

재생 버튼을 클릭하면 (스피커가 켜져 있는지 확인하십시오!) 녹음 된 음성이 들립니다. 문구가 올바르게 사용되었다고 판단되면 를 클릭하십시오. 잘못된 발음, 다른 말 또는 다른 오류가있는 경우 아니요를 클릭하십시오.

결론

이것은 Mozilla가 현재 진행하고있는 많은 프로젝트 중 하나 일뿐입니다 (모질라 웹 사이트 를 클릭하고 상단의 프로젝트를 클릭하십시오. 항상 변경됩니다). 크라우드 소싱은 가치있는 프로젝트가 발생하기에 좋은 방법이며, 미래에 유용한 무언가를 구축하는 데 도움을주기 위해 항상 시간을 기부 할 가치가 있습니다.

관련 게시물:


5.08.2019