W3C

World Wide Web Consortium VoiceXML 2.0 후보 권고안 발표

막바지에 다다른 W3C 음성 입출력 인터페이스 프레임워크 개발

미국, 호주 연락처 --
Janet Daly, <janet@w3.org>, +1.617.253.5884 or +1.617.253.2613
유럽 연락처 --
Marie-Claire Forgue, <mcf@w3.org>, +33.492.38.75.94
아시아 연락처 --
Yasuyuki Hirakawa <chibao@w3.org>, +81.466.49.1170

(언어별 보도자료 : 영어, 불어, 일본어)


http://www.w3.org/ -- 2004년 2월 3일 -- 월드 와이드 웹 컨소시움 (W3C; World Wide Web Consortium)은 웹에 음성 입출력 인터페이스를 위한 VoiceXML 2.0을 후보권고안으로 공개하였다. VoiceXML 2.0은 웹에 기반으로 하는 대화형 음성 응용에 대하여 웹기반의 개발과 컨텐츠 전달에 편리성 제공을 목적으로 하고 있다.

W3C의 기술 문서가 후보 권고안으로 되는것은, 워킹 그룹에 의한 일반 및 W3C의 다른 워킹 그룹으로부터의 검토 및 의견에 대한 회답이 문제 없이 완료되었으며, 상호운영성 구현에 대한 검증이 성공되었으며, 그 결과가 공개된것임을 의미한다. 또한, 웹 표준으로 인지되고 있는 권고안(Recommendation)에 대한 최종 검토 기간인것도 의미한다.

웹에 음성 입출력 인터페이스를 제공하는 W3C 음성 입출력 인터페이스 프레임워크

1999년 이래, 웹에 사람들로 하여금 키패드, 음성 명령, 녹음이나 합성된 음성, 음악을 듣는 등의 확장을 하는 W3C는 음성 인터페이스 프레임워크 개발 작업을 해 왔다. W3C의 음성 인터페이스 프레임워크는 전 세계의 10억대를 훨씬 초과하는 방대한 수의 휴대 전화나 가입 전화를 통하여 웹에 근거한 서비스에 접근할 수 있게 된다.

음성 입출력 인터페이스 프레임워크에 음성 대화 기능을 제공하는 VoiceXML 2.0

VoiceXML 2.0은 개발자로 하여금 음성 합성, 디지털 오디오, 음성 인식, 버튼식 전화기로부터의 다이얼 톤(DTMF) 입력, 음성의 녹음, 통화 등의 음성 대화 다이얼로그를 생성한다.

"VoiceXML 2.0은 전화에 의한 정보 시스템이나 고객 서비스의 구현 방법을 크게 바꾸는 힘이 있다. 벌써 "무엇무엇의 경우는 1을, 그렇지 않은 경우는 2를 누르세요" 등이라고 말해지는 것은 있지 않다. 대신, 음성으로 선택지나 정보를 전하거나 선택할 수 있게 된다. 또한, VoiceXML 2.0은 눈이 불편한 사람이나, 자동차의 운전증 손이나 한눈 팔 수 없는 상황하에서 웹 접근을 필요로 하는것에 그 기회를 제공한다"라고 W3C의 Voice Browser 활동 리더인 Dave Ragget은 설명하고 있다.

W3C 음성 인터페이스 프레임워크에는 VoiceXML은 어플리케이션과 사용자의 대화 제어 방법을 제공한다. 또한, 음성 합성 기술 언어(SSML)은 음성 입력시에 이용되며, 음성 인식 문법 사양(SRGS)는 예상되는 사용자 응답을 기술하는 문법을 통한 음성 인식 시스템에 이용되며, VoiceXML이나 다른 대화 시스템에 통화 호출 제어 기능을 제공하는 호출 제어 기술 언어(CCXML)와 SRGS에서 구문이나 의미를 규정하는 음성 인식 의미 해석도 프레임워크에 포함된다.

이미 업계에서 광범위하게 이용되고 있는 VoiceXML 2.0

W3C의 후보권고안 상태를 개선하기 위해서는 독립적인 상호운영 가능한 구현의 증거를 제공하여야 한다. 이는 본 표준이 문제 없이 이용될 수 있다는것을 검증하지 않으면 안되는것을 의미한다. VoiceXML 2.0의 경우에는, 프로토타입과 완전히 구현된 제품들로 최소한 잘 알려진 8개의 구현을 제공한다. 현재 구현되어 있는 리스트는 이용 가능하다.

VoiceXML 2.0에는 확장 테스트슈트도 제공한다. 초기 버전으로는 300개 정도의 테스트로 구성되어 있으나, 최종 버전에는 500개 이상의 테스트로 구성될 예정이다. 테스트 슈트에 대한 최신 정보는 Voice Browser 공개 메일링 리스트에 소개될 예정이다.

이 테스트 슈트는 2002년 6월에 W3C의 호보 권고안이 된 음성 인식 문법 사양(SRGS)와 함께 공개된 테스트 슈트를 보완한 것이다. 음성 합성 기술 언어(SSML)을 포함하는 다른 W3C 음성 입출력 인터페이스 프레임워크에 대한 테스트 슈트는 W3C의 Voice Browser 워킹 그룹에서 개발이 진행되고 있고, 수개월 후에는 공개될 예정이다.

음성 인터페이스 프레임워크로의 발전, 그리고 특허 문제의 해결

W3C의 Voice Browser 워킹 그룹은 W3C 안에서도 가장 활발한 워킹그룹 중의 하나이다. 이 워킹 구룹의 참여자로는 BeVocal Inc., 캐논, Comverse, France Telecom, Genesys Telecommunications Laboratories, HP, HeyAnita, 히타치 제작소, IBM, Intel, Loquendo, Microsoft, MITRE, 미쓰비시 전기, Motorola, Nokia, Nortel Networks, Nuance, Philips, PipeBeach, SAP, ScanSoft, SnowShore Networks, SpeechWorks, Sun, Syntellect, Tellme Networks, Unisys, Verascape, VoiceGenie, Voxeo, Voxpilot 등이다.

Voice Browser 워킹 그룹이 채택한 로열티 프리 라이센스 방식과의 모순에서 발단한 특허 문제에 대해서는 W3C의 특허 취급 운용 규약(Current Patent Practice)에 근거하여 W3C 안에 설치된 특허 자문 위원회(PAG)에 근거하여 해결되었다. 이에 따라 VoiceXML 2.0의 핵심에 대한 사양에 대해서는 W3C의 로열티 프리 라이센스에 따라 이용 가능할 수 있도록 W3C의 Voice Browser 워킹 그룹은 개방적인 사양의 책정에 찬성하고, Voice Browser 특허 자문 위원회에 의한 문제 해결에 이르렀다.

월드 와이드 웹 컨소시움[W3C]에 대하여

W3C는 웹 관련 상호운영성과 기술혁신을 주도하는 프로토콜 개발 등 웹을 주도하기 위하여 창립되었다. W3C는 국제 산업 컨소시움으로 미국 MIT 컴퓨터 과학 인공지능 연구소(CSAIL), 프랑스에 본부를 두고 있는 유럽 정보 처리수학 연구 컨소시엄(ERCIM), 그리고 일본의 게이오 대학에서 운영되고 있다. 컨소시움은 개발자와 사용자를 위한 WWW에 관한 정보의 공급, 새로운 기술의 사용을 설명하기 위한 다양한 프로토타입과 샘플 애플리케이션 등의 서비스를 제공하고 있다. 현재까지 400여 기관들이 컨소시움의 회원으로 가입하고 있으며, 이에 대한 추가 정보는 홈페이지(http://www.w3.org/)를 참조하면 된다.