Simon - napisany w C++ open source’owy system głosowego sterowania interfejsem użytkownika, choć mało znany, może okazać się ciekawym rozwiązaniem.
Simon - napisany w C++ open source’owy system głosowego sterowania interfejsem użytkownika, choć mało znany, może okazać się ciekawym rozwiązaniem.
Austriacki system sterowania głosem , który ma w założeniu zastąpić myszkę i klawiaturę w nawigacji, opiera się na nowatorskim podejściu do przetwarzania języka. Użytkownik musi zainwestować trochę wysiłku w jego dostosowanie do własnych potrzeb, otrzymuje on jednak interesujący, w pełni dopasowany do niego produkt.
O założeniach projektu Simon (od Simon Listens – Simon słucha) mówi jego twórca Peter Grasch: - Przyjęty model zawiera w sobie informacje na temat samego języka. Tym językiem może być właściwie cokolwiek: standardowy angielski, francuski a nawet klingoński. Model ten musi zawierać „słowa” oraz przypisane im dźwięki. Dźwięki reprezentowane są jako fonemy (które mają się tak do mowy, jak litery do słów pisanych). Pomimo, że istnieją już zdefiniowane alfabety fonetyczne – jak IPA czy X-SAMPA, użytkownik może samodzielnie zdefiniować własne. Model ten także określa, które kombinacje słów są poprawne (jest to rodzaj „gramatyki”).
Zaleta tego rozwiązania, w porównaniu do produktów komercyjnych, jest fakt, że użytkownik dostaje program bez predefiniowanego systemu mowy. Dzięki temu możliwe jest utworzenie własnego systemu, niezależnie od konkretnej wymowy lub jej wad. Użyteczność ta może znaleźć zastosowanie między innymi dla osób dotkniętych spastycznością lub mówiących niewyraźnie. Minusem tego rozwiązania jest ogromna ilość czasu, jaką poświęcić musi użytkownik na budowę własnego systemu, by móc płynnie dyktować dłuższe teksty - według autora jest to kilka tysięcy godzin.
Za niewątpliwą zaletę uznać można także pełną integrację Simona ze środowiskiem KDE, a po pewnym zmianach również Windows. Wydaje się także, że podejście polegające na tworzeniu własnego systemu mowy w dobie personalizacji rozwiązań software’owych jest bardziej przyszłościowe, niż opieranie rozpoznawania mowy o gotowe scenariusze dźwiękowe. Czas, który użytkownik poświęci na opracowanie własnego systemu zwraca się, gdyż może on określić zestaw najistotniejszych i najczęściej używanych, z jego punktu widzenia, komend. Obiecującym rozwiązaniem jest modularność, czyli integracja komendy, bądź zestawu komend i tekstu, pod jedną etykietą dźwiękową.
Co ciekawe, pomimo że projekt ten pisany był pod KDE, czyli środowisko *NIXowe, to lepiej radzi sobie w środowisku Windows.
Źródło: kdenews.org, linuxnews.pl
Pobierz ebook "Social media marketing dla firm i agencje się w nim specjalizujące"
Zaloguj się, a jeśli nie masz jeszcze konta w Interaktywnie.com - możesz się zarejestrować albo zalogować przez Facebooka.
Pomagamy markom odnosić sukces w Internecie. Specjalizujemy się w pozycjonowaniu stron, performance marketingu, social …
Zobacz profil w katalogu firm
»
1stplace.pl to profesjonalna agencja SEO/SEM, specjalizująca się w szeroko pojętym marketingu internetowym. Firma oferuje …
Zobacz profil w katalogu firm
»
Projektujemy i wdrażamy strony internetowe - m.in. sklepy, landing page, firmowe. Świadczymy usługi związane …
Zobacz profil w katalogu firm
»
Pozycjonujemy się jako alternatywa dla agencji sieciowych, oferując konkurencyjną jakość, niższe koszty i większą …
Zobacz profil w katalogu firm
»
W 1999 roku stworzyliśmy jedną z pierwszych firm hostingowych w Polsce. Od tego czasu …
Zobacz profil w katalogu firm
»