Powstała aplikacja AI, która daje głos osobom z zaburzeniami mowy

Wszyscy przyznamy, że technologia cieszy szczególnie, gdy wykorzystywana jest do wyższych celów. To dzięki niej przyszłość dzieje się na naszych oczach. Ostatnio pięknie udowodniła to izraelska firma, która stworzyła aplikację AI, dokonującą transkrypcji zaburzeń mowy w czasie rzeczywistym. Efekt? Dzięki niej osoby z różnymi ograniczeniami mowy mają móc spontanicznie komunikować się z otoczeniem. Sprawdźmy szczegóły.

Aplikacja AI do tłumaczenia mowy z zaburzeniami

Program Voiceitt 2, bo tak nazywa się ta propozycja, został stworzony przez izraelską firmę Voiceitt i jest jej drugą ofertą na rynku aplikacji mobilnych. 

Jego głównym zadaniem jest bieżące tłumaczenie mowy, którą charakteryzują różnego rodzaju defekty. Chodzi tu przede wszystkim o zaburzenia będące następstwem ciężkich chorób albo np. podeszłego wieku. Ponadto aplikacja Voiceitt 2 z powodzeniem poradzi sobie także np. z obcojęzycznym akcentem, który nie raz i nie dwa potrafi znacznie zniekształcić wypowiedź. Wszystko po to, aby możliwie najskuteczniej pomóc swoim użytkownikom komunikować się za pomocą własnego głosu – bez względu na ich niepełnosprawność lub inne trudności w mówieniu. 

Wyjątkowość tej aplikacji tkwi także w jej specyficznej i nad wyraz zaawansowanej formie, która w znacznej mierze opiera swoje działanie na algorytmach sztucznej inteligencji, czerpiącej m.in z dobrodziejstw ChatGPT. Program Voiceitt 2 szybko i z wysoką precyzją przekłada usłyszane dźwięki na poprawną mowę. Przeprowadzona za jego pomocą transkrypcja sprawia, że osoba korzystająca z zalet tej aplikacji staje się natychmiast zrozumiała dla swojego odbiorcy.

aplikacja Ai

Voiceitt a Voiceitt 2 – najważniejsze różnice 

Pierwotna wersja aplikacji, którą od nazwy firmy nazwano po prostu Voiceitt, również tłumaczyła mowę z zaburzeniami. Ograniczała się jednak wyłącznie do transkrypcji zniekształconych poleceń w oparciu o system uczenia maszynowego, szczególnie w zakresie stylu mowy konkretnej osoby. Mówiąc prościej, potrafiła przetłumaczyć polecenie dopiero wtedy, „zapamiętała” wiele potrzebnych do tego fraz i wzorców zachowania oraz wypowiedzi użytkownika. 

Jej dodatkową zaletą był fakt, że doskonale sprawdzała się, jako pośrednik do wydawania poleceń głosowych inteligentnym systemom smart home,  w tym np. Amazon Alexa, co miało skutecznie ułatwiać codzienne życie osób z niepełnosprawnością. 

Z kolei Voiceitt 2 wychodzi o krok dalej i oprócz powyższego oferuje możliwość tłumaczenia wypowiadanych, zniekształconych słów w czasie rzeczywistym. Umożliwia w ten sposób jeszcze bardziej spontaniczną, niemal niczym nieskrępowaną komunikację z otoczeniem. 

Ale to nie wszystko. Współpraca Voiceitt 2 z asystentami AI, takimi jak ChatGPT, daje również możliwość  wykorzystywania atutów aplikacji nie tylko podczas rozmów na żywo, ale i np. wideokonferencji na Teams albo Zoom, w których sprawdza się doskonale jako tłumacz zniekształconej mowy na żywo, podając prawidłowe słowa w formie napisów. 

Wprowadzenie na rynek Voiceitt2 jest ważnym kamieniem milowym w ewolucji technologii i biznesu Voiceitt (...) Przenosi dotychczasowe formy użycia na wyższy poziom, umożliwiając osobom z zaburzeniami mowy spontaniczne mówienie."
Alyson Pace
dyrektor generalny Voiceitt
aplikacja smartfon AI

Jak działa aplikacja Voiceitt 2?

Korzystanie z aplikacji bazującej na AI jest bardzo proste, ale zanim nastąpi, trzeba nieco „nakierować ją” na nasze indywidualne potrzeby. 

Po pierwsze, zanim zaczniemy korzystać z jej atutów, musimy ją przeszkolić, aby znała i rozumiała nasz głos. Na taki kurs, podobnie jak w pierwszej wersji programu, składa się około 400 fraz, zawierających około 3-4 słów. Przyda się cierpliwość, ale warto do tego podejść na poważnie. Im dokładniej przeprowadzona będzie ta część, tym jest większa szansa, że program lepiej sprawdzi się w praktyce. 

Kolejny etap to główne zastosowanie tego programu, czyli tzw. tryb mowy, polegający na bieżącym tłumaczeniu zniekształconych słów. Wystarczy wypowiadać zdania, a aplikacja pokaże ich tłumaczenie na ekranie smartfona – tak, aby użytkownik mógł je szybko pokazać osobie, z którą chce się w danym momencie porozumieć. Dodatkowo istnieje tu również opcja zadawania pytań głosowych dla ChatGPT. 

Trzecia możliwość, to tzw. tryb dyktowania. Polega on na przenoszeniu mowy na tekst, który wyświetli się na ekranie smartfona w formie notatki.  Ma to na celu np. szerszą edycję lub poprawę interpunkcji. Tak „złapany” tekst można też wygodnie udostępniać, np. w postaci wiadomości tekstowej albo e-maila. 

Cena i dostępność Voiceitt 2

Voiceitt 2 to aplikacja działająca wyłącznie na abonament, którą można zamówić przez pośrednika razmobility.com

Za miesiąc korzystania z jej zalet użytkownicy muszą zapłacić 49,99 USD. Z kolei roczna subskrypcja wynosi 499,99 USD. Zanim jednak będzie trzeba zapłacić, firma Voiceitt proponuje 30-dniowy okres próbny, po którym można anulować subskrypcję bez żadnych kosztów. 

Program Voiceitt 2 współpracuje z systemem zarówno z systemem iOS, jak i Android. 

Przeczytaj też:

Źródła tekstu: 
  • https://www.razmobility.com/solutions/voiceitt/,
  • https://www.voiceitt.com/,
  • https://www.mobihealthnews.com/news/new-app-called-voiceitt-helps-folks-non-standard-speech-communicate,
  • https://nocamels.com/2023/08/new-web-app-gives-a-voice-to-people-with-speech-impairment/