poniedziałek, 30 stycznia, 2023
Strona głównaKulturaSyntezator mowy IVONA. Polski program, który podbił świat

Syntezator mowy IVONA. Polski program, który podbił świat

Kiedy w 2005 roku na rynku pojawia się polski syntezator mowy IVONA, okrzyknięty zostaje on prawdziwą rewolucją. Program stworzony przez trójmiejskich informatyków otrzymał wiele prestiżowych nagród, ale w pewnym momencie został sprzedany innej firmie. Co stanowiło tego przyczynę?

Nie ukrywam, że jakkolwiek dziwnie mogłoby to nie zabrzmieć dla osób niezaznajomionych z tematem, syntezator mowy IVONA był kawałkiem mojego dzieciństwa. I serio, większość osób raczej oceniłaby, że bardziej kojarzyłbym z dawnych lat jakąś grę albo program telewizyjny aniżeli aplikację służącą do wypowiadania napisanych słów. Żeby jednak uzasadnić, dlaczego syntezator ten mogę postawić na tej samej półce co klasycznego Brick Game czy pegasusowego kartridża, musimy cofnąć się do samego początku.

Syntezator mowy IVONA. Cyfrowa rewolucja w Polsce

Jak napisałem na wstępie, program został wydany w 2005 roku. Nie stanowił on co prawda pierwszej próby utworzenia aplikacji czytającej słowo pisane, ale wykorzystana wówczas technologia naprawdę robiła wrażenie. IVONA była dziełem Łukasza Osowskiego oraz Michała Kaszczuka, dwóch studentów Politechniki Gdańskiej.

Samo przedsiębiorstwo Ivo Software pojawiło się jednak znacznie szybciej, ponieważ już w 2001 roku, zaś jego siedziba początkowo mieściła się w Parku Naukowo-Technologicznym w Gdyni, potem zaś w kompleksie Olivia Business Center w Gdańsku. Pierwszym produktem wypuszczonym przez dwóch uzdolnionych twórców był Spiker 1.0, który choć obecnie raczej uchodzi za zapomniany, to w tamtym okresie świetnie sprawdzał się choćby w telefonach komórkowych. Przy tym bardzo pomagał osobom niewidomym i słabo słyszącym, co także będzie miało znaczenie przy samym syntezatorze IVONA.

Kilka lat później Ivo Software wypuszcza Speaker Mobile bazujący na podobnych, niezwykle prostych zasadach co poprzednia aplikacja. Posiadanie programu pozwalało osobom niepełnosprawnym łatwiej obsługiwać swoje telefony, a także korzystać z funkcji, które wcześniej były dla nich całkowicie niedostępne. Innowacyjność firmy została doceniona i w 2004 roku otrzymała ona medal „Gdynia bez Barier”.

Ogrom prestiżowych nagród spowodował, że popularność syntezatora zwiększyła się jeszcze bardziej. Firma cieszyła się dużym zainteresowaniem swoimi produktami, co przełożyło się na możliwość zainwestowania w dzieło znacznie większe – wspomniany syntezator IVONA. Łukasz Osowski w jednym z udzielonych wywiadów przyznał, że to właśnie finanse stanowiły największy problem funkcjonowania firmy w pierwszych latach jej działalności. Nie zgłosili się bowiem żadni zewnętrzni inwestorzy.

Od lewej Łukasz Osowski i Michał Kaszczuk – ojcowie syntezatora IVONA

Ostatecznie IVONA okazała się pod względem swych funkcji o wiele lepsza niż produkty konkurencyjne. Przede wszystkim kwestie wypowiadane przez syntezator, choć pozbawione emocji, były całkowicie zrozumiałe i płynne. Sztuczna inteligencja sprawdzała się pod tym względem naprawdę dobrze, a efekt końcowy mógł zostać odsłuchany jeszcze przed zapisaniem głosu w postaci pliku dźwiękowego. Późniejsze wprowadzenie narzędzia Expressivo pozwoliło na dodatkowe opcje takie jak wykorzystanie programu jako lektora do filmu (oczywiście użytkownik musiał posiadać do niego napisy) lub tekstu zawartego na stronie internetowej.

Aplikacją zainteresowały się potężne polskie przedsiębiorstwa takie jak choćby PKP. Nawet dzisiaj charakterystycznego głosu posłuchać można od czasu do czasu na dworcach lub w komunikacji miejskiej. Za jego pośrednictwem dowiadujemy się, czy nasz pociąg się spóźni, czy może w ogóle nie przyjedzie. Informuje on także o kolejnych przystankach i o konieczności niezbliżania się do krawędzi peronu. Czasami jest to głos męski, a czasami damski – tu akurat wypowiadam się z perspektywy osoby z okolic Trójmiasta.

Syntezator mowy IVONA. Uznanie na świecie

IVONA zdominowała polski rynek, ale z czasem zdołała wspiąć się jeszcze wyżej. W 2006 roku National Geographic przyznało syntezatorowi nagrodę Traveler za odkrycie roku. Sukcesów było znacznie więcej, lecz warto jeszcze wspomnieć o licznych zwycięstwach w Blizzard Challenge, w których polski produkt pokonał wielu branżowych, międzynarodowych gigantów. Nic więc dziwnego, że bardzo szybko innowacyjny program uznano za najlepszy na świecie.

W 2007 roku zaimplementowany został nowy głos nazwany Jessica i – jak można się domyślić, choć w dzisiejszych czasach nie takie egzotyczne imiona nadaje się dzieciom – wyróżniał się tym, że „rozmawiał” w języku angielskim. W późniejszym okresie firma rozpoczęła współpracę z jedną z największych organizacji charytatywnych Royal National Institute of Blind People, co pokazało tylko, jak bardzo zainteresowane oprogramowaniem są osoby niewidzące.

IVONA pojawiła się także między innymi na rynku amerykańskim, brytyjskim czy hiszpańskim, oferując kilkadziesiąt unikatowych języków, w tym nawet kaszubski. Rozwiązania zaproponowane przez Osowskiego oraz Kaszczuka z czasem zostały uznane przez różne międzynarodowe organizacje nie tylko za konkurencyjne wobec gigantów takich jak Microsoft, a wręcz od nich lepsze. Sam Osowski w wywiadzie dla Albrecht Partners wspomina:

Pamiętam doskonale spotkanie z zespołem z Microsoftu. Ci ludzie byli zszokowani, że takich dwóch gostków, którzy tam mają 23 czy 24 lata, i w ogóle nikt o nich nigdy nie słyszał, nie wiadomo z jakiej uczelni pochodzą, nigdzie nieznana jest ta ich firma, a oni mają taką technologię. Także niesamowite przeżycie, aż trudno mi opowiedzieć o tych wszystkich emocjach, które tam nami targały.

W 2011 roku przedsiębiorstwo zmieniło swoją nazwę na IVONA Software. Nadal funkcjonowało ono w Polsce, lecz dominujący rynek stanowił ten zagraniczny. Wiele firm tworzących oprogramowanie oraz urządzenia elektroniczne wykazywało chęć współpracy z polskim producentem. Nie będę tu jednak zagłębiać się w typowo techniczne i biznesowe sprawy, bo wymienienie absolutnie wszystkich potencjalnych zainteresowanych zajęłoby za dużo miejsca. Wystarczy Wam wiedzieć, że IVONA uchodziła za tak oryginalne cudo, że każda licząca się na świecie korporacja chciała ten syntezator posiadać. W tym pewne przedsiębiorstwo założone w 1994 roku przez Jeffa Bezosa.

Mowa oczywiście o Amazonie, który najbardziej pragnął wykorzystać technologię IVONA Software do zaprojektowania sprzętu Kindle. W 2013 roku cała polska firma została wykupiona przez amerykańskiego kolosa, który dostrzegł, że stosowane rozwiązania jawią się jako proste i niezbędne do osiągnięcia zamierzonych celów, choćby w czytnikach e-booków.

Obecnie zatem przedsiębiorstwo jak i syntezator istnieją, jednak nie pod tą samą nazwą co dawniej. Dzisiaj mówić można o Amazon Development Center Poland oraz produkcie ochrzczonym mianem Amazon Polly. Do tradycyjnego programu dodano wiele innowacji, lecz oryginalnej pudełkowej starej wersji syntezatora próżno obecnie szukać. Polska technologia przyczyniła się do wyprodukowania asystentki Amazona – Alexy. Wielu komentatorów zauważa jednak, że Amazon Polly w głównej mierze dedykowany jest firmom, podczas gdy IVONA stanowiła bardziej przystępny dla zwykłej osoby fizycznej produkt.

Jacek Labijak użyczył swojego głosu do najbardziej znanego wariantu głosowego w syntezatorze. Nie myślał wówczas raczej o tym, że nieświadomie wypowie tyle soczystych bluzgów.

Syntezator mowy IVONA. Przeróbki na YouTube

Temat IVONY nie zostałby w pełni wyczerpany, gdybym nie wspomniał o licznych przeróbkach tworzonych za jej pośrednictwem. Dzisiaj takie podstawianie sztucznego głosu pod film nieco razi w uszy, jednak w czasach, gdy YouTube jeszcze raczkował, wszelkiego typu parodie wykorzystujące IVONĘ stanowiły niekwestionowane hity Internetu.

Chyba jednymi z najpopularniejszych filmów, które przerabiano, były odcinki programu „Jeden z dziesięciu”, czechosłowackiego serialu animowanego „Sąsiedzi” oraz popularnej gry „Gothic”. Pamiętam także proste reklamy Biedronki, gdzie prezentowano nietypowe produkty głosem ivonowego Jacka. W dzieciństwie produkcje tego rodzaju stanowiły dla mnie skarbnicę dobrego humoru, choć oczywiście zdecydowana większość tych dzieł bazowała na wymyślnych przekleństwach. Stworzono nawet program „Bluzgator”, który generował gotowe teksty i bardzo często autorzy decydowali się na korzystanie z jego funkcji.

Przeróbki miały różną jakość. Niektórzy twórcy tak wycinali poszczególne sceny, aby do siebie pasowały, inni z kolei za główny cel postawili sobie „zdubbingowanie” syntezatorem całości odcinka od początku do końca. Niektóre filmy charakteryzowały się większym zaangażowaniem i trudnością wykonania, na przykład w Internecie do dziś dostępny jest film, na którym za pośrednictwem omawianego programu telefonicznie zamawiana jest pizza.

Z czasem internauci po prostu zaczęli się męczyć tym słyszanym w niemal każdej parodii głosem i IVONA stała się czymś niepożądanym. Nie oznaczało to oczywiście, że całkowicie zaniechano korzystania z jej możliwości, lecz obecnie wszelkiego typu przeróbki kreskówek czy filmów raczej bazują na naturalnym dubbingu tak, jak czyniono to przed popularnością IVONY. Ot, choćby należy wskazać wiecznie młodego youtubera Klocucha.

Obecnie drogi twórców programu IVONA rozeszły się i nie pracują już razem przy dalszym rozwijaniu tego projektu. Łukasz Osowski w późniejszym okresie rozpoczął realizację pomysłu na Vika Life, czyli aplikację, która pomaga ludziom w praktykowaniu zdrowego trybu życia. Co do Michała Kaszczuka trudno jest znaleźć jakieś rzetelne informacje o tym, czym aktualnie się zajmuje. Z profilu LinkedIn wynika jednak, że prawdopodobnie także nie pracuje już w Amazonie.

Jeśli historia syntezatora IVONA może nam coś pokazać, to najpewniej są to dwie rzeczy. Po pierwsze, Polacy jak najbardziej potrafią stworzyć markę rozpoznawalną na całym świecie. Po drugie, za geniuszem i innowacyjnością nie zawsze kroczy wsparcie inwestorów. Trójmiejska firma musiała pracować naprawdę bardzo długo, aby uzyskać satysfakcjonujący efekt końcowy, ale dalszy rozwój mogła osiągnąć przez wchłonięcie przez korporacyjnego giganta.

Czytaj także:

Sebastian Jadowski-Szrederhttps://www.jadowskiszreder.pl/
Youtuber i pisarz, twórca zbioru opowiadań "Incydenty Antoniego Zapałki", hobbystycznie zbieracz filmów i pasjonat horrorów, a także starych gier. Główną sferą jego zainteresowań jest popkultura z wyraźnym zaakcentowaniem elementów retro.
ARTYKUŁY POWIĄZANE

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

NajNOWsze

NajPOPULARNIEJsze

Ostatnie komentarze