poniedziałek, 5 grudnia, 2022
Strona głównaNaukaMałpy piszące Szekspira, czyli dlaczego przegrywamy z liczbami

Małpy piszące Szekspira, czyli dlaczego przegrywamy z liczbami

Znacie powiedzenie, że gdyby dać małpie maszynę do pisania i nieskończoną ilość czasu, to z rachunku prawdopodobieństwa wynika, że gdy będzie ona wciskać przypadkowe znaki, prędzej czy później napisze słowo w słowo dzieło Szekspira? A co ono ma wspólnego z tym, że większe liczby niż te, które możemy policzyć na palcach obu rąk, sprawiają, że występują u nas zimne poty?

Czy ta małpa, gdyby dać jej nieskończoną ilość czasu, napisałaby artykuł na True Story? (iStock)

Krok 1: zamień małpę na maszynę

Oczywiście sympatyczny przedstawiciel naczelnych stukający w klawiaturę to raczej metafora. Gdyby faktycznie wytresować taką małpę, która byłaby w stanie sumiennie i rzetelnie siedzieć osiem godzin dziennie przed ekranem niczym pracownik każdego biura, to i tak program szybciej wykona założenia eksperymentu. Nasz naczelny powinien paść ofiarą algorytmizacji pracy i patrzeć  na to, jak maszyna generuje znaki za niego. Przyjmijmy, że Hamlet będzie pisany z wyłączeniem spacji, znaków specjalnych i majuskuł, i zabierzmy się do pracy.

Klawiatura QWERTY ma 26 znaków literowych, tak więc szansa na prawidłowe wpisanie pierwszej litery Hamleta wynosi 1 do 26 (ok. 4%). Dwie litery to już 1 do 676 (ok. 0,1%), trzy to 1 do 17576 (0,005%) i tak dalej. Musimy bowiem założyć, że konieczne jest wpisanie wszystkich znaków prawidłowo po kolei. Wykładniczy spadek prawdopodobieństwa powoduje, że wpisanie pierwszych dwunastu znaków graniczy już z cudem (1 do 95428956661682180, czyli ok. 0,00000000000000001%. Dla porównania, szansa na trafienie szóstki w Lotto wynosi ok. 0,000007%. Już zjechaliśmy do absurdalnych rzędów wielkości, a przecież dopiero co zaczynamy! 

Oczywiście, sprawny komputer prędzej czy później wygeneruje nam te kilka słów. Na takiej samej zasadzie jak nasza wirtualna małpa, działają łamacze haseł korzystające z metody siłowej (brute force). Program po prostu wpisuje w okienko wszystkie możliwe kombinacje liter po kolei. Każdy, kto próbował włamać się do swojej starej poczty mailowej, wie, że generowanie w ten sposób hasła może trwać całe wieki. Wyobraźmy sobie zatem, że przez przypadek jako zabezpieczenie do poczty ustawiliśmy tekst Hamleta, składający się z ok. 130 tysięcy znaków. Nie do złamania. No chyba, że dosłownie dysponujemy nieskończoną ilością czasu.

Krok 2: daj sobie spokój

Szansa na to, że program-małpa czy też łamacz haseł wygeneruje nam finalnie tekst Hamleta, jest liczbą skończoną i wynosi ok. 3*10-183,946 procent. Pamiętacie potęgi o wykładniku ujemnym ze szkoły? Skala tej wartości powoduje, że eksperyment przestaje mieć jakikolwiek sens. Gdyby zamienić każdy proton we wszechświecie w małpę z klawiaturą, która swoją czynność wykonywałaby nieprzerwanie od Wielkiego Wybuchu do końca świata, to i tak prawdopodobieństwo nie wzrosłoby do żadnego znaczącego stopnia. Można zatem skrócić sobie cierpień i przyjąć, że szansa na to, że małpa napisze tekst Szekspira, wynosi po prostu zero.

Podjęte w rzeczywistości eksperymenty mające na celu stworzenie dzieła napisanego przez małpy skończyły się sromotną klapą. W 2002 r. w zoo w angielskim Devon przeprowadzono eksperyment, w którym sześć makaków z Celebes – Elmo, Gum, Heather, Holly, Mistletoe i Rowan – otrzymało maszynę do pisania i zadanie: napisać Hamleta. W rezultacie naukowcy otrzymali pięć stron tekstu, zapisanego głównie literą „S”. Na końcu eksperymentu małpy postanowiły spróbować innych liter, ale po stworzeniu niżej zacytowanego ustępu jedna z nich zaczęła okładać maszynę kamieniem, a pozostałe się na nią wypróżniły, więc eksperyment przerwano.

Zainteresowani mogą zweryfikować nasze założenia i pobawić się bezpiecznym symulatorem małpy piszącej Szekspira. Przy czym proszę mieć na uwadze, że każde napisane słowo dłuższe niż na parę liter będzie galaktycznym sukcesem.

„naaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaasssssssssssssssssfssssfhgggggggsssassfssssssgggggggaaavmlvvssajjjlssssssssssssssssajjjajaajjsssssaaaaaaaaaaaaavvjjjjlajjjjjaaaaaajjjjjjjajjjjjjjdjjajjjjjjjjjjjjjjjjjjaajjjjjjjjjjjjjjaaaaaaaaaajjjjjjjajajjjjjjjaajjjjjjjjjjjjjbjmmslllggmmlljjmmmmmmnjjjnvvvnbvvmmllnknnbmmmmllllllllllllllllllllllllllllblbbbbnnfllmnnmjfgmnmmmassssssjjkbhnmnn”

Elmo, Gum, Heather, Holly, Mistletoe i Rowan, Notes towards the complete works of Shakespeare, Paignton Zoo Environmental Park, Devon 2002

Małpy wypełniły bibliotekę

Dość powiedzieć, że koncepcja małpy tworzącej Szekspira na maszynie nie wzięła się z powietrza. Chociaż podobne idee – pojawiania się tekstu z chaosu – pojawiały się w pracach Arystotelesa, Cycerona, Pascala, Jonathana Swifta, Emile’a Borela oraz Arthura Eddingtona, to chyba najsilniej w kulturze odbiły się teksty Jorge Luisa Borgesa – esej „La biblioteca total” z 1939 r. i powstałe na jego podstawie opowiadanie „La biblioteca de Babel” z 1941 r. To drugie, popularne dzieło opisuje świat składający się z nieskończonej przestrzeni bibliotecznej podzielonej na heksagonalne pomieszczenia. W tych znajdują się dokładnie ponumerowane ściany, półki i woluminy. Każdy tom składa się zaś z 410 stron wypełnionych losowo ułożonymi znakami.

Ponieważ ilość tomów jest nieskończona, potencjalnie oferują one „dokładną historię przyszłości, autobiografię archaniołów, prawdziwy katalog Biblioteki, tysiące i tysiące katalogów fałszywych, dowód fałszywości tych katalogów, dowód fałszywości prawdziwego katalogu, ewangelię gnostyczną Bazylidesa, komentarz tej ewangelii, prawdziwą opowieść o twojej śmierci, przekłady wszystkich książek na wszystkie języki, interpelację każdej książki we wszystkie inne” (tłum. Borgesa za Andrzejem Sobolem-Jurczykowskim).

Oczywiście, w internecie wszystko jest możliwe, dlatego po lekturze opowiadania można wybrać się na spacer po wirtualnej Bibliotece Babel, stworzonej przez pisarza Jonathana Basile’a. Przeklikiwanie Biblioteki w poszukiwaniu czegoś sensownego zabrałoby oczywiście więcej czasu, niż to tego warte, można jednak zabawić się w wyszukiwanie własnych fraz (bo tak jak zostało wspomniane, każda w końcu znajduje się w jakimś tomie). I tak tytuł tego artykułu znajduje się na 139 stronie 13 tomu na półce nr 5 ściany nr 2 w heksagonie nr:

328v28gvprh8gd3nf66gdo21pky9yenynwx7t2rabb6r8ggg6fx6m3z76qqje4pl51tu3ods2t51omnr0b159bdg1ll6sa4vsgwxihyjul69vjfdrspmm8zx72ayw8gnevzk2go4656amhpgmuc5txz1xnox1sqig7paqau488r1qmjey9o58fd7ynyntun6q4875zvp6k9m4ppdm5yqon55ldhxc8t3hl2ga95j25lsqdt6bizebs16ng8b6kcytyiqkms910ntxn1z56gkck4p6tt4ffydxoliilrdxhmkln08xmmv8yc2t17v83yr7f4q4ibb1w2h3jzdvp3jedrpw9nsx0js8o4llw2vel02ijsrlvkrd8aggjw12si16p0x3qqd4aobwybvvejbn9uyaw50srxnlkq40n2dn010zivayw3gbpgy26rrl7mvbi7pyjym0jqhxklgmdl54v85o271tzxpyfmbm2e32z33vzxnbs4sxlhyesy1emfjvtqj7bo37dk7iqd5aycmhwghdmw38x3lvvblah64doyuu8r5vixowk9l30p8yvrlc1m5tj09ugwrw8comnz69hj2gk0ztyltbuhzj31h7xjzhmz9f4pie9r31usy5dpvbh2e1xlbqmzo0t4k8rf06pwh0s4pe5sqz9d6xrym3d0avu3jzddv5pup4p4jvq8db9d46knfluj5xfbk6rbzpxlbllych4uet7vf0020l6cqgoes1nzw47bl6s65gq65en7h0iq8dp6p7nm8n4dqoz9w54dzs7kfgbvaadj6q8duyf9y0sv78scmkhd9y2lij1sv32a1v4srgmvik2kijjn73772k5urj1f9r1fbe70nr3vy6kjxfzi9ixlw7f5yadvtbq8t3z5m440dvuyn5ee2affv8a47yiyxhk12vf4luuk5sneiuuhbfjgjuywbtjt8xmj2vutjt2ru3ayz8s9pjayadcdyz5l4c0bhdmmd5zzhtrbcpete05a1pvq5m7kvomo1zoqxv3ct1byn3bywjbdiqce0vcbxlv8yc9jn0r6shsizh80dg0attvdv6jgshftz15okw861d47swonwyoz30rq93qw14hsedkcqvla7w0klzkmoy2hkdjw1howdrji28msvbbepsadwafd02rxznyzpuv8wqf31ltsd06klyrovuwh7102420l87h68w04ry5gr1rw09hsu3395jc902akpq1xem76pso6ckgtlbwrwwxfuelprzb57ywtb1n1yv93zfsvxhifiztvj9pg7b8zrbmpz99epuhfr69v14d9pi9aqhwmthb4omyexvn5j8ams9rzv0mffhlcmoh1fh2yspgxo4madzn92n107ogw855kid36bz9wu2injoaag1d9wrek883fppc6p9ndtj2qpmhelw7qp5cfino093cbsu0tw4f05equqebe4virib05oe12t6f78w05x8f0y26kwv1byjp9ngoinf5pdy478r7mwa8fagxdj0mz1mzv6ah48x5beqx1g9hvmsic48fn7625lii1ybi63od7kmvtrrnvccop125d3fssdrfpb9iwgfgawvsyle2da33sdkslg5hc8nsarmhxep825rr12q8dtweu7jgkeg1ak10hb4hv5ehlw4fmvzdbdytkxbfpo611wz1vey12ijlevg2fwkcio2w3mz7jsnk4xidqch65qv22zj2orzr5qvnq3p0q3sladvjefyj44h9ax21lqmmpjerc4yqq5j44yhyjihkn6dqd7yr5znk886b54jdg766cs9v4904nomlswup6bivq6ebaiavpdrpj6mf8046radqhpjl9ecu1tbvq7hjpfva2fxsj8m5rohtypfp14omxu9jtlvmqlx31w16hn96mgi8f1mgu240dslqfaw3bfj1z8xbr7ass8rfn3xb8snnkmox0as2dv1995gkqoicf4u4oqscy8h22msbtl9o4kbfjw18zrc6u8puoxcwnc72d9nl1mudwzrrnjgvpoca3tlutue5m377ardavsgnnt0lxeacrvtdcp46n99sfjc5sybxi4nesv272bz4a8g0u76h1kdgsbewrmjah9qnckcd3cr6yh0etz470pjd14t4dfl7f2it5esl7cr4ueojoer9v6rq91g51u8lx9ylcp5xzq8dfo2fqts1k3wusoo9vvt55jdto5e655bsya4zynhe99k89nrjmmg9a3eb2uyepbe7intuu4jd2kp7oarzy1djdwdkur0lj3n0owvs3x8fgcvl78b6867na870wkqg2akrfe42h1ti0ibh40bps4q2qb3ecsie1n011lk3sd8h5sgcsu6x2k83mc1nqidbi4rqy7ympoiu70jfrsen7jre6fvs3j4zgra40v2u3ms0p8mqfhco7j0pfvsyco9j5kp6aix5o0aawt9hhx97dl9eav5kz4e44ewwmub4wymrvsx8z16kb72tns2oj5yhe192z1plp8x7ipd0obxg6vsjku7573ajz10tcdu6r7wsd68vm4nqycatlcsn0zf7zt2fvb14y78amdauugbpxgcgtl8jlvpxpm9tdmw4ihhiv8nyjk7we9pyo924okvh5ghietsgvny9jpgxf0d9cgiiv834j5d5nhdhkwe0zx4mu0kut3a0lsdx167txw5f0ieh8xg0xmsxwszrzeqx4cna17d0atucmo8es2c1y5tckqbuk45353dry7jxrzw3ajiiyfwpuml47ndx5r87nqycqj2whxn60te94569rcysrdwmdmu5h6tda540e38wqgo39flt4rbe1ueo7x308tb7mruvsa80y9geimhxvgdtqnlmmwnuvjigsjxvr9z8nuoq799k2n2fm1e3f5tk6giv8p2go991nuu5p6ku9hv67onoug2emru6k4lobiv28nvcbuyt8n3khryq8ourq3z72gdghkadbxqd05ge8ueawxpfu7ftx9sbqcw9s9wwh0maxy2sp4nidef4awlyunz9tk5xkjux05nzbwd96y17jyn1vbee67u7on04lm5f0aacedcpmg8agc5ya6xsh2u4ixcr9pb4y1t5pd4ubt3lu73kg8kyn3igqzho6352mrxgocua63nyqgqvksyh64eed73rn7gxo0avgy174aw2dushtg2r1tr6xj9d48njcr4c070dkraifktnvgp0

Kto nie wierzy, niech wyszuka.

Plagiator. (Knowyourmeme)

Małpy nie potrafią pisać, a człowiek nie umie liczyć

Jaki możemy wyciągnąć z tego wszystkiego morał? Postaci w uniwersum Borgesa snują się po swojej bibliotece, szukając gdzieś fraz, które mają im wyjaśnić sens istnienia tego świata – podczas gdy prawdopodobieństwo znalezienia czegokolwiek za ich życia należy zredukować do zera.  Opowiadanie argentyńskiego autora pokazuje dobrze, jak w ludzkiej głowie kłębi się nadzieja na spełnienie się najmniej prawdopodobnych wydarzeń. To popularny błąd w heurystyce myślenia, o którym dużo pisał w swoich pracach chociażby Daniel Kahneman.

Według tego autora człowiek jest zasadniczo skłonny do minimalizowania istotnego ryzyka oraz rozdmuchiwania niewielkich szans. Z jakiegoś powodu tyle osób kupuje regularnie kupony na totolotka, mimo, że statystycznie nie starczy im czasu życia na wygraną. Podobnie, jesteśmy dobrzy w liczeniu na takich wartościach, na jakich operujemy na co dzień – ale skrajnie wielkie oraz bardzo niewielkie liczby nas pokonują. Nie potrafimy też zbyt dobrze porównywać do siebie cyfr z zakresu różnych rzędów wielkości.

Przełóżmy teorię na przykład na światowe postawy w stosunku do epidemii koronawirusa. Można bez problemu znaleźć informację, że ogólna średnia śmiertelność choroby to mniej więcej 2%. Wiele osób bagatelizuje to, porównując to ze śmiertelnością grypy: ta jednak wynosi ok. 0,1%, a więc cały rząd wielkości niżej. Powyższe informacje znalazłem na stronach WHO w pięć minut, więc nie jest to sekretna wiedza dostępna dla jedynie wybranych. Porównajmy sobie to do gry, w której ciągniemy losy z pudełka. W przypadku covidu, na 49 losów jest jeden, po wyciągnięciu którego pracownik loterii strzela nam ze strzelby w głowę. Grypa zwiększa ilość neutralnych losów do 999, ale nadal ryzyko śmierci pozostaje całkiem realne. Nikt poza największymi straceńcami nie zagrałby dobrowolnie w taką grę.

Ryzyko zmniejsza szczepionka, ale co do niej z kolei przeszacowujemy skrajnie małą wartość wyznaczającą jej zagrożenie. Popularna Astra Zeneca istotnie potrafi być zabójcza, ale szansa na śmierć po niej to 0,000001% – bardziej prawdopodobne jest już bycie trafionym piorunem. Informację o tym również z łatwością można znaleźć na stronach producenta. W tej sytuacji na 999 999 losów pustych wypada 1 los zabójczy. Mimo to wiele osób nie szczepi się właśnie ze strachu o swoje życie. Porównajmy jeszcze tę szansę na z prawdopodobieństwem trafienia szóstki w totka (0,000007%!).

Może powinniśmy wszyscy czytać w szkołach Borgesa i uczyć kontekstu, który z niego wynika, w szczególności co do operowania na bardzo wielkich i niewielkich liczbach oraz szacowania dostępnych ryzyk na podstawie danych, którymi przecież dysponujemy. Człowiek w ciągu swojego życia uczy się operować niewielkimi liczbami, które dotyczą obiektów w świecie fizycznym oraz co najwyżej tysiącami w pieniądzu, który zarabia. Można przeżyć szczęśliwe życie bez liczb pokroju 3*10-183,946, nie kroimy sobie też 0,000001 proc. banana. Jednak ignorancja w tym zakresie sprawia, że stajemy się podatni nie tylko na bajki o małpach piszących Szekspira, ale przede wszystkim na manipulację i niewiedzę.

Bartłomiej Król
Prawnik, publicysta, redaktor. Na TrueStory pisze głównie o polityce zagranicznej i kulturze, chociaż nie zamierza się w czymkolwiek ograniczać.
ARTYKUŁY POWIĄZANE

ZOSTAW ODPOWIEDŹ

Proszę wpisać swój komentarz!
Proszę podać swoje imię tutaj

NajNOWsze

NajPOPULARNIEJsze

Ostatnie komentarze