25 lipiec 2009

Wikisłownik i esperanto

Dzisiaj liczba haseł w esperanto na polskim Wikisłowniku przekroczyła 5000. Pięciotysięczne to Bjalistoko, a hasło nr 5001 — Universala Kongreso. Wszystko to z okazji rozpoczynającego się właśnie Światowego Kongresu Esperanto, który w tym roku odbywa się w Białymstoku.
Esperanto na Wikisłowniku wciąż się rozwija, ale przy okazji warto zrobić pewne podsumowanie tego co już jest.
Oto kilka informacji na temat esperanta na Wikisłowniku:
  • Obecnie esperanto na polskojęzycznym Wikisłowniku zajmuje 11. miejsce jeśli chodzi o liczbę haseł (na ponad 200 obecnych tam języków).
  • Hasła te to opisy słów, morfemów (rdzeni, przedrostków i przyrostków) oraz przysłów.
  • Istnieje też kilka słowników tematycznych, m.in. fałszywi przyjaciele, kolory oraz indeksy dotyczące państw i zwierząt.
Tyle suchych faktów. Ważniejsze jest to dlaczego Wikisłownik jest wyjątkowy jeśli chodzi chodzi o esperanto:
  • Prawdopodobnie jest to jedyny polskojęzyczny słownik esperanta zawierający indeks a tergo, czyli taki, w którym o kolejności decyduje najpierw ostatnia litera, potem przedostatnia itd. W esperanto jest to bardzo przydatne narzędzie ze względu na schematyczność tego języka. W ten sposób razem zgrupowane są wszystkie rzeczowniki (końcówka -o), przymiotniki (końcówka -a) lub czasowniki (końcówka -i). Co więcej, obok siebie leżą np. określenia narzędzi (końcówka -ilo) lub zawodów (końcówka -isto).
  • Hasła to nie tylko same definicje, ale też ilustracje, przykłady użycia, nagrania wymowy, synonimy, antonimy, spis przysłów, w których występuje dane słowo itp.
  • Opisy słów linkują do wszystkich morfemów, które zawiera dane słowo. I w drugą stronę — w opisach morfemów podane są słowa pochodne.
I jeszcze jedna ciekawostka — polski Wikisłownik jest z zasady pisany po polsku. Ale jeśli ustawi się w preferencjach użytkowanika język interface'u na esperanto, to nie tylko sam interface będzie esperanckojęzyczny, ale i duże fragmenty opisu danego słowa. Bowiem od niedawna standardowe elementy haseł są przetłumaczone na kilka języków, wśród których jest i esperanto. A zatem w takim przypadku zamiast „przykłady” zobaczymy „ekzemploj”, a zamiast „etymologia” — „etimo”.
Obecna liczba haseł o słowach i wyrażeniach esperanckich to nie jest zasługa jednej osoby, a większej grupy edytorów. Bardzo dużo haseł zostało wprowadzonych przez boty a następnie są one ręcznie weryfikowane przez użytkowników. Tak odbył się na przykład import z Universala Vortaro. Esperantyści, którzy napracowali się przy tych 5000 haseł to oprócz botów i ich operatorów m.in. Phoenix84, Kasiajulka, Tarnoob, ja i wielu niezalogowanych użytkowników. Ja niestety nie mogę uczestniczyć w tegorocznym kongresie, ale być może ktoś z pozostałych wikisłownikowców się tam pojawi...

23 styczeń 2009

Łużyce nową Irlandią, ziemia połabska nową Ziemią Świętą

Dorzucę jeszcze małe post scriptum do wczorajszego posta o Słowianach Połabskich. Grzebiąc niedawno w Internecie trafiłem na niebanalny artykuł pod tytułem… "O reslawizację Wschodnich Niemiec". Pomysł jego można streścić tak: trzeba stworzyć państwo dwu-trzymilionowe państwo łużyckie oraz państwo połabskie — od Hamburga przez Berlin do granicy z Polską (na Odrze i Nysie ma się rozumieć). Pięknie, ale co z niemieckojęzycznymi mieszkańcami tych terenów? Wywieźć wszystkich jeszcze bardziej na Zachód? O nie, autor do takich rozwiązań uciekać się nie zamierza, ale nie znaczy to wcale, że jego plany pozbawione są rozmachu.

Po pierwsze, pisze pomysłodawca, w Niemczech od dawna istnieje ruch dążący do zrzucenia niemieckiego jarzma i powrotu do słowiańskich korzeni. Mieszkańcy wschodnich Niemiec zaczynają się ku temu organizować, czując swoją odrębność od reszty Niemiec. Ruch został zahamowany, ale nie zniszczony przez represje hitlerowskie. Co więc należy zrobić, aby ich zamiary urzeczywistnić?

W Łużycach mówiący po łużycku "musieliby posiąść możność reslawizacji swych zgermanizowanych ziomków" (pięknie powiedziane, prawda?). Tak samo, jak w Irlandii wprowadzano język irlandzki w społeczeństwo mówiące niemal wyłącznie po angielsku, łużycki poprzez szkolnictwo wypierałby niemiecki. Powiedzmy, prawie tak samo — z małą poprawką na konieczność wysiedlenia Niemców na terenie między Dolnymi a Górnymi Łużycami, żeby powstał jednolity ośrodek słowiański w państwie.

Proste, prawda? Ale co tu zrobić z terenami Słowian Połabskich — wszak od 200 lat jedyny słyszany tam język słowiański to najwyżej polski. To, co zostało po Drzewianach, to ewentualnie gdzieniegdzie strój ludowy. Reslawizacja w takich warunkach? Da się zrobić! Skoro Żydom w Palestynie udało się zrewitalizować hebrajski, w końcu wymarły o wiele dawniej niż połabski — pisze autor — dlaczego nie udało by się tak ze słowiańskim językiem w północnych Niemczech? Trzeba, żeby odpowiednia ilość osób poczuwająca się do słowiańskich, połabskich korzeni wróciła do języka przodków — a dalej już pójdzie. Przez pewien czas językiem potocznym i urzędowym byłby niemiecki, ale powoli zastępowano by go przez połabski. Nad wszystkim czuwałaby ONZ.

"O reslawizację Wschodnich Niemiec" stworzył nasz rodak. Żeby nieco usprawiedliwić powyższe szalone pomysły — tekst powstał tuż po II wojnie światowej. Jeśli ktoś chce przeczytać całość — jest dostępna na stronie Polic. Jeśli ktoś nie ma ochoty i zastanawia się, co to ma znaczyć, że naplotłem tu tyle rzeczy bez związku ze słownikami i Wikisłownikiem — proszę bardzo, rzecz o rzeczy w połabskim i polskim.

22 styczeń 2009

Jak się drzewiej słowniki tworzyło

Język połabski, używany przez Słowian na terenach od dzisiejszej północnej Brandenburgii do Dolnej Saksonii, jest językiem, w którym nikt nigdy nie pisał (a przynajmniej nic nam o tym nie wiadomo) i który zdążył wymrzeć, zanim zajął się nim ktokolwiek o wykształceniu językoznawczym (nadłużej przetrwał w odosobnionych wioskach plemienia Drzewian, ale w XIX wieku nikt już się nim nie posługiwał). Co wcale nie przeszkadza temu, by powstał np. słownik połabsko-angielski. Mowa tu o "Polabian-English dictionary" naszych rodaków Kazimierza Polańskiego i Janusza Sehnerta; istnieją zresztą słowniki po polsku i niemiecku, a nawet opracowania gramatyki. Jak to możliwe? Posiadamy źródła z czasów, gdy mówiono jeszcze po połabsku, i choć ich autorzy (z jednym małym wyjątkiem) nie posługiwali się opisywanym przez siebie językiem, obecni naukowcy są w stanie metodami porównawczymi zrekonstruować w pewnym stopniu mowę Słowian Połabskich.

Cała ta konstrukcja wydaje się po zapoznaniu się z okolicznościami zupełnie niewiarygodna, wręcz szarlatańska — a jednak udała się (choć należy pamiętać, że jest to przybliżone odtworzenie wycinka języka). Zobaczmy bowiem: słowa spisywali amatorzy zaciekawieni "egzotyczną" mową: filozof (sam Leibniz), matematyk, pastor oraz sołtys (jako Drzewianin jedyny Słowianin i jedyna osoba znająca język w tym towarzystwie). Słowniki były tworzone bardziej jako ciekawostka niż jako coś praktycznego (użytkownicy połabskiego mieszkali na wsi, musieli ze względu na okoliczności i tak znać niemiecki, więc dla Niemca nie było sensu uczyć się ich języka). Stosunek do połabskiego dobrze obrazuje sprowadzenie na dwór króla Hanoweru kobiety mówiącej w drzewiańskim połabskim — by jaśnie pan usłyszał dziwny język zanim ów zniknie. Badacze-amatorzy zapisywali słowa niemieckim alfabetem, tak, jak potrafili — bo nie wiedzieli, jak można by inaczej.

W sumie dość zabawne są problemy, jakie wiążą się ze stworzonymi przez nich słownikami. Przytaczane wypowiedzi nie zawsze są prawidłowo podzielone na wyrazy — co nie powinno dziwić, bo kto miałby robić rozbiór gramatyczny zdania: wypytywani niepiśmienni ludzie czy odpytujący Słowian, którzy często w ogóle nie rozumieli tego, co piszą? W jednym słowniku spisanym po francusku jest część dotycząca różnych zwrotów z języka codziennego; obok pytań po francusku pojawia się tekst po połabsku — ale tekst odpowiedzi zamiast tłumaczenia pytania. Ot, najwidoczniej odpytywani ludzie nie dogadali się z badaczem, co chce uzyskać (od razu przychodzi mi na myśl Świat Dysku Pratchetta i góry "Nie Wiem", "Jakaś Góra", "Twój Palec Idioto", pozostałość po odkrywcach zapisujących fonetycznie odpowiedzi tubylców na pytania o okolicę).

Jeden z autorów słowników z tamtych czasów, pastor von Jessen, wspomniał o problemach, jakie napotkał w trakcie pracy. I tu zaczyna się zabawa: znającymi połabski byli prości ludzie żyjący na wsi. Mało ich obchodziła pomoc w jakichkolwiek "badaniach": od poniedziałku do soboty ciężko pracowali i nie mieli na nic czasu, a w niedzielę chcieli mieć po prostu święty spokój. Pastor był więc w kropce i dopiero po długich staraniach znalazł jednego chłopa, który zgodził się z nim regularnie rozmawiać. I całe szczęście, bo inaczej nie było by słownika von Jessena, uznawanego ze względu na staranność pastora za jedno z najważniejszych źródeł wiedzy o połabskim. Autorzy "Polabian-English dictionary" czynią na podstawie koncentracji słownictwa wokół różnych tematów obserwację, że Drzewianie, jako prości ludzie, mieli w języku słowa tylko na to, czego sami doświadczali, natomiast bardzo mało na tematy abstrakcyjne itp. Wyliczają więc rzeczy, które składały się na życie typowego Słowianina na tych terenach (cytuję z pamięci): "uprawa roli, las, owoce leśne, ptaki; jedzenie, picie, handel, walka, wojna, prostytucja". Ciekawe, prawda? Wśród brakujących słów wymieniają… krzesło — ubodzy Drzewianie w domach siedzieli na ziemi, krzeseł nie mieli, więc też i na nie określenia. Ostatecznie określenie na krzesło zostało zapożyczone do połabskiego z niemieckiego.

Ciekawe, jak dużo słowników powstało w ten sposób: wyjeżdża naukowiec na głęboką prowincję, chodzi za autochtonami i uprasza ich o poświęcenie chwili czasu, a w końcu głowi się, jak zapisać, co usłyszał, bo odpytywany nie jest w stanie mu pomóc. Hej, ktoś narzekał, że jest trudno tworzyć Wikisłownik?

16 grudzień 2008

Słowa zdecentralizowane

Wyobraźcie sobie rzecz, która jest znana w całej Polsce, ale w każdym regionie nazywana. I nie ma jednej, ogólnopolskiej nazwy. Pewnym zaskoczeniem było dla mnie odkrycie takich tworów przy okazji uzupełniania regionalizmów na Wikisłowniku.
A chyba najbardziej zdecentralizowany leksykalnie przedmiot wygląda tak



W Łodzi jest to angielka, w Krakowie - weka, w Poznaniu - kawiorek lub kawiorka, w Katowicach - francuz, w Białymstoku - baton, a w Warszawie - bułka paryska lub wrocławska. A jak to nazwać w języku zrozumiałym dla wszystkich Polaków? Długa bułka pszenna? A wydawałoby się, że polski to taki jednolity, scentralizowany język...

06 grudzień 2008

Jeszcze fałszywi przyjaciele

Znowu czytając dzisiaj wiadomości z Łużyc wpadłem na zabawnego fałszywego przyjaciela. Weźmy tekst "wy sćo jězu skazali?". Nie jest to wcale fragment piosenki wygolonego na łyso zespołu ani treść wymiany zdań między kibicami rywalizujących drużyn (zdanie zresztą spreparowałem na poczekaniu, nie szukajcie w Google'u). Weźmy pozornie podobny przypadek: jeśli głośno wymówi się "wy sćo tam byli?", można wpaść, że chodzi o odpowiednik "wyście tam byli?".

Tak naprawdę "wy sćo jězu skazali?" znaczy "czy zamówiliście już jedzenie?", a jak coś jest "skazane" to jest zamówione ;-) W tekście z wiadomości, który czytałem, dziwiłem się z kolei, czemu "gmejny kažu swójim staršym wobydlarjam" (mieszkańcom) coś na święta zrobić. Okazało się, że gminy nie każą, tylko zapraszają, bo kazaś to zapraszać.

02 grudzień 2008

Nowe strony kategorii języków

W ostatnim czasie wprowadziliśmy małą reformę stron kategorii języków. Chodziło głównie o to, by ustandaryzować wygląd takich stron, pozbyć się złych rzeczy (jak wielki i nieprzydatny formularz „dodaj hasło”), a dobre udostępnić dla wszystkich języków. Co wchodzi w skład tych dobrych rzeczy?

  • dla większej przejrzystości i oszczędności miejsca treść upakowano w tabelkę

  • automatycznie aktualizowane i mówiące poprawną polszczyzną liczniki haseł

  • po prawej stronie wyróżnione linki do opisu języka na Wikipedii, podręcznika na Wikibooks, nagrań wymowy do Wikimedia Commons

  • link „losuj hasło” dla osób na wypadek, by ktoś miał ochotę po prostu „poskakać” po hasłach ;-)

  • kanał RSS z nowymi hasłami — coś zarówno dla osób uczących się języka (choć nie przy każdym języku jest gwarancja, że coś na kanale będzie często się pojawiać), jak i autorów (powiadamianie, gdy ktoś dopisze hasło do naszego ulubionego języka); RSS taki zresztą stworzyć może każdy dla dowolnej kategorii nie tylko na Wikisłowniku (szczegóły)


Rezultaty można zobaczyć na przykładzie języka angielskiego.

11 listopad 2008

Jak klasyka literatury polskiej szkodzi Wikisłownikowi

Na Wikisłowniku pojawił się ostatnio trend, by jako przykłady do haseł polskich wstawiać cytaty z materiałów Wikiźródeł – najczęściej starych książek, do których prawa autorskie wygasły, w związku z tym nie ma wątpliwości prawnych, czy można ich użyć. Na pierwszy rzut oka ma to same zalety – nie wymyślamy własnych, niestworzonych historii, tylko czerpiemy z dzieł wielkich autorów, dajemy przykład pięknej i na pewno poprawnej polszczyzny, oszczędzamy czas i wysiłek na samodzielne tworzenie przykładów. A do tego podbijamy ranking Google’a siostrzanych Wikiźródeł i być może skłaniamy kogoś do przeczytania trochę więcej z cytowanego dzieła. Brzmi pięknie, ale niestety naprawdę tak różowo nie jest.

Pomysł z użyciem dla języka polskiego gotowych przykładów, czy to z książek, czy to z korpusu językowego, nie jest nowy. Wypowiadałem się zawsze o nim z dużą dozą sceptycyzmu, którzy zwolennicy takich rozwiązań kontrowali mówiąc m.in., że nie mamy kompetencji językowych do pisania przykładów użycia słów, bo przykłady takie będą zawsze skażone subiektywizmem – będziemy więc pisali, jak my widzimy użycie słowa, a nie to, jak owe użycie wygląda w prawdziwym języku.

Dylematowi temu miałem okazję się przyjrzeć od drugiej strony – jako użytkownik. Zaglądam do dwóch internetowych słowników – języka dolnołużyckiego stworzonego przez Instytut Łużycki oraz górnołużyckiego Wikisłownika. Oba mają tę zaletę, że przy słowach podają przykłady, ale jednocześnie stoją na przeciwległych biegunach w metodologii ich doboru. W pierwszym przykłady są ewidentnie wymyślane; często nie są to nawet zdania, ale krótkie zwroty albo kolokacje. W drugim stosowane są wyłącznie teksty z korpusu językowego.

Korzystanie z dzieła Instytutu Łużyckiego to prawdziwa przyjemność. Ciężko jest w krótkiej definicji oddać znaczenie słowa, ale w zorientowaniu się, jaki zakres znaczeniowy ma dany wyraz, bardzo pomagają świetne przykłady – jest ich zazwyczaj tyle, ile trzeba, nie są pisane „na jedno kopyto”, podchodzą często do słowa z kilku stron. Z górnołużyckiego słownika korzystam bardzo mało, a prawie w ogóle nie czytam tamtejszych przykładów. Czytelnik jest tam atakowany wielką zbitą górą tekstu, najczęściej z artykułów publicystycznych z przestrzeni ostatnich 150 lat, gdzie autorzy żonglują słowami, wyszukanymi metaforami i odnoszą się do poważnych problemów społeczeństwa górnołużyckiego. Ciągnące się niemiłosiernie zdanie (lub czasem kilka zdań) trzeba czytać kilka razy, żeby rozgryźć figury retoryczne, złapać mniej więcej sens kompletnie wyrwanego z kontekstu fragmentu i dopiero wtedy móc zanalizować, jakie miejsce ma w tym zdaniu analizowane słowo. To prawdziwe piekło.

Całe szczęście, że na Wikisłowniku nie korzystamy w tak dużym stopniu z cytatów z dawnej prasy (za to preferujemy literaturę przygodową i „narodową”, co rodzi inne problemy), ale mimo wszystko uważam, że dla użytkownika o wiele lepszy jest pierwszy sposób pisania przykładów – z własnej głowy. Z głowy – to nie znaczy szybko i byle jak; tworzenie własnych przykładów daje właśnie swobodę skonstruowania zdania tak, by stanowiło samodzielną całość, a nie urywek długiego tekstu; by kontekst użycia słowa podpowiadał jego znaczenie na wypadek, gdyby definicja słowa była nieprecyzyjna lub trudna do zrozumienia dla obcokrajowca. Umożliwia pokazanie od razu w przykładach składni i kolokacji. Daje swobodę napisania tylko tyle, ile trzeba, zamiast okrajać zapożyczony cytat, martwiąc się, czy zdanie wciąż zachowuje sens. „Ale co my się tyle przejmujemy tymi głupimi obcokrajowcami” – mógłby ktoś rzucić. Sęk w tym, że funkcja przykładu jako elementu hasła, który jest w stanie wyklarować sens znaczenia, do którego jest przyporządkowany, jest ważna nie tylko dla obcokrajowca. Sam spotykam się nie tak znowu rzadko z sytuacją, że mam polskie hasło i wiem, jakie to słowo ma tłumaczenia na język obcy – nie jestem jednak w stanie przypisać tych tłumaczeń do numerów, bo nie rozumiem, co autor hasła miał na myśli, pisząc definicje znaczeń. Ja też jako codzienny użytkownik języka polskiego i autor haseł wcale nie mam ochoty głowić się, co Prus, Sienkiewicz czy Mickiewicz w danym miejscu mieli na myśli.

Zarzut o skazie subiektywizmu zawartej w samodzielnym pisaniu przykładów uważam za chybiony – bo nawet jeśli bierzemy jeden tekst z korpusu albo literatury, to dokonujemy tym samym selekcji, a więc subiektywizm wymyślania zastępujemy subiektywizmem wybrania jednego cytatu z ogółu i odrzucenia reszty. Co więcej, masowo wstawiając teraz teksty sprzed stu albo stu pięćdziesięciu lat, robimy słownik polszczyzny z innego wieku. Nie tylko ryzykujemy, że pewnych starych konstrukcji czytelnik nie będzie znał i zmusi to go do skakania po słowniku (zapewne nie naszym, bo w takich starych słowach mamy duże braki), ale ryzykujemy coś więcej: że oderwiemy słownik od aktualnej rzeczywistości. Skoro profesjonaliści piszą do słownika teksty „z głowy”, dlaczego my nie mielibyśmy tak robić? Pomijając już słownik dolnołużycki – biorę do ręki mój jednojęzyczny Oxford Advanced Learner’s Dictionary of Current English. Nie widzę tam śladu nawiązań do literatury pięknej; przykłady są takie, by pomagały w zrozumieniu znaczenie słowa, a jednocześnie zajmowały jak najmniej miejsca. Spytam się więc odwrotnie: czy ktoś widział profesjonalistów używających na taką skalę jak my cytatów z literatury? Czy nasz pomysł nie jest wręcz wybrykiem, jednostkowym eksperymentem na żywym ciele?

Dodając do hasła tylko cytat z literatury powodujemy, że hasło niby przykład ma (czyli automatyczne statystyki nie pokażą, że w haśle brakuje przykładu), ale nie jest to prawdziwy przykład. Wstawianie do haseł o rzeczach najprostszych (tzn. słowach podstawowych dla języka; które zna dziecko kończące zerówkę, które podaje się w pierwszych rozdziałach podręcznika do nauki języka obcego) jest strzelaniem z armaty do muchy. Jeśli obcokrajowiec zainteresuje się takim hasłem, to będzie to oznaczało, że zna polski na słabym poziomie i uczy się podstaw. My zaś rzucamy go na głęboką wodę, serwujemy przykład z literatury pięknej. Czy naprawdę żeby zrozumieć słowo „powolny” trzeba siłować się z Bolesławem Prusem, zerkać na znaczenie słów „rozlec się”, „turkot”, „bryczka”, „bita droga”, „stęp”? Czy pierwszy przykład daje jakąkolwiek wskazówkę, co mogłoby oznaczać słowo „powolny”? (Podpowiedź: jeśli w miejsce opisywanego słowa wstawimy np. „szybko” albo „głośno” i zdanie zachowa sens, to znaczy, że przykład nie daje takich wskazówek.) Jeszcze pół biedy, gdyby te cytaty były z prasy – ale one są z wierszy i powieści, gdzie pisanie prosto i zrozumiale jest wręcz wykroczeniem, gdzie dekoruje się każde zdanie wyszukanymi epitetami, gdzie w dobrym guście jest sztuczna archaizacja i ogólne udziwnianie języka. Żywy język to nie język powieści; jego nieodłączną częścią są wypowiedzi przy śniadaniu w domu, w sklepie na rogu, na spotkaniu ze znajomymi. Owszem, zapewne ktoś kiedyś w jakimś dziele użył słowa w takim „podwórkowym” znaczeniu, o jakie nam chodzi, ale w przypadku codziennych dialogów o wiele szybciej (i lepiej) jest po prostu wymyślić zdanie z głowy niż szukać.

Nie żebym był całkowicie przeciwko cytowaniu w przykładach. Uważam jednak, że każde narzędzie należy dostosować do okoliczności. Literatura piękna to fikcja, sztuczny świat (a w przypadku tekstów z Wikiźródeł – dodatkowo świat z innej epoki), dlatego nie należy jej używać do opisu języka życia codziennego. Pojęcia abstrakcyjne, wyszukane albo starsze słownictwo – tak, to miejsce, gdzie można, a czasem trzeba podeprzeć się literaturą. Ale nie udawajmy, że żyjemy w „Nad Niemnem”. Jeśli ktoś bardzo chce dodać cytat jako przykład do słowa z „normalnego życia” – dobrze, ale niech nie będzie to cytat jedyny dla danego znaczenia, lecz przykład dodatkowy, uzupełniający przykład napisany specjalnie dla tego hasła. Byłbym też za zwiększeniem udziału prasy w cytatach kosztem literatury pięknej: bo prasa używa żywszego języka, bardziej ukierunkowanego na komunikatywność, zamiast bawić się w wywoływanie takich czy innych uczuć u czytelnika.

Do tej pory cały czas miałem na myśli przede wszystkim język polski. W przypadku języków obcych sytuacja jest nieco inna, bo nie mamy stuprocentowej pewności, że pisząc przykład „z głowy”, piszemy go poprawnie – toteż bezpieczniej jest w większym stopniu opierać się na cytatach. Osobiście jednak i w tym przypadku podtrzymuję zdanie, że prasa (ewentualnie Wikipedia, jako źródło bądź co bądź popularnonaukowe, a nie śmiertelnie poważny traktat naukowy) jest lepszym od literatury pięknej źródłem przykładów.

10 październik 2008

Tu nie będzie przeklinania

Jebany kał! Najebać to porno…

Nie, nie, nie odbiło mi zupełnie, proszę nie zamykać kart przeglądarek! Krótka wypowiedź, którą wyżej napisałem, nie jest wcale oburzająca. Jest całkiem zwyczajna, w pewnym języku takimi słowy mogłaby zwrócić się kochająca żona do męża przy rodzinnym obiedzie, tekst taki mógłby na pewno znaleźć się w artykule w gazecie, poważnym opracowaniu naukowym albo na przykład w publicznym przemówieniu premiera Saksonii (który mówi owym językiem w domu). No, może nie przemówieniu do polskich polityków, bo pan Tilich nieźle podobno mówi po polsku. A język, o którym mowa, wcale nie jest taki obcy. Weźmy na przykład: Kultura twori mosty mjez ludami, Łódź je město w Pólskej, kotrež leži w łódźskim wojewódstwje albo Wrocław je město w Pólskej a stolica Delnjeje Šleskeje. Ma přibližnje 635 tysacy wobydlerjow.

Jaki to język? Osoby, które czytają posty na blogu, są zapewne blisko rozwiązania. To ciekawe, jak odmienne od tego, co nam się wydaje, jest znaczenie najebać w języku zupełnie bliskim naszemu, że czasownik jebać pojawia się w tekście z pisma Katolicki Posoł z 1915 roku, lub że w haśle porno na Wikisłowniku można poruszyć całkiem poważne i niewesołe sprawy. Ba, dobrze też wiedzieć, że nie musimy mścić się za zniewagę, gdy obcokrajowiec spyta się nas, czy jemy kał.

To było o tym, co można znaleźć na Wikisłowniku, a wspomnę jeszcze, że na angielskich Wikibooks tworzony jest zbiór "fałszywych przyjaciół", tzn. wyrazów, które wyglądają podobnie, ale znaczą co innego w różnych językach. Polecam zajrzeć i uzupełnić lub — jeśli ktoś woli — po prostu pośmiać się z tego, do jakich nieporozumień może dochodzić między "braćmi Słowianami".

06 październik 2008

Jakich języków nie ma na Wikisłowniku?

Obecnie polski Wikisłownik zawiera 202 języki. Porównując to do kilku tysięcy znanych języków wygląda to na kroplę w morzu. Jakich języków brakuje? Większości naturalnych, np. telugu i wielu sztucznych, np. toki pona, czy quenya.

Wydawałoby się, że brakujące języki są mało popularne, więc mała strata, że ich nie ma. Guzik prawda. W telugu mówi 76 milionów osób. Dla porównania po polsku około 50 milionów. Tyle tylko, że część wspólna zbiorów osób mówiących po polsku i w telugu jest widać zbyt mała, żeby ten język pojawił się na naszym Wikisłowniku. A szkoda.

No właśnie. Języki, których brakuje, są w Polsce mało popularne. Bo kogo zainteresuje telugu, oprócz części imigrantów z Indii i fanów tollywoodu? Kto będzie chciał zagłębiać się w quenyi z wyjątkiem bardzo głębokich tolkienomaniaków?

Ale to co przed chwilą napisałam nie dotyczy wszystkich brakujących. Nie ma na Wikisłowniku całej grupy bardzo ważnych języków i to popularnych wśród Polaków. Chodzi mi to o języki migowe. A w szczególności o Polski Język Migowy. Chyba nie muszę tłumaczyć jak ważny w Polsce jest to język.

Tyle tylko, że PJM ma kilka cech, które utrudniają jego usłownikowanie. Po pierwsze nie jest liniowy, po drugie nie ma alfabetycznego zapisu (a nawet w ogóle zapisu). O ile to pierwsze nie powinno być dużą przeszkodą, to to drugie prowadzi do kolejnych problemów. Największy z nich to brak możliwości nazywania stron w tym języku. Wydaje mi się, że można by to rozwiązać tylko poprzez nazywanie stron polskimi odpowiednikami znaczeń, co zabiera dużą część funkcjonalności słownika. Nie da się wtedy zrobić słownika migowo-polskiego a tylko polsko-migowy. Z drugiej strony świetnie by się w tym przypadku sprawdziła „multimedialność” Wikisłownika. Filmiki z nagraniami „wymowy”, itp.

Marzy mi się Wikisłownik zawierający wszystkie wymienione w tym poście języki. Primo, chciałabym móc łatwo sprawdzić jak coś pokazać głuchoniememu. Secundo, lubię zarówno Tolkiena jak i Tollywood.

Wygrałem zakład

W czerwcu pisząc o "EKG" Wikisłownika stwierdziłem, że Wikisłownik dobije do liczby 100 000 stron przed prognozowanym wtedy przez skrypt 24 października. I co? Miałem rację; szkoda, że z nikim nie założyłem się o żadne pieniądze ;-) Gdzieś w nocy z 5 na 6 października padła kolejna granica — przede wszystkim dzięki Nemo produkującemu hasła z węgierskiego i anonimowemu użytkownikowi z Warszawy wstydzącemu się zalogować, a piszącemu w zakresie od bośniackiego i słowackiego przez polski do arabskiego.

Mnie zaś dzisiaj udało się rozwiązać zagadnienie, czy skiba i pomazka oznaczają po górnołużycku kromkę czy naszą skibę. Znajomy Łużyczanin wyjaśnił przyjaźnie, że skiba w górnołużyckim to odkryty kawałek chleba (czyli zwykła kromka), a pomazka to już taka skiba posmarowana masłem. Ot, o takich szczegółach normalne słowniki nie piszą. A ponieważ nie piszą, trzeba robić małe śledztwa; na szczęście nie zawsze takie, jak czasem w dolnołużyckim. Ech, dolnołużycki… Ja tu kiedyś wszystko z siebie w końcu wyrzucę, ujawnię, jak to naprawdę z tym językiem jest, co ma wspólnego z Izraelem, kim są naprawdę włodarze dolnołużyckich instytucji oraz za czym stoją kultyści Latającego Potwora Spagetti. Ha! Ale to w następnych odcinkach, bądźcie cierpliwi.

26 wrzesień 2008

Europejski Dzień Języków

Dzisiaj mamy Europejski Dzień Języków, mający przypominać ludziom, że warto uczyć się języków. Sprawa ma widać dużą wagę, bo święto zostało ustanowione przez radę ministrów Unii Europejskiej w roku 2001, a teraz wspierają je Komisja i Rada Europejska. W Polsce organizowanych jest parę imprez, zarówno w większych, jak i mniejszych miastach. Co do ciekawostek, ulotka przygotowana przez europejskie instytucje zachęca do nauki języków bardzo wymownie, bo przygotowano ją w 11 językach, wszystkich dla nas obcych.

Z naszej strony chcieliśmy świętować Europejski Dzień Języków przez osiągnięcie 10 000 stron — jak na złość całkiem niedawno zepsuł się licznik (zepsuł, nie zepsuł — w każdym razie ani drgnie) i mimo heroicznych wysiłków użytkowników nie udało nam się to.

Jeszcze w kwestii języków — do 200 brakuje nam na Wikisłowniku jeszcze jednego. Może to właśnie ty znasz ten, którego jeszcze nie mamy?

24 wrzesień 2008

KISS psa w nos...

Na blogu Radomila pojawił się wpis o trudności w edycji Wikipedii. Zauważono, że powinna być stosowana reguła KISS, która sprowadza się do tego, że jak najwięcej rzeczy powinno być maksymalnie uproszczonych. Na Wikipedii jest zbyt dużo zasad, zbyt dużo szablonów i szablono-maniaków.

Zastanawiam się, jak to odnieść do Wikisłownika. Chyba moje obawy są słuszne, że Wikisłownik dogoni Wikipedię w trudności edycji już niedługo. Co może być tego przyczyną?

1. brak struktur specjalnie dla słownika; Wikisłownik i pozostałe projekty mają taki sam system edycji jak Wikipedia; musimy dostosowywać się do zastanych struktur; brak nowych rozwiązań

2. powoli, ale rośnie liczba szablonów; na początku pisało się ''[[rzeczownik|rzecz.]]'' ''[[czasownik|czas.]]'', ''z łac. [[hypothēca]]'', zobacz też: [[w:Prostota|prostota]] w Wikipedii, zobacz też: [[musika]] (i od razu wszystko było jasne). Teraz pisze się {{rzecz}}, {{czas}}, {{etym|łac|hypothēca}}, {{wikipedia}}, {{zobteż}}, {{zobteż2}} i inne... Że już nie wspomnę o ilości parametrów do spamiętania... Boję się myśleć, ile tego jest na Wikipedii...

Być może na Wikipedii ze strony zwolenników szablonów padał argument, że kod strony jest dla edytorów, a efekt jest ważniejszy, to właśnie efekt końcowy oglądają czytelnicy. Ha! Taki wał! Powiem szczerze - wolę edytować strony pełne HTMLa niż hasła Wikipedii. Wróćmy jednak na nasz poczciwy Wikisłownik...

Zastanawiam się nad pomysłem powrotu do starych zasad. Co by było, gdyby nie było szablonu {{wikipedia}}, a zamiast niego pisali jak powyżej? Albo zamiast {{zobteż}} i {{zobteż2}} pisać także jak powyżej?

Tylko proszę, nie piszcie mi, że szablony są dla dobra serwerów, albo że szablony to krótszy zapis i mniej znaków jest zapisywanych... Jakoś gdy boty edytują setki tysięcy znaków w ciągu minuty to nikt nie mówi o serwerach, a gdy my chcemy uprościć edycję do pełnego widoku hasła, to zasłaniacie się serwerami albo - o zgrozo - prostotą edycji. Pisząc "pełny widok" mam na myśli, żeby jak najwięcej tego, co widzi czytelnik było w kodzie strony. I tak mamy już szablony w szkielecie hasła. Ja nie chcę więcej! Do czego to doszło, żeby na zlocie uczyć ludzi z Wikipedii jak tworzyć proste hasła słownika?!