27 lutego 2012

Nowa Strona Główna

Niedawno w nasze skromne progi zawitał wikipedysta o wdzięcznym i zagadkowym pseudonimie: Tar Lócesilion. Gdybyśmy posługiwali się jakimś wskaźnikiem edytorskiej produktywności, pewnie w styczniu Tar nie wypadłby najgorzej, ponieważ w niespełna trzystu edycjach udało mu się od początku do końca przeprowadzić kampanię na rzecz modernizacji strony głównej.

Nowa strona jest przede wszystkim ładniejsza. Kolorystycznie kojarzy się teraz z naszym logo, obramowanie zostało wygładzone i zaokrąglone. Małe nagłówki rubryk zastąpiliśmy dużo większymi, a każdy został opatrzony miniaturowym obrazkiem. Mimo że układ graficzny pożyczyliśmy od Wikipedii, różne kolory i treści powinny zapobiec wszelkim pomyłkom. Co tydzień mamy drobny problem z dopasowaniem długości lewej i prawej szpalty ze względu na zmianę Słowa Tygodnia. Na szczęście jest to rubryka elastyczna, którą stosunkowo łatwo skrócić lub wydłużyć.

Główną zmianą merytoryczną jest dodanie rubryki "Język miesiąca" i umieszczenie jej w najbardziej widocznym miejscu, by jako pierwsza przykuwała uwagę odwiedzających. Co miesiąc jeden z redaktorów wybierze pewien język i wypisze kilka ciekawostek na jego temat, wymieni kilka podstawowych lub ciekawych haseł oraz poda odnośniki do indeksów tematycznych. Pierwszym językiem miesiąca został fiński, a wczoraj jego miejsce zastąpił turecki. Miejmy nadzieję, że taka reklama języka będzie bodźcem do jego rozwoju. Fińskich haseł w lutym niestety nie przybyło, ale akurat tak się złożyło, że użytkownik zajmujący się czasem mową Finów w zeszłym miesiącu był mało aktywny.

Przywróciliśmy rubrykę "Słowo tygodnia", którą niektórzy już pochowali pod koniec zeszłego roku. Postanowiliśmy jednak, że hasło takie nie musi być nowe lub nawet bardzo rozbudowane. Jeśli w danym tygodniu nie będzie żadnych kandydatów, prawo do wstawienia ST ma każdy redaktor według własnego widzimisię. W zeszłym roku próbowaliśmy wprowadzić zasadę, by rubryka była ustawiana z tygodniowym wyprzedzeniem. Chyba należy do tego pomysłu wrócić – pozwoli to chociażby na uniknięcie dziury, która powstaje o północy z niedzieli na poniedziałek, dopóki nikt nie zajmie się wstawieniem nowego słowa. Postaramy się też zachować różnorodność językową; jak na razie mieliśmy już ST arabskie (كحل), staropolskie (dziewosłąb), łacińskie (sphaera) oraz polskie (kaloryfer).

Zrezygnowaliśmy z wyliczania języków, które liczą sobie w Wikisłowniku mniej niż 500 haseł. Po pierwsze, mamy już ponad 300 języków i średnio co tydzień dochodzi jakiś nowy, więc prędzej czy później rubryka rozrosłaby się zanadto. Po drugie, wrzucanie sycylijskiego (465 haseł) z !Xóõ (2 hasła), jest zgoła krzywdzące. Zamiast całej listy, mamy zatem odnośnik do statystyk, gdzie użytkownik znajdzie każdy język wraz z odpowiadającą mu liczbą haseł i znaczeń.

Dodaliśmy też rubrykę "Indeks tematyczny", która wprawdzie istniała wcześniej, ale była znacznie uboższa i mniej widoczna. To ukłon w stronę użytkowników, którzy dopiero zaczynają przygodę z nowym językiem obcym. Znajdą tam indeksy takie jak "podstawowe rzeczowniki", "części ciała", "kolory", ale też opisy gramatyczne czy aneks zawierający przysłowia. Dział "Praca nad Wikisłownikiem" został uporządkowany, tak że teraz większość przydatnych redaktorom odnośników dostępna jest na stronie głównej, tuż pod rubrykami przeznaczonymi dla nowych odwiedzających. Jedyny dział, którego treść nie została zmieniona, to "Projekty siostrzane". Zapraszam do odwiedzania naszej SG – może znajdziecie tam coś ciekawego dla siebie?

12 marca 2011

Wikisłownik w czasopiśmie językoznawczym

W XII zeszycie publikowanego przez Wydawnictwo Uniwersytetu Warmińsko–Mazurskiego czasopisma Prace Językoznawcze ukazał się artykuł o Wikisłowniku.

Pomysł artykułu powstał przy okazji wykładu o Wikisłowniku wygłoszonego w 2007 r. na zorganizowanej przez UWM w Olsztynie konferencji językoznawczej "Nowe zjawiska w języku, tekście i komunikacji". Piętnastostronicowy tekst zawiera w pierwszej części prezentację projektu, jego zasobów oraz obowiązujących w nim zasad pracy, zaś w drugiej części dość szczegółową analizę gramatycznych i fleksyjnych informacji podawanych w polskich hasłach Wikisłownika.







Dane publikacji:
Urszula Andrejewicz, Tomasz Sienicki; "Wikisłownik - pierwszy naprawdę uniwersalny słownik polski?"; Prace Językoznawcze XII 2010; Olsztyn: Wyd. UWM; s. 5-21; ISSN 1509-5304

09 listopada 2010

Slovio poległo...

W nawiązaniu do notki z 2007 r. o usunięciu artykułu o sztucznym języku Slovio z angielskiej Wikipedii warto poinformować, że w zeszłym tygodniu hasło "Slovio" zostało skasowane także z zasobów polskiej Wikipedii. Dyskusja była dość mikra, oprócz wnoszącego o skasowanie hasła użytkownika (zresztą przedstawiającego się jako autor innych języków sztucznych) wzięły w niej udział tylko 3 osoby. Obecnie rozważa się także usunięcie hasła o autorze tego języka.

O Slovio można jeszcze poczytać po niemiecku i w prawie 30 innych językach. No i oczywiście w Wikisłowniku.

25 lipca 2009

Wikisłownik i esperanto

Dzisiaj liczba haseł w esperanto na polskim Wikisłowniku przekroczyła 5000. Pięciotysięczne to Bjalistoko, a hasło nr 5001 — Universala Kongreso. Wszystko to z okazji rozpoczynającego się właśnie Światowego Kongresu Esperanto, który w tym roku odbywa się w Białymstoku.
Esperanto na Wikisłowniku wciąż się rozwija, ale przy okazji warto zrobić pewne podsumowanie tego co już jest.
Oto kilka informacji na temat esperanta na Wikisłowniku:
  • Obecnie esperanto na polskojęzycznym Wikisłowniku zajmuje 11. miejsce jeśli chodzi o liczbę haseł (na ponad 200 obecnych tam języków).
  • Hasła te to opisy słów, morfemów (rdzeni, przedrostków i przyrostków) oraz przysłów.
  • Istnieje też kilka słowników tematycznych, m.in. fałszywi przyjaciele, kolory oraz indeksy dotyczące państw i zwierząt.
Tyle suchych faktów. Ważniejsze jest to dlaczego Wikisłownik jest wyjątkowy jeśli chodzi chodzi o esperanto:
  • Prawdopodobnie jest to jedyny polskojęzyczny słownik esperanta zawierający indeks a tergo, czyli taki, w którym o kolejności decyduje najpierw ostatnia litera, potem przedostatnia itd. W esperanto jest to bardzo przydatne narzędzie ze względu na schematyczność tego języka. W ten sposób razem zgrupowane są wszystkie rzeczowniki (końcówka -o), przymiotniki (końcówka -a) lub czasowniki (końcówka -i). Co więcej, obok siebie leżą np. określenia narzędzi (końcówka -ilo) lub zawodów (końcówka -isto).
  • Hasła to nie tylko same definicje, ale też ilustracje, przykłady użycia, nagrania wymowy, synonimy, antonimy, spis przysłów, w których występuje dane słowo itp.
  • Opisy słów linkują do wszystkich morfemów, które zawiera dane słowo. I w drugą stronę — w opisach morfemów podane są słowa pochodne.
I jeszcze jedna ciekawostka — polski Wikisłownik jest z zasady pisany po polsku. Ale jeśli ustawi się w preferencjach użytkowanika język interface'u na esperanto, to nie tylko sam interface będzie esperanckojęzyczny, ale i duże fragmenty opisu danego słowa. Bowiem od niedawna standardowe elementy haseł są przetłumaczone na kilka języków, wśród których jest i esperanto. A zatem w takim przypadku zamiast „przykłady” zobaczymy „ekzemploj”, a zamiast „etymologia” — „etimo”.
Obecna liczba haseł o słowach i wyrażeniach esperanckich to nie jest zasługa jednej osoby, a większej grupy edytorów. Bardzo dużo haseł zostało wprowadzonych przez boty a następnie są one ręcznie weryfikowane przez użytkowników. Tak odbył się na przykład import z Universala Vortaro. Esperantyści, którzy napracowali się przy tych 5000 haseł to oprócz botów i ich operatorów m.in. Phoenix84, Kasiajulka, Tarnoob, ja i wielu niezalogowanych użytkowników. Ja niestety nie mogę uczestniczyć w tegorocznym kongresie, ale być może ktoś z pozostałych wikisłownikowców się tam pojawi...

23 stycznia 2009

Łużyce nową Irlandią, ziemia połabska nową Ziemią Świętą

Dorzucę jeszcze małe post scriptum do wczorajszego posta o Słowianach Połabskich. Grzebiąc niedawno w Internecie trafiłem na niebanalny artykuł pod tytułem… "O reslawizację Wschodnich Niemiec". Pomysł jego można streścić tak: trzeba stworzyć państwo dwu-trzymilionowe państwo łużyckie oraz państwo połabskie — od Hamburga przez Berlin do granicy z Polską (na Odrze i Nysie ma się rozumieć). Pięknie, ale co z niemieckojęzycznymi mieszkańcami tych terenów? Wywieźć wszystkich jeszcze bardziej na Zachód? O nie, autor do takich rozwiązań uciekać się nie zamierza, ale nie znaczy to wcale, że jego plany pozbawione są rozmachu.

Po pierwsze, pisze pomysłodawca, w Niemczech od dawna istnieje ruch dążący do zrzucenia niemieckiego jarzma i powrotu do słowiańskich korzeni. Mieszkańcy wschodnich Niemiec zaczynają się ku temu organizować, czując swoją odrębność od reszty Niemiec. Ruch został zahamowany, ale nie zniszczony przez represje hitlerowskie. Co więc należy zrobić, aby ich zamiary urzeczywistnić?

W Łużycach mówiący po łużycku "musieliby posiąść możność reslawizacji swych zgermanizowanych ziomków" (pięknie powiedziane, prawda?). Tak samo, jak w Irlandii wprowadzano język irlandzki w społeczeństwo mówiące niemal wyłącznie po angielsku, łużycki poprzez szkolnictwo wypierałby niemiecki. Powiedzmy, prawie tak samo — z małą poprawką na konieczność wysiedlenia Niemców na terenie między Dolnymi a Górnymi Łużycami, żeby powstał jednolity ośrodek słowiański w państwie.

Proste, prawda? Ale co tu zrobić z terenami Słowian Połabskich — wszak od 200 lat jedyny słyszany tam język słowiański to najwyżej polski. To, co zostało po Drzewianach, to ewentualnie gdzieniegdzie strój ludowy. Reslawizacja w takich warunkach? Da się zrobić! Skoro Żydom w Palestynie udało się zrewitalizować hebrajski, w końcu wymarły o wiele dawniej niż połabski — pisze autor — dlaczego nie udało by się tak ze słowiańskim językiem w północnych Niemczech? Trzeba, żeby odpowiednia ilość osób poczuwająca się do słowiańskich, połabskich korzeni wróciła do języka przodków — a dalej już pójdzie. Przez pewien czas językiem potocznym i urzędowym byłby niemiecki, ale powoli zastępowano by go przez połabski. Nad wszystkim czuwałaby ONZ.

"O reslawizację Wschodnich Niemiec" stworzył nasz rodak. Żeby nieco usprawiedliwić powyższe szalone pomysły — tekst powstał tuż po II wojnie światowej. Jeśli ktoś chce przeczytać całość — jest dostępna na stronie Polic. Jeśli ktoś nie ma ochoty i zastanawia się, co to ma znaczyć, że naplotłem tu tyle rzeczy bez związku ze słownikami i Wikisłownikiem — proszę bardzo, rzecz o rzeczy w połabskim i polskim.

22 stycznia 2009

Jak się drzewiej słowniki tworzyło

Język połabski, używany przez Słowian na terenach od dzisiejszej północnej Brandenburgii do Dolnej Saksonii, jest językiem, w którym nikt nigdy nie pisał (a przynajmniej nic nam o tym nie wiadomo) i który zdążył wymrzeć, zanim zajął się nim ktokolwiek o wykształceniu językoznawczym (nadłużej przetrwał w odosobnionych wioskach plemienia Drzewian, ale w XIX wieku nikt już się nim nie posługiwał). Co wcale nie przeszkadza temu, by powstał np. słownik połabsko-angielski. Mowa tu o "Polabian-English dictionary" naszych rodaków Kazimierza Polańskiego i Janusza Sehnerta; istnieją zresztą słowniki po polsku i niemiecku, a nawet opracowania gramatyki. Jak to możliwe? Posiadamy źródła z czasów, gdy mówiono jeszcze po połabsku, i choć ich autorzy (z jednym małym wyjątkiem) nie posługiwali się opisywanym przez siebie językiem, obecni naukowcy są w stanie metodami porównawczymi zrekonstruować w pewnym stopniu mowę Słowian Połabskich.

Cała ta konstrukcja wydaje się po zapoznaniu się z okolicznościami zupełnie niewiarygodna, wręcz szarlatańska — a jednak udała się (choć należy pamiętać, że jest to przybliżone odtworzenie wycinka języka). Zobaczmy bowiem: słowa spisywali amatorzy zaciekawieni "egzotyczną" mową: filozof (sam Leibniz), matematyk, pastor oraz sołtys (jako Drzewianin jedyny Słowianin i jedyna osoba znająca język w tym towarzystwie). Słowniki były tworzone bardziej jako ciekawostka niż jako coś praktycznego (użytkownicy połabskiego mieszkali na wsi, musieli ze względu na okoliczności i tak znać niemiecki, więc dla Niemca nie było sensu uczyć się ich języka). Stosunek do połabskiego dobrze obrazuje sprowadzenie na dwór króla Hanoweru kobiety mówiącej w drzewiańskim połabskim — by jaśnie pan usłyszał dziwny język zanim ów zniknie. Badacze-amatorzy zapisywali słowa niemieckim alfabetem, tak, jak potrafili — bo nie wiedzieli, jak można by inaczej.

W sumie dość zabawne są problemy, jakie wiążą się ze stworzonymi przez nich słownikami. Przytaczane wypowiedzi nie zawsze są prawidłowo podzielone na wyrazy — co nie powinno dziwić, bo kto miałby robić rozbiór gramatyczny zdania: wypytywani niepiśmienni ludzie czy odpytujący Słowian, którzy często w ogóle nie rozumieli tego, co piszą? W jednym słowniku spisanym po francusku jest część dotycząca różnych zwrotów z języka codziennego; obok pytań po francusku pojawia się tekst po połabsku — ale tekst odpowiedzi zamiast tłumaczenia pytania. Ot, najwidoczniej odpytywani ludzie nie dogadali się z badaczem, co chce uzyskać (od razu przychodzi mi na myśl Świat Dysku Pratchetta i góry "Nie Wiem", "Jakaś Góra", "Twój Palec Idioto", pozostałość po odkrywcach zapisujących fonetycznie odpowiedzi tubylców na pytania o okolicę).

Jeden z autorów słowników z tamtych czasów, pastor von Jessen, wspomniał o problemach, jakie napotkał w trakcie pracy. I tu zaczyna się zabawa: znającymi połabski byli prości ludzie żyjący na wsi. Mało ich obchodziła pomoc w jakichkolwiek "badaniach": od poniedziałku do soboty ciężko pracowali i nie mieli na nic czasu, a w niedzielę chcieli mieć po prostu święty spokój. Pastor był więc w kropce i dopiero po długich staraniach znalazł jednego chłopa, który zgodził się z nim regularnie rozmawiać. I całe szczęście, bo inaczej nie było by słownika von Jessena, uznawanego ze względu na staranność pastora za jedno z najważniejszych źródeł wiedzy o połabskim. Autorzy "Polabian-English dictionary" czynią na podstawie koncentracji słownictwa wokół różnych tematów obserwację, że Drzewianie, jako prości ludzie, mieli w języku słowa tylko na to, czego sami doświadczali, natomiast bardzo mało na tematy abstrakcyjne itp. Wyliczają więc rzeczy, które składały się na życie typowego Słowianina na tych terenach (cytuję z pamięci): "uprawa roli, las, owoce leśne, ptaki; jedzenie, picie, handel, walka, wojna, prostytucja". Ciekawe, prawda? Wśród brakujących słów wymieniają… krzesło — ubodzy Drzewianie w domach siedzieli na ziemi, krzeseł nie mieli, więc też i na nie określenia. Ostatecznie określenie na krzesło zostało zapożyczone do połabskiego z niemieckiego.

Ciekawe, jak dużo słowników powstało w ten sposób: wyjeżdża naukowiec na głęboką prowincję, chodzi za autochtonami i uprasza ich o poświęcenie chwili czasu, a w końcu głowi się, jak zapisać, co usłyszał, bo odpytywany nie jest w stanie mu pomóc. Hej, ktoś narzekał, że jest trudno tworzyć Wikisłownik?

16 grudnia 2008

Słowa zdecentralizowane

Wyobraźcie sobie rzecz, która jest znana w całej Polsce, ale w każdym regionie nazywana. I nie ma jednej, ogólnopolskiej nazwy. Pewnym zaskoczeniem było dla mnie odkrycie takich tworów przy okazji uzupełniania regionalizmów na Wikisłowniku.
A chyba najbardziej zdecentralizowany leksykalnie przedmiot wygląda tak



W Łodzi jest to angielka, w Krakowie - weka, w Poznaniu - kawiorek lub kawiorka, w Katowicach - francuz, w Białymstoku - baton, a w Warszawie - bułka paryska lub wrocławska. A jak to nazwać w języku zrozumiałym dla wszystkich Polaków? Długa bułka pszenna? A wydawałoby się, że polski to taki jednolity, scentralizowany język...

06 grudnia 2008

Jeszcze fałszywi przyjaciele

Znowu czytając dzisiaj wiadomości z Łużyc wpadłem na zabawnego fałszywego przyjaciela. Weźmy tekst "wy sćo jězu skazali?". Nie jest to wcale fragment piosenki wygolonego na łyso zespołu ani treść wymiany zdań między kibicami rywalizujących drużyn (zdanie zresztą spreparowałem na poczekaniu, nie szukajcie w Google'u). Weźmy pozornie podobny przypadek: jeśli głośno wymówi się "wy sćo tam byli?", można wpaść, że chodzi o odpowiednik "wyście tam byli?".

Tak naprawdę "wy sćo jězu skazali?" znaczy "czy zamówiliście już jedzenie?", a jak coś jest "skazane" to jest zamówione ;-) W tekście z wiadomości, który czytałem, dziwiłem się z kolei, czemu "gmejny kažu swójim staršym wobydlarjam" (mieszkańcom) coś na święta zrobić. Okazało się, że gminy nie każą, tylko zapraszają, bo kazaś to zapraszać.

02 grudnia 2008

Nowe strony kategorii języków

W ostatnim czasie wprowadziliśmy małą reformę stron kategorii języków. Chodziło głównie o to, by ustandaryzować wygląd takich stron, pozbyć się złych rzeczy (jak wielki i nieprzydatny formularz „dodaj hasło”), a dobre udostępnić dla wszystkich języków. Co wchodzi w skład tych dobrych rzeczy?

  • dla większej przejrzystości i oszczędności miejsca treść upakowano w tabelkę

  • automatycznie aktualizowane i mówiące poprawną polszczyzną liczniki haseł

  • po prawej stronie wyróżnione linki do opisu języka na Wikipedii, podręcznika na Wikibooks, nagrań wymowy do Wikimedia Commons

  • link „losuj hasło” dla osób na wypadek, by ktoś miał ochotę po prostu „poskakać” po hasłach ;-)

  • kanał RSS z nowymi hasłami — coś zarówno dla osób uczących się języka (choć nie przy każdym języku jest gwarancja, że coś na kanale będzie często się pojawiać), jak i autorów (powiadamianie, gdy ktoś dopisze hasło do naszego ulubionego języka); RSS taki zresztą stworzyć może każdy dla dowolnej kategorii nie tylko na Wikisłowniku (szczegóły)


Rezultaty można zobaczyć na przykładzie języka angielskiego.

11 listopada 2008

Jak klasyka literatury polskiej szkodzi Wikisłownikowi

Na Wikisłowniku pojawił się ostatnio trend, by jako przykłady do haseł polskich wstawiać cytaty z materiałów Wikiźródeł – najczęściej starych książek, do których prawa autorskie wygasły, w związku z tym nie ma wątpliwości prawnych, czy można ich użyć. Na pierwszy rzut oka ma to same zalety – nie wymyślamy własnych, niestworzonych historii, tylko czerpiemy z dzieł wielkich autorów, dajemy przykład pięknej i na pewno poprawnej polszczyzny, oszczędzamy czas i wysiłek na samodzielne tworzenie przykładów. A do tego podbijamy ranking Google’a siostrzanych Wikiźródeł i być może skłaniamy kogoś do przeczytania trochę więcej z cytowanego dzieła. Brzmi pięknie, ale niestety naprawdę tak różowo nie jest.

Pomysł z użyciem dla języka polskiego gotowych przykładów, czy to z książek, czy to z korpusu językowego, nie jest nowy. Wypowiadałem się zawsze o nim z dużą dozą sceptycyzmu, którzy zwolennicy takich rozwiązań kontrowali mówiąc m.in., że nie mamy kompetencji językowych do pisania przykładów użycia słów, bo przykłady takie będą zawsze skażone subiektywizmem – będziemy więc pisali, jak my widzimy użycie słowa, a nie to, jak owe użycie wygląda w prawdziwym języku.

Dylematowi temu miałem okazję się przyjrzeć od drugiej strony – jako użytkownik. Zaglądam do dwóch internetowych słowników – języka dolnołużyckiego stworzonego przez Instytut Łużycki oraz górnołużyckiego Wikisłownika. Oba mają tę zaletę, że przy słowach podają przykłady, ale jednocześnie stoją na przeciwległych biegunach w metodologii ich doboru. W pierwszym przykłady są ewidentnie wymyślane; często nie są to nawet zdania, ale krótkie zwroty albo kolokacje. W drugim stosowane są wyłącznie teksty z korpusu językowego.

Korzystanie z dzieła Instytutu Łużyckiego to prawdziwa przyjemność. Ciężko jest w krótkiej definicji oddać znaczenie słowa, ale w zorientowaniu się, jaki zakres znaczeniowy ma dany wyraz, bardzo pomagają świetne przykłady – jest ich zazwyczaj tyle, ile trzeba, nie są pisane „na jedno kopyto”, podchodzą często do słowa z kilku stron. Z górnołużyckiego słownika korzystam bardzo mało, a prawie w ogóle nie czytam tamtejszych przykładów. Czytelnik jest tam atakowany wielką zbitą górą tekstu, najczęściej z artykułów publicystycznych z przestrzeni ostatnich 150 lat, gdzie autorzy żonglują słowami, wyszukanymi metaforami i odnoszą się do poważnych problemów społeczeństwa górnołużyckiego. Ciągnące się niemiłosiernie zdanie (lub czasem kilka zdań) trzeba czytać kilka razy, żeby rozgryźć figury retoryczne, złapać mniej więcej sens kompletnie wyrwanego z kontekstu fragmentu i dopiero wtedy móc zanalizować, jakie miejsce ma w tym zdaniu analizowane słowo. To prawdziwe piekło.

Całe szczęście, że na Wikisłowniku nie korzystamy w tak dużym stopniu z cytatów z dawnej prasy (za to preferujemy literaturę przygodową i „narodową”, co rodzi inne problemy), ale mimo wszystko uważam, że dla użytkownika o wiele lepszy jest pierwszy sposób pisania przykładów – z własnej głowy. Z głowy – to nie znaczy szybko i byle jak; tworzenie własnych przykładów daje właśnie swobodę skonstruowania zdania tak, by stanowiło samodzielną całość, a nie urywek długiego tekstu; by kontekst użycia słowa podpowiadał jego znaczenie na wypadek, gdyby definicja słowa była nieprecyzyjna lub trudna do zrozumienia dla obcokrajowca. Umożliwia pokazanie od razu w przykładach składni i kolokacji. Daje swobodę napisania tylko tyle, ile trzeba, zamiast okrajać zapożyczony cytat, martwiąc się, czy zdanie wciąż zachowuje sens. „Ale co my się tyle przejmujemy tymi głupimi obcokrajowcami” – mógłby ktoś rzucić. Sęk w tym, że funkcja przykładu jako elementu hasła, który jest w stanie wyklarować sens znaczenia, do którego jest przyporządkowany, jest ważna nie tylko dla obcokrajowca. Sam spotykam się nie tak znowu rzadko z sytuacją, że mam polskie hasło i wiem, jakie to słowo ma tłumaczenia na język obcy – nie jestem jednak w stanie przypisać tych tłumaczeń do numerów, bo nie rozumiem, co autor hasła miał na myśli, pisząc definicje znaczeń. Ja też jako codzienny użytkownik języka polskiego i autor haseł wcale nie mam ochoty głowić się, co Prus, Sienkiewicz czy Mickiewicz w danym miejscu mieli na myśli.

Zarzut o skazie subiektywizmu zawartej w samodzielnym pisaniu przykładów uważam za chybiony – bo nawet jeśli bierzemy jeden tekst z korpusu albo literatury, to dokonujemy tym samym selekcji, a więc subiektywizm wymyślania zastępujemy subiektywizmem wybrania jednego cytatu z ogółu i odrzucenia reszty. Co więcej, masowo wstawiając teraz teksty sprzed stu albo stu pięćdziesięciu lat, robimy słownik polszczyzny z innego wieku. Nie tylko ryzykujemy, że pewnych starych konstrukcji czytelnik nie będzie znał i zmusi to go do skakania po słowniku (zapewne nie naszym, bo w takich starych słowach mamy duże braki), ale ryzykujemy coś więcej: że oderwiemy słownik od aktualnej rzeczywistości. Skoro profesjonaliści piszą do słownika teksty „z głowy”, dlaczego my nie mielibyśmy tak robić? Pomijając już słownik dolnołużycki – biorę do ręki mój jednojęzyczny Oxford Advanced Learner’s Dictionary of Current English. Nie widzę tam śladu nawiązań do literatury pięknej; przykłady są takie, by pomagały w zrozumieniu znaczenie słowa, a jednocześnie zajmowały jak najmniej miejsca. Spytam się więc odwrotnie: czy ktoś widział profesjonalistów używających na taką skalę jak my cytatów z literatury? Czy nasz pomysł nie jest wręcz wybrykiem, jednostkowym eksperymentem na żywym ciele?

Dodając do hasła tylko cytat z literatury powodujemy, że hasło niby przykład ma (czyli automatyczne statystyki nie pokażą, że w haśle brakuje przykładu), ale nie jest to prawdziwy przykład. Wstawianie do haseł o rzeczach najprostszych (tzn. słowach podstawowych dla języka; które zna dziecko kończące zerówkę, które podaje się w pierwszych rozdziałach podręcznika do nauki języka obcego) jest strzelaniem z armaty do muchy. Jeśli obcokrajowiec zainteresuje się takim hasłem, to będzie to oznaczało, że zna polski na słabym poziomie i uczy się podstaw. My zaś rzucamy go na głęboką wodę, serwujemy przykład z literatury pięknej. Czy naprawdę żeby zrozumieć słowo „powolny” trzeba siłować się z Bolesławem Prusem, zerkać na znaczenie słów „rozlec się”, „turkot”, „bryczka”, „bita droga”, „stęp”? Czy pierwszy przykład daje jakąkolwiek wskazówkę, co mogłoby oznaczać słowo „powolny”? (Podpowiedź: jeśli w miejsce opisywanego słowa wstawimy np. „szybko” albo „głośno” i zdanie zachowa sens, to znaczy, że przykład nie daje takich wskazówek.) Jeszcze pół biedy, gdyby te cytaty były z prasy – ale one są z wierszy i powieści, gdzie pisanie prosto i zrozumiale jest wręcz wykroczeniem, gdzie dekoruje się każde zdanie wyszukanymi epitetami, gdzie w dobrym guście jest sztuczna archaizacja i ogólne udziwnianie języka. Żywy język to nie język powieści; jego nieodłączną częścią są wypowiedzi przy śniadaniu w domu, w sklepie na rogu, na spotkaniu ze znajomymi. Owszem, zapewne ktoś kiedyś w jakimś dziele użył słowa w takim „podwórkowym” znaczeniu, o jakie nam chodzi, ale w przypadku codziennych dialogów o wiele szybciej (i lepiej) jest po prostu wymyślić zdanie z głowy niż szukać.

Nie żebym był całkowicie przeciwko cytowaniu w przykładach. Uważam jednak, że każde narzędzie należy dostosować do okoliczności. Literatura piękna to fikcja, sztuczny świat (a w przypadku tekstów z Wikiźródeł – dodatkowo świat z innej epoki), dlatego nie należy jej używać do opisu języka życia codziennego. Pojęcia abstrakcyjne, wyszukane albo starsze słownictwo – tak, to miejsce, gdzie można, a czasem trzeba podeprzeć się literaturą. Ale nie udawajmy, że żyjemy w „Nad Niemnem”. Jeśli ktoś bardzo chce dodać cytat jako przykład do słowa z „normalnego życia” – dobrze, ale niech nie będzie to cytat jedyny dla danego znaczenia, lecz przykład dodatkowy, uzupełniający przykład napisany specjalnie dla tego hasła. Byłbym też za zwiększeniem udziału prasy w cytatach kosztem literatury pięknej: bo prasa używa żywszego języka, bardziej ukierunkowanego na komunikatywność, zamiast bawić się w wywoływanie takich czy innych uczuć u czytelnika.

Do tej pory cały czas miałem na myśli przede wszystkim język polski. W przypadku języków obcych sytuacja jest nieco inna, bo nie mamy stuprocentowej pewności, że pisząc przykład „z głowy”, piszemy go poprawnie – toteż bezpieczniej jest w większym stopniu opierać się na cytatach. Osobiście jednak i w tym przypadku podtrzymuję zdanie, że prasa (ewentualnie Wikipedia, jako źródło bądź co bądź popularnonaukowe, a nie śmiertelnie poważny traktat naukowy) jest lepszym od literatury pięknej źródłem przykładów.

10 października 2008

Tu nie będzie przeklinania

Jebany kał! Najebać to porno…

Nie, nie, nie odbiło mi zupełnie, proszę nie zamykać kart przeglądarek! Krótka wypowiedź, którą wyżej napisałem, nie jest wcale oburzająca. Jest całkiem zwyczajna, w pewnym języku takimi słowy mogłaby zwrócić się kochająca żona do męża przy rodzinnym obiedzie, tekst taki mógłby na pewno znaleźć się w artykule w gazecie, poważnym opracowaniu naukowym albo na przykład w publicznym przemówieniu premiera Saksonii (który mówi owym językiem w domu). No, może nie przemówieniu do polskich polityków, bo pan Tilich nieźle podobno mówi po polsku. A język, o którym mowa, wcale nie jest taki obcy. Weźmy na przykład: Kultura twori mosty mjez ludami, Łódź je město w Pólskej, kotrež leži w łódźskim wojewódstwje albo Wrocław je město w Pólskej a stolica Delnjeje Šleskeje. Ma přibližnje 635 tysacy wobydlerjow.

Jaki to język? Osoby, które czytają posty na blogu, są zapewne blisko rozwiązania. To ciekawe, jak odmienne od tego, co nam się wydaje, jest znaczenie najebać w języku zupełnie bliskim naszemu, że czasownik jebać pojawia się w tekście z pisma Katolicki Posoł z 1915 roku, lub że w haśle porno na Wikisłowniku można poruszyć całkiem poważne i niewesołe sprawy. Ba, dobrze też wiedzieć, że nie musimy mścić się za zniewagę, gdy obcokrajowiec spyta się nas, czy jemy kał.

To było o tym, co można znaleźć na Wikisłowniku, a wspomnę jeszcze, że na angielskich Wikibooks tworzony jest zbiór "fałszywych przyjaciół", tzn. wyrazów, które wyglądają podobnie, ale znaczą co innego w różnych językach. Polecam zajrzeć i uzupełnić lub — jeśli ktoś woli — po prostu pośmiać się z tego, do jakich nieporozumień może dochodzić między "braćmi Słowianami".

06 października 2008

Jakich języków nie ma na Wikisłowniku?

Obecnie polski Wikisłownik zawiera 202 języki. Porównując to do kilku tysięcy znanych języków wygląda to na kroplę w morzu. Jakich języków brakuje? Większości naturalnych, np. telugu i wielu sztucznych, np. toki pona, czy quenya.

Wydawałoby się, że brakujące języki są mało popularne, więc mała strata, że ich nie ma. Guzik prawda. W telugu mówi 76 milionów osób. Dla porównania po polsku około 50 milionów. Tyle tylko, że część wspólna zbiorów osób mówiących po polsku i w telugu jest widać zbyt mała, żeby ten język pojawił się na naszym Wikisłowniku. A szkoda.

No właśnie. Języki, których brakuje, są w Polsce mało popularne. Bo kogo zainteresuje telugu, oprócz części imigrantów z Indii i fanów tollywoodu? Kto będzie chciał zagłębiać się w quenyi z wyjątkiem bardzo głębokich tolkienomaniaków?

Ale to co przed chwilą napisałam nie dotyczy wszystkich brakujących. Nie ma na Wikisłowniku całej grupy bardzo ważnych języków i to popularnych wśród Polaków. Chodzi mi to o języki migowe. A w szczególności o Polski Język Migowy. Chyba nie muszę tłumaczyć jak ważny w Polsce jest to język.

Tyle tylko, że PJM ma kilka cech, które utrudniają jego usłownikowanie. Po pierwsze nie jest liniowy, po drugie nie ma alfabetycznego zapisu (a nawet w ogóle zapisu). O ile to pierwsze nie powinno być dużą przeszkodą, to to drugie prowadzi do kolejnych problemów. Największy z nich to brak możliwości nazywania stron w tym języku. Wydaje mi się, że można by to rozwiązać tylko poprzez nazywanie stron polskimi odpowiednikami znaczeń, co zabiera dużą część funkcjonalności słownika. Nie da się wtedy zrobić słownika migowo-polskiego a tylko polsko-migowy. Z drugiej strony świetnie by się w tym przypadku sprawdziła „multimedialność” Wikisłownika. Filmiki z nagraniami „wymowy”, itp.

Marzy mi się Wikisłownik zawierający wszystkie wymienione w tym poście języki. Primo, chciałabym móc łatwo sprawdzić jak coś pokazać głuchoniememu. Secundo, lubię zarówno Tolkiena jak i Tollywood.