11 listopada 2008

Jak klasyka literatury polskiej szkodzi Wikisłownikowi

Na Wikisłowniku pojawił się ostatnio trend, by jako przykłady do haseł polskich wstawiać cytaty z materiałów Wikiźródeł – najczęściej starych książek, do których prawa autorskie wygasły, w związku z tym nie ma wątpliwości prawnych, czy można ich użyć. Na pierwszy rzut oka ma to same zalety – nie wymyślamy własnych, niestworzonych historii, tylko czerpiemy z dzieł wielkich autorów, dajemy przykład pięknej i na pewno poprawnej polszczyzny, oszczędzamy czas i wysiłek na samodzielne tworzenie przykładów. A do tego podbijamy ranking Google’a siostrzanych Wikiźródeł i być może skłaniamy kogoś do przeczytania trochę więcej z cytowanego dzieła. Brzmi pięknie, ale niestety naprawdę tak różowo nie jest.

Pomysł z użyciem dla języka polskiego gotowych przykładów, czy to z książek, czy to z korpusu językowego, nie jest nowy. Wypowiadałem się zawsze o nim z dużą dozą sceptycyzmu, którzy zwolennicy takich rozwiązań kontrowali mówiąc m.in., że nie mamy kompetencji językowych do pisania przykładów użycia słów, bo przykłady takie będą zawsze skażone subiektywizmem – będziemy więc pisali, jak my widzimy użycie słowa, a nie to, jak owe użycie wygląda w prawdziwym języku.

Dylematowi temu miałem okazję się przyjrzeć od drugiej strony – jako użytkownik. Zaglądam do dwóch internetowych słowników – języka dolnołużyckiego stworzonego przez Instytut Łużycki oraz górnołużyckiego Wikisłownika. Oba mają tę zaletę, że przy słowach podają przykłady, ale jednocześnie stoją na przeciwległych biegunach w metodologii ich doboru. W pierwszym przykłady są ewidentnie wymyślane; często nie są to nawet zdania, ale krótkie zwroty albo kolokacje. W drugim stosowane są wyłącznie teksty z korpusu językowego.

Korzystanie z dzieła Instytutu Łużyckiego to prawdziwa przyjemność. Ciężko jest w krótkiej definicji oddać znaczenie słowa, ale w zorientowaniu się, jaki zakres znaczeniowy ma dany wyraz, bardzo pomagają świetne przykłady – jest ich zazwyczaj tyle, ile trzeba, nie są pisane „na jedno kopyto”, podchodzą często do słowa z kilku stron. Z górnołużyckiego słownika korzystam bardzo mało, a prawie w ogóle nie czytam tamtejszych przykładów. Czytelnik jest tam atakowany wielką zbitą górą tekstu, najczęściej z artykułów publicystycznych z przestrzeni ostatnich 150 lat, gdzie autorzy żonglują słowami, wyszukanymi metaforami i odnoszą się do poważnych problemów społeczeństwa górnołużyckiego. Ciągnące się niemiłosiernie zdanie (lub czasem kilka zdań) trzeba czytać kilka razy, żeby rozgryźć figury retoryczne, złapać mniej więcej sens kompletnie wyrwanego z kontekstu fragmentu i dopiero wtedy móc zanalizować, jakie miejsce ma w tym zdaniu analizowane słowo. To prawdziwe piekło.

Całe szczęście, że na Wikisłowniku nie korzystamy w tak dużym stopniu z cytatów z dawnej prasy (za to preferujemy literaturę przygodową i „narodową”, co rodzi inne problemy), ale mimo wszystko uważam, że dla użytkownika o wiele lepszy jest pierwszy sposób pisania przykładów – z własnej głowy. Z głowy – to nie znaczy szybko i byle jak; tworzenie własnych przykładów daje właśnie swobodę skonstruowania zdania tak, by stanowiło samodzielną całość, a nie urywek długiego tekstu; by kontekst użycia słowa podpowiadał jego znaczenie na wypadek, gdyby definicja słowa była nieprecyzyjna lub trudna do zrozumienia dla obcokrajowca. Umożliwia pokazanie od razu w przykładach składni i kolokacji. Daje swobodę napisania tylko tyle, ile trzeba, zamiast okrajać zapożyczony cytat, martwiąc się, czy zdanie wciąż zachowuje sens. „Ale co my się tyle przejmujemy tymi głupimi obcokrajowcami” – mógłby ktoś rzucić. Sęk w tym, że funkcja przykładu jako elementu hasła, który jest w stanie wyklarować sens znaczenia, do którego jest przyporządkowany, jest ważna nie tylko dla obcokrajowca. Sam spotykam się nie tak znowu rzadko z sytuacją, że mam polskie hasło i wiem, jakie to słowo ma tłumaczenia na język obcy – nie jestem jednak w stanie przypisać tych tłumaczeń do numerów, bo nie rozumiem, co autor hasła miał na myśli, pisząc definicje znaczeń. Ja też jako codzienny użytkownik języka polskiego i autor haseł wcale nie mam ochoty głowić się, co Prus, Sienkiewicz czy Mickiewicz w danym miejscu mieli na myśli.

Zarzut o skazie subiektywizmu zawartej w samodzielnym pisaniu przykładów uważam za chybiony – bo nawet jeśli bierzemy jeden tekst z korpusu albo literatury, to dokonujemy tym samym selekcji, a więc subiektywizm wymyślania zastępujemy subiektywizmem wybrania jednego cytatu z ogółu i odrzucenia reszty. Co więcej, masowo wstawiając teraz teksty sprzed stu albo stu pięćdziesięciu lat, robimy słownik polszczyzny z innego wieku. Nie tylko ryzykujemy, że pewnych starych konstrukcji czytelnik nie będzie znał i zmusi to go do skakania po słowniku (zapewne nie naszym, bo w takich starych słowach mamy duże braki), ale ryzykujemy coś więcej: że oderwiemy słownik od aktualnej rzeczywistości. Skoro profesjonaliści piszą do słownika teksty „z głowy”, dlaczego my nie mielibyśmy tak robić? Pomijając już słownik dolnołużycki – biorę do ręki mój jednojęzyczny Oxford Advanced Learner’s Dictionary of Current English. Nie widzę tam śladu nawiązań do literatury pięknej; przykłady są takie, by pomagały w zrozumieniu znaczenie słowa, a jednocześnie zajmowały jak najmniej miejsca. Spytam się więc odwrotnie: czy ktoś widział profesjonalistów używających na taką skalę jak my cytatów z literatury? Czy nasz pomysł nie jest wręcz wybrykiem, jednostkowym eksperymentem na żywym ciele?

Dodając do hasła tylko cytat z literatury powodujemy, że hasło niby przykład ma (czyli automatyczne statystyki nie pokażą, że w haśle brakuje przykładu), ale nie jest to prawdziwy przykład. Wstawianie do haseł o rzeczach najprostszych (tzn. słowach podstawowych dla języka; które zna dziecko kończące zerówkę, które podaje się w pierwszych rozdziałach podręcznika do nauki języka obcego) jest strzelaniem z armaty do muchy. Jeśli obcokrajowiec zainteresuje się takim hasłem, to będzie to oznaczało, że zna polski na słabym poziomie i uczy się podstaw. My zaś rzucamy go na głęboką wodę, serwujemy przykład z literatury pięknej. Czy naprawdę żeby zrozumieć słowo „powolny” trzeba siłować się z Bolesławem Prusem, zerkać na znaczenie słów „rozlec się”, „turkot”, „bryczka”, „bita droga”, „stęp”? Czy pierwszy przykład daje jakąkolwiek wskazówkę, co mogłoby oznaczać słowo „powolny”? (Podpowiedź: jeśli w miejsce opisywanego słowa wstawimy np. „szybko” albo „głośno” i zdanie zachowa sens, to znaczy, że przykład nie daje takich wskazówek.) Jeszcze pół biedy, gdyby te cytaty były z prasy – ale one są z wierszy i powieści, gdzie pisanie prosto i zrozumiale jest wręcz wykroczeniem, gdzie dekoruje się każde zdanie wyszukanymi epitetami, gdzie w dobrym guście jest sztuczna archaizacja i ogólne udziwnianie języka. Żywy język to nie język powieści; jego nieodłączną częścią są wypowiedzi przy śniadaniu w domu, w sklepie na rogu, na spotkaniu ze znajomymi. Owszem, zapewne ktoś kiedyś w jakimś dziele użył słowa w takim „podwórkowym” znaczeniu, o jakie nam chodzi, ale w przypadku codziennych dialogów o wiele szybciej (i lepiej) jest po prostu wymyślić zdanie z głowy niż szukać.

Nie żebym był całkowicie przeciwko cytowaniu w przykładach. Uważam jednak, że każde narzędzie należy dostosować do okoliczności. Literatura piękna to fikcja, sztuczny świat (a w przypadku tekstów z Wikiźródeł – dodatkowo świat z innej epoki), dlatego nie należy jej używać do opisu języka życia codziennego. Pojęcia abstrakcyjne, wyszukane albo starsze słownictwo – tak, to miejsce, gdzie można, a czasem trzeba podeprzeć się literaturą. Ale nie udawajmy, że żyjemy w „Nad Niemnem”. Jeśli ktoś bardzo chce dodać cytat jako przykład do słowa z „normalnego życia” – dobrze, ale niech nie będzie to cytat jedyny dla danego znaczenia, lecz przykład dodatkowy, uzupełniający przykład napisany specjalnie dla tego hasła. Byłbym też za zwiększeniem udziału prasy w cytatach kosztem literatury pięknej: bo prasa używa żywszego języka, bardziej ukierunkowanego na komunikatywność, zamiast bawić się w wywoływanie takich czy innych uczuć u czytelnika.

Do tej pory cały czas miałem na myśli przede wszystkim język polski. W przypadku języków obcych sytuacja jest nieco inna, bo nie mamy stuprocentowej pewności, że pisząc przykład „z głowy”, piszemy go poprawnie – toteż bezpieczniej jest w większym stopniu opierać się na cytatach. Osobiście jednak i w tym przypadku podtrzymuję zdanie, że prasa (ewentualnie Wikipedia, jako źródło bądź co bądź popularnonaukowe, a nie śmiertelnie poważny traktat naukowy) jest lepszym od literatury pięknej źródłem przykładów.

6 komentarzy:

Anonimowy pisze...

Problem polega na tym, że Wikiźródła publikują w zasadzie wyłącznie teksty z domeny publicznej, a więc stare. Gdybyśmy mieli dostęp do źródeł XX-wiecznych, to opisywany problem użyteczności cytatów byłby znacznie mniejszy...

Equadus pisze...

Takie "starsze" przykłady nie są złe, choć też nie najlepsze. Poniekąd zgadzam się z Derbethem. Rozmawialiśmy już o możliwości brania przykładów z Korpusów lub np. z książek. Rozmowa jednak ucichła i tak naprawdę do tej pory nie wiadomo, czy jeśli ktoś ma całe półki i łóżko powieści (także w innym języku), może wykorzystywać ich fragmenty w Wikisłowniku. Stwierdziliśmy, że "bezpieczniej" wymyślać własne, a tego jak widać nie ma komu robić...

Derbeth pisze...

Właśnie moim zdaniem największy problem związany z cytatami z książek nie leży w tym, że są to cytaty z rzeczy zbyt starych, ani w tym, że cytowanie takie może powodować wątpliwości natury prawnej (gdybyśmy cytowali nowsze rzeczy).

Dla mnie po prostu wszystkie cytaty z literatury pięknej są przykładami gorszej jakości - bo zawsze, niezależnie od tego, czy będą aktualne czy sprzed półtora wieku, będą dla początkujących użytkowników języka niezrozumiałe, przeładowane nieistotnymi wyrażeniami zaciemniającymi sens całości. Po prostu literatura piękna nie powstaje po to, by była zrozumiała i skoro nikt nie pisze słowników jednojęzycznych wykorzystując cytaty z powieści i wierszy, to musi być to znak, że i my nie powinniśmy tego robić.

Anonimowy pisze...

Nawet jeśli to "dawne" źródła, to wciąż czytywane i używane i jako takie tworzące język - nasz hymn, z tych które ja sam wprowadzałem to choćby Sienkiewicz, Prus, Żeromski, nasz Hymn itp. Złotym środkiem byłoby dawanie więcej niż jednego przykładu - na wstępie proste, za nimi zdania złożone z literatury. Wtedy i wilk syty, i owca cała ;) ~~~~

Equadus pisze...

Czy naprawdę nie można wykorzystać fragmentów książek (nawet najnowszych) w Wikisłowniku na prawach cytatu? To przecież kwestia kilku zdań. Podany autor i tytuł.

Anonimowy pisze...

dlaczego nie:)