08 czerwca 2007

Nieśmiertelny stub

"Stub", pojęcie zapożyczone z Wikipedii, w Wikisłowniku też ma się nieźle. Oznacza u nas hasło, w którym podane jest tylko znaczenie wyrazu, podczas gdy jego pozostałe właściwości - odmiana, przykłady, synonimy, itd - nie są omawiane. Stuby produkuje się z założeniem, że "ktoś to kiedyś dopisze".

Nierówny poziom haseł Wikisłownika wynika z dwóch różnych filozofii jego tworzenia: niektórzy uważają, że lepiej wpisać mnóstwo minihaseł zawierających tylko krótką jednowyrazową definicję, inni, że raczej warto poświęcić czas na tworzenie bardziej rozbudowanych omówień. Pisanie krótkich haseł jest proste, szybko widać efekty: wzrasta pozycja danego języka w statystykach. Warto jednak spojrzeć na to od strony użytkownika: czy wystarcza mu informacja, że słowo dog oznacza psa, czy może chciałby wiedzieć coś więcej (Czy można tak nazwać policjanta? Jak nazywa się samica psa? A przymiotnik? Czy wobec tego można powiedzieć po angielsku "pieskie życie"? A przy okazji, jak po angielsku mówi się o tym wszystkim, co robi pies: szczeka, warczy, gryzie, łasi się i merda ogonem?). W szablonie hasła jest miejsce na te wszystkie informacje - ale to miejsce często jest, niestety, puste.

Zastanówmy się więc nad zapotrzebowaniem na stuby. We Francji przeprowadzono badania nad efektywnością używania słowników w nauce języków obcych. Zapytano studentów, czego w słownikach szukają i z jakich informacji korzystają. Jak się okazuje:


  • 87% znaczenie
  • 70% przykłady
  • 68% synonimy
  • 53% składnia i odmiana
  • 25% wymowa
  • 24% grafika/zdjęcie
  • 19% obszar stosowania
  • 5% etymologia

Z tych wyników można wyciągnąć wniosek, że samo wyjaśnienie znaczenia słowa to (za) mało. Aż 70% użytkowników oczekuje przykładów użycia słowa i spisu jego synonimów, ponad połowa chce składni i odmiany. Wiele osób szuka danego wyrazu w słowniku nie dla jego znaczenia - które już zna - ale w poszukiwaniu tych dodatkowych informacji. Oznacza to, że dla bardzo dużej części użytkowników Wikisłownik - oferując tylko stub - po prostu nie spełnia swojego zadania.

Trochę bardziej szczegółowe badania przeprowadzano przygotowując elektroniczne wydanie The New Oxford English Dictionary. Poproszono użytkowników, by zastanowili się nad swoimi potrzebami i zasugerowali, co powinno się w tym wydaniu znaleźć:


  • 41% etymologia
  • 39% przykłady
  • 39% odmiana
  • 38% wymowa
  • 37% aktualność (np. "przestarzałe", "archaiczne")
  • 37% związki frazeologiczne
  • 34% temat (np. "zool.", "fiz.")
  • 34% cechy gramatyczne (np. "czasownik przechodni")
  • 30% obszar stosowania (np. regionalizm warszawski, angielski brytyjski)
  • 32% styl (np. "pot.", "wulg.")
  • 28% znaczenie
  • 25% nagłówek (sprawdzanie pisowni)

Nie powinna tu dziwić zamiana miejscami "znaczeń" i "etymologii" - badania dotyczą słownika języka ojczystego, więc większość użytkowników definicje słów zna.

W obu zestawieniach zwraca uwagę wysokie zapotrzebowanie na przykłady. W Wikisłowniku kładziemy duży nacisk na ich dodawanie (ekhm, przynajmniej w niektórych językach) i widać, że ma to sens, warto o tym pamiętać, organizować i powtarzać akcje typu "tydzień dodawania brakujących przykładów". Nie tylko przydają się one użytkownikom, ale i tworzą powiązania między hasłami, uczą kolokacji i zachęcają do zapoznawania się z kolejnymi słowami. Dodawajcie przykłady! Ciekawe też, że aż 31% użytkowników chciałoby, aby podawać źródła przykładów (z "wyborczej"/z "Quo Vadis"/z dyskusji internetowej) - my w zasadzie podajemy te źródła, ale mam wrażenie, że bez szczególnej pieczołowitości.

Cytowane badania świadczą też pośrednio o dobrej organizacji polskiego Wikisłownika. Wypracowany przez nas szablon hasła wychodzi naprzeciw zapotrzebowaniu - zawiera niemal wszystko to, czego ludzie w słownikach szukają. Postarajmy się, aby nie tylko szablon to zawierał, ale i same hasła. :)

PS: Dla formalności: badania cytuję za Bergenholtz H. & Tarp S. (1994), Manual i fagleksikografi, Herning: Systime (ISBN 8777834534)

8 komentarzy:

Marcowy zając pisze...

Hmm...
Chyba dostaję kompleksów =="

Rovdyr pisze...

aaa, najgorsze wyrzuty sumienia wyłażą na powierzchnię...
no dobra, dobiję kiedyś pod koniec sesji do 2000 i biorę się za te przykłady, chociaż chciałam do nich wrócić tak po przekroczeniu 5000 (przodowa dewiza studenta: to co możesz zrobić jutro - odłóż na pojutrze, zdaje się została potępiona...)

Michał Połtyn pisze...

Ja staram się zawsze wypełniać do końca hasła, a przynajniej dać przykłady, tłumaczenia, odmianę i etymologię ;)

Equadus pisze...

To mnie teraz dobiłeś...

Equadus pisze...

Hm, ja się zastanawiam... Ja osobiście, gdy zaglądam do słownika, to pierwsze czego oczekuję, to znaczenie. To jest na pierwszym miejscu. Potem nagranie wymowy. Przykłady użycia stawiam gdzieś na koniec, bo jeśli tłumaczę jakiś tekst, to już mam kontekst i nie potrzebuję kolejnych przykładów. Zawsze wkurzam się, gdy widzę tekst, widzę słowo, którego nie znam, zaglądam do słownika i... nie ma.

Marcowy zając pisze...

Psze pana, psze pana, a Equadus się mi-i-iga-a-a-a...! :D

No cóż... powiedzmy, że zawsze będziemy mieli czas na dodawanie przykładów. Ilość haseł także ma znaczenie. Co z tego, że będziemy mieli ileś tam haseł kompletnych, z przykładami i innymi bajerami, skoro nie będzie można nigdy znaleźć pożądanego słowa. Podstawową funkcją każdego słownika jest podawanie znaczeń wyrazów. Tak myślę, przynajmniej.

Derbeth pisze...

Według mnie należy zachować równowagę. Bo jeśli będziemy mieli mało słów to mało kto będzie używał Wikisłownika. Z drugiej strony, Wikisłownik w dającej się przewidzieć przyszłości nie będzie mógł się równać ze słownikami papierowymi (mój kieszonkowy słownik niemieckiego ma 80 000 haseł, Wikisłownik ma ponad 4 000). Musimy dodawać coś od siebie, żeby być "fajniejsi" od tradycyjnych słowników. Samą ilością haseł nie wygramy.

Słyszałem, że np. "gazeta" Fakt ma oficjalną politykę, by używać w tekstach tylko 3 000 słów (strzelam, nie pamiętam dokładnie, ile). Jest specjalny ubrany w dresy zespół, który czyta artykuły i podkreśla słowa, których nie rozumie; artykuły potem wracają do korekty. Jaka płynie z tego konkluzja: wystarczy mało słów, by porozumiewać się w sposób zrozumiały. Patrząc choćby na nasz niemiecki widzę, że większość podstawowych słów już tam jest. Co z tego, że nie mamy jak jest "kangur", "łódź podwodna"; statystyczny użytkownik częściej będzie szukał prostszych haseł.

W ogóle proponuję wciąć germańskiego Bilda i sprawdzić, ile słów używanych tam w artykułach posiadamy w Wikisłowniku. :)

Marcowy zając pisze...

ja nie rozumie co zuy jest bild bild jest dobry ciekawy

Mimo wszystko, uważam, iż wnikliwe studium gatunków sosny jest niezbędne w kazdym słowniku xD