24 listopada 2007
Wikisłownik dostrzeżony
To nie wszystko, co oferuje lingro. Jeśli tekst, który chcemy tłumaczyć jest zapisany w jednym z trzech formatów: .txt, .doc lub .pdf, to możemy go załadować na stronę i w identyczny sposób skorzystać z funkcjonalności narzędzia. Można w nim też sprawdzać znaczenia w jednojęzycznych słownikach. Niestety przy polsko-polskim pojawia się komunikat "Dictionary in development, only 5961 translations so far...".
Moim zdaniem lingro.com jest bardzo obiecującym narzędziem. Nie brak mu jeszcze błędów, ale w miarę zwiększania się liczby użytkowników z pewnością będą one wygładzane. Najważniejsze jednak jest to, by była w nim dostępna odpowiednia ilość tłumaczeń. Zatem Wikisłoniki, do pracy!
23 listopada 2007
Brzydkie slovio i chińszczyzna
Trzy tysiące słów (a sześć tysięcy haseł, bo każde słowo tego języka zapisujemy i alfabetem łacińskim, i cyrylicą) znalazło się w Wikisłowniku dzięki pracy Kpjasa - ech, przed powstaniem Wiki* miało się czas i na inne projekty :) Kpjas pracował nad słownikiem slovio, który za jego zgodą wykorzystaliśmy.
Idea jest ciekawa - stworzenie języka, w którym będą mogły komunikować się narody słowiańskie. Można o tym poczytać w artykule na polskiej Wikipedii. Za to na angielskiej Wikipedii już nie można. Dwa razy hasło o slovio trafiło na tamtejszą listę haseł do usunięcia; za drugim razem poległo (podobnie poległ artykuł o twórcy języka, Marku Hucko (pl)). Dlaczego anglojęzyczni wikipedyści uznali, że na hasło o tym języku nie ma miejsca w encyklopedii, w której opisywane są zamknięte rumuńskie przystanki kolejowe i kolory futra Pokémonów (hej WarX)? Otóż naturalnie dlatego, że slovio "nie jest dostatecznie znaczące", "nie zostało stworzone przez znanego językoznawcę", "nikt tego nie używa". Argumenty strony przeciwnej i przykłady również zostały uznane za "niedostatecznie znaczące" i hasło skasowano.
Tyle, że slovio jednak jest językiem znanym osobom o zainteresowaniach językoznawczych, bywa też używane (niewiele, ale zawsze - przykładem jest chociażby tworzona przez słowiańskich Wikipedystów Slavopedia, która, owszem, ledwo zipie, ale jeszcze nie wyzionęła ducha (ostatni wpis z 18.07.2007: Slovenju Vikipedija dosaglit 50.000 zapisis!). Google podaje jeszcze kilka przykładów wykorzystania języka.
Dla osób nie do końca kompetentnych w danym temacie zawsze coś będzie mało znaczące, błędne lub zbyt niszowe - to znana bolączka wszystkich Wikipedii i ich Stron do Usunięcia. Bywa i jeszcze gorzej: na duńskiej Wikipedii usunięto hasło [[Slovio]] bo skasowano je na angielskiej. Okazuje się, że to wystarczający argument, bo przekonał także Norwegów. Nieważne, że za skasowaniem tego hasła było na angielskiej Wikipedii tylko pięć osób, a w dyskusji ogólnie mało kto wziął udział. Fakt, że hasła nie skasowano na pozostałych 25 Wikipediach też jest nieistotny... Nie popisali się Skandynawowie. Złośliwie dodam, że w języku duńskim słowo volapyk oznacza "chińszczyznę, coś niezrozumiałego", a mało kto z używających tego słowa wie (a często pytam!), że volapük to oryginalnie nazwa dziewiętnastowiecznego języka sztucznego. A pewnie będzie wiedziało jeszcze mniej osób, dzięki takim radosnym inicjatywom społeczności Wiki*, jak propozycja zamknięcia Wikipedii w języku Volapük. Ale się uczepili tych sztucznych języków...
Artykuł w dzisiejszej gazecie przypomniał mi, że miesięcznie na świecie wymierają dwa języki. Możemy jeszcze poprawić tę statystykę dobijając te sztuczne... ;P
07 listopada 2007
Botowanie i wymowa
Tak właściwie to nie ja, ale mój bot i nie na dwie godziny, bo blok został w końcu wcześniej zdjęty. Poszło o małe nieporozumienie - polscy admini Commons powiedzieli mi, że mój bot nie potrzebuje flagi (która ukrywa edycje na liście ostatnich zmian), natomiast inni admini kazali mi nie robić niczego bez flagi. ;-) Ku mojemu zaskoczeniu, już dzisiaj mój wniosek został pomyślnie rozpatrzony i bot śmiga dalej. A ładować jest co - w kolejce czeka jakieś 12 000 nagrań wymowy.
Skąd to wszystko? Jest strona Shtooka Project, gdzie zamieszczane są bazy słów na licencji Creative Commons. Tsca brał z niej kiedyś nagrania słów rosyjskich; teraz doszły tam dodatkowe zbiory.
Z papierkowej roboty - czekam na flagę bota na polskim, niemieckim i angielskim Wikisłowniku - mój bot będzie tam te wszystkie nagrania wymowy wstawiał. Kod bota jest prawie gotowy ;), więc gdy głosowania się skończą, wszystko powinno być już gotowe i przetestowane. Na razie zapisuję w notatniku (dane z początku października): polski Wikisłownik - 4 400 nagrań, angielski - 12 000 nagrań, niemiecki - 1 500 nagrań. Ciekawe, jak będzie po przejściu bota…
15 września 2007
Software Freedom Day
Czy nauczyłem czegoś ludzi o siostrzanych projektach Wikipedii? Z jednej strony, jeden człowiek na sali wiedział nawet, że jest coś takiego jak Wikiversity. Z drugiej, jeden z prelegentów ucieszył się, że jest w końcu polskie tłumaczenie książki o Pythonie "na Wikipedii". Ech. Może lepiej przestać mówić "siostrzane projekty Wikipedii", żeby ludziom przestało się wydawać, że to wszystko Wikipedia?
12 września 2007
Plakaty
Z samym przygotowaniem tych plakatów była całkiem niezła historia. O sprawie dowiedziałem się w lipcu. Wikipedia miała już wtedy gotowy plakat promocyjny, natomiast reszta projektów - nie. Czas leciał, więc postanowiłem wziąć sprawy w swoje ręce. Na początek poszła nauka obsługi programu graficznego Inkscape, który polecali mi do tego celu inni wikipedyści. Program jak program, ma swoje dziwactwa, ale udało mi się go opanować, po długich dyskusjach w Barach projektów, próbach z różnymi wariantami, udało mi się w końcu przygotować projekty, które znalazły (mniejszą lub większą) akceptację.
Ucieszony, że wszystko jest gotowe, zostawiłem sprawę plakatów i dopiero, gdy zbliżał się czas oddania projektów, pomyślałem, że być może warto byłoby zasięgnąć rady u naczelnego speca od DTP na Wikipedii, Beno. Przy okazji dopytałem się, jakiej postaci plakatów oczekuje drukarnia i okazało się, że tak naprawdę przygotowane przeze mnie plakaty absolutnie nie nadają się do druku. :) Drukarnia nie przyjmowała grafik PNG, które produkował Inkscape, a eksport do PDF dawał plakaty z białą dziurą w miejsce logo i innymi felerami. Co gorsza, Inkscape okazał się programem służącym tylko do produkcji grafik przeznaczonych do oglądania na ekranie monitora, gdzie przestrzeń barw RGB sprawdza się doskonale, ale, co uświadomił mi Beno, na druku wygląda bardzo kiepsko. Sprawdziwszy, że możliwości wykorzystania barw CMYK w Inkscape nie ma (ba, jego twórców to w ogóle nie interesuje), doszedłem do desperackiego wniosku, że najprawdopodobniej plakaty trzeba będzie zrobić od zera w innym programie. W tym samym czasie zorientowałem się jeszcze, że robiąc plakaty nie pomyślałem o rzeczy podstawowej - w jakim formacie mają być. Tymczasem jest to kwestia podstawowa, od której należy zacząć :) Plakaty miałem więc w formacie A4, a potrzebny był B1. Ups.
Siedząc po nocach, prowadząc długie konsultacje z Beno, wyprodukowałem w programie Scribus (poniekąd, bardzo przyjemnym w użyciu) nowe wersje plakatów Wikibooks i Wikinews. Po drodze okazało się, że te same czcionki w różnych programach (Inkscape i Scribus) potrafią wyglądać nieco inaczej, że obsługa wektorowego formatu SVG w Scribusie niby jest, ale po zerknięciu na podgląd wydruku człowiek stwierdza, że to tak, jakby go nie było (postawiłem na generowanie z SVG dużych bitmap) - ale nic to. Efekt końcowy był bardzo - dla mnie - zadowalający. Beno wziął na siebie ręczną modyfikację plakatu Wikisłownika, zmieniając w nim RGB na CMYK i dopasowując plakat do rozmiaru B1 (nie pytajcie mnie, jak to zrobił - to po prostu czarna magia :).
Dzięki całej historii nauczyłem się w końcu, jak zrobić coś składnego w programie graficznym, jak obsługiwać pożyteczny (mimo wszystko) program Inkscape a do tego korzystania z prawie profesjonalnego narzędzia, jakim jest Scribus, no i paru rzeczy o DTP. Wśród plików, do jakich dałem link, plakaty Wikibooks i Wikinews mają dodane okolicznościowe ramki na Olsztyńskie Dni Nauki (plakatu Wikisłownika zmodyfikować nie mogłem). Jak przyznaję, moje projekty były robione nieco w pośpiechu, być może nie wszystko jest do końca dopracowane, ale jeśli się spodobają, wrzucę je na Commons, by każdy mógł sobie taki wydrukować.
27 lipca 2007
Ślunski w Wikisłowniku
Dotychczas w Wikisłowniku słowa śląskie omawialiśmy pod nagłówkiem "język polski", dodając tylko kategorię i szablon "regionalizm śląski". Czy czas na zmiany? Największym problemem jest brak oficjalnej ortografii śląskiego: pisać lipsta czy libsta? Chyba trochę potrwa, zanim te problemy zostaną rozwiązane.
25 lipca 2007
Rozwój oprogramowania Wikisłownika
Dlatego redaktorzy Wikisłownika na pewno z radością powitają wiadomość o powstaniu projektu WiktionaryDev. Jest to osobna instalacja MediaWiki mająca na celu rozwój i testowanie funkcji przydatnych lub koniecznych konkretnie w Wiktionaries/Wikisłownikach. Inicjatywa jest świeża, ale już może się pochwalić osiągnięciami; na stronie głównej można przeczytać o powstałych nowych funkcjach:
- rozszerzenie Czy chodziło Ci o... automatycznie generujące linki {zobteż| przy wpisaniu słowa z błędem
- rozszerzenie WiktionaryLang dodające informacje, które języki mają wpisy na której stronie słownika
- działający na bieżąco indeks każdego języka, ułatwiający wyszukiwanie i pracę nad konkretnymi językami
- ułatwienie tworzenia "wariacji" języka (np. grecki współczesny - grecki klasyczny); możliwość łączenia wpisów takich języków, jeśli jest to pożądane przy danym słowie.
- przyciski umożliwiające ukrycie języków i sekcji, które nas nie interesują
- szablony typu {{LICZBAJĘZYKÓW}} ułatwiające automatyczną aktualizację wielu stron
Lista funkcji planowanych i "w produkcji" jest dłuższa. Wszystko można sobie obejrzeć i potestować, zapewne też warto się włączyć w dyskusje.
PS: O WiktionaryDev pisze też GerardM na swoim słownikowym blogu.
10 lipca 2007
meta logo
Minęło ponad pół roku i okazuje się, że Wiktionaries nadal używają starego logo. Metodą biernego oporu wybrany projekt został odrzucony a wyniki konkursu - w praktyce - unieważnione. Z głosów na meta i na liście dyskusyjnej Wiktionary dość wyraźnie wynika, że jednak pozostajemy przy dotychczasowym wzorze, mimo jego wielu wad.
Sytuacja taka częściowo wynikła z faktu, że idea wypracowania nowego logo i samo głosowanie odbywało się nie do końca z inicjatywy i bez poparcia społeczności projektów, których zmiana miała dotyczyć. W konkursie i dyskusjach uczestniczyło wiele osób, które w pracach nad Wiktionary nie uczestniczą i do projektów nie zaglądają. <POV>Zapewne też fakt, że wybrana propozycja jest mocno nieudana, przyczynił się do zignorowania wyników głosowania.</POV>
Dobrze przynajmniej, że nauka nie poszła w las: dokładnie taka sama inicjatywa z logo Wikibooks właśnie zostaje na meta zamykana po miesiącach przepychanek. Być może na tym etapie rozwoju projektów nie wystarczy już rzucić hasła "zróbmy nowe logo". Czy w ogóle da się jeszcze skutecznie taką reformę przeprowadzić? Nie wiem. Całkiem możliwe, że loga pozostaną już na zawsze takie, jakie są, łącznie z błędnymi literkami na globie Wikipedii. :)
Tymczasem jeśli ktoś chce się pobawić w projektowanie i wybieranie logo z przymrużeniem oka, zapraszam do udziału w konkursie na logo TOP 600. :)
05 lipca 2007
28 czerwca 2007
Iście nordyckiej sagi ciąg dalszy
Nie jestem zadowolony z tego, co ujrzałem. Właściwie jestem bardzo niezadowolony. Dobrych, kompletnych haseł jest jak na lekarstwo. Większość to stuby i to nierzadko z błędami. Wiele z tych błędów poprawiłem, ale nie wiem, ile mi umknęło.
Oprócz tego:
- 12 usuniętych haseł
- kilka haseł, które powinny być usunięte, ale je zignorowałem
- 237 podstawowych słów domagających się natychmiastowego rozszerzenia i dopracowania
Zebrałem także listę haseł, które wymagają dodatkowych informacji. Zazwyczaj weryfikacji odmiany, znaczenia lub częstotliwości występowania.
- zapis słowa Stóra Bretland: z kreską (Stóra-Bretland) czy bez? W Google występują oba warianty.
- odmiana słowa ananas: niewiadoma
- odmiana słowa balsamik edik: ...a konkretnie jego pierwszej części
- występowanie słowa belgiari: w Google ma trzy wyniki. Nie wiem, czy w ogóle jest używane. A jeżeli nie, to jak określa się mieszkańca Belgii?
- odmiana słowa esdragon: niewiadoma. Czy fáfnisgras jest synonimem? W Google ma o wiele więcej trafień.
- forma słowa frið: odnoszę silne wrażenie, że to biernik od friður, błędnie uznany za mianownik. Nie jestem tego pewien.
- kurka (grzyb) jest nazywana po islandzku kantarell czy rifsveppur? Może to synonimy? Kantarell ma więcej wyników w Google (powalająca liczba dwudziestu dziewięciu). Może jednak jest jeszcze inaczej nazywana?
- kokosmjöl jako wiórki kokosowe: siedem wyników w Google.
- spotkałem się z trzema tłumaczeniami słowa maur: mrówka, termit i roztocz. W Wikisłowniku mamy tylko pierwsze znaczenie. Słowniki nie są zgodne co do pozostałych dwóch.
- odmiana słowa mey: brak
- pressujárn jako żelazko: poważne wątpliwości co do tego słowa (trzy wyniki w Google, trzynaście w ritmálsskrá, zero w słownikach
- jaka jest różnica pomiędzy znaczeniem słów raffræði a rafmagnsverkfræði? W Wikisłowniku radośnie określiłem oba jako elektrotechnikę.
- odmiana rzeczownika salami: brak
Te wątpliwości postaram się wyjaśnić. Skoro mamy tak mało haseł po islandzku, to wypadałoby, by były chociaż wiarygodne.
Znowu namieszałem, innymi słowy.
Pierwsze urodziny słownika jidysz
Dokładnie rok temu 27 czerwca 2006 roku, o godz. 11:17:46, pojawiło się na stronach Wikisłownika pierwsze hasło w języku jidysz. Było nim słowo ייִד, słowo dla owego języka bazowe. W najśmielszych planach nie przypuszczałbym, iż rok później słownik tego języka będzie liczył ponad 7000 haseł, stanowiąc tym samym największy nowoczesny1 słownik żydowsko-polski jaki ukazał się w tym kraju od czasów II wojny światowej.
W dodatku jest to słownik nie-zwykły. Jest to bowiem słownik online. Słownik, który oczywiście, można przeszukiwać tradycyjnie, wertując strona po stronie, ale też, czego nie dają nam wydania książkowe, używając w tym celu wyszukiwarki. Umożliwia nam ona przeszukiwanie zawartości, bądź to wpisując hasła w ich orginalnej formie, używając w tym celu alfabetu hebrajskiego, bądź, co istotne dla osób go nie znających, wpisując hasła łacinką. Przy czym, możemy je wpisywać zarówno fonetycznie, jak też, dla osób bardziej obeznanych z tematem, stosując romanizację YIVO. Bez względu jednak, którą z opcji wybierzemy, informację zwrotną dostaniemy w przeciągu kilku sekund.
Słownik ten, ma jeszcze jedną właściwość, której z oczywistych względów nie mógłby mieć wydany drukiem. Mianowicie jeśli nie znajdziemy interesującego nas hasła, zawsze możemy, na specjalnie w tym celu przygotowanej stronie, poprosić autorów aby je opracowali, będąc jednocześnie pewnym, iż zostanie ono dodane w przeciagu kilku dni.
Wreszcie rzecz chyba najważniejsza. Jest to słownik, z którego zasobów możemy korzystać zupełnie bezpłatnie. Jest to bowiem "wolny słownik", dostępny na Licencji GNU Wolnej Dokumentacji (GNU FDL). Moja radość z tego faktu jest tym większa, iż dzięki pasji i bezinteresownej pomocy ludzi tworzących "wolne oprogramowanie" czy też z kręgów "open source" udało się mi zrealizować to, czego wcześniej nie byłem w stanie sfinalizować w ramach reguł gry "wolnorynkowej" – no, bo kto to kupi?! – Dlatego też korzystając z okazji, chciałbym publicznie podziękować wszystkim tym, dzięki którym udało mi się zrealizować dotychczasową część projektu "!ייִדיש לעבט". Tak, jidysz żyje! ...i będzie żyć dzięki wam!
Tak więc, będąc nerdem, który zaniedbuje wszystko dookoła, całymi nocami przesiadując przed komputerem – łączę, tymsamym dwie moje pasje, po to tylko, aby setki, a w przyszłości może i tysiące, jidyszystów mogły mieć łatwy dostęp do tego, czego mi w swoim czasie brakowało najbardziej. Więc dziś Panowie i Panie w okrągłą rocznicę tego ważnego, dla mnie, wydarzenia wznoszę kielichy i gromkim głosem światu donoszę: Niech żyje wiki, wikisłowniki, niech żyje jidysz, niech żyją geeki!
1 Zgodny z normami ortograficznymi Żydowskiego Instytutu Naukowego (YIVO).
27 czerwca 2007
Brzmi chrząszcz w Szczebrzeszynie
Tworzenie zasobów nagrań wymowy to chyba jedyny obok linków interwiki przejaw współpracy Wiktionaries różnych języków. W repozytorium mediów Commons stworzyliśmy (zgadnijcie, czyj to był pomysł :) centrum zamówień nagrań i zdefiniowaliśmy format nazwy pliku tak, że pojawiające się nagrania można automatycznie wykorzystywać w hasłach danego języka. System działa; Polacy nagrywają polskie słowa, Niemcy niemieckie, i korzystają z tego wszystkie wersje językowe słownika.
Dobra nowina: po wczorajszej akcji tsca.bota Wikisłownik wzbogacił się o kolejne półtora tysiąca nagrań. Łącznie można już odsłuchać wymowy ponad trzech i pół tysiąca słów. Nic, tylko siadać i słuchać! :) Wysłuchanie nie jest zresztą jedynym sposobem korzystania z tych zasobów; można słowo powtarzać za lektorem i ćwiczyć; można je analizować w świetle umieszczonego obok zapisu fonetycznego (ucząc się w ten sposób alfabetu IPA), a w niektórych przypadkach, jak przy angielskim słowie solder, można porównać wymowę brytyjską, kanadyjską, amerykańską i australijską! W naszym języku też zresztą mamy bogactwo dźwięków: w haśle trzydzieści posłuchać można standardowej ogólnopolskiej wymowy oraz wymowy krakowskiej (haha).
Ponieważ wszyscy kochają statystyki, tsca.bot składa raport z frontu udźwiękowienia polskiego Wikisłownika (numery to liczba udźwiękowionych haseł):
- język angielski: 2641
- język polski: 447
- język niemiecki: 206
- język holenderski: 114
- język włoski: 29
- język francuski: 29
- język duński: 17
- język szwedzki: 16
- język rumuński: 13
- język hiszpański: 11
...oraz kilka języków mających mniej, niż 10 nagrań. Angielski ma się dobrze, bo aż 42% haseł ma udostępnioną wymowę. Dalej jest gorzej - polski 8%; niemiecki 5%... Ale to dopiero początki! I Ty możesz pomóc! :) Chwyć za mikrofon, nagraj kilka... (naście... dziesiąt...) polskich słów i wrzuć wynik do kategorii wymowa polska na Commons. Instrukcję znajdziesz tutaj.
PS: Swoją drogą, ostatnio zadziwiła mnie jakość najnowszych generatorów mowy. Ta technologia jest już na etapie, w którym można myśleć o wykorzystaniu jej w słownikach...
08 czerwca 2007
Nieśmiertelny stub
Nierówny poziom haseł Wikisłownika wynika z dwóch różnych filozofii jego tworzenia: niektórzy uważają, że lepiej wpisać mnóstwo minihaseł zawierających tylko krótką jednowyrazową definicję, inni, że raczej warto poświęcić czas na tworzenie bardziej rozbudowanych omówień. Pisanie krótkich haseł jest proste, szybko widać efekty: wzrasta pozycja danego języka w statystykach. Warto jednak spojrzeć na to od strony użytkownika: czy wystarcza mu informacja, że słowo dog oznacza psa, czy może chciałby wiedzieć coś więcej (Czy można tak nazwać policjanta? Jak nazywa się samica psa? A przymiotnik? Czy wobec tego można powiedzieć po angielsku "pieskie życie"? A przy okazji, jak po angielsku mówi się o tym wszystkim, co robi pies: szczeka, warczy, gryzie, łasi się i merda ogonem?). W szablonie hasła jest miejsce na te wszystkie informacje - ale to miejsce często jest, niestety, puste.
Zastanówmy się więc nad zapotrzebowaniem na stuby. We Francji przeprowadzono badania nad efektywnością używania słowników w nauce języków obcych. Zapytano studentów, czego w słownikach szukają i z jakich informacji korzystają. Jak się okazuje:
- 87% znaczenie
- 70% przykłady
- 68% synonimy
- 53% składnia i odmiana
- 25% wymowa
- 24% grafika/zdjęcie
- 19% obszar stosowania
- 5% etymologia
Z tych wyników można wyciągnąć wniosek, że samo wyjaśnienie znaczenia słowa to (za) mało. Aż 70% użytkowników oczekuje przykładów użycia słowa i spisu jego synonimów, ponad połowa chce składni i odmiany. Wiele osób szuka danego wyrazu w słowniku nie dla jego znaczenia - które już zna - ale w poszukiwaniu tych dodatkowych informacji. Oznacza to, że dla bardzo dużej części użytkowników Wikisłownik - oferując tylko stub - po prostu nie spełnia swojego zadania.
Trochę bardziej szczegółowe badania przeprowadzano przygotowując elektroniczne wydanie The New Oxford English Dictionary. Poproszono użytkowników, by zastanowili się nad swoimi potrzebami i zasugerowali, co powinno się w tym wydaniu znaleźć:
- 41% etymologia
- 39% przykłady
- 39% odmiana
- 38% wymowa
- 37% aktualność (np. "przestarzałe", "archaiczne")
- 37% związki frazeologiczne
- 34% temat (np. "zool.", "fiz.")
- 34% cechy gramatyczne (np. "czasownik przechodni")
- 30% obszar stosowania (np. regionalizm warszawski, angielski brytyjski)
- 32% styl (np. "pot.", "wulg.")
- 28% znaczenie
- 25% nagłówek (sprawdzanie pisowni)
Nie powinna tu dziwić zamiana miejscami "znaczeń" i "etymologii" - badania dotyczą słownika języka ojczystego, więc większość użytkowników definicje słów zna.
W obu zestawieniach zwraca uwagę wysokie zapotrzebowanie na przykłady. W Wikisłowniku kładziemy duży nacisk na ich dodawanie (ekhm, przynajmniej w niektórych językach) i widać, że ma to sens, warto o tym pamiętać, organizować i powtarzać akcje typu "tydzień dodawania brakujących przykładów". Nie tylko przydają się one użytkownikom, ale i tworzą powiązania między hasłami, uczą kolokacji i zachęcają do zapoznawania się z kolejnymi słowami. Dodawajcie przykłady! Ciekawe też, że aż 31% użytkowników chciałoby, aby podawać źródła przykładów (z "wyborczej"/z "Quo Vadis"/z dyskusji internetowej) - my w zasadzie podajemy te źródła, ale mam wrażenie, że bez szczególnej pieczołowitości.
Cytowane badania świadczą też pośrednio o dobrej organizacji polskiego Wikisłownika. Wypracowany przez nas szablon hasła wychodzi naprzeciw zapotrzebowaniu - zawiera niemal wszystko to, czego ludzie w słownikach szukają. Postarajmy się, aby nie tylko szablon to zawierał, ale i same hasła. :)
PS: Dla formalności: badania cytuję za Bergenholtz H. & Tarp S. (1994), Manual i fagleksikografi, Herning: Systime (ISBN 8777834534)
07 czerwca 2007
NetSprint zainteresował się Wikinews; kolej na Wikisłownik?
Postanowiłem skorzystać z okazji i zasugerowałem przedstawicielowi NetSprinta przyjrzenie się również Wikisłownikowi. Wyszukiwarka ma bowiem usługę słownika a oprócz tego potrzebuje list synonimów, które obecnie bierze z Wikipedii (a konkretnie ze stron ujednoznaczniających), co nie zawsze jest łatwe w realizacji i dokładne. W odpowiedzi dostałem, że co prawda niczego nie mogą obiecać, ale zastanowią się. Całość dyskusji na Wikiliście.
Ja trzymam kciuki i liczę, że Wikisłownik stanie się w końcu mainstreamowym serwisem.
05 czerwca 2007
Histeryczne uśmiechy
Łódź.
Zając robi bardzo głupią rzecz.
Nie śpi.
Aua.
Jest to dość uzasadnione, biorąc pod uwagę to, iż poprzedniej nocy spał dwie godziny, a dzisiaj po przyjściu do szkoły postanowił odespać tę noc. Wszystko byłoby (w miarę) w porządku, gdyby nie to, że obudził się o 22:00.
Nu. I teraz siedzi.
Hmm... tja... ach. Ten egzamin ustny. A więc, egzamin ustny był iście rozkoszny. Zając przyszedł do szkoły na przewidzianą dla niego godzinę. Z katarem do pasa i oczami jak królik (nie zając). Było to spowodowane nie nadużywaniem alkoholu (tudzież innych używek) w wieku młodzieńczym, jak zgadywaliby moi drodzy czytelnicy, lecz tym dobrodziejstwem cywilizacji, jakim jest alergia na pyłki. To ta sama kategoria co komputery, samochody, zraszacze do trwaników, zapinki do włosów i choroby weneryczne.
Tak więc zając przyszedł, po czym - obrzucany nieco dziwnymi spojrzeniami, być może z racji jego ubioru, być może z racji wrodzonej nieudolności manualno-intelektualnej, która nie pozwala mu na ułożenie okularów pod odpowiednim kątem, kto wie - podjął karkołomną próbę wymyślenia jakiegoś usprawiedliwienia swego stanu, lecz jedyne tłumaczenie na "chusteczkę do nosa", jakie mu przychodziło do głowy, to "das Haus", więc dał sobie spokój.
Generalnie mam dziwną właściwość, że w takich momentach właściwym tłumaczeniem dla każdego słowa wydaje się być "das Haus".
Tak... na czym to ja skończyłem?
Ach.
A więc w końcu poproszono zająca do tej jask... tego pomieszczenia. Ze względu na półmrok panujący w korytarzu, blask wydobywający się zza drzwi przypominał światło na końcu tunelu.
Tja.
Ach, 2:34.
Zając wszedł. Jego germanistka oraz germanistka drugiej grupy były bardzo miłe. To było na tyle szokujące, że odbierało mowę. Zapewne to taki chwyt.
Frau W. łaskawie zaprosiła zająca, by wylosował sobie kartkę. Zając, starając się zachować spokój, co przychodziło mu z trudem, drżącą ręką sięgnął po kartkę, uważnie obserwując germanistkę, z twarzy której nie schodził histerycznie przyjazny uśmiech. Spojrzał (tym razem na kartkę). Statystyka. Aua.
Statystyka przedstawiała dane na temat przyczyn przeprowadzek Niemców do wielkich miast. Zając musiał pokrótce ją przedstawić oraz odnieść te dane do sytuacji w Polsce oraz swoich doświadczeń. Przy okazji się wydało, że zając jest profanem, który ma w nosie Wielką Sztukę i w domu siedzi, miast rozkoszować się urokiem miast (i ich Życia Kulturalnego).
Najbardziej interesująca była trzecia część, w której to części zając jest studentem i miał zamiar zamieszkać w jedym domu z germanistką drugiej grupy, która także była studentką (trochę się tylko na roku zasiedziała). Zając oczywiście zaczął mącić, że najlepiej to w centrum miasta, bo stamtąd najłatwiej wszędzie dotrzeć, oraz bla bla bla, a także srututu. Germanistka określiła ten pomysł jako sratatata. No, może nie dosłownie, ale widać było po jej minie.
Trochę się zakałapućkało, kiedy zając zaczął wyjaśniać, że okolica powinna być spokojna, "co byśmy się mogli uczyć". Tyle że centrum miasta raczej nie przypomina czegoś, co można by nazwać "spokojną okolicą". Zając więc przyjał na twarz (czy co on tam ma) Przepraszający-Acz-Nie-Nachalny-Uśmiech-nr-9 i zaczął tłumaczyć, że jemu to chodziło o cichych sąsiadów.
Ech, jestem zmęczony.
I nic nie pamiętam.
Tja.
Egzamin, ogólnie rzecz biorąc, dość satysfakcjonujące przyniósł wyniki. 90,5/100 z pisemnego (jestem na tyle zarozumiały, że poczułem się tym wynikiem nieco zawiedziony) i - wbrew oczekiwaniom - 24/25 z ustnego.
Odjęli mi jeden punkt za "bierność w rozmowie", czyli za powtarzanie "ja... ja... ja..." i robienie przy tym głupiej miny =="
Ale to oczywiście nie koniec. W środę otrzymam spowrotem moje orgazmicznie kompletne portfolio, za które dostanę 3/30. Ale co tam. Ważne, że Fishah dostał 7.
Ja nie opowiadałem o Fishah?
Hmm...
Nie lubię opowiadać strasznych historii na noc.
Hmm...
Tja.
O renesansie zainteresowania językiem islandzkim trąbię wszem i wobec, więc już nie będę truł.
Ahm.
Hm.
No.
To by chyba było na tyle.
Ha! Ale już nie zszedłem z tematu Wikisłownika!
(ja po prostu na niego nie wszedłem)
31 maja 2007
Przestrzeń nazw i co z niej wynikło
Projekt ten odłożyłem jednak na później, aż pojawiła się sytuacja, że na niemieckim Wikisłowniku miałem wpisać w pole z opisem zmian "zła przestrzeń nazw" (chodziło o uzasadnienie zgłoszenia strony do skasowania). I co tu zrobić, skoro normalne słowniki nie rejestrują nawet słowa "Klick" a co dopiero myśleć o takiej egzotyce jak "przestrzeń nazw"? Poradziłem sobie wchodząc na strony specjalne oprogramowania MediaWiki, gdzie akurat ten termin jest użyty, ale stwierdziłem, że Wikisłownik powinien takie informacje koniecznie mieć.
Wcześniej również napotkałem problem z niemieckim słownictwem związanym z komputerami. Na IRC-u pewien Niemiec poprosił mnie o pomoc z systemem DesktopBSD - chodziło o jakieś niskopoziomowe sprawy, edycję plików konfiguracyjnych czy coś w tym stylu. No i tu zaczęła się cała zabawa, bo Niemiec po angielsku nie rozumiał absolutnie nic i próbowałem mu pomóc nie znając ani zbyt dobrze tego systemu ani też samego języka niemieckiego. :) Od razu pojawiły się problemy, bo jak powiedzieć "plik", "ścieżka dostępu", "ściągnąć", "karta sieciowa"? Nie uczą tego przecież w szkole ;-)
Z terminami komputerowymi jest ogólnie taki problem, że słowniki, nawet aktualne, nie podają wielu spośród określeń, którymi posługują się na co dzień zwyczajni użytkownicy komputera. Wikipedia jest tu pewnym rachunkiem - wchodzimy na dane hasło po polsku albo angielsku i patrzymy, co jest w linkach interwiki. Jest to jednak mało wygodne i do tego trzeba dobrze wiedzieć, czego się szuka. Dlatego myślę, że słownik tematyczny na Wikisłowniku jest potrzebny. Słownik taki stworzyłem w swoim brudnopisie i póki co zbieram słówka. Gdy treść ustabilizuje się, obecne zbiorcze tabelki zostaną podzielone na normalne słowniki tematyczne - z jednym językiem na stronę. Przy okazji, miło, że mój spis został zauważony - dzięki Rovdyr pojawiły się w nim rosyjskie określenia (ciekawi mnie, jak Rovdyr znalazła np. "typ wyliczeniowy" :).
Jednocześnie ze tematycznym słownikiem informatycznym zwróciłem uwagę na matematykę. Istniejące obecnie strony - np. dla języka angielskiego - są bardzo nieczytelne i niewygodne w użyciu. Próbą znalezienia nowej formuły jest słownik niemiecki. Strona wzorem nowych słowników tematycznych jest podzielona na części z sortowalnymi tabelkami.
P.S. Po dziwactwach Bloggera i psuciu wpisywanego tekstu zdecydowałem się napisać tego posta w moim edytorze HTML. Uff!
25 maja 2007
Wikisłownik wykopany
W zamierzeniu ten "wrzut" na wykop miał być chyba trochę skandalizujący, autor o nicku Obi-san zatytułował go ironicznie "Wikipedia Óczy" (Wikipedii miało się dostać za Wikisłownik? :). Obi-san zadał sobie trud zrobienia szeregu zrzutów ekranu z omówieniami wulgaryzmów i oznaczenia na nich ramką interesujących go fragmentów, tj. przykładów użycia tych słów. Cóż - jak zresztą zauważyli użytkownicy wykopu w komentarzach - słownik to słownik, omawia się wszystkie wyrazy, a przykłady użycia tych konkretnych słów nie mogą być zdaniami, które padają z ambony w kościele. Dla obcokrajowca wcale nie jest oczywiste, jak używa się danego "przerywnika". Żaden to skandal...
Ciekawe, swoją drogą, czego ludzie szukają w sieci... Jak pisałem w poprzedniej notce, najczęściej wyszukiwanym słowem w Wikisłowniku jest ch..j. Hasła dotyczące wulgaryzmów mają największy odsetek osób, które edytują tylko raz - pojawiają się na słowniku, żeby dopisać różne, czasem z sufitu wzięte "synonimy" tych słów i znikają. Notka na wykopie pasuje do tego obrazka: "Hehe, ktoś na płocie napisał du..".
Ale to dobrze, że o nas mówią. Może wśród dwudziestu osób, które trafią na Wikisłownik z wykopu i zechcą dodać przykład do słowa ku... znajdzie się choć jedna, która będzie potrafiła dodać odmianę przez przypadki do mucha. :)
Głupi Blogger
Kończąc ten krótki wpis mam nadzieję, że Blogger nie posypie się teraz przy próbie jego zapisania i obiecuję, że kończę z narzekaniem i wracam do tematu :)
P.S. A jednak. W niewiadomy sposób udało mi się wstawić do tekstu "twarde spacje" i post był "pokrojony" przy zawijaniu wierszy. Prawda wyszła na jaw przy podglądzie kodu HTML, ale do tej pory zastanawiam się, jak to było możliwe ;)
23 maja 2007
Humor
22 maja 2007
Zejście (z tematu, ale co za różnica)
Ninejszym zając postanawia także, że chociaż tutaj zaprzestanie pisania o sobie w trzeciej osobie, który to zwyczaj nie wynika z jego wybujałego ego, lecz z przyzwyczajenia złego, przez otoczenie w postaci maniery narzuconego (z wrażenia zacząłem rymować, nie szkodzi, że prymitywnie).
Jednocześnie z pewną dozą niezadowolenia rejestruję fakt, iż nie ma tu funkcji podglądu == to oczekiwanie to chyba wikizboczenie.
Wymyśliłem nowe schorzenie!
Proszę w tej chwili o Nagrody Nobla wręczenie.
Chyba mi ciepie*.
Taak...
Myślę, że skoro już się wypłakuję, to może wyliczę to, co miałem lub mam w planach zrobić, a czego nie zrobiłem lub mi się nie chce zrobić:
- przyimki islandzkie -> wykasowane ze strony użytkownika i porzucone
- przyimki niemieckie -> niedokończone
- słownik tematyczny: Fonologia -> nawet nie zaczęty, co wynika z mojego lenistwa i zamotania w zmyślnym systemie tabelek na Wikipedii
- utworzenie indeksu dla języka gockiego -> to dopiero po słowniku tematycznym, a skoro tamten stoi w miejscu...
- Arbeit
- Schule
- sehen
- sprawa połączeń "da(r)-" i "wo(r)-" z przyimkami, którą ignoruję mimo zamieszczenia notatki na stronie
- rozwijanie indeksu języka islandzkiego
Właściwie to powinienem się zabrać za uzupełnianie mojego portfolio z języka niemieckiego, które musi być gotowe na jutro, a jak na razie to leży w kącie pokoju i kwiczy radośnie z nieprzygotowania.
Albowiem jutro zając... tfu... ja... mam egzamin ustny z języka niemieckiego. I muszę na niego przynieść portfolio. A portfolio jest dokładnie w takim samym stanie, jak przed trzema miesiącami, kiedy to mieliśmy je pokazać germanistce na lekcji. Wtedy to zostałem serdecznie o... solony za to, że - według zdania germanistki - moje portfolio to "repetytorium, a to nie ma być repetytorium, tylko kompendium wiedzy!". Tak, to nadal jest repetytorium, a nie kompendium wiedzy. A za to ma być trzydzieści punktów o.O
Boję się tego egzaminu. Przeżyłem już jeden egzamin ustny. Na konkursie z języka niemieckiego. Wiłem się i kręciłem na tym krześle w mojej efektownej jak twór nieboży marynarce i cÓdownych przykrótkich spodniach do kompletu (właściwie bardziej odpowiednio byłoby nazwać to kąpletem), jąkając się i spoglądając lękliwie na trojga członków komisji. No cóż... komisja świetnie się bawiła. Byli wręcz ucieszeni moją wypowiedzią. Miny im zrzedły, kiedy przeszedłem do historyjki skleconej na poczekaniu na podstawie czterech obrazków. Było to rozkoszne lovestory. Zaczynało się ono tak, że pewnego dnia zapracowana pani prawnik poszła do teatru, gdzie oglądała przedstawienie, w którym chodziło o to (zawarłem historię w historii - błąd, droga na skróty), że papuga zakochała się w kocie (z wzajemnością). Tej pani to przedstawienie się niezwykle (!) podobało. Lecz nagle...
Tak to w skrócie wyglądało.
Należy nadmienić, iż zając (nie przemogę się) zakończył swą historię uroczym zdaniem: "Und dann haben sich die Frau und der Mann schneiden lassen"**. W tym momencie członkowie komisji zrobili oczy jak denka od butelek. Zając poniewczasie zauważył swój błąd i, podczas gdy komisja zbierała szczęki z okolic Chin, wyjąkał kilka słów usprawiedliwienia, jednocześnie krztusząc się ze śmiechu.
Ahm...
Złe wspomnienia powracają. Chyba z wrażenia skończę. W końcu muszę coś zrobić z tym portfolio. Dziękuję za uwagę, danke fir ire ałfmerkzamkajt, jakby to powiedziała moja koleżanka z klasy, o której nie będę opowiadał, bo obiecałem sobie, że już nie będę jej obgadywał.
No dobrze, i tak ją obgaduję w każdej wolnej chwili, ale co tam.
P.S. Mam dziwne wrażenie, że trochę zszedłem z tematu Wikisłownika. Ekhm.
*Ciepie mi -> nie kontroluję tego, co piszę, co może być wynikiem słuchanej piosenki, rozmowy na gadu-gadu i/lub wypicia kawy.
**Zdanie miało oznaczać "Pani i pan się rozwiedli". Rozwieść się to po niemiecku "sich scheiden lassen". A zając powiedział "schneiden lassen". W rezultacie wyszło na to, że oni się nie rozwiedli, tylko... dali się pociąć.
Wolno działa
21 maja 2007
Statystyki
Próba mikrofonu...
Ogłaszam(y) otwarcie bloga Wikisłownika! :) W założeniu ma to być miejsce, w którym edytorzy projektu będą się, dzielić pomysłami, radościami i frustracjami związanymi z tworzeniem Najlepszego Słownika w sieci. A jak wyjdzie? Zobaczymy :)
Jednocześnie z blogiem dostaliśmy jeszcze jedną zabawkę: podgląd, czego ludzie u nas szukają. Dobrze wiedzieć, że serwis jest odwiedzany i że praca ma sens. Mniej dobrze, że najczęściej odwiedzanym hasłem jest ch.. ;)
Blog nie będzie jedynym kanałem promocji słownika. :) 25 maja na Uniwersytecie Warmińsko-Mazurskim w Olsztynie na odbędzie się konferencja językoznawcza Nowe zjawiska w języku, tekście i komunikacji, podczas której przedstawiony będzie nasz projekt; może po tej prezentacji do pracy włączy się więcej osób? Oby! Napiszę potem więcej o tym wykładzie.