24 listopada 2007

Wikisłownik dostrzeżony

No i wreszcie się doczekaliśmy :-) Po raz pierwszy pojawiła się strona internetowa, która korzysta z Wikisłownika. Nazywa się ona lingro.com. Jej zadaniem jest ułatwić sprawdzanie i uczenie się słówek pojawiających się na innych przeglądanych przez użytkownika stronach. Zasada działania jest bardzo prosta: wystarczy wkleić link do odpowiedniego okienka w lingro, wtedy otworzy się w nim nasza strona, a na każde słówko będzie można kliknąć i sprawdzić jego znaczenie. Dostępne są na razie następujące kombinacje języków: angielski <-> hiszpański/francuski/włoski/niemiecki/polski, a autorzy strony obiecują dodanie kolejnych w przyszłości. Pod każdym tłumaczeniem jest podany link do słownika, z którego pochodzi definicja:
To nie wszystko, co oferuje lingro. Jeśli tekst, który chcemy tłumaczyć jest zapisany w jednym z trzech formatów: .txt, .doc lub .pdf, to możemy go załadować na stronę i w identyczny sposób skorzystać z funkcjonalności narzędzia. Można w nim też sprawdzać znaczenia w jednojęzycznych słownikach. Niestety przy polsko-polskim pojawia się komunikat "Dictionary in development, only 5961 translations so far...".

Moim zdaniem lingro.com jest bardzo obiecującym narzędziem. Nie brak mu jeszcze błędów, ale w miarę zwiększania się liczby użytkowników z pewnością będą one wygładzane. Najważniejsze jednak jest to, by była w nim dostępna odpowiednia ilość tłumaczeń. Zatem Wikisłoniki, do pracy!

23 listopada 2007

Brzydkie slovio i chińszczyzna

U zarania dziejów w Wikisłowniku królowały trzy języki sztuczne: interlingua, esperanto i slovio. Według aktualnych statystyk "pierwsza trójca" jest już sztuczna tylko w jednej trzeciej (interlingua). Slovio spadło na piąte miejsce, a esperanto na siódme. Z każdym z tych trzech języków jest u nas jakiś problem: interlingua to cała masa haseł, nad którymi nikt nie pracuje, esperanto ma wrzucone tylko morfemy słów, a slovio...

Trzy tysiące słów (a sześć tysięcy haseł, bo każde słowo tego języka zapisujemy i alfabetem łacińskim, i cyrylicą) znalazło się w Wikisłowniku dzięki pracy Kpjasa - ech, przed powstaniem Wiki* miało się czas i na inne projekty :) Kpjas pracował nad słownikiem slovio, który za jego zgodą wykorzystaliśmy.

Idea jest ciekawa - stworzenie języka, w którym będą mogły komunikować się narody słowiańskie. Można o tym poczytać w artykule na polskiej Wikipedii. Za to na angielskiej Wikipedii już nie można. Dwa razy hasło o slovio trafiło na tamtejszą listę haseł do usunięcia; za drugim razem poległo (podobnie poległ artykuł o twórcy języka, Marku Hucko (pl)). Dlaczego anglojęzyczni wikipedyści uznali, że na hasło o tym języku nie ma miejsca w encyklopedii, w której opisywane są zamknięte rumuńskie przystanki kolejowe i kolory futra Pokémonów (hej WarX)? Otóż naturalnie dlatego, że slovio "nie jest dostatecznie znaczące", "nie zostało stworzone przez znanego językoznawcę", "nikt tego nie używa". Argumenty strony przeciwnej i przykłady również zostały uznane za "niedostatecznie znaczące" i hasło skasowano.

Tyle, że slovio jednak jest językiem znanym osobom o zainteresowaniach językoznawczych, bywa też używane (niewiele, ale zawsze - przykładem jest chociażby tworzona przez słowiańskich Wikipedystów Slavopedia, która, owszem, ledwo zipie, ale jeszcze nie wyzionęła ducha (ostatni wpis z 18.07.2007: Slovenju Vikipedija dosaglit 50.000 zapisis!). Google podaje jeszcze kilka przykładów wykorzystania języka.

Dla osób nie do końca kompetentnych w danym temacie zawsze coś będzie mało znaczące, błędne lub zbyt niszowe - to znana bolączka wszystkich Wikipedii i ich Stron do Usunięcia. Bywa i jeszcze gorzej: na duńskiej Wikipedii usunięto hasło [[Slovio]] bo skasowano je na angielskiej. Okazuje się, że to wystarczający argument, bo przekonał także Norwegów. Nieważne, że za skasowaniem tego hasła było na angielskiej Wikipedii tylko pięć osób, a w dyskusji ogólnie mało kto wziął udział. Fakt, że hasła nie skasowano na pozostałych 25 Wikipediach też jest nieistotny... Nie popisali się Skandynawowie. Złośliwie dodam, że w języku duńskim słowo volapyk oznacza "chińszczyznę, coś niezrozumiałego", a mało kto z używających tego słowa wie (a często pytam!), że volapük to oryginalnie nazwa dziewiętnastowiecznego języka sztucznego. A pewnie będzie wiedziało jeszcze mniej osób, dzięki takim radosnym inicjatywom społeczności Wiki*, jak propozycja zamknięcia Wikipedii w języku Volapük. Ale się uczepili tych sztucznych języków...

Artykuł w dzisiejszej gazecie przypomniał mi, że miesięcznie na świecie wymierają dwa języki. Możemy jeszcze poprawić tę statystykę dobijając te sztuczne... ;P

07 listopada 2007

Botowanie i wymowa

Dostałem wczoraj bloka na Commons. Na dwie godziny.

Tak właściwie to nie ja, ale mój bot i nie na dwie godziny, bo blok został w końcu wcześniej zdjęty. Poszło o małe nieporozumienie - polscy admini Commons powiedzieli mi, że mój bot nie potrzebuje flagi (która ukrywa edycje na liście ostatnich zmian), natomiast inni admini kazali mi nie robić niczego bez flagi. ;-) Ku mojemu zaskoczeniu, już dzisiaj mój wniosek został pomyślnie rozpatrzony i bot śmiga dalej. A ładować jest co - w kolejce czeka jakieś 12 000 nagrań wymowy.

Skąd to wszystko? Jest strona Shtooka Project, gdzie zamieszczane są bazy słów na licencji Creative Commons. Tsca brał z niej kiedyś nagrania słów rosyjskich; teraz doszły tam dodatkowe zbiory.

Z papierkowej roboty - czekam na flagę bota na polskim, niemieckim i angielskim Wikisłowniku - mój bot będzie tam te wszystkie nagrania wymowy wstawiał. Kod bota jest prawie gotowy ;), więc gdy głosowania się skończą, wszystko powinno być już gotowe i przetestowane. Na razie zapisuję w notatniku (dane z początku października): polski Wikisłownik - 4 400 nagrań, angielski - 12 000 nagrań, niemiecki - 1 500 nagrań. Ciekawe, jak będzie po przejściu bota…