Scott Tiger Tech Blog

Blog technologiczny firmy Scott Tiger S.A.

Archiwum dla Luty, 2017

CLARIN-PL: narzędzia lingwistyczne do przetwarzania języka polskiego

Autor: Piotr Karpiuk o 9. lutego 2017

Nierzadko informatycy stają przed zadaniem przetwarzania języka polskiego. Jest to oczywiście złożone zagadnienie i mało prawdopodobne by ktoś chciał sam się pokusić o napisanie parsera (choćby tylko płytkiego) dla języka polskiego, nie mówiąc już o poziomie semantycznym. Na szczęście polscy lingwiści-informatycy udostępniają stworzone przez siebie narzędzia w Internecie, a wśród nich prawdziwe perełki.
CLARIN-PL to strona od której warto zacząć przegląd. Mamy tu bardzo szybki analizator morfologiczny Morfeusz, wrocławski szybki tager języka polskiego WCRFT2, narzędzie do wydłubywania nazw własnych z tekstu Liner2, parsery do języków polskiego/angielskiego/niemieckiego czy narzędzia do przetwarzania mowy.
Ponieważ z czasem pojawiają się nowe narzędzia i aktualizacje istniejących, warto skorzystać z Wyszukiwarki, gdzie można sobie posortować wyniki malejąco po dacie zgłoszenia.
Niektóre narzędzia są intrygujące, np. system do wykrywania listów samobójczych.

Napisany w Lingwistyka | Brak komentarzy »

Zanieczyszczenie powietrza na bieżąco

Autor: Piotr Karpiuk o 2. lutego 2017

Główny Inspektorat Ochrony Środowiska udostępnił serwis Ocena jakości powietrza, w którym w miarę na bieżąco (z dokładnością do ok. 2h) sprawdzimy czy możemy wyjść na spacer albo mieszkańcom której części kraju można pozazdrościć.

Napisany w GIS, WWW | Brak komentarzy »