Wyszukiwarka korpusowa PELCRA dla danych NKJP (Cytowanie)
O wyszukiwarce
Wyszukiwarka korpusowa PELCRA dla danych NKJP powstała w ramach projektu Narodowy Korpus Języka Polskiego*. Umożliwia ona przeszukiwanie zrównoważonej wersji korpusu (ponad 250 milionów słów tekstowych, czyli ok. 300 milionów segmentów) oraz całej puli danych NKJP (ok. 1500 milionów słów tekstowych, czyli ok. 1800 milionów segmentów) zebranych w ramach projektu.Wyszukiwarkę PELCRA cechuje łatwość użycia oraz szybkość zwracania nawet bardzo dużych zbiorów wyników, które można także pobierać w postaci arkuszy kalkulacyjnych. Specjalna składnia zapytań umożliwia też stosowanie rozszerzeń morfologicznych oraz ortograficznych, wyszukiwanie w jednym zapytaniu wariantów leksykalnych i elastycznych związków frazeologicznych.
Wyszukiwarka PELCRA NKJP oferuje także funkcję wizualizacji rejestru oraz generowanie szeregów czasowych dla słów, fraz i idiomów.
Osobny moduł ekstrakcji kolokacji umożliwia badanie łączliwości frazeologicznej wyrazów występujących w korpusie zbyt często, aby można je było przeanalizować na podstawie konkordancji.
Oto kilka przykładów możliwości naszej wyszukiwarki:
- wyraz ręka we wszystkich odmianach, do 3 przykładów z danego źródła (zobacz)
- użycia wyrazu strażnik lub wartownik posortowane po dopasowaniu, a następnie po lewym kontekście (zobacz)
- użycia wyrazu wymiękać, do 3 przykładów użycia z danego roku, w kolejności chronologicznej (zobacz)
- użycia frazy odprawić z kwitkiem, lub odprawić z niczym (zobacz)
- związki frazeologiczne tworzone przez wyrazy łezka, oko i kręcić, występujące w różnej kolejności i odległości od siebie (zobacz)
- kolokacje przymiotnikowe rzeczownika zdrada posortowane według istotności statystycznej (zobacz)
- kolokacje rzeczownikowe odstawić do (zobacz)
Obsługujemy również dostęp programistyczny do wyszukiwarki, dzięki czemu wyniki przeszukiwania NKJP (cytaty i metadane) można przetwarzać dla własnych potrzeb bez konieczności ściągania i aktualizowania gigabajtów danych. Inną przydatną funkcją wyszukiwarki jest generowanie skompresowanych odsyłaczy do ekranów wyników, które można w ten sposób łatwo i wygodnie zapisywać, oraz wymieniać z innymi użytkownikami.
Szczegółowy opis funkcji wyszukiwarki można znaleźć na stronie Pomocy. Zamieszczone tam przykłady pomogą Państwu w pełni wykorzystać jej możliwości. Bezpośrednie sugestie i pytania można kierować na ten adres e-mail.
* Autorów publikacji powołujących się na wyszukiwarkę PELCRA NKJP prosimy o cytowanie następującej publikacji:
Piotr Pęzik (2012) Wyszukiwarka PELCRA dla danych NKJP. Narodowy Korpus Języka Polskiego. Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B. (red.). 2012. Wydawnictwo PWN .
Piotr Pęzik, Narodowy Korpus Języka Polskiego