Nowoczesny użytkownik języka obcego wspiera się wieloma narzędziami dostępnymi on-line lub w formie aplikacji. Są to różnego rodzaju słowniki, aplikacje do nauki słówek, programy służące robieniu interaktywnych notatek, map myśli, itd. Narzędziem, którego potencjał nie jest jeszcze wykorzystywany na szerszą skalę w nauce języków obcych są korpusy językowe.

Korpus językowy

Korpus językowy to zbiór tekstów naturalnych służący jako materiał do badań nad częstością występowania wyrazów, ich form, związków frazeologicznych oraz kontekstów, w których dane elementy leksykalne są stosowane. Przez tekst należy rozumieć materiały pochodzące z wszelkich źródeł pisanych (tradycyjnych m.in. książki, prasa, raporty, akty prawne, oraz internetowych takich jak elektroniczne wydania magazynów, blogi, fora, czaty, a nawet komentarze na facebooku), jak i transkrypcje języka mówionego (np. wywiadów, audycji radiowych, debat sejmowych, przesłuchań sądowych, codziennych rozmów na ulicy czy wideorozmów). Dzięki temu korpus językowy reprezentuje całościowy obraz wykorzystania danego języka.

Na przykład Korpus Języka Polskiego PWN zawiera teksty powstałe w latach 1920-2005 pochodzące z następujących źródeł:

  • książki beletrystyczne – 20%,
  • książki niebeletrystyczne – 21%,
  • prasa – 45,5%,
  • rozmowy – 4,5%,
  • druki ulotne i użytkowe – 5,5%,
  • strony internetowe – 3,5%.

Natomiast Brytyjski Korpus Narodowy składa się z tekstów powstałych w latach 1975-2007 pochodzących z następujących źródeł:

  • 90% tekstów pisanych (75% tekstów publicystycznych, 25% tekstów literackich; pochodzących w 60% z książek, 35% z czasopism i w 5% z materiałów niepublikowanych),
  • 10% tekstów mówionych – 2000 godzin nagrań w formie transkrypcji przeprowadzonych przez ochotników z 35 regionów Wielkiej Brytanii.

Rodzaje korpusów

highlights

W zależności od tego, co chcemy zbadać, teksty do korpusu mogą być wybierane wg specjalnego klucza. Mówimy wtedy o korpusach zrównoważonych – np. pod względem dziedziny, gatunku, czasu lub miejsca powstania, wieku lub płci autora, itp.

Istnieją również korpusy równoległe, do których dobiera się teksty mające swój odpowiednik w innym języku (lub innych językach). Tego typu korpusy stanowią nieocenioną pomoc dla tłumaczy i terminologów.

Przykładem zbioru tekstów i ich odpowiedników w różnych językach jest baza aktów prawnych Unii Europejskiej (https://eur-lex.europa.eu).

Jak korzystać z korpusu

Korpusy językowe dostępne w internecie wyposażone są w wyszukiwarkę. Wpisujemy dane słowo lub frazę i otrzymujemy wynik: czyli wszystkie wystąpienia zadanego elementu w danym zbiorze.

W korpusie językowym nie znajdziemy słownikowych definicji tudzież tłumaczeń wyrazów czy zwrotów na nasz język ojczysty. Jednak wynik wyszukiwania pozwala nam przyjrzeć się, jak dane słowo łączy się z innymi, w jakim kontekście najczęściej występuje. Tu właśnie drzemie ogromny potencjał korpusów językowych, jako źródła autentycznego języka dla osób uczących się. Np. wyszukując słowo „utmost” w korpusie brytyjskim dowiemy się, że zwykle występuje w następujących zwrotach:

  • of (the) utmost importance,
  • with the utmost dedication,
  • with the utmost attention to,
  • with the utmost care,
  • to one’s utmost,
  • strive one’s utmost.

W ten sposób, w oparciu o autentyczne teksty, dociekliwy adept języka obcego może stworzyć swój własny zasób zwrotów zawierających dany wyraz lub kombinację wyrazów.

Narzędzie to jest szczególnie przydatne dla tych osób, które osiągnęły już pewien poziom biegłości językowej, ale chciałyby świadomie zgłębiać jego niuanse, doszlifować znajomość słownictwa, a także poznać język w takiej odmianie, w jakiej jest stosowany przez rodzimych użytkowników.

Co więcej, wyniki wyszukiwania w korpusie będą zawsze najbardziej aktualnym źródłem informacji – w przeciwieństwie do np. słowników, które szybko się dezaktualizują.

Otaczający nas świat pędzi do przodu, język stara się dotrzymać mu kroku, a my – użytkownicy tego języka usiłujemy nie zostać daleko w tyle… Korzystanie z korpusu językowego może nam choć trochę w tym pomóc 🙂