# Projekt              : Clarin-PL
# Opis                 : Kamień milowy M12 zadania A15
# Data publikacji      : 30 maja 2014

1. Wstęp

   Paczka zawiera bazę nazw własnych pozyskanych w sposób automatyczny i półautomatyczny
   z różnych zasobów internetowych, m.in. z polskiej Wikipedii i Wikisłownika.

   NELexicon2 zawiera blisko 2,3 miliona nazw własnych dla 107 kategorii obiektów.
   Pełna lista nazw wraz z przypisanymi kategoriami obiektów znajduje się w pliku 
   nelexicon2-names.txt. Pliki z katalogu extra/ zawierają podzbiory pliku nelexicon2-names.txt 
   wraz z dodatkowymi informacjami uzależnionymi od źródła, z którego nazwy zostały pobrane.

2. Zawartość paczki:

   a) nelexicon2-names.txt

      Lista wszystkich nazw wraz z przypisanymi kategoriami obiektów.


   b) nelexicon2-stats.txt

      Statystyki liczby nazw dla poszczególnych kategorii obiektów.

      -----------------------------------------------------
       12733 nam_eve_human
         813 nam_eve_human_cultural
         716 nam_eve_human_holiday
        4692 nam_eve_human_sport
         229 nam_eve_natural_phenomenom
        4721 nam_fac
         639 nam_fac_bridge
       ...
      -----------------------------------------------------


   c) extra/first-names-diminutive.txt

      Zdrobnienia imion. 
 

   d) extra/first-names-diminutive-with-bases.txt

      Zdrobnienia imion wraz z formą oficjalną imienia. 

      -----------------------------------------------------
      nam_liv_person_first    Olunia  Aleksandra
      nam_liv_person_first    Ola     Aleksandra
      nam_liv_person_first    Oluchna Aleksandra
      nam_liv_person_first    Alosia  Aleksandra
      ...
      -----------------------------------------------------


   e) extra/first-names-foreign.txt

      Obcojęzyczne formy polskich imion.


   f) extra/first-names-foreign-with-polish.txt

      Obcojęzyczne formy polskich imion wraz z polskimi odpowiednikami.

      -----------------------------------------------------
      nam_liv_person_first    Oleksandra      Aleksandra
      nam_liv_person_first    Aleksandra      Aleksandra
      nam_liv_person_first    Sanderstje      Aleksandra
      nam_liv_person_first    Alexandrine     Aleksandra
      nam_liv_person_first    Sanderke        Aleksandra
      ...
      -----------------------------------------------------
   

   g) extra/nelexicon-names.txt

      Lista nazw z NELexon wraz z przypisanymi kategoriami obiektów.

      -----------------------------------------------------
      nam_fac_bridge  Erzsébet híd
      nam_fac_bridge  Karlův most
      nam_fac_bridge  Margit híd
      nam_fac_bridge  most Elżbiety
      ...
      -----------------------------------------------------


   h) extra/wikipedia-infobox-forms.txt

      Formy odmiany nazw z infoboxów polskiej Wikipedii wyciągnięte z linków
      wewnętrznych Wikipedii.


   i) extra/wikipedia-infobox-forms-with-bases.txt

      Formy odmiany nazw z infoboxów polskiej Wikipedii wyciągnięte z linków
      wewnętrznych Wikipedii wraz z formami bazowymi.
      
      -----------------------------------------------------
      nam_org_group   1 Armią Wojska Polskiego        1 Armia Wojska Polskiego
      nam_org_group   1 Armię Wojska Polskiego        1 Armia Wojska Polskiego
      nam_org_group   1 Armii Wojska Polskiego        1 Armia Wojska Polskiego
      nam_org_group   1 Armii 1 Armia
      nam_org_group   1 Armię 1 Armia
      nam_org_group   1 Armią 1 Armia
      ...
      -----------------------------------------------------


   j) extra/wikipedia-infobox-names.txt

      Nazwy wyciągnięte z infoboxów polskiej Wikipedii. 

   k) extra/wikipedia-liner2.txt

      Lista nazw rozpoznanych przez Liner2 z modelem 56 nam o liczbie wystąpień
      równej lub większej niż 5. Jako, że nazwy zostały rozpoznane automatycznie,
      to lista może zawierać błędnie rozpoznane nazwy.


   l) extra/wikipedia-liner2-with-counts.txt

      Lista nazw rozpoznanych przez Liner2 z modelem 56 nam o liczbie wystąpień
      równej lub większej niż 5 wraz z liczbą wystąpień. Jako, że nazwy zostały
      rozpoznane automatycznie, to lista może zawierać błędnie rozpoznane nazwy.

      -----------------------------------------------------
      nam_loc_gpe_admin1      Abisynii        16
      nam_loc_gpe_admin1      Abitibi - Témiscamingue 8
      nam_loc_gpe_admin1      Abjan   11
      nam_loc_gpe_admin1      Aceh    8
      nam_loc_gpe_admin1      Achai   9
      ...
      -----------------------------------------------------


   m) extra/wiktionary-forms.txt
 
      Formy odmiany nazw wyciągnięte z polskiego Wikisłownika.
      

   n) extra/wiktionary-forms-with-bases-and-tags.txt

      Formy odmiany nazw wyciągnięte z polskiego Wikisłownika wraz z formą bazową,
      liczbą i przypadkiem.

      -----------------------------------------------------
      nam_liv_person  Aaronom Aaron   pl:dat
      nam_liv_person  Aaronami        Aaron   pl:inst
      nam_liv_person  Aaronach        Aaron   pl:loc
      nam_liv_person  Aarona  Aaron   sg:acc
      nam_liv_person  Aaronie Aaron   sg:loc
      nam_liv_person  Aaronów Aaron   pl:gen
      ...
      -----------------------------------------------------

