- benchmark_interps -zbiór znaków interpunkcyjnych do badań stylometrycznych do użycia w Fextorze - cecha "interp_signs"
- blogi_orth_100 - lista 100 najczęstszych orthów w korpusie blogów do użycia w Fextorze - cecha "orth"
- emocje_czasowniki.txt - słownik czasowników wyrażających emocje do użycia w Fextorze - cecha "verb_emotion_markers"
- emocje_przymiotniki.txt - słownik przymiotników wyrażających emocje do użycia w Fextorze - cecha "adj_emotion_markers"
- emocje_rzeczowniki.txt - słownik rzeczowników wyrażających emocje do użycia w Fextorze - cecha "noun_emotion_markers"
- lex_counterfeited_plus_tune.txt - słownik wygenerowany skryptem Janka Koconia - lematy charakterystyczne dla klasy counterfeited z korpusu listów pożegnalnych (wygenerowane ze zbioru tuningowego) - Fextor, cecha "counterfeited_dictionary"
- lex_genuine_plus_tune.txt - Fextor, cecha "genuine_dictionary"
- lex_text_plus_tune.txt - Fextor, cecha "text_dictionary"
- nkjp500 - lista 500 najczęstszych lematów z korpusu nkjp do użycia w Fextorze, cecha "base"
- nkjp360-meaningless.txt - jak wyżej, po odfiltrowaniu 140 lematów...
- nkjp212-meaningless-no-prep-freq-above-3500.txt - ...po kolejnym filtrowaniu...
- nkjp172-meaningless-no-prep-freq-above-3500-shorter.txt - ...i kolejnym. Tu już powinny być same lematy bez znaczenia. Do badań stylometrycznych.
- propernames.csv - kategorie nazw własnych do użycia w Fextorze - cecha "proper_names" - stary model 	Linera
- propernames-top9.csv - kategorie nazw własnych do użycia w Fextorze - cecha "proper_names" - nowy model Linera
- stoplist_biblio - cechy odfiltrowane z macierzy biblio.
- synset_dict_11_2015.csv - id;opis synsetu dla wszystkich synsetów ze Słowosieci (11.2015)
- taglist.csv - tagi z tagsetu nkjp do użycia w Fextorze - cecha "lex_classes"
