Uwagi do projektu Cinderella i rzeczy powiązanych

1. Używałam zawsze tylko jednego modułu Fextora - fextor.features.paragraph, iteratora fextor.iterators.WholeDocumentIterator i slicera fextor.contexts.slicer.UniversalDocumentSlicer(). Jeżeli trzeba będzie dopisać jakąś nową cechę do klasyfikacji całych dokumentów, to moduł paragraph jest najbardziej prawdopodobnym miejscem.

2. Ostatnimi trzema cechami w configu Fextora powinny być context doc_name class - w tej kolejności.

3. Po ważeniu Supermatrixem może się okazać, że macierz ma mniej rzędów, niż miała na początku. To znaczy, że niektóre rzędy się wyzerowały i zostały usunięte.

4. Jeżeli gdzieś jest używana WEKA, nazwy kolumn nie powinny zawierać spacji. WEKA traktuje spację jako koniec nazwy.

5. Wszystkie funkcje do liczenia cech różnicowych są w skrypcie matrix_tools.py
