Wszystko zaczyna się od przesłania nowego dokumentu do biblioteki. System "odczytuje" go, przetwarza i po krótkim czasie (w zależności od rozmiaru pliku) wyświetla stronę z opisem zawierającą listę najczęstszych wyrazów, fraz i jednostek nazewniczych z tekstu. System pomaga również w kategoryzacji pliku przez zaproponowanie listy tematów, z którymi jest najprawdopodobniej związany.
W ten sposób można poznać tematykę tekstu i ocenić jego przydatność przed przeczytaniem całej treści.
nazwy własne - osób, firm, państw, miast, organizacji;
odnośniki - adresy WWW i e-mailowe znalezione w dokumencie.
ważne słowa - słowa występujące w tekście najczęściej i zwykle przybliżające treść dokumentu.
ważne frazy - określenia statystycznie istotne w kontekście bieżącego dokumentu, a nieistotne dla pozostałych zasobów biblioteki i w ten sposób oddające znaczenie dokumentu.
© 2011-12 Atlas Project