Długa droga od tekstu na kartce do cyfrowych danych

Jan Kaliński
opublikowano: 07-02-2007, 00:00

Sterty dokumentów zalegających w biurach odchodzą do lamusa. Coraz częściej tradycyjne archiwa zastępują ich e-odpowiedniki.

archiwizacjaProces eliminacji papieru z biura

Sterty dokumentów zalegających w biurach odchodzą do lamusa. Coraz częściej tradycyjne archiwa zastępują ich e-odpowiedniki.

Cyfrowe archiwa zajmują mniej miejsca, łatwiej je przeszukiwać, są tańsze w utrzymaniu, a ich bezpieczeństwo jest większe. W procesie zamiany dokumentów papierowych na dokumenty cyfrowe można wyróżnić kilka etapów. Pierwszym z nich jest przyjęcie przez firmę dokonującą archiwizacji dokumentów od klienta. Najczęściej są one znakowane według schematów ustalonych z klientem i sortowane zgodnie z typem, ma to na celu usprawnienie kolejnego kroku procesu. Drugim zaś jest skanowanie i indeksowanie dokumentów. Ich pobranie może odbywać się za pomocą wielu różnych technologii. Najpopularniejsza metoda to użycie skanera, który stworzy wersję elektroniczną papierowego dokumentu.

— Skanowanie to nic innego jak konwersja dokumentu w formie papierowej do formy elektronicznej. Dużą popularnością cieszy się format PDF, który ma cechy zarówno dokumentu tekstowego, jak i obrazu — tłumaczy Krzysztof Ukleja, konsultant w ATA-INT.

Problemem może się okazać olbrzymia ilość dokumentów, które należy zeskanować. Może ich być setki tysięcy rocznie.

— Na szczęście producenci sprzętu oferują skanery o bardzo dużej wydajności wraz ze specjalnymi podajnikami na większe ilości dokumentów — mówi Piotr Gosek z Euroscript Polska.

Prosto do systemu

Potem przeprowadzana jest digitalizacja dokumentu, czyli inaczej — zapisanie go w odpowiednim formacie. Kolejnym etapem jest weryfikacja. Ma ona na celu sprawdzenie, czy uzyskany obraz dokumentu spełnia wymogi jakościowe, czy jest czytelny i kompletny. Na tym etapie taki zeskanowany dokument może zostać oczyszczony i poprawiony.

By korzystanie z komputerowego archiwum było wygodne, samo zeskanowanie dokumentów nie wystarczy. By z tych danych korzystać w programach wspomagających zarządzanie, trzeba je odczytać. Do rozpoznawania pisma maszynowego służy oprogramowanie OCR, a do rozpoznawania pisma ręcznego — ICR. Zeskanowane obrazy dokumentu są przekształcane na formę tekstową. Dzięki temu dane z dokumentów wprowadzane są do procesu biznesowego.

— Przykładem takiego zastosowania może być uzyskiwanie danych o klientach z formularzy i przenoszenie ich do systemu, np. CRM — przytacza Piotr Gosek.

Na rynku pojawiają się również usługi umożliwiające sortowanie dostarczanych dokumentów, które rozpoznają wcześniej określone wzorce dokumentów, np. faktur czy reklamacji.

Największym problemem pojawiającym się podczas uzyskiwania danych z formularzy jest odczytywanie danych wprowadzonych ręcznie.

— Na świecie istnieje zaledwie kilka systemów, które radzą sobie z tym wyzwaniem. Niestety, nawet najlepsze z nich osiągają skuteczność rozpoznania na poziomie 70-90 proc. poprawnie rozpoznanych znaków pisma ręcznego. Tak niska skuteczność rozpoznania oznacza konieczność korekty, która zwykle musi być dokonana przez człowieka — tłumaczy Dariusz Bochomulski, product manager w OptiX Polska.

Wprost do użytkownika

Choć skuteczność odczytywania pisma maszynowego jest dużo większa — 98-99 proc., jednak i w tym przypadku nie można obyć się bez weryfikacji danych. Proces sprawdzania poprawności danych to walidacja. Ten etap może odbywać się ręcznie lub automatycznie.

— Weryfikacja ręczna części dokumentów na pewno jest nieunikniona, ale celem wdrażania systemów informatycznych jest maksymalne zautomatyzowanie takiego procesu, a co za tym idzie — minimalizacja udziału w procesie czynnika ludzkiego — zauważa Piotr Gosek.

Kolejnym krokiem w procesie archiwizacji jest indeksowanie. Ma ono na celu ułatwienie dotarcia do konkretnego dokumentu. W bazie danych archiwalnych, oprócz obrazu dokumentu, zostaną zapisane wszystkie potrzebne informacje.

— Może to być informacja na temat typu dokumentu (faktura, oferta), data wpłynięcia, odbiorca docelowy, miejsce archiwizacji oryginalnego dokumentu papierowego i wiele innych. Ilość indeksowanych danych jest nieograniczona, ale ze względów funkcjonalnych należy ograniczyć się do informacji podstawowych. Im mniej danych do indeksowania, tym proces będzie przebiegał szybciej — mówi Krzysztof Ukleja.

Ostatnim etapem jest eksport danych i udostępnienie archiwów w systemie komputerowym. Oczywiście systemy archiwizacji elektronicznej dają możliwość określania praw dostępu do poszczególnych dokumentów, co pozwala efektywnie zarządzać dostępem do archiwum.

© ℗
Rozpowszechnianie niniejszego artykułu możliwe jest tylko i wyłącznie zgodnie z postanowieniami „Regulaminu korzystania z artykułów prasowych” i po wcześniejszym uiszczeniu należności, zgodnie z cennikiem.

Podpis: Jan Kaliński

Polecane

Inspiracje Pulsu Biznesu