Pliki zastępują druki

Jan Kaliński
opublikowano: 20-06-2007, 00:00

Wyzwaniem dla producentów aplikacji rozpoznających pismo pozostaje dostosowanie ich do wymogów języka polskiego.

Zarządzanie dokumentami OCR przetworzy zapisaną kartkę w plik

Wyzwaniem dla producentów aplikacji rozpoznających pismo pozostaje dostosowanie ich do wymogów języka polskiego.

Im mniej standardowe — o nietypowym formacie, kształcie czy strukturze — tym trudniej przetworzyć dokumenty w formę elektroniczną.

— Nie istnieją jednak takie, których nie dałoby się zdigitalizować. W jednym z projektów mieliśmy do czynienia z dokumentacją przedwojenną, bardzo zniszczoną i nietypową, często zalakowaną bądź powiązaną sznurkami. Jej przetworzenie wymagało dużego nakładu pracy i zmodernizowania infrastruktury informatycznej. Ale daliśmy radę — wspomina Marek Bronder, dyrektor ds. sprzedaży i rozwoju ArchiDoc.

Wszystko możliwe

Sercem przetwarzania danych pozostaje oprogramowanie typu OCR (ang. Optical Character Recognition). Aplikacje do zastosowań domowych kładą nacisk na jak najwierniejsze odwzorowanie układu i zawartości stron, z możliwością ich zapisania w popularnych formatach: doc, xls czy pdf.

— Natomiast programy OCR dla biznesu stosowane są głównie do odczytu strefowego danych — choćby formularzy — czy ich odczytu z dokumentów niesformalizowanych, np. faktur — wyjaśnia Agnieszka Banaszkiewicz, menedżer w Canon-Dicom Polska.

Typowy program OCR jest w stanie poprawnie zanalizować dane tabelaryczne, układ wielokolumnowy czy też rozpoznać grafikę w tekście. Można więc skanować dokumenty biurowe, strony czasopism czy książki.

— Odczyt strefowy pozwala na czytanie danych o określonej, stałej pozycji w dokumencie. Stosowane są techniki ułatwiające odczyt pól otoczonych liniami czy pozycjonowanie stref odczytu względem specjalnych znaczników. Często w takich formularzach rozpoznawane są również pola wyboru i kody kreskowe — opisuje Agnieszka Banaszkiewicz.

Bez współpracy ani rusz

Programy do zastosowań biznesowych muszą być przystosowane do przetwarzania dużych ilości dokumentów, ale także do współpracy z innymi aplikacjami używanymi w firmie.

— Dzięki temu przetworzone elektronicznie dokumenty i dane mogą być automatycznie sprzężone z oprogramowaniem do zarządzania zasobami przedsiębiorstwa, elektronicznymi repozytoriami dokumentów czy systemami do zarządzania obiegiem dokumentów — przypomina Marek Bronder.

Oprogramowanie OCR da się zintegrować z innymi aplikacjami — jeśli chcemy wykorzystać tę technologię np. do przetwarzania faktur, ważna staje się współpraca z systemem finansowo-księgowym lub narzędziem klasy ERP.

— Dane z zeskanowanych faktur mogą być automatycznie porównywane z danymi z systemu informatycznego, dzięki czemu nie trzeba weryfikować ich zgodności ani wprowadzać ich ręcznie — dodaje Marek Bronder.

A księgowość ma dostęp do sprawdzonych faktur, połączonych z odpowiadającymi im zamówieniami.

— System odczytu faktur to niezależna platforma przetwarzania dokumentów, pozwalająca na integrację na poziomie plików — tu przykładowo można użyć formatu XML do przeniesienia odczytanych danych, łącza ODBC (otwarte łącza baz danych) z dowolnym systemem bazodanowym lub za pomocą specjalizowanych konektorów do wszystkich znaczących produktów obecnych na rynku — sumuje Agnieszka Banaszkiewicz.

Skaner dla biznesu

Firmy wykorzystują tzw. skanery dokumentowe o różnej prędkości, umożliwiające skanowanie w różnych trybach. Te urządzenia wyposażane są w rozmaite typy obróbki i polepszania jakości obrazu — niezależne od skanera oprogramowanie, pozwalające na minimalizację ustawień aplikacji skanującej. Pozwala na uzyskanie obrazu dobrej jakości, bez potrzeby zmiany ustawień typu jasność, kontrast. Obraz jest też przycięty do właściwej wielkości, co pozwala na mieszanie kartek o różnych rozmiarach, automatycznie usuwa przekrzywienia obrazu i obraca tak, by obraz miał poprawną orientację. Atutem jest usuwanie pustych stron i czyszczenie śladów po dziurkaczu. Najnowsze skanery wyposażone są m.in. w opcję skanowania do projektora. W „trybie prezentacji” skaner można podłączyć bezpośrednio do projektora i przekazywać obrazy z różnych źródeł — zeskanowanych dokumentów, telefonów komórkowych (przez transmisję w podczerwieni) czy kart pamięci.

40

proc.

Tyle światowego rynku systemów wsadowego przetwarzania dokumentów należy do firmy Kofax. Dalsze miejsca zajmują: Captiva, Kodak, Iris.

75

proc. Tyle dużych firm, według Ipsos, korzysta z technologii skanowania i elektronicznego przetwarzania dokume

© ℗
Rozpowszechnianie niniejszego artykułu możliwe jest tylko i wyłącznie zgodnie z postanowieniami „Regulaminu korzystania z artykułów prasowych” i po wcześniejszym uiszczeniu należności, zgodnie z cennikiem.

Podpis: Jan Kaliński

Polecane

Inspiracje Pulsu Biznesu