Indeksowanie - pozyskiwanie danych z dokumentów

Indeksowanie

 

Indeksowanie, pozyskiwanie danych z dokumentów

 

Samo zeskanowanie, nawet w doskonałej jakości nie będzie wystarczające do stworzenia użytecznego archiwum elektronicznego. Kluczowe jest odpowiednie poindeksowanie dokumentów. Rozumiemy przez to stworzenie właściwej struktury dla skanowanych dokumentów oraz opis każdego dokumentu czyli wprowadzenie metadanych.

 

W zależności od rodzaju skanowanego zasobu struktury mogą być proste lub złożone, może być jedna lub wiele metadanych dla poszczególnego dokumentu. Od tego jak poindeksujemy zasób będzie zależała możliwość szybkiego znalezienia poszukiwanego dokumentu, ponieważ struktura indeksowania jest tożsama z konstrukcją wyszukiwarki.

 

Sposoby pozyskiwania indeksów:

 

  • ręczny poprzez przepisywanie istotnych dla klienta danych z dokumentu
  • automatyczny poprzez pozyskiwanie danych metodą OCR
  • z odczytem kodu kreskowego
  • z dołączeniem indeksów z dostarczonej bazy danych