DeskTop Publishing (DTP)
Extracción de texto de archivos PDF
Los archivos con formato PDF son una imagen y como tal no tiene caracteres sino píxeles. Para poder extraer el texto de estos documentos primero hay que procesarlos utilizando un OCR. Recomendamos Abby Fine Reader y OmniPage ya que mantienen el maquetado del documento, la tipografía, tienen corrector ortográfico, exportan a MS Word, y muchas otras funciones que preparan al documento para la traducción.
volver
|