PDFTextStream

Screenshot Software:
PDFTextStream
Detalii soft:
Versiune: 2.6.0
Incarca data: 20 Feb 15
Licenţă: Shareware
Preţ: 1900.00 $
Popularitate: 2

Rating: nan/5 (Total Votes: 0)

proiect PDFTextStream este o bibliotecă de extracție de text PDF și metadate disponibile pentru Java, Python, și .NET.
Acesta suporta toate versiunile de caietul de sarcini document PDF, (inclusiv v1.6, folosite de Acrobat 7), extracția de text codificat, folosind seturi de caractere dublu-octet (inclusiv chineză, japoneză, coreeană și), decriptarea de 40-biți și 128 documente bit criptate, și extracția tuturor metadatelor documentelor furnizate de documente PDF (inclusiv datele de formular, semne de carte, și adnotări).
Integrare ușoară cu Jakarta Lucene este inclus

Ce este nou în această versiune:.

  • Această versiune include o varietate de remedieri si voi pentru a se asigura PDFTextStream este capabil de a extrage text din documente PDF care sunt neconforme cu caietul de sarcini PDF.
  • De asemenea, include o varietate de îmbunătățiri de performanță.

Ce este nou în versiunea 2.3.0:

  • Adaugata o metodă .isStruckThrough () pentru a com. snowtide.pdf.TextUnit, indicând dacă un personaj are o tăiat trasată prin ea.
  • îmbunătățit sprijinul PDFTextStream pentru mapările de caractere încorporate.
  • Calculul spații între cuvinte a fost fixat pentru a ține cont în mod corespunzător de spații care este codificată în mod explicit în documentele sursă PDF.
  • îmbunătățită manipularea PDFTextStream de codificări de conținut compozite, care anterior ar putea eșua rezultând în unele intervale de conținut PDF fi "ignorat" în timpul extracției.
  • Fixed un bug în VisualOutputTarget în care textul dintr-un singur rând ar fi împărțită pe mai multe linii
  • aliniere îmbunătățită pe verticală a textului extras folosind VisualOutputTarget
  • Improved extracte VisualOutputTarget-a produs pentru a elimina spații suplimentare fals între cuvinte strâns-adiacente

Ce este nou în versiunea 2.2.5:

  • Această versiune adaugă suport pentru extragerea XFA forme de date ca XML.
  • Se îmbunătățește semnificativ performanțele de extracție text folosind VisualOutputTarget. Suport pentru documente PDF mai mari decât 2GB.
  • O fix pentru un bug în cazul în care codificări din fonturile Type1 integrate au fost anterior nu a fost corect aplicate în anumite circumstanțe.
  • O fix pentru o problemă în cazul în care conținutul de nouă în documentele PDF actualizate fost uneori ignorate.
  • O fix pentru o problemă în cazul în care marcaje și metadate codificate-PDFDocEncoding nu au fost decodificate corect.
  • A .getDestinationName () metoda în com.snowtide.pdf.Bookmark.

Cerințe :

  • Apache Lucene

Comentarii la PDFTextStream

Comentariile nu a fost găsit
Adauga comentarii
Porniţi pe imagini!