Hva dette verktøyet gjør
PDF Text Extractor leser en PDF i nettleseren din og henter ut tekst som allerede er markerbar i dokumentet. Resultatet er ren tekst som du kan kopiere eller laste ned som en TXT-fil for notater, søkeindeksering, datagjennomgang eller videre behandling.
Gode bruksområder
- Kopiere tekst fra rapporter, kontrakter, kontoutskrifter, håndbøker eller forsknings-PDF-er uten å åpne et PDF-redigeringsprogram på skrivebordet.
- Sjekke om et dokument har ekte innebygd tekst før du sender det til en søkeindeks, oversettelsesflyt, tilgjengelighetsgjennomgang eller automatiseringsjobb.
- Trekke ut en lett TXT-kopi for supportsaker, dokumentrevisjoner, innholdsopprydding eller rask sammenligning med en annen versjon.
- Oppdage sider som kan være skanninger fordi de inneholder bildeinnhold, men ingen markerbar tekst.
Personvernmerknader
PDF-en behandles lokalt i nettleseren din og lastes ikke opp av dette verktøyet. Den uthentede teksten kan likevel inneholde personopplysninger, kontraktsvilkår, kontonumre, skjulte topptekster eller annet sensitivt innhold. Se gjennom resultatet før du deler det eller limer det inn i en annen tjeneste.
Begrensninger
Dette verktøyet er ikke en OCR-motor. Skannede sider, fotograferte sider, flate PDF-er som bare består av bilder, og enkelte krypterte eller skadde filer kan gi lite eller ingen tekst. Layout normaliseres til ren tekst, så kolonner, tabeller, fotnoter og leserekkefølge kan avvike fra den visuelle siden. Bruk et dedikert OCR- eller PDF-reparasjonsverktøy når kildedokumentet ikke inneholder markerbar tekst.