Vad det här verktyget gör
PDF Text Extractor läser en PDF i din webbläsare och hämtar text som redan är markerbar i dokumentet. Resultatet är oformaterad text som du kan kopiera eller ladda ner som en TXT-fil för anteckningar, sökindexering, datagranskning eller vidare bearbetning.
Bra användningsfall
- Kopiera text från rapporter, avtal, kontoutdrag, handböcker eller forsknings-PDF:er utan att öppna en PDF-redigerare på datorn.
- Kontrollera om ett dokument har verkligt inbäddad text innan du skickar det till ett sökindex, ett översättningsflöde, en tillgänglighetsgranskning eller ett automatiseringsjobb.
- Extrahera en lätt TXT-kopia för supportärenden, dokumentgranskningar, innehållsrensning eller snabb jämförelse med en annan version.
- Upptäcka sidor som kan vara skanningar eftersom de innehåller bildinnehåll men ingen markerbar text.
Integritetsnoteringar
PDF-filen bearbetas lokalt i din webbläsare och laddas inte upp av det här verktyget. Den extraherade texten kan ändå innehålla personuppgifter, avtalsvillkor, kontonummer, dolda sidhuvuden eller annat känsligt innehåll. Granska resultatet innan du delar det eller klistrar in det i en annan tjänst.
Begränsningar
Det här verktyget är inte en OCR-motor. Skannade sidor, fotograferade sidor, PDF:er som bara består av platta bilder och vissa krypterade eller skadade filer kan ge lite eller ingen text. Layouten normaliseras till oformaterad text, så kolumner, tabeller, fotnoter och läsordning kan skilja sig från den visuella sidan. Använd ett särskilt OCR- eller PDF-reparationsverktyg när källdokumentet inte innehåller markerbar text.