Bu araç ne yapar
PDF Text Extractor, bir PDF’yi tarayıcınızda okur ve belgenin içinde zaten seçilebilir olan metni çıkarır. Çıktı; notlar, arama dizinleme, veri inceleme veya sonraki işlemler için kopyalayabileceğiniz ya da TXT dosyası olarak indirebileceğiniz düz metindir.
İyi kullanım alanları
- Masaüstü PDF düzenleyici açmadan raporlardan, sözleşmelerden, ekstrelerden, kılavuzlardan veya araştırma PDF’lerinden metin kopyalama.
- Bir belgeyi arama dizinine, çeviri iş akışına, erişilebilirlik incelemesine veya otomasyon işine göndermeden önce gerçek gömülü metin içerip içermediğini kontrol etme.
- Destek talepleri, belge denetimleri, içerik temizliği veya başka bir sürümle hızlı karşılaştırma için hafif bir TXT kopyası çıkarma.
- Görüntü içeriği barındırdığı halde seçilebilir metin içermeyen ve bu yüzden tarama olabilecek sayfaları belirleme.
Gizlilik notları
PDF bu araç tarafından tarayıcınızda yerel olarak işlenir ve yüklenmez. Çıkarılan metin yine de kişisel veriler, sözleşme şartları, hesap numaraları, gizli üstbilgiler veya başka hassas içerikler barındırabilir. Sonucu paylaşmadan veya başka bir hizmete yapıştırmadan önce inceleyin.
Sınırlamalar
Bu araç bir OCR motoru değildir. Taranmış sayfalar, fotoğraflanmış sayfalar, yalnızca görüntü içeren düzleştirilmiş PDF’ler ve bazı şifreli ya da bozuk dosyalar çok az metin üretebilir veya hiç metin üretmeyebilir. Düzen, düz metne normalleştirilir; bu nedenle sütunlar, tablolar, dipnotlar ve okuma sırası görsel sayfadan farklı olabilir. Kaynak belge seçilebilir metin içermiyorsa özel bir OCR veya PDF onarım aracı kullanın.