Czy lepiej po prostu renderować pliki PDF jako obrazy i stosować OCR, zamiast czytać je bezpośrednio?