Удаление текста из PDF
Я ищу решение, чтобы удалить / удалить весь текст из PDF. Я'Мы уже давно используем iTextSharp, и с его помощью легко извлечь текст из PDF-файла (без использования OCR). Однако я могуНе могу найти вариант удалить текст.
Это решение честно говоря нея не работаю
page.GetAsArray(PdfName.CONTENTS);
возвращает ноль для меня, также при использованииPdfName.Text
и некоторые другие ямы пробовали
Библиотека для использования не делаетэто не имеет значения, я просто думаю, что iTextsharp должен быть в состоянии сделать это. Однако, если есть другое (бесплатное) решение, принесите его
РЕДАКТИРОВАТЬ:Просто чтобы понять, почему я хочу удалить весь текст из PDF-файлов
Я хочу уменьшить размер PDF "s. Я делаю это, уменьшая разрешение изображений в формате PDF. Однако во многих случаях векторные изображения занимают большую часть пространства. Поэтому я подумал о следующем: удалите весь текст, затем преобразуйте оставшийся pdf (только с изображениями и векторами) в растровое изображение (jpeg). После этого я вставляю текст поверх него снова. Другой вариант - сделать текст невидимым, но я неЯ думаю, это проще.