Результаты поиска по запросу "text-extraction"

2 ответа

извлечение определенных строк данных из нескольких текстовых файлов для преобразования в один CSV-файл

Во-первых, извиняюсь за мою плохую способность к кодированию, однако я потратил несколько часов, читая форумы и давая им трещину, поэтому я был бы очень признателен за любую помощь в решении следующей проблемы: У меня есть 3 текстовых файла, из ...

4 ответа

php: получить простой текст из html - simplehtmldom или php strip_tags?

Я смотрю на получение простого текста из HTML. Какой из них выбрать, php strip_tags [http://php.net/manual/en/function.strip-tags.php]или жеsimplehtmldom [http://simplehtmldom.sourceforge.net/]извлечение открытого текста? Одним из плюсов для ...

6 ответов

Использование кипера для извлечения неанглийских статей

Я пытаюсь использоватьboilerpipe [http://code.google.com/p/boilerpipe/] библиотека Java, чтобы извлечь новостные статьи из набора веб-сайтов. Он отлично работает для текстов на английском языке, но для текста со специальными символами, например, ...

ТОП публикаций

2 ответа

Соскребание текста из файла в тегах HTML

У меня есть файл, из которого я хочу извлечь даты, это исходный файл HTML, так что он полон кода и фраз, которые мне не нужны. Мне нужно извлечь каждый экземпляр даты, который обернут в определенный тег HTML: abbr title = "((это текст, который ...

4 ответа

Извлечение номера и имени из строки [r]

POSIX Expression вызывает у меня головную боль. Допустим, у нас есть строка: a = "[question(37), question_pipe(\"Person10\")]"и в конечном итоге я хотел бы иметь возможность: b = c("37", "Person10")Я посмотрел наstringr пакет, но не могу ...

8 ответов

Извлечение текста из HTML Java

Я работаю над программой, которая загружает HTML-страницы, затем выбирает некоторую информацию и записывает ее в другой файл. Я хочу извлечь информацию, которая находится между тегами абзаца, но я могу получить только одну строку абзаца. Мой код ...

3 ответа

Как я могу прочитать PDF в Python? [Дубликат]

На этот вопрос уже есть ответ: Как извлечь текст из файла PDF? [/questions/34837707/how-to-extract-text-from-a-pdf-file] 14 ответов Как я могу прочитать pdf на python? Я знаю один способ преобразования его в текст, но я хочу читать содержимое ...