Тессеракт - неоднозначность в пространстве и табуляция
У меня был файл TIFF, который содержит текст, разделенный табуляцией (4 пробела). Но когда я извлекаю текст из этого файла изображений, я всегда получаю один пробел между двумя столбцами. Пример примера:
TIFF IMAGE:
col-a col-b col-c
desired output:
col-a col-b col-c
but I am getting the following:
col-a col-b col-c
Я пробовал это с несколькими изображениями одного формата, но результат всегда одинаков. Как я могу исправить эту проблему? Могу ли я тренировать тессеракт, чтобы понять это?