Как получить службу индексирования и MODI для создания полнотекстового текста через OCR?

Я настроил службу индексирования для индексирования моих файлов, которые также включают в себя отсканированные изображения, сохраненные в виде файлов TIFF высокого разрешения. Я также установил MS Office 2003+ и правильно сконфигурировал MS Office Document Imaging (MODI), чтобы я мог выполнять оптическое распознавание изображений и даже вставлять текст распознавания в TIFF.

Служба индексирования может индексировать и находить те TIFF-файлы, которые были вручную распознаны и повторно сохранены с текстовыми данными (с использованием средства визуализации документов MS).

Оказывается, Data Execution Prevention (DEP), развернутая с Windows XP SP2, считает, что MODI является вредоносным и отказывается позволить ему творить чудеса. Мне удалось заставить его работать, полностью отключив DEP, но я нашел это решение не элегантным.

Есть ли лучшее решение, чтобы сделать это без отключения DEP?

5.08.2008 23:16:30
Я попробовал то же самое и столкнулся с некоторыми из тех же ограничений. Также я обнаружил, что MODI слишком медленный для индексации большого количества изображений.
Leon Bambrick 6.08.2008 01:48:15
Есть исправление, которое, кажется, решает эту проблему.
Greg Hurlman 6.08.2008 20:10:11
Я не знаю вашу среду, но вместо того, чтобы полагаться на какую-то смешанную магию, которая может сломаться во многих суставах, почему бы не пойти на что-то вроде маленького приложения, использующего tesseract ocr + lucene?
Tuncay Göncüoğlu 17.03.2017 11:07:31
@ TuncayGöncüoğlu: Да, я давно перешел из Моди и Службы индексирования. Я держу этот очень старый вопрос только для исторических целей.
Ishmaeel 17.03.2017 15:25:55
1 ОТВЕТ

Отключить DEP для конкретных приложений.

Как отключить DEP для определенных приложений

  1. Нажмите кнопку «Пуск» на компьютере Windows и выберите «Компьютер»> «Свойства системы»> «Дополнительные параметры системы».
  2. В диалоговом окне «Свойства системы» выберите «Настройки».
  3. Выберите вкладку «Предотвращение выполнения данных».
  4. Выберите «Включить DEP» для всех программ и служб, кроме выбранных.

Нажмите «Добавить» и используйте функцию обзора, чтобы найти исполняемый файл программы, который вы хотите исключить, например, Excel.exe или Word.exe.

В зависимости от вашей версии Windows вам может потребоваться открыть диалоговое окно «Свойства системы», щелкнув правой кнопкой мыши «Этот компьютер» или «Компьютер» в проводнике Windows.

  1. В проводнике Windows щелкните правой кнопкой мыши и выберите «Свойства»> «Дополнительные параметры системы»> «Свойства системы».
  2. Выберите «Дополнит.»> «Производительность»> «Предотвращение выполнения данных».
  3. Выберите «Включить DEP» для всех программ и служб, кроме выбранных.
  4. Нажмите «Добавить» и используйте функцию обзора, чтобы найти исполняемый файл программы, который вы хотите исключить.

Исключить:

C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPOCRDC.EXE  
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPSCAN.EXE  
C:\Program Files\Common Files\Microsoft Shared\MODI\11.0\MSPVIEW.EXE

Дополнительная информация не является частью ответа:

Чтобы получить и установить MODI в новейших версиях Windows, см.
« Microsoft Office Document Imaging - Office 2010 в Office 2016 ».

Ссылки:

« Исключить программы из DEP (предотвращение выполнения данных) »

« Ошибка сканирования документов Microsoft Office »

MODI является частью (бесплатного) « Microsoft SharePoint Designer 2007 ».

1
7.09.2018 09:38:28
Спасибо, что нашли время для компиляции этих инструкций. Я помню, что не мог определить, что именно исключить из DEP, тогда. Я не хочу принимать ответ, поскольку у меня больше нет способа проверить решение, но я проголосовал за него.
Ishmaeel 8.09.2018 18:09:57
Спасибо. Возможно, если он получит дюжину голосов, это правильно. Ссылки говорят, что это работает для нескольких человек. Моей целью было очистить очередь вопросов без ответа.
Rob 8.09.2018 18:37:51