Электронная библиотека. 3 серия. Поиск в нескольких PDF.
Продолжаем серию обучающих мини-видеоуроков по работе с цифровыми библиотеками.
В третьей серии мы рассказываем, про поиск в PDF-документах на примере сохраненной из облака: библиотеки тайн крови и костного мозга.
Для быстрого поиска по содержимому множества PDF-файлов можно использовать индексацию. Индексация позволяет заранее обработать содержимое документов и создать структуру, которая ускоряет поиск.
Поиск через специализированные программы
Adobe Acrobat (Pro версия):
Позволяет индексировать и искать по содержимому сразу во многих PDF-файлах.
Индексация создаёт специальный файл каталога, ускоряющий поиск.
Вот краткая и упрощённая инструкция с нумерацией шагов без разделения на абзацы:
1. Переместите все PDF-файлы в одну папку.
2. Запустите Adobe Acrobat Pro.
3. Перейдите в Инструменты → Каталог (Catalog).
4. Нажмите Создать (New Index).
5. Укажите папку с вашими PDF-файлами.
6. Выберите место для сохранения файла индекса (.pdx).
7. Нажмите OK и затем Build, чтобы начать индексацию.
8. После завершения откройте Edit → Advanced Search (Расширенный поиск).
9. Выберите Search in Index (Искать в индексе).
10. Загрузите созданный файл .pdx и выполните поиск по запросу.
Если нужно будет обновить индекс, повторите шаги 3-7.
цифровая библиотека