Об этом сайте
Сайт позволяет искать информацию о метрических книг, исповедных ведомостях, ревизских сказках, хранящихся в Центральном государственном архиве г. Москвы (ЦГА Москвы).
Задуман сайт был для того, чтобы восполнить многочисленные недостатки, имеющиеся в поисковых системах государственных архивов. На примере одного архива я хочу показать, как можно сделать работу с записями об архивных делах более эффективной. Здесь нет каких-то дизайнерских изысков, зато этот сайт раскрывает пользователям все инструменты поиска, которые обычно недоступны на сайтах архивов. Кроме того, всё доступное пространство экрана используется для вывода полезной информации.
Один поисковый запрос на этом сайте во многих случаях может заменить десятки запросов на сайтах архива. Одна страница с результатами запроса здесь во многих случаях может содержать информации больше, чем десятки страниц выдачи на сайте архивов. Внешне простой, но очень эффективный и быстрый поиск. (Пока поиск, но есть еще и другие задумки.)
Язык запросов
- "*" – (звездочка) – равносильна любому количеству любых символов
- "?" – (знак вопроса) – равносилен одному любому символу
- "~" – (тильда) – равносильна одному любому символу, но при этом символа в этой позиции может не быть совсем. Если в поисковом запросе задать, например, десять таких тильд подряд, это будет равносильно любым символам в количестве от нуля до десяти.
- "@" – (собака) – равносильна одному любому слову произвольной длины, включая предлоги. При этом слова в этом месте может не быть совсем. Допускается указание нескольких "@".
- "|" – (разделитель) – равносилен логическому ИЛИ.
- " " – (кавычки) – всё, что внутри кавычек, искать по точному слову/фразе, не пытаясь заменять окончания и не использовать различные формы слов. Вместо обычных кавычек допускается использование фигурных кавычек « ».
- "$" – (доллар) – означает конец слова в произвольном месте текста. Допускается указание "~" перед "$"
- "^" – (крыша) – означает начало слова в произвольном месте текста. Допускается указание "~" после "^"
- 1, 2 – (номера) – В полях "фонд", "опись", "дело", "исключить фонды" и "исключить описи" допускается вводить одновременно несколько номеров через любой разделитель (пробел, запятая, точка с запятой + пробел итп).
Пример использования языка запросов:
- Максим*Варвар – Найдет "Максима Блаженного на Варварке" итп.
- Сте?ана – Найдет "Степана", "Стефана" итп.
- Петр~~~~Павл~~ – Найдет "ПетраПавлов", "Петра и Павла", "Петра-Павлов" итп.
- Москва@сорок – Найдет "Москва, Сретенский сорок", "Москва Никитский сорок", "Москва, Сорок ..." итп. Знаки препинания и цифры в исходном тексте игнорируются.
- Троицкая на Бережках|Старая Руза|Ново~Покровское – Означает поиск "Троицкая на Бережках" ИЛИ "Старая Руза" ИЛИ "Ново~Покровское"
- "Московский" – Если слово в кавычках, то найдет только "Московский". Если слово без кавычек, то кроме "Московский" найдет "Московская", "Московского", "Московские" итп.
- Можайск$ – Найдет слова, заканчивающиеся на "Можайск" – "Можайск", "Заможайск", но проигнорирует "Можайский" итп.
- ^город – Найдет слова, начинающиеся на "город" – "Город", "городу", "городка", "городской", но проигнорирует "Звенигород", "Богородский", "Новгородский" итп.
- ^глеб~$ – Найдет целое слово "Глеб" с необязательной одной дополнительной произвольной буквой в конце слова – "Глеба", но проигнорирует "Глебский", "Борисоглебский" итп.
- 204, 607 – При вводе в поле "Фонд №" выведет все записи из двух фондов №204, №607. В качестве разделителя номеров обычно удобнее использовать пробел.
Язык запросов с указанными спецсимволами поддерживается только в первых трех поисковых полях "Слова в описании". Все остальные поля, включая "Название фонда", "Название описи", Минус-слова" указанный язык запросов не поддерживают.
Обратите внимание, что при использовании звездочки (*) она может захватывать и выделять очень большую часть текста. Например, если одно слово расположено в начале текста, а второе ближе к концу, то будет выделен почти весь текст от первого слова до второго. Если вместо использования звездочки первое и второе слово ввести отдельно в разные поля поиска, то можно получить ту же выборку, но в описаниях будут подсвечены только ключевые слова.
О некоторых особенностях поиска
- Записи можно искать по одному ключевому слову или по нескольким словам. В случае поиска по нескольким словам, указывайте их в разных полях "Слова в описании дела".
- Поисковые слова желательно указывать без окончания. Так Вы получите больше результатов. (Например, поиск по слову "Дмитровск" найдет записи, содержащие "Дмитровский / Дмитровском / Дмитровского" итп.
- При вводе нескольких ключевых слов в разных полях осуществляется поиск записей, содержащих одновременно все введенные слова в любом месте текста описания единицы хранения (логическое "И").
- Если поисковые слова должны быть в описании друг за другом, то задайте поисковую фразу в одном поле. При этом в одном поле все слова поисковой фразы кроме последнего нужно писать полностью с окончаниями (например, "Звенигородский уезд") или с использованием языка запросов.
- Записи можно искать по точному указанию года, а также по определенному периоду. Период можно указывать, как ограниченный с двух сторон (1780 – 1800), так и с ограничением только с одной стороны ("до 1850", "после 1740").
- Можно искать по названию фондов или по названию описей. Например, если в поле "Название фонда" ввести "Москв", то отобразятся все дела из фондов "Москва, Никитский сорок", "Церкви города Москвы" итп.
- Можно отфильтровать записи по конкретному номеру фонда/описи/дела.
- Кроме основного блока с поисковыми полями есть блок, помогающий ещё точнее отфильтровать результаты, убрав лишнее. Для этого предназначены поля с "минус-словами". Например, при поиске по слову "Одинцово" выдаются результаты с "Одинцово" из Подольского и из Звенигородского уездов. Если задать минус слово "Подольск", то в результатах выборки останется только Одинцово из Звенигородского уезда.
- Также можно исключать дела по номеру фонда/описи/дела. Например, можно искать все дела определенного уезда, но при этом исключить тот фонд, который Вы уже хорошо исследовали.
- Отдельно можно фильтровать по "статусам" дела. Есть несколько статусов
- "Сканы онлайн" - это самое интересное. Означает, что дело выложено на сайте ЦГА Москвы (https://cgamos.ru/) и перейдя по ссылке в поисковой выдаче можно бесплатно ознакомиться с цифровыми копиями дел.
- "Дело оцифровано" - часто совпадает с отметкой на "Сканы онлайн", но далеко не всегда. Часть оцифрованных дел пока доступны только на компбютерах в читальном зале ЦГА Москвы.
- "Есть на пленке" - это означает, что копию дела на фотопленке можно посмотреть на специальных аппаратах в читальном зале архива.
- Регистр (верхний/нижний) - не имеет значения
- По умолчанию в результатах поиска выводятся только дела, доступные для онлайн-просмотра на сайте ЦГА Москвы. Это примерно 45% от имеющихся в поисковой базе записей. Вы можете отключить настройку "Сканы онлайн" в поисковой форме, чтобы найти дополнительные дела, которые хранятся в архиве.
Откуда данные?
Данные получаются с двух сайтов ЦГА Москвы. Основной сайт с оцифрованными копиями дел https://cgamos.ru и второй сайт - Научно-Справочный Аппарат ЦГА Москвы (НСА) https://nsa.cgamos.ru/ . Обновление данных происходит примерно раз в месяц.
После получения данных из разных источников, они объединяются, проводится программная обработка, которая позволяет исправить ошибки оформления, форматирования, разбиения на части итп. Информация о части дел есть только на одном из двух сайтов архива (иногда только в НСА, а иногда только на основном сайте). Кроме того, встречаются и дела с выложенными цифровыми изображениями, которые совсем не содержат текстовых заголовков с описанием. Для возможности поиска по таким делам был добавлен третий источник - это открытая таблица, в которую все желающие могут добавить свои данные. Ссылка на таблицу https://docs.google.com/spreadsheets/d/1Yu2TI8dq7... Если у Вас есть какие-то наработки по разбору дел, Вы также можете внести свой вклад в наполнение пользовательской таблицы.
Почему поиск на этом сайте ищет лучше, чем поиск на сайте архива и на других сайтах?
Кроме описанной выше возможности задавать поисковый запрос по множеству параметров, выделю еще несколько моментов.
- Текстовый поиск осуществляется сразу по двум источникам (по данным из НСА и по данным с основного сайта ЦГА Москвы), а также по дополнительным пользовательским записям. Если хоть в одном описании есть ключевое слово, то Вы обязательно увидите запись в результатах поиска.
- Здесь можно найти данные и по выложенным на сайт архива делам и по делам, пока не выложенным. (А на основном сайте архива есть информация только о выложенных делах. На сайте НСА есть информация о большинстве дел, включая не оцифрованные, но там нет ссылок для перехода на основной сайт архива для просмотра сканов).
- Язык запросов, который значительно расширяет возможности поиска.
- Интеллектуальный поиск по году. Например поиск по году "1876" найдет записи, у которых год был в оригинале указан "1875-1877", "1870, 1879, 1900", "2 января 1876г", "после 1875 г" итп. (На сайтах архивов в поле годы данные указываются без какой-то четкой структуры, а поиск по году обычно отсутствует или нормально не работает)
- Интеллектуальный поиск по периоду. Тоже, что и выше. Например поиск по периоду 1820-1840 найдет записи, в у которых оригинале год был указан "1830", "1815-1850", "1830-1845", "5 января 1835 ...1836" итп.
- Возможность сразу увидеть в результатах поиска подсвеченные поисковые слова в части фрагмента описания, а также возможность по клику сразу в таблице развернуть полное описание, длина которого иногда может быть более 10 тысяч символов.
- По каждому делу доступно отображение даты первого появляения сканов на сайте ЦГА Москвы. Также доступен поиск и фильтрация с учетом этих дат.
- Поиск доступен для пользователей, расположенных за пределами РФ. (В настоящее время государственные архивы разрешают доступ к своим сайтам только с российских IP-адресов).
- Поисковые запросы выполняются значительно быстрее, чем на сайтах архивов
- Более 300 дел в описании содержат дополнительные пользовательские примечания. Например, это могут быть номера начальных страниц для каждой церкви в большом деле. Такая информация в некоторых случаях может сильно облегчить нахождение в деле требуемого фрагмента.
- Расширенная статистика по составу фондов и описей.
Список сокращений:
- ФП - Фонд пользования (копия оригинала в каком-то виде)
- СФ - Страховой фонд (копия на пленке)
- ЭФП - Электронный Фонд Пользования (дело отсканировано и доступно на компьютере в читальном зале, а некоторые дела доступны и на сайте в разделе "Моя семья")
- ОЦ - Особая ценность
- УД - Уникальные документы
Обратная связь
Для связи с автором сайта можно воспользоваться формой обратной связи.
Также можно написать пользователю "xbox" на генеалогическом форуме:
https://forum.vgd.ru/462/129726/0.htm
https://forum.vgd.ru/462/139318/0.htm