Обслуживание системы: различия между версиями
(не показано 18 промежуточных версий этого же участника) | |||
Строка 28: | Строка 28: | ||
Примечание 2: при определении периодичности создания резервных копий важно учитывать интервалы очистки журналов и индикаторов. Проверка и запуск автоматической процедуры очистки журналов и файлов происходит ежедневно в 3:00 AM. | Примечание 2: при определении периодичности создания резервных копий важно учитывать интервалы очистки журналов и индикаторов. Проверка и запуск автоматической процедуры очистки журналов и файлов происходит ежедневно в 3:00 AM. | ||
− | [[File:Defaultsett.PNG | | + | [[File:Defaultsett.PNG | 700px]] |
Определите место хранение медиа-файлов, используемых модулем «Технологии» (если таковые имеются). | Определите место хранение медиа-файлов, используемых модулем «Технологии» (если таковые имеются). | ||
Строка 70: | Строка 70: | ||
==Самостоятельная диагностика неполадок== | ==Самостоятельная диагностика неполадок== | ||
+ | |||
+ | В данном разделе описаны самые распространенные причины сбоев в работе системы, зарегистрированные у наших заказчиков, связанные с внешними факторами (сеть, антивирус, права доступа, производительность сервера и прочее) и не имеющие отношения к системным ошибкам и логике работы системы. | ||
+ | |||
+ | <b>Возможные проявления: | ||
+ | *не доступен Host (сайт) | ||
+ | *не поступают данные с оборудования: | ||
+ | ** со всего оборудования | ||
+ | ** части оборудования | ||
+ | *не доступен один или несколько микросервисов | ||
+ | * система "зависает" (загрузка занимает ощутимо больше времени чем обычно, простые формы без аналитики загружаются несколько секунд) | ||
+ | </b> | ||
+ | |||
+ | <b>1. Первое что нужно проверить - запущена ли служба компонента.</b> | ||
+ | |||
+ | На сервере, на котором установлен соответствующий компонент: Диспетчер задач -> Службы -> Открыть службы | ||
+ | |||
+ | Удостоверьтесь, что служба запущена и выполняется. | ||
+ | |||
+ | [[File:Services.PNG | 1000px]] | ||
+ | |||
+ | В случае, если служба не запущена - попробуйте ее запустить. Важно чтобы пользователь от имени которого происходит запуск не утратил соответствующие права. | ||
+ | |||
+ | <b>Пример</b>: на предприятии запуск был службы настроен не от имени Системы (настройка по умолчанию), а от имени уполномоченного пользователя, в ходе эксплуатации системы, в соответствии с политикой безопасности истек срок действия пароля, после перезапуска сервера служба не смогла стартовать. | ||
+ | |||
+ | <b>Неконтролируемые периодические остановки службы</b> могут быть вызваны работой антивируса или недостаточностью ресурсов сервера. | ||
+ | |||
+ | <b>Пример</b>: Раз в сутки в 3:59 PM происходила остановка службы, выяснилось, что в это время работает ПО, которое завершает все процессы, не внесенные в белый список. | ||
+ | |||
+ | На сервере, на котором установлен соответствующий компонент: Диспетчер задач -> Производительность -> Мониторинг ресурсов | ||
+ | |||
+ | <b>Оцените на сколько загружен процессор и диск</b> и какие службы получают большую долю ресурсов, возможно службам компонентов DPA не хватает ресурсов для запуска. | ||
+ | |||
+ | <b>Пример</b>: в ходе диагностики обнаружилось, что SQL сервер после перезагрузки сервера потреблял ~100% ОЗУ и не позволял стартовать другим службам, после настройки ограничений на потребление ОЗУ для SQL проблема решилась. Такая проблема, как правило, характерна для низкопроизводительных серверов, выделенных на тестовый период, особенно в случаях когда к системе мониторинга подключено много высокопроизводительного оборудования. | ||
+ | |||
+ | <b>2. Убедитесь, что лицензия активна </b> | ||
+ | |||
+ | Это актуально для случаев, когда в систему "перестали поступать данные" и "станки зависли в одном состоянии". | ||
+ | |||
+ | Меню настройки [[File:Settings.png | 20px]] -> Мониторинг, выберите соответствующий DPA сервер (их может быть несколько) и перейдите в ветку "Лицензия" | ||
+ | Ниже приведен пример активной лицензии | ||
+ | |||
+ | [[File:LicenseView.png | 700px]] | ||
+ | |||
+ | В случае если лицензия не активна: | ||
+ | * У вас кончилась демо-лицензия и нужно запросить продление или купить коммерческую лицензию | ||
+ | * У вас сменился HID машины DPA сервера | ||
+ | |||
+ | HID - это уникальный ключ, базирующийся на физической конфигурации машины, в случае если производилась модернизация сервера (например, замена сетевой карты) или сервер развернут на виртуальной машине и, как следствие, имеет динамические MAC-адреса HID мог измениться, сделав лицензию не действительной. | ||
+ | Подробнее про проблемы и ограничения лицензий вы можете прочитать https://help2.rundpa.com/wiki/%D0%A2%D0%B8%D0%BF%D1%8B_%D0%BB%D0%B8%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D0%B9 | ||
+ | |||
+ | <b>3. Убедитесь, что не изменились IP-адреса серверов</b> | ||
+ | |||
+ | В данной настройке указано "по какому адресу DPA сервер должен отправлять пакеты" | ||
+ | |||
+ | Проверьте что, все ip-адреса и порты пингуются в соответствующих направлениях. | ||
+ | |||
+ | <b>4.Проверьте размер базы данных и наличие свободного места на диске сервера, на котором установлена система/организованно хранение индикаторов </b> | ||
+ | |||
+ | <b>Пример</b>: при обновлении системы на предприятии не удалось обновить микросервис, в ходе диагностики выяснилось, что размер базы превысил лимит, установленный для SQL Express - этот момент совпал с обновлением | ||
+ | |||
==Техподдержка== | ==Техподдержка== | ||
+ | |||
+ | При обращении в техподдержку важно указать: | ||
+ | *Версию компонентов | ||
+ | *Описание проблемы в формате: | ||
+ | ** В каком модуле/микросервисе была зарегистрирована ошибка (желательно приложить запись или снимок экрана) | ||
+ | ** От имени какого пользователя был выполнен вход | ||
+ | ** Была ли проблема разовой или регистрируется постоянно | ||
+ | ** Пошаговое описание действий, приведших к сбою/ошибке | ||
+ | ** Если ошибка связана с данными (логика определения состояния, результаты вычислений) опишите ожидаемый результат | ||
+ | *Критичность проблемы по вашей оценке с кратким пояснением |
Текущая версия на 03:45, 7 декабря 2021
Содержание
Создание резервных копий
Полная копия DPA включает в себя следующие компоненты:
- Резервная копия базы данных Host
- Резервные копия баз данных KPI, UserActionLog, Mesenger (если компоненты используются)
- Установочный файл соответствующей версии DPA
- Архив индикаторов
- Архив медиафайлов
Перед началом резервного копирования: Определите номер установленной версии и директивы хранения файлов, для этого перейдите: Меню настройки -> Мониторинг , выберите DPA Host (ваш экземпляр может называться иначе) и в правой части экрана вы увидите установленную версию.
Для того чтобы воспользоваться резервной копией, вам потребуется установочный файл этой версии DPA Определите место хранение индикаторов. По умолчанию индикаторы хранятся в файловой системе и поэтому не будут включены в резервную копию. Директорию хранения вы можете посмотреть: Меню настройки -> Настройки системы -> Хранение данных
Файлы из директории, указанной в пункте «Лог индикаторов» необходимо хранить и архивировать вручную или настроить архивирование по расписанию с помощью стороннего ПО (например, Windows Планировщик заданий и WinRAR https://winrar-fansite.com/instructions/kak-nastroit-avtomaticheskoe-arhivirovanie-fajlov-cherez-winrar.html)
Примечание 1: при создании/редактировании индикаторов настройки хранения могли быть изменены на базу данных (пример приведен на рисунке ниже), такая настройка не является рекомендуемой, но в этом случае копировать файлы индикаторов отдельно – не нужно.
Примечание 2: при определении периодичности создания резервных копий важно учитывать интервалы очистки журналов и индикаторов. Проверка и запуск автоматической процедуры очистки журналов и файлов происходит ежедневно в 3:00 AM.
Определите место хранение медиа-файлов, используемых модулем «Технологии» (если таковые имеются).
Для резервного копирования БД (Host и KPI, UserActionLog, Mesenger) предлагается воспользоваться SQL Server Management Studio:
- После подключения к соответствующему экземпляру в обозревателе объектов выберите требуемую базу данных, щелкните правой кнопкой мыши на базу данных, выберите Задачи и выберите команду Создать резервную копию...
- В диалоговом окне Резервное копирование базы данных выбранная база данных приводится в раскрывающемся списке (ее можно изменить на любую другую базу данных на сервере).
- В раскрывающемся списке Тип архивной копии выберите нужный вариант (по умолчанию выбран тип Полная).
- В разделе Компонент резервного копирования выберите База данных.
- В разделе Назначение проверьте расположение по умолчанию для файла резервной копии
- Чтобы начать резервное копирование, нажмите кнопку OK.
После успешного завершения резервного копирования щелкните ОК, чтобы закрыть диалоговое окно SQL Server Management Studio.
Развертывание резервных копий
Для развертывания DPA на архивных данных необходимо:
- Подготовить отдельный ПК/сервер, отвечающий системным требованиям системы:
- ОЗУ: 1000 Гб
- SQL 2016 Standard+, 64 bit
- Windows Server 2016+, Standart+, 64 bit
- Разархивировать файлов индикаторов и медиафайлов в директориях (стандартных см. Рисунок 2 или пользовательских)
- Развернуть резервную копию базы данных
- После подключения к соответствующему экземпляру в обозревателе объектов создайте базу данных с именем идентичным имени резервируемой базы
- Выберите созданную базу данных, щелкните правой кнопкой мыши на базу данных, выберите Задачи и выберите команду Восстановить/База данных
- В диалоговом окне Восстановление базы данных выбранная база данных приводится в раскрывающемся списке (ее можно изменить на любую другую базу данных на сервере).
- Выберите опцию «Устройство» в разделе «Источник», в раскрывшемся диалоговом окне нажмите кнопку добавить и выберите файл искомой резервной копии
- Чтобы начать восстановление, нажмите кнопку OK.
- После успешного завершения щелкните ОК, чтобы закрыть диалоговое окно SQL Server Management Studio.
Финальный шаг - Установить DPA на подготовленный ПК в соответствии с инструкцией по установке, на шагах «DPA Host» (а так же «DPA KPI», «DPA UserActionLog», «DPA Mesenger», если требуется) выберите существующую восстановленную базу.
Самостоятельная диагностика неполадок
В данном разделе описаны самые распространенные причины сбоев в работе системы, зарегистрированные у наших заказчиков, связанные с внешними факторами (сеть, антивирус, права доступа, производительность сервера и прочее) и не имеющие отношения к системным ошибкам и логике работы системы.
Возможные проявления:
- не доступен Host (сайт)
- не поступают данные с оборудования:
- со всего оборудования
- части оборудования
- не доступен один или несколько микросервисов
- система "зависает" (загрузка занимает ощутимо больше времени чем обычно, простые формы без аналитики загружаются несколько секунд)
1. Первое что нужно проверить - запущена ли служба компонента.
На сервере, на котором установлен соответствующий компонент: Диспетчер задач -> Службы -> Открыть службы
Удостоверьтесь, что служба запущена и выполняется.
В случае, если служба не запущена - попробуйте ее запустить. Важно чтобы пользователь от имени которого происходит запуск не утратил соответствующие права.
Пример: на предприятии запуск был службы настроен не от имени Системы (настройка по умолчанию), а от имени уполномоченного пользователя, в ходе эксплуатации системы, в соответствии с политикой безопасности истек срок действия пароля, после перезапуска сервера служба не смогла стартовать.
Неконтролируемые периодические остановки службы могут быть вызваны работой антивируса или недостаточностью ресурсов сервера.
Пример: Раз в сутки в 3:59 PM происходила остановка службы, выяснилось, что в это время работает ПО, которое завершает все процессы, не внесенные в белый список.
На сервере, на котором установлен соответствующий компонент: Диспетчер задач -> Производительность -> Мониторинг ресурсов
Оцените на сколько загружен процессор и диск и какие службы получают большую долю ресурсов, возможно службам компонентов DPA не хватает ресурсов для запуска.
Пример: в ходе диагностики обнаружилось, что SQL сервер после перезагрузки сервера потреблял ~100% ОЗУ и не позволял стартовать другим службам, после настройки ограничений на потребление ОЗУ для SQL проблема решилась. Такая проблема, как правило, характерна для низкопроизводительных серверов, выделенных на тестовый период, особенно в случаях когда к системе мониторинга подключено много высокопроизводительного оборудования.
2. Убедитесь, что лицензия активна
Это актуально для случаев, когда в систему "перестали поступать данные" и "станки зависли в одном состоянии".
Меню настройки -> Мониторинг, выберите соответствующий DPA сервер (их может быть несколько) и перейдите в ветку "Лицензия" Ниже приведен пример активной лицензии
В случае если лицензия не активна:
- У вас кончилась демо-лицензия и нужно запросить продление или купить коммерческую лицензию
- У вас сменился HID машины DPA сервера
HID - это уникальный ключ, базирующийся на физической конфигурации машины, в случае если производилась модернизация сервера (например, замена сетевой карты) или сервер развернут на виртуальной машине и, как следствие, имеет динамические MAC-адреса HID мог измениться, сделав лицензию не действительной. Подробнее про проблемы и ограничения лицензий вы можете прочитать https://help2.rundpa.com/wiki/%D0%A2%D0%B8%D0%BF%D1%8B_%D0%BB%D0%B8%D1%86%D0%B5%D0%BD%D0%B7%D0%B8%D0%B9
3. Убедитесь, что не изменились IP-адреса серверов
В данной настройке указано "по какому адресу DPA сервер должен отправлять пакеты"
Проверьте что, все ip-адреса и порты пингуются в соответствующих направлениях.
4.Проверьте размер базы данных и наличие свободного места на диске сервера, на котором установлена система/организованно хранение индикаторов
Пример: при обновлении системы на предприятии не удалось обновить микросервис, в ходе диагностики выяснилось, что размер базы превысил лимит, установленный для SQL Express - этот момент совпал с обновлением
Техподдержка
При обращении в техподдержку важно указать:
- Версию компонентов
- Описание проблемы в формате:
- В каком модуле/микросервисе была зарегистрирована ошибка (желательно приложить запись или снимок экрана)
- От имени какого пользователя был выполнен вход
- Была ли проблема разовой или регистрируется постоянно
- Пошаговое описание действий, приведших к сбою/ошибке
- Если ошибка связана с данными (логика определения состояния, результаты вычислений) опишите ожидаемый результат
- Критичность проблемы по вашей оценке с кратким пояснением