Технические аспекты управления рисками в IT-проектах и инфраструктуре
Лекция 8
2025
IT-риски — потенциальные события или условия, которые могут негативно повлиять на IT-системы, данные или процессы
Отказы ПО/оборудования, багги в коде, архитектурные проблемы
Утечки данных, нарушение целостности, доступности
Сбои процессов, человеческий фактор, конфигурации
Превышение сроков/бюджета, изменение требований
Выявление потенциальных рисков
Качественная и количественная оценка
Приоритизация по критичности
Выбор стратегии митигации
Контроль и обновление
Циклический процесс, требующий постоянного внимания
💡 Используйте исторические данные и отраслевые бенчмарки для точной оценки
Приоритизация рисков по вероятности и воздействию:
Изменение архитектуры, отказ от рискованных технологий
Резервирование, мониторинг, автоматизация
Страхование, cloud-провайдеры, аутсорсинг
Планы восстановления, резервные фонды
Выбор стратегии зависит от критичности системы и доступных ресурсов
Трекинг рисков, интеграция с проектами
Российский аналог: YouGile (планирование задач)
Анализ логов, выявление аномалий
Российский аналог: Логика (лог-анализ)
Мониторинг метрик, дашборды
Российский аналог: АстроСофт Мониторинг
Корпоративное управление рисками
Российский аналог: Галактика ERP
Cloud security posture management
Российский аналог: Ростелеком Cloud
Vulnerability assessment
Российский аналог: Доктор Веб Сканер уязвимостей
💡 Автоматизация критична: ручной мониторинг не масштабируется
Компания внедряла CI/CD pipeline для микросервисной архитектуры
Результат: снижение incident rate на 75%, MTTR с 4 часов до 15 минут
Миграция legacy ERP системы в AWS
Результат: миграция выполнена за weekend с downtime 2 часа вместо планируемых 12
Обеспечение безопасности публичного REST API для финтех приложения
Результат: zero security incidents за год, 99.9% API availability
Security requirements, threat modeling
Architecture review, risk assessment
Secure coding, code review
Security testing, penetration testing
Security hardening, monitoring setup
Внедрение security практик на ранних стадиях разработки снижает стоимость исправления на 100x
Изоляция рисков, независимое масштабирование
Российский стек: T1Market, Сбербанк Технологии
Асинхронность, отказоустойчивость
Предотвращение каскадных сбоев
Изоляция критических компонентов
Distributed transaction management
💡 Архитектурные решения должны закладывать отказоустойчивость на уровне дизайна
Время доступности системы
Среднее время восстановления
Recovery Time Objective
Recovery Point Objective
Проведите риск-ассессмент текущих проектов
Внедрите систему мониторинга и алертинга
Автоматизируйте security и compliance проверки
Обучите команду методологиям риск-менеджмента
Вопросы и обсуждение