Код: KAFKA Специализация: Авторские курсы: СУБД и хранилища данных
Продолжительность - 3 дня
Расписание:
12 февраля 2025 года (Москва)
14 апреля 2025 года (Москва)
Стоимость:
72 000 руб.
Курс «Администрирование кластера Kafka» 3-х дневный практический курс по установке, настройке и администрированию кластера Apache Kafka/Confluent, распределенной потоковой обработке событий (Event Stream Processing), конфигурации безопасности Kerberos, интеграции с Apache NiFi, GreenPlum.
Apache Kafka — это брокер сообщений (Enterprise bus) в виде распределённой, горизонтально масштабируемой системы обработки сообщений. Kafka используется для централизованного сбора, передачи и непрерывной потоковой обработки большого количества сообщений из различных источников: микросервисы, распределенные приложения, устройства интернета вещей, веб-сайты, соцсети, корпоративные информационные системы и т.д.
Основными достоинствами Кафка считаются следующие:
горизонтальная масштабируемость,
распределенность,
долговечность,
надежность,
интегрируемость с другими Big Data технологиями (NiFi, Spark, Flume, Hadoop),
высокая производительность (чтение и запись более 1 миллиона событий в секунду),
отказоустойчивость;
безопасность.
Apache Kafka устроена так, что сообщения записываются в разделы топика Кафка и хранятся в течении заданного периода. Приложения-подписчики сами опрашивают Kafka на предмет наличия новых сообщений, и указывают, какие записи им нужно прочесть, увеличивая или уменьшая смещение к нужной записи. Записанные события могут переигрываться или обрабатываться повторно. Кафка обеспечивает различные стратегии доставки сообщений: строго однократная, как максимум однократная, периодическая, поочередная.
Сохранность сообщений обеспечивается архитектурой master-slave (ведущий-ведомый), механизмом реплицирования и синхронизацией реплик. Потеря сообщений возможна только в случае сбоя ведущего узла и отсутствия участвующих в синхронизации реплик. Но даже в этом случае есть возможность восстановить смещение необработанного сообщения. Kafka использует ZooKeeper для хранения метаданных о разделах своих топиков и брокерах, а также для выбора брокера в качестве контроллера Кафка. Так обеспечивается надежная согласованность состояния кластера, его конфигурации и обнаружения одноранговых узлов.
На практике Apache Кафка широко применяется в следующих задачах:
интерактивный обмен данными между распределенными приложениями и микросервисами;
считывание информации из распределенных файловых систем (HDFS, Amazon S3);
организация конвейеров обработки данных (data pipeline);
прием технологической информации из интеллектуальных устройств Internet of Things (IoT), в т.ч. промышленного интернета вещей (Industrial IoT, IIoT);
обработка событий из журналов корпоративных информационных систем;
анализ логов пользовательского поведения на сайтах и в соцсетях.
Apache Kafka активно используется во множестве отечественных и зарубежных Big Data проектов, от высоконагруженных веб-платформ обработки больших данных до корпоративных систем управления промышленным производством. Специалисты по Kafka (инженеры данных, администраторы кластера, разработчики Data Flow) востребованы в различных отраслях деятельности: банковский сектор, медицина, промышленные предприятия, страхование, автомобильное производство и т.д
Курс «Администрирование кластера Kafka» ориентирован на системных администраторов, разработчиков Big Data систем и DevOps-инженеров, которые хотят получить следующие знания и навыки:
понять, что такое Apache Kafka;
научиться устанавливать, настраивать и поддерживать кластера Кафка и Zookeeper;
освоить методы администрирования кластера Kafka (Confluent);
изучить настройки безопасности для Apache Kafka с использованием SSL, SASL, Kerberos;
настраивать мониторинг и оптимизацию очереди сообщений Kafka с использованием практических примеров реализации;
интегрировать Apache Кафка с другими Big Data фреймворками (Hadoop, Spark, NiFi, Flume) и внешними системами.
Предварительный уровень подготовки:
Уверенное знание базовых команд Linux (опыт работы с командной строкой, файловой системой , POSIX, текстовыми редакторами vi, nano)
Базовые знания настройки компонент безопасности (Kerberos, PKI, LDAP)
Курс «Администрирование кластера Kafka» 3-хдневный практический курс по установке и настройке кластера Apache Kafka, распределенной потоковой обработке событий (Event Stream Processing), конфигурации безопасности Kerberos, интеграции с Apache NiFi, Spark, Flume, Zookeeper.
Вы изучите необходимый теоретический минимум, чтобы понять основные концепции этого брокера сообщений и узнаете некоторые особенности управления кластером Кафка. Преподаватель курса администрирования Apache Kafka подробно объяснит все тонкости установки, конфигурирования, мониторинга и прикладного использования этой Big Data системы, чтобы вы могли самостоятельно работать с ней в реальности.
На практике вы развернете собственный кластер Apache Kafka, настроив его конфигурацию, средства обеспечения информационной безопасности (cybersecurity) и инструменты мониторинга.
Аудитория Специалисты желающие изучить методы администрирования и настройки кластера Apache Kafka; настройку безопасности Kafka с SSL и Kerberos; примеры интеграции; мониторинг и оптимизацию кластера Apache Kafka с использованием практических примеров.
Соотношение теории к практике 40/60
Предварительная подготовка
Уверенное знание базовых команд Linux (опыт работы с командной строкой, файловой системой, POSIX, текстовыми редакторами vi, nano)
Программа курса
Введение в Kafka
Что такое Apache Kafka?
Сценарии использования Kafka
Компоненты Kafka и Kafka экосистемы
Архитектура Kafka
Кластер Zookeeper ( Установка кластера Kafka без использования Zookeeper KIP-500)
Основные концепции Kafka
Как работает Kafka: Топики (Topics) и партиций (Partitions). Репликация данных.
Поставщики данных (Producers): Типы партиций. Синхронные и асинхронные Producers.
Потребители данных (Consumers): Очереди Consumers.
Установка кластера Apache Kafka
Требования по установке кластера Kafka
Установка и настройка кластера Zookeeper: Настройка кворума. Конфигурация сервисов и файловой системы. Оптимизация и отказоустойчивость Zookeeper. Установка кластера Kafka без использования Zookeeper KIP-500
Установка и настройка кластера Kafka: Планирование установки и sizing кластера Kafka.
Типовые проблемы при установке. Запуск и первоначальное конфигурирование Kafka.
Балансировка разделов(partition) и использование Partition Reassignment Tools
Best Practices Kafka/Confluent
Мониторинг кластера Kafka
Настройка мониторинга кластера Kafka с использованием Prometheus + Grafana
Интеграция с Apache Kafka (обзорно)
Использование Apache NiFi
Интеграция Apache Flume с Kafka
Сценарии интеграции с Apache Kafka
Расширенная конфигурация кластера Kafka
Расширенная конфигурация топиков (Topic): Изменение конфигурации топиков.
Sizing (количество партиций и фактор репликации). Сегменты и индексы. Политика очистки логов (Log Cleanup Policy). Сжатие и консолидация данных в логах.
Репликация кластера с использованием Mirror Maker 2
Безопасность в Kafka
Шифрование SSL: Установка центра сертификатов (CA), настройка SSL/TLS для Kafka кластера и клиентов
Аутентификация SSL/SASL
Аутентификация Kerberos: Настройка Kerberos. Keytabs и principals. Настройка кластера Kafka и клиентов для поддержки Kerberos
Авторизация в Kafka
Управление списками управления доступом (ACL)
Программа читается совместно с Школа Больших Данных.
В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения
В современном мире сложно обойтись без информационных технологий и их производных - компьютеров, мобильных телефонов, интернета и т.д., особенно в крупных компаниях и государственных организациях, работающих с большим количеством людей, а не только с парой VIP-клиентов, как это может быть в случае небольшой компании. А там, где есть большое количество контрагентов, заявителей и т.д. - не обойтись без баз данных, необходимых для обработки информации. Естественно, что времена гроссбухов и карточек, памятных многим по библиотекам, давно прошли, сегодня используются персональные компьютеры и электронные базы данных.
Сегодня невозможно представить работу крупнейших компаний, банков или государственных организаций без использования баз данных и средств Business Intelligence. Базы данных позволяют нам хранить и получать доступ к большим объемам информации, а система управления базами данных (СУБД) — осуществлять менеджмент доступных хранилищ информации.
В Учебном центре « Интерфейс» Вы научитесь эффективно использовать системы управления базами данных: быстро находить нужную информацию, ориентироваться в схеме базы данных, создавать запросы, осуществлять разработку и создание баз данных.
Обучение позволит Вам не только получить знания и навыки, но и подтвердить их, сдав соответствующие экзамены на статус сертифицированного специалиста . Опытные специалисты по СУБД Microsoft SQL Server или Oracle могут быть заинтересованы в изучении систем бизнес-аналитики. Это задачи достаточно сложные, использующие громоздкий математический аппарат, но они позволяют не только анализировать происходящие процессы, но и делать прогнозы на будущее, что востребовано крупными компаниями. Именно поэтому специалисты по бизнес-аналитике востребованы на рынке, а уровень оплаты их труда весьма и весьма достойный, хотя и квалифицированным специалистам по базам данных, администраторам и разработчикам, жаловаться на низкий уровень дохода тоже не приходится. Приходите к нам на курсы и получайте востребованную и высокооплачиваемую профессию. Мы ждем Вас!
В конце обучения на курсах проводится итоговая аттестация в виде теста или путём выставления оценки преподавателем за весь курс обучения на основании оценок, полученных обучающимся при проверке усвоения изучаемого материала на основании оценок за практические работы, выполненные в процессе обучения.
Учебный центр "Интерфейс" оказывает консалтинговые услуги по построению моделей бизнес-процессов, проектированию информационных систем, разработке структуры баз данных и т.д.
Нужна помощь в поиске курса? Наша цель заключается в обеспечении подготовки специалистов, когда и где им это необходимо. Возможна корректировка программ курсов по желанию заказчиков! Мы расскажем Вам о том, что интересует именно Вас, а не только о том, что жестко зафиксировано в программе курса. Если вам нужен курс, который вы не видите на графике или у нас на сайте, или если Вы хотите пройти курс в другое время и в другом месте, пожалуйста, сообщите нам, по адресу mail@interface.ru или shopadmin@itshop.ru
Поговорите со своим личным тренинг-менеджером! Мы предоставляет Вам индивидуальное обслуживание. Если у вас есть потребность обсудить, все вопросы касательно обучения, свяжитесь, пожалуйста c нами по телефонам: +7 (495) 925-0049, + 7 (495) 229-0436. Или любым другим удобным для Вас средствами связи, которые Вы можете найти на сайтах www.interface.ru или www.itshop.ru
Подтвердить полученные знания можно, сдав сертификационные экзамены. Учебный центр "Интерфейс" является авторизованным центром тестирования Pearson VUE
Учебный центр "Интерфейс" оказывает консалтинговые услуги по построению моделей бизнес-процессов, проектированию информационных систем, разработке структуры баз данных и т.д.
Возможна корректировка программ курсов по желанию заказчиков! Мы расскажем Вам о том, что интересует именно Вас, а не только о том, что жестко зафиксировано в программе курса.
Где Вам удобнее учиться? В Москве? Санкт-Петербурге? Подмосковье? В вашем собственном офисе? Позвоните нам по тел.:+7 (495) 925-0049 и мы обсудим удобный для Вас вариант обучения.