Batch обработка с Apache Spark

Лектор: Егор Пахомов

Егор — Spark сontributor. Занимался интеграцией Spark в Яндекс Островах и Yandex Data Factory. Работает в AlpineNow, компания занимающаяся разработкой BI инструмента для Apache Spark.

Аннотация: На лекции рассматривается технология для batch и streaming обработки больших данных Apache Spark. Существует ряд проблем, с которыми инженеры сталкиваются, работая с большими данными: нехватки объёма диска одной машины для хранения данных, сложность разработки параллельных алгоритмов, etc. На протяжении долгого времени стандартом в индустрии для решения этих проблем являлся Hadoop, но ряд архитектурных недостатков этого фреймворка не позволяет ему справляться с новыми вызовами больших данных: machine learning, streaming, интерактивная работа с данными. Spark предложил новую вычислительную модель — RDD, в которой это всё стало возможно. Рассматриваются основные принципы этой модели и примеры кода. Важной частью любого big data framework является инфраструктура вокруг него. Обзорно рассматриваются основные библиотеки, написанные в рамках RDD: GraphX для графовой обработки данных, MLLib для machine learning, Spark Streaming для стриминга, SparkSQL, а также виды деплоинга spark кластера и тулы, облегчающие работу дата аналитиков.

( ! ) Warning: Invalid argument supplied for foreach() in /home/domains/malitikov.ru/public_html/wp-content/themes/malitikov/single.php on line 44
Call Stack
#	Time	Memory	Function	Location
1	0.0000	350072	{main}( )	.../index.php:0
2	0.0000	350352	require( '/home/domains/malitikov.ru/public_html/wp-blog-header.php )	.../index.php:17
3	0.1635	8467952	require_once( '/home/domains/malitikov.ru/public_html/wp-includes/template-loader.php )	.../wp-blog-header.php:19
4	0.1651	8492608	include( '/home/domains/malitikov.ru/public_html/wp-content/themes/malitikov/single.php )	.../template-loader.php:106

Мы рекомендуем

15 октября 2024

Batch обработка с Apache Spark

Мы рекомендуем

СЕКРЕТНЫЕ ЭПИЗОДЫ ПИН-КОДА!!!

Барбоскины | Дружок уменьшился | серия «Микромир» | Короткое видео

Новости ЮУрГУ от 16 04

Вечерний выпуск новостей города Владимира и Владимирской области 21 ноября 2023