1 020 ₽
Как это работает?
1
Выбираете товар
Добавьте интересующие вас товары в корзину
2
Оформляете заказ
Заполните все поля формы, чтобы получить предложение
3
Получаете предложения
В ближайшее время с вами свяжется менеджер для уточнения деталей
аналитикаКнига: Лаcерсон У., Оуэн Ш., Райза С., Тандон А., Уиллс Д. "Расширенная аналитика с PySpark"
Практические примеры анализа больших наборов данных с использованием Python и Spark В современном мире накоплен ошеломляющий объем данных, и он продолжает расти. Один из основных инструментов анализа данных — Apache Spark, фреймворк с открытым исходным кодом для распределенной обработки неструктурированных и слабоструктурированных данных. Это практическое руководство объединяет Spark, статистические методы и наборы данных из реального мира. Авторы научат вас решать задачи анализа с помощью системы с открытым исходным кодом PySpark, применяемой для распределенной обработки больших данных с использованием Python, а также других передовых методов программирования Spark. Специалисты по обработке данных знакомят читателей с экосистемой Spark, а затем приводят примеры базовых методов анализа, включая классификацию, кластеризацию, совместную фильтрацию и обнаружение аномалий в таких областях, как геномика, безопасность и финансы. Отдельные главы посвящены обработке изображений и библиотеке Spark NLP. Если у вас имеются базовые знания о машинном обучении и статистике, и вы программируете на Python, книга поможет вам освоить анализ больших данных. Ознакомьтесь с моделью программирования и экосистемой Spark Изучите общие подходы в науке о данных Изучите практические примеры анализа больших наборов данных Узнайте, какие инструменты машинного обучения подходят для решения конкретных задач Напишите код, который можно адаптировать для многих целей Об авторе Акаш Тандон — cоучредитель и технический директор компании Looppanel. Ранее работал главным инженером по данным в компании Atlan, специализирующейся на обработке данных и аналитике. Сэнди Райза — ведущий разработчик проекта Dagster, облачного оркестратора для анализа данных, и участник проекта Apache Spark. Ури Ласерсон — учредитель и технический директор компании Patch Biosciences, специализирующей в области геномики и расшифровки ДНК. Ранее работал с большими данными в Cloudera, создателе дистрибутиво1020RUB

0.00015