瑞客论坛

 找回密码
 立即注册
查看: 1024|回复: 10

Data Analysis with Python and PySpark

[复制链接]

金币272  第4701名

52

主题

3346

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7412
贡献
5523
热心值
7
金币
272
注册时间
2021-5-11

活跃会员最佳新人灌水之王

发表于 2022-4-15 20:48 | 显示全部楼层 |阅读模式

链接:https://pan.baidu.com/s/1s9EO2KmfVHO8KRWKOXc0Lg
提取码:
游客,本付费内容需要支付 4金币 才能浏览, 赞助VIP全站免费下载支付

--来自百度网盘超级会员V7的分享

1-9.jpg
内容简介:
Think big about your data! PySpark brings the powerful Spark big data processing engine to the Python ecosystem, letting you seamlessly scale up your data tasks and create lightning-fast pipelines.
In Data Analysis with Python and PySpark you will learn how to:
  • Manage your data as it scales across multiple machines
  • Scale up your data programs with full confidence
  • Read and write data to and from a variety of sources and formats
  • Deal with messy data with PySpark’s data manipulation functionality
  • Discover new data sets and perform exploratory data analysis
  • Build automated data pipelines that transform, summarize, and get insights from data
  • Troubleshoot common PySpark errors
  • Creating reliable long-running jobs
Data Analysis with Python and PySpark is your guide to delivering successful Python-driven data projects. Packed with relevant examples and essential techniques, this practical book teaches you to build pipelines for reporting, machine learning, and other data-centric tasks. Quick exercises in every chapter help you practice what you’ve learned, and rapidly start implementing PySpark into your data systems. No previous knowledge of Spark is required.
about the technology
The Spark data processing engine is an amazing analytics factory: raw data comes in, insight comes out. PySpark wraps Spark’s core engine with a Python-based API. It helps simplify Spark’s steep learning curve and makes this powerful tool available to anyone working in the Python data ecosystem.
about the book
Data Analysis with Python and PySpark helps you solve the daily challenges of data science with PySpark. You’ll learn how to scale your processing capabilities across multiple machines while ingesting data from any source—whether that’s Hadoop clusters, cloud data storage, or local data files. Once you’ve covered the fundamentals, you’ll explore the full versatility of PySpark by building machine learning pipelines, and blending Python, pandas, and PySpark code.
what’s inside
  • Organizing your PySpark code
  • Managing your data, no matter the size
  • Scale up your data programs with full confidence
  • Troubleshooting common data pipeline problems
  • Creating reliable long-running jobs
about the reader
Written for data scientists and data engineers comfortable with Python.
about the author
As a ML director for a data-driven software company, Jonathan Rioux uses PySpark daily. He teaches the software to data scientists, engineers, and data-savvy business analysts.

回复

使用道具 举报

金币2597  第655名

1

主题

1986

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
5076
贡献
3243
热心值
2
金币
2597
注册时间
2022-3-30
发表于 2022-4-15 23:30 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

金币257  第4885名

1

主题

379

回帖

2230

积分

金牌会员

Rank: 6Rank: 6

威望
1225
贡献
748
热心值
0
金币
257
注册时间
2022-4-2
发表于 2022-4-16 00:06 | 显示全部楼层
激动人心,无法言表!
回复

使用道具 举报

金币6063  第187名

14

主题

3796

回帖

2万

积分

论坛元老

Rank: 8Rank: 8

威望
9669
贡献
4811
热心值
1
金币
6063
注册时间
2022-4-10

最佳新人活跃会员灌水之王一年荣誉奖章

发表于 2022-4-16 06:14 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

金币272  第4701名

52

主题

3346

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7412
贡献
5523
热心值
7
金币
272
注册时间
2021-5-11

活跃会员最佳新人灌水之王

 楼主| 发表于 2022-4-16 07:53 | 显示全部楼层
我只是路过打酱油的。
回复

使用道具 举报

金币1843  第929名

0

主题

1463

回帖

8097

积分

论坛元老

Rank: 8Rank: 8

威望
3813
贡献
2441
热心值
0
金币
1843
注册时间
2022-2-28
发表于 2022-4-16 09:22 | 显示全部楼层
真是难得给力的帖子啊。
回复

使用道具 举报

金币763  第2127名

0

主题

646

回帖

2424

积分

金牌会员

Rank: 6Rank: 6

威望
989
贡献
672
热心值
0
金币
763
注册时间
2022-1-17
发表于 2022-4-16 10:44 | 显示全部楼层
谢谢分享
回复

使用道具 举报

金币272  第4701名

52

主题

3346

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7412
贡献
5523
热心值
7
金币
272
注册时间
2021-5-11

活跃会员最佳新人灌水之王

 楼主| 发表于 2022-4-16 15:32 | 显示全部楼层
淡定,淡定,淡定……
回复

使用道具 举报

金币5832  第201名

0

主题

3086

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
5711
贡献
5471
热心值
0
金币
5832
注册时间
2019-7-25
发表于 2022-4-17 09:48 | 显示全部楼层
强烈支持楼主ing……
回复

使用道具 举报

金币272  第4701名

52

主题

3346

回帖

1万

积分

论坛元老

Rank: 8Rank: 8

威望
7412
贡献
5523
热心值
7
金币
272
注册时间
2021-5-11

活跃会员最佳新人灌水之王

 楼主| 发表于 2022-4-17 10:14 | 显示全部楼层
感恩无私的分享与奉献
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|瑞客论坛 |网站地图

GMT+8, 2024-11-24 04:56

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表