��] ��(sh��)��(j��)�ɼ��c�A̎��(��2�� )

��ߣ��

��磺��]늳��r�g��2025-02-01

�_�� 16�_ 퓔�(sh��)�� 284

���Σ��̲��N��

�� D �r:¥51.3(7.3��) ��r ~~¥69.8~~ ��䛺�ɿ��T�r

��ُ��܇ �ղ�

�_��٣� ȫ��]

?�½��س��

��Ǖ��>

>
�J�M��(sh��)�W��D�D̽�ؚvʷ��}

�J�M��(sh��)�W��D�D̽�ؚvʷ��}

¥20.7¥32.8
>
��t(y��)��A��Փ

��t(y��)��A��Փ

¥51.7¥59
>
��Ї��c��(�¾�21��o��ϵ�н̲�)

��Ї��c��(�¾�21��o��ϵ�н̲�)

¥31.2¥48
>
��У܊��n�̳�

��У܊��n�̳�

¥12.4¥38
>
˼��c��(2021��)

˼��c��(2021��)

¥8.5¥18
>
ë�ɖ|˼��Ї��ɫ��x��Փ�wϵ��Փ(2021��)

ë�ɖ|˼��Ї��ɫ��x��Փ�wϵ��Փ(2021��)

¥8.5¥25
>
��t(y��)��(n��i)�ƌW��ȫ��t(y��)ˎ�ИI(y��)�ߵȽ��ʮ��塱Ҏ(gu��)��̲�

��t(y��)��(n��i)�ƌW��ȫ��t(y��)ˎ�ИI(y��)�ߵȽ��ʮ��塱Ҏ(gu��)��̲�

¥85.1¥99

��ƷԔ��
��Ʒ�uՓ(0�l)

�ЈD�r:¥51.3 ��ُ��܇

��(qu��n)��Ϣ
��ɫ
��(n��i)�ݺ��
Ŀ�
��ߺ��

��(sh��)��(j��)�ɼ��c�A̎��(��2�� ) ��(qu��n)��Ϣ

ISBN��9787115657282
�l�δa��9787115657282 ; 978-7-115-65728-2
�b��ƽ�b
�Ԕ�(sh��)��o
��o
��ٷ��
�̲�
>
�о��/��/��ƽ̲�

��(sh��)��(j��)�ɼ��c�A̎��(��2�� ) ��ɫ

1.��򞲿��Linux��ϵ�y(t��ng)��ͬ�r��̌W�YԴ��ṩWindowsϵ�y(t��ng)��򞣬��ڲ�ͬԺУ�̌W��

2.ͻ��`��Ӱ��(sh��)��c��ИI(y��)��Y(ji��)�ϣ��ڌW��Ք�(sh��)��(j��)�ɼ��c�A̎��g�đ��á�

3. ��YԴ�S��}�졢PPT��̰��̌W��V��nҕ�l��ָ�ϡ��n��}�𰸵ȡ�

��(sh��)��(j��)�ɼ��c�A̎��(��2�� ) ��(n��i)�ݺ��

��Ԕ��U��˴�(sh��)��(j��)�I��(sh��)��(j��)�ɼ��c�A̎��P��Փ�ͼ��g��ȫ��8�£��(n��i)�ݰ��(sh��)��(j��)��h(hu��n)����W(w��ng)�j��(sh��)��(j��)�ɼ��ֲ�ʽ��Ϣϵ�y(t��ng)Kafka��־�ɼ�ϵ�y(t��ng)Flume��(sh��)��(j��)�}��еĔ�(sh��)��(j��)��ɡ�ETL��Kettle��ʹ��pandas�M�Д�(sh��)��(j��)��ϴ��S��Č��`��͑��ð��Ԏ��x�߸��õ،W��Ք�(sh��)��(j��)�ɼ��c�A̎��P�I��g�� ߵ�ԺУ��(sh��)��(j��)��I(y��)�Ĵ�(sh��)��(j��)�n�̲̽ģ�Ҳ�ɹ��P��g�ˆT��

��(sh��)��(j��)�ɼ��c�A̎��(��2�� ) Ŀ�

��1�� 1

1.1 ��(sh��)��(j��)��1

1.1.1 ��(sh��)��(j��)�ĸ��1

1.1.2 ��(sh��)��(j��)��͡�2

1.1.3 ��(sh��)��(j��)�ĽM��ʽ��2

1.1.4 ��(sh��)��(j��)�ărֵ��2

1.1.5 ��(sh��)��(j��)��ը��3

1.2 ��(sh��)��(j��)��^�̡�3

1.3 ��(sh��)��(j��)�ɼ��c�A̎��΄ա�4

1.4 ��(sh��)��(j��)�ɼ��5

1.4.1 ��(sh��)��(j��)�ɼ��ĸ��5

1.4.2 ��(sh��)��(j��)�ɼ��Ҫ�c��5

1.4.3 ��(sh��)��(j��)�ɼ��Ĕ�(sh��)��(j��)Դ��6

1.4.4 ��(sh��)��(j��)�ɼ��7

1.5 ��(sh��)��(j��)��ϴ��8

1.5.1 ��(sh��)��(j��)��ϴ�đ��I��8

1.5.2 ��(sh��)��(j��)��ϴ�Č��F(xi��n)��ʽ��8

1.5.3 ��(sh��)��(j��)��ϴ�ă�(n��i)�ݡ�9

1.5.4 ��(sh��)��(j��)��ϴ��ע��헡�9

1.5.5 ��(sh��)��(j��)��ϴ�Ļ��̡�10

1.5.6 ��(sh��)��(j��)��ϴ��u�r�˜ʡ�10

1.6 ��(sh��)��(j��)��ɡ�11

1.7 ��(sh��)��(j��)�D(zhu��n)�Q��11

1.7.1 ��(sh��)��(j��)�D(zhu��n)�Q��ԡ�11

1.7.2 ƽ��̎��12

1.7.3 Ҏ(gu��)��̎��13

1.8 ��(sh��)��(j��)�w�s��14

1.9 ��(sh��)��(j��)Ó��16

1.9.1 ��(sh��)��(j��)Ó��ԭ�t��16

1.9.2 ��(sh��)��(j��)Ó��16

1.10 ��С�Y(ji��)��17

1.11 ��}��17

��2�� (sh��)��(j��)��h(hu��n)����19

2.1 Linux��ϵ�y(t��ng)�İ��b��ʹ�á�19

2.1.1 ��d��b�ļ��19

2.1.2 Linux��ϵ�y(t��ng)�İ��b��ʽ��20

2.1.3 ��bLinux̓�M�C��20

2.1.4 ��(chu��ng)��hadoop�Ñ��29

2.1.5 ��Windows��ϵ�y(t��ng)��Linux̓�M�C֮�g��ļ��29

2.1.6 ʹ��FTP��F(xi��n)Windows��Linux֮�g��ļ��ݔ��31

2.1.7 vim��݋��İ��b��ʹ�á�33

2.1.8 �O��ݔ�뷨��34

2.1.9 ��õ�Linux��36

2.1.10 �ļ��≺��36

2.1.11 Ŀ䛵ę�(qu��n)�ޡ�37

2.1.12 ��APT��37

2.1.13 Linux��ϵ�y(t��ng)��һЩʹ�ü��ɡ�37

2.2 Python�İ��b��ʹ�á�37

2.2.1 Python��顡38

2.2.2 Python�İ��b��39

2.2.3 Python�Ļ��ʹ�÷��39

2.2.4 Python��A�Z��֪�R��40

2.2.5 Python��ģ�K�İ��b��43

2.3 JDK�İ��b��44

2.4 Hadoop�İ��b��ʹ�á�45

2.4.1 Hadoop��顡45

2.4.2 ��bHadoopǰ�Ĝʂ乤��46

2.4.3 ��bHadoop��3�Nģʽ��48

2.4.4 ��dHadoop��b�ļ��48

2.4.5 �ηֲ�ʽģʽ��á�48

2.4.6 �ֲ�ʽ�ļ�ϵ�y(t��ng)HDFS��51

2.4.7 HDFS�Ļ��ʹ�÷��52

2.5 MySQL��(sh��)��(j��)��İ��b��ʹ�á�53

2.5.1 �Pϵ��(sh��)��(j��)�졡53

2.5.2 �Pϵ��(sh��)��(j��)��˜��Z��SQL��55

2.5.3 ��bMySQL��57

2.5.4 MySQL��(sh��)��(j��)��ʹ�÷��58

2.5.5 ʹ��Python��MySQL��(sh��)��(j��)�졡59

2.6 MongoDB�İ��b��ʹ�á�63

2.6.1 MongoDB��顡63

2.6.2 ��bMongoDB 6.0��63

2.6.3 MongoDB��A��65

2.6.4 ʹ��Python��MongoDB��67

2.7 Redis�İ��b��ʹ�á�69

2.7.1 Redis��顡69

2.7.2 ��bRedis��69

2.7.3 Redis��70

2.7.4 ʹ��Python��Redis��(sh��)��(j��)�졡72

2.8 ��С�Y(ji��)��73

2.9 ��}��73

��1 ��ϤMySQL��HDFS�Ĳ��73

��3�� W(w��ng)�j��(sh��)��(j��)�ɼ��76

3.1 �W(w��ng)�j��x��76

3.1.1 �W(w��ng)�j��x�Ķ��x��ԭ��76

3.1.2 �W(w��ng)�j��x��͡�77

3.1.3 ��x�C�ơ�77

3.1.4 ��ȡ��ӆ��79

3.2 �W(w��ng)퓻��A֪�R��80

3.2.1 ��ı��HTML��80

3.2.2 HTTP��80

3.3 ��Python��F(xi��n)HTTPՈ��81

3.3.1 urllibģ�K��81

3.3.2 urllib3ģ�K��82

3.3.3 requestsģ�K��82

3.4 ��requests��83

3.4.1 ��fURL��(sh��)��83

3.4.2 ��Ո��^��84

3.4.3 �W(w��ng)�j��r̎��84

3.5 ��W(w��ng)퓡�85

3.5.1 BeautifulSoup��顡85

3.5.2 BeautifulSoup�Ĵ��86

3.5.3 ��v�ęn�䡡88

3.5.4 ��ęn�䡡92

3.5.5 CSS�x��95

3.6 �C�ό��96

3.6.1 ��1��ɼ��W(w��ng)퓔�(sh��)��(j��)��浽�ı��ļ��96

3.6.2 ��2��ɼ��W(w��ng)퓔�(sh��)��(j��)��浽MySQL��(sh��)��(j��)�졡99

3.6.3 ��3��ɼ��W(w��ng)퓔�(sh��)��(j��)��浽MongoDB��(sh��)��(j��)�졡101

3.6.4 ��4��ɼ��W(w��ng)퓔�(sh��)��(j��)��浽Redis��(sh��)��(j��)�졡102

3.7 Scrapy��ܡ�104

3.7.1 Scrapy��ܸ��104

3.7.2 XPath�Z�ԡ�105

3.7.3 Scrapy��ܑ��Ì��109

3.8 ͨ�^JSON�ӿ��ȡ�W(w��ng)վ��(sh��)��(j��)��115

3.8.1 ��ʲô�x��JSON�ӿڡ�115

3.8.2 ͨ�^JSON�ӿ��ȡ��(sh��)��(j��)�Ĳ��E��116

3.8.3 ��116

3.9 ��С�Y(ji��)��118

3.10 ��}��119

��2 �W(w��ng)�j��x��`��119

��4�� ֲ�ʽ��Ϣϵ�y(t��ng)Kafka��121

4.1 Kafka��顡121

4.1.1 Kafka��ԡ�121

4.1.2 Kafka��Ҫ��È��122

4.1.3 Kafka��Ϣ��fģʽ��122

4.2 Kafka�ڴ�(sh��)��(j��)��B(t��i)ϵ�y(t��ng)�е��á�123

4.3 Kafka��Flume�ą^(q��)�e�c(li��n)ϵ��124

4.4 Kafka��P��124

4.5 Kafka�İ��b��ʹ�á�125

4.5.1 ��bKafka��125

4.5.2 ʹ��Kafka��126

4.6 ʹ��Python��Kafka��127

4.7 Kafka�cMySQL�ĽM��ʹ�á�130

4.8 Kafka�ɼ��(sh��)��(j��)��浽MongoDB�С�132

4.8.1 �΄��132

4.8.2 ��F(xi��n)��a��132

4.8.3 ��(zh��)��^�̡�133

4.9 ��С�Y(ji��)��133

4.10 ��}��133

��3 ��ϤKafka�Ļ��ʹ�÷��134

��5�� ־�ɼ�ϵ�y(t��ng)Flume��136

5.1 Flume��顡136

5.2 Flume�İ��b��ʹ�á�137

5.2.1 Flume�İ��b��137

5.2.2 Flume��ʹ�á�138

5.3 Flume��Kafka�ĽM��ʹ�á�139

5.3.1 Flume�ɼ�NetCat��(sh��)��(j��)��

Kafka��139

5.3.2 Flume�ɼ��ļ��(sh��)��(j��)��Kafka��141

5.3.3 Flume�ɼ�MySQL��(sh��)��(j��)��еĔ�(sh��)��(j��)��Kafka��143

5.4 �ɼ��־�ļ��HDFS��145

5.4.1 �ɼ�Ŀ䛵�HDFS��145

5.4.2 �ɼ��ļ��HDFS��147

5.5 �ɼ�MySQL��(sh��)��(j��)��еĔ�(sh��)��(j��)��HDFS��148

5.5.1 �ʂ乤��149

5.5.2 ��(chu��ng)��MySQL��(sh��)��(j��)�졡149

5.5.3 ��ú͆��Flume��149

5.6 Flume��(sh��)��(j��)Դ��Ì��151

5.6.1 ��OӋ��151

5.6.2 ��Flume��152

5.6.3 ��(zh��)��^�̡�154

5.7 ��С�Y(ji��)��154

5.8 ��}��155

��4 ��ϤFlume�Ļ��ʹ�÷��155

��6�� (sh��)��(j��)�}��еĔ�(sh��)��(j��)��ɡ�157

6.1 ��(sh��)��(j��)�}��ĸ��157

6.1.1 ��y(t��ng)�Ĕ�(sh��)��(j��)�}�졡157

6.1.2 ��r��Ӕ�(sh��)��(j��)�}�졡158

6.2 ��(sh��)��(j��)��ɡ�159

6.2.1 ��(sh��)��(j��)��ɷ�ʽ��159

6.2.2 ��(sh��)��(j��)�ְl(f��)��ʽ��160

6.2.3 ��(sh��)��(j��)��ɼ��g��160

6.3 ETL��161

6.3.1 ETL��顡161

6.3.2 ETL��ģ�K��162

6.3.3 ETLģʽ��163

6.3.4 ETL��ߡ�164

6.4 CDC��165

6.4.1 CDC��ԡ�165

6.4.2 CDC�ĽM�ɡ�166

6.4.3 CDC�ľ��w��È��166

6.4.4 ��CDC��Ҫ˼��ҕ�Ć��}��167

6.5 ��С�Y(ji��)��168

6.6 ��}��168

��7�� ETL��Kettle��169

7.1 Kettle�Ļ��169

7.2 Kettle�Ļ��ܡ�170

7.3 ��bKettle��172

7.4 ��(sh��)��(j��)��ȡ��174

7.4.1 ��ı��ļ��Excel�ļ��174

7.4.2 ��ı��ļ��MySQL��(sh��)��(j��)�졡179

7.4.3 ��Excel�ļ��MySQL��(sh��)��(j��)�졡183

7.5 ��(sh��)��(j��)��ϴ�c�D(zhu��n)�Q��186

7.5.1 ʹ��Kettle��F(xi��n)��(sh��)��(j��)��187

7.5.2 ��Kettle��t��_ʽ��ϴ��(sh��)��(j��)��189

7.5.3 ʹ��Kettleȥ��ȱʧֵӛ䛡�192

7.5.4 ʹ��Kettle�D(zhu��n)��MySQL��(sh��)��(j��)��еĔ�(sh��)��(j��)��197

7.6 ��(sh��)��(j��)��d��203

7.6.1 �ѱ��ļ��d��HDFS�С�203

7.6.2 ��HDFS�ļ��d��MySQL��(sh��)��(j��)��С�208

7.7 ��С�Y(ji��)��212

7.8 ��}��212

��5 ��ϤKettle�Ļ��ʹ�÷��212

��8�� ʹ��Pandas�M�Д�(sh��)��(j��)��ϴ��215

8.1 NumPy�Ļ��ʹ�÷��215

8.1.1 ��(sh��)�M��(chu��ng)��215

8.1.2 ��(sh��)�M��Ƭ��217

8.1.3 ��(sh��)�M�\�㡡218

8.1.4 ��(sh��)�M��ĳ��ú��(sh��)��218

8.2 Pandas�Ĕ�(sh��)��(j��)�Y(ji��)��(g��u)��221

8.2.1 Series��221

8.2.2 DataFrame��224

8.2.3 ��228

8.3 Pandas��댧��(sh��)��(j��)��229

8.3.1 ��c��Excel�ļ��229

8.3.2 ��c��CSV�ļ��230

8.3.3 ��c��TXT�ļ��231

8.3.4 ��(sh��)��(j��)��c��MySQL��(sh��)��(j��)�졡231

8.4 Pandas�Ļ��ܡ�233

8.4.1 ��(sh��)��(j��)��c�ϲ��233

8.4.2 ��237

8.4.3 �G��ָ��S�ϵ�헡�239

8.4.4 ��xȡ��^�V��240

8.4.5 ��g�\�㡡241

8.4.6 DataFrame��Series֮�g��\�㡡241

8.4.7 ��(sh��)��ú�ӳ�䡡242

8.4.8 ��243

8.4.9 �ֽM��246

8.4.10 ��ú��(sh��)��248

8.5 �R��y(t��ng)Ӌ��251

8.5.1 �c��y(t��ng)Ӌ��P�ĺ��(sh��)��251

8.5.2 Ψһֵ��ֵӋ��(sh��)��ɆT�Y��253

8.6 ̎��ȱʧ��(sh��)��(j��)��254

8.6.1 �z��ȱʧֵ��255

8.6.2 ��/��ȱʧֵ��255

8.6.3 �ų�ȱ�ٵ�ֵ��256

8.7 ��ϴ��ʽ��(n��i)�ݡ�257

8.7.1 �h��ַ��еĿո�257

8.7.2 ��ϴ��С��á�258

8.8 �C�ό��258

8.8.1 Matplotlib��ʹ�÷��258

8.8.2 ��1��ʳƷ��(sh��)��(j��)��M�л��261

8.8.3 ��2��Ӱ��(sh��)��(j��)��M��ϴ��262

8.8.4 ��3��ٶ��ָ��(sh��)��263

8.8.5 ʾ��4��Bվ��(sh��)��(j��)��265

8.8.6 ��5��Ӱ�u�֔�(sh��)��(j��)��270

8.8.7 ��6��App�О锵(sh��)��(j��)�A̎��273

8.9 ��С�Y(ji��)��281

8.10 ��}��281

��6 Pandas��(sh��)��(j��)��ϴ��`��281

��īI��284

չ�_ȫ��

��(sh��)��(j��)�ɼ��c�A̎��(��2�� ) ��ߺ��

��꣬�У��ʿ��(n��i)��У֪��(sh��)��(j��)�̎��B�T��WӋ��C�ƌW�c��gϵ��ڣ��B�T��W��(sh��)��(j��)�쌍��ؓ؟�ˣ��Ї�Ӌ��C�W��(sh��)��(j��)�쌣ί��ί�T��Ї�Ӌ��C�W��Ϣϵ�y(t��ng)��ί��ί�T��x��2021��УӋ��C��I(y��)��(y��u)��̎��Ӌ��s�@��2022�긣��ʡ�ߵȽ��̌W�ɹ��صȪ��һ��͡�2018�긣��ʡ�ߵȽ��̌W�ɹ��Ȫ��һ��12��(sh��)��(j��)ϵ�н̲ģ��(n��i)500��У��ã��O�ˇ��(n��i)��У�ׂ��(sh��)��(j��)�n�̹��ƽ�_��ƽ�_��Ӌ�W(w��ng)�j�L��^2300�f�Σ��ɞ�ȫ��У��(sh��)��(j��)�̌W֪��Ʒ�ƣ��ֵ��n�̡��(sh��)��(j��)��gԭ��c��á��@�u��2018��Ҿ�Ʒ�ھ��_��n�̡��͡�2020��Ҽ��һ��n�̡��ֵ��n�̡�Spark��̻��A��@�u��2021��Ҽ��һ��n�̡��

��Ʒ�uՓ(0�l)

��u ٍ��

��o�uՓ��

��]