�ЈD�W

>

��OӋ

>

��

��\��W��:��̌��

$��\��W��:��̌��$

��

��] ��\��W��:��̌��

��ߣ��

��磺��ӹ��I��r�g��2020-03-01

�_�� 24cm 퓔�� 264�

���Σ�Ӌ��C/�W�j�N��

�� D �r:¥51.7(5.8��) ��r ~~¥89.0~~ ��䛺�ɿ��T�r

��ُ��܇ �ղ�

�_��٣� ȫ��]

?�½��س��

��Ǖ��>

>
ȫ��Ӌ��C�ȼ��ԇ��濼�}��ģ�M��Ԕ�⡤��MSOffice�߼��

ȫ��Ӌ��C�ȼ��ԇ��濼�}��ģ�M��Ԕ�⡤��MSOffice�߼��

¥14.4¥45
>
�Q��Мy5000�}(��Z��c��_)

�Q��Мy5000�}(��Z��c��_)

¥44.1¥88
>
ܛ��ܜyԇ.��c�{��`֮·

ܛ��ܜyԇ.��c�{��`֮·

¥56.2¥69
>
��һ�д��aAndroid

��һ�д��aAndroid

¥55.4¥99
>
JAVA��m��

JAVA��m��

¥58.1¥119
>
EXCEL��̿ƕ�(��ȫ��)(ȫ��ӡˢ)

EXCEL��̿ƕ�(��ȫ��)(ȫ��ӡˢ)

¥31.1¥69.9
>
��ȌW��

��ȌW��

¥92.4¥168

��ƷԔ��
��Ʒ�uՓ(0�l)

�ЈD�r:¥51.7 ��ُ��܇

��Ϣ
��ɫ
��ݺ��
Ŀ�
��ߺ��

��\��W��:��̌�� Ϣ

ISBN��9787121367465
�l�δa��9787121367465 ; 978-7-121-36746-5
�b��һ��z�漈
�Ԕ��o
��o
��ٷ��
Ӌ��C/�W�j
>
��OӋ
>
��

��\��W��:��̌�� ɫ

��\��W��̌��ǡ��\��W��ԭ��T��Ľ��ƪ�� 1 ��ԏ��Ծ��̌��ּ�ڎ��x��ͨ�^��㷨��ّ��á� 2 ϵ�yȫ�棺��R��ɷ��Փ��£��B��*��㷨��w�˻��ֵ��㷨��ֱ�Ӳ��ģ�͵ď��W��ȡ� 3 ǰ�ؼ��g��AlphaZero��g��ȏ��W��ԭ��B��ϵľ��w��F�� 4 ��ԏ��x�߿ɸ��еĴ��aֱ��֣��ͨ�^�޸ĳ��еĳ��H��w��㷨ԭ��

��\��W��:��̌�� ݺ��

��ƪ��B��Ŀǰ��W��㷨��*��㷨��**ƪ��ֵ��ď��W��㷨, ԓƪ��B�˻��ڃɷN��u�� (��ؿ��u��͕r�g��ֲ��u��) �ď��W��㷨, �M��B��Ό��ƽ��ķ��뵽��W��㷨�С��ڶ�ƪ��ֱ�Ӳ��, ԓƪ��B��*��Ĳ��ݶȷ��AC��PPO��DDPG�㷨��ƪ��ģ�͵ď��W��, ԓƪ��B�˻��mpc�ķ��, AlphaZero�㷨��ԭ��ϵľ��w��F��

��\��W��:��̌�� Ŀ�

��0 ƪ �Ȍ�ƪ ......... 1

1 һ��O�了�εď��W�� .................................. 2

1.1 ��ـ��C ..................... 2

1.1.1 e - greedy�� .... 3

1.1.2 ��Ɲ�� ...... 6

1.1.3 UCB �� ............. 7

1.2 ��ـ��C��a��F ..... 7

2 �R��ɷ�Q��^�� .............. 13

2.1 �Ķ��ـ��C��R��ɷ�Q��^�� ............... 13

2.2 �R��ɷ�Q��^�̴��a��F ........................... 23

��1 ƪ ��ֵ��ķ�� .......................... 31

3 ��ڄӑBҎ��ķ�� ........... 32

3.1 ��Ե��cֵ�� ....... 32

3.1.1 ��Ե��㷨ԭ�� ................................ 33

3.1.2 ֵ��㷨ԭ�� 35

3.2 ��Ե��ֵ��Ĵ��a��F ....................... 36

3.2.1 �x��h��޸� 36

3.2.2 ��Ե��㷨��a��F ........................ 37

3.2.3 ֵ��㷨��a��F ............................ 41

4 ��ؿ��ķ�� ........... 45

4.1 ��ؿ��㷨ԭ�� ....... 46

4.2 ��ؿ��㷨�Ĵ��a��F ............................... 49

4.2.1 �h����޸ĺ��ؿ��㷨�� ................................ 49

4.2.2 ̽��ʼ��ؿ��㷨��F ............ 52

4.2.3 ͬ��ؿ��㷨��F .................... 56

5 ��ڕr�g��ֵķ�� ........... 62

5.1 �ĄӑBҎ��r�g��֏��W�� ................... 62

5.2 �r�g��㷨��a��F ................................... 66

5.2.1 �r�g��㷨�� ........................ 66

5.2.2 SARSA �㷨 ...... 67

5.2.3 Q-Learning �㷨 70

6 ��ں��ƽ��ķ�� ........... 74

6.1 �ı��͏��W��Ժ��ƽ��W�� 74

6.1.1 ��ʾ .... 74

6.1.2 �̶�ϡ��ʾ .... 75

6.1.3 ��Ӗ�� ........ 76

6.2 ��ھ��Ժ��ƽ��Q-Learning �㷨��F ... 76

6.3 �Ǿ��Ժ��ƽ�DQN �㷨��a��F ............. 85

��2 ƪ ֱ�Ӳ��ķ�� ...................... 95

7 ��ݶȷ�� ..................... 96

7.1 �㷨��ԭ��a�ܘ� ............................... 96

7.1.1 ��Եı�ʾ��} 97

7.1.2 �S�C��ݶȵ��ƌ� ............................ 98

7.1.3 �ۿ��۷e�؈� .... 99

7.1.4 ��a�ܘ� .......... 101

7.2 �xɢ��CartPole ��̌�� ... 103

7.2.1 CartPole �� ... 103

7.2.2 ��}��MDP ģ�� ....................... 104

7.2.3 �ɘ��Python Դ�a��F ................. 105

7.2.4 ��ԾW�jģ�ͷ�� .............................. 106

7.2.5 ��ԾW�j�Python Դ�a��F ......... 108

7.2.6 ��ԾW�j��Ӗ��c�yԇ ....................... 110

7.2.7 �ò��ݶȷ��Cartpole �� ................................... 112

7.2.8 CartPole ��h��_�l ........................ 113

7.3 �B�m��Pendulum ��̌�� .... 117

7.3.1 Pendulum �� .. 118

7.3.2 �ɘ��Python Դ��a��F .............. 118

7.3.3 ��ԾW�jģ�ͷ�� .............................. 120

7.3.4 ��ԾW�j�Python Դ�a��F ......... 121

7.3.5 ��ԾW�j��Ӗ��c�yԇ ...................... 125

7.3.6 �ò��ݶȷ��Pendulum �� ................................ 126

7.3.7 Pendulum ��h��_�l ..................... 127

8 Actor-Critic �� ............... 131

8.1 Actor-Critic ԭ��a�ܘ� ......................... 131

8.1.1 Actor-Critic ��ԭ�� .......................... 131

8.1.2 Actor-Critic �㷨�ܘ� .......................... 133

8.2 TD-AC �㷨 ................ 133

8.2.1 �ɘ��Python Դ�a ......................... 134

8.2.2 ��ԾW�j��Python Դ�a ..................... 135

8.2.3 ��Ӗ��͜yԇ .................................. 138

8.2.4 ��Ӗ��Ч�� .............................. 140

8.3 Minibatch-MC-AC �㷨 ................................. 141

8.3.1 Minibatch-MC-AC �㷨�� .............. 141

8.3.2 �ɘ��Python Դ�a ......................... 142

8.3.3 ��ԾW�j��Python Դ�a ..................... 144

8.3.4 ��Ե�Ӗ��͜yԇ .............................. 147

8.3.5 ��Ӗ��Ч�� .............................. 149

9 PPO �� ......................... 151

9.1 PPO �㷨��ԭ��a�Y�� ..................... 151

9.2 Python Դ�a�� ......... 154

9.2.1 �ɘ�� .............. 154

9.2.2 ��ԾW�j .......... 156

9.2.3 ��Ե�Ӗ��͜yԇ .............................. 159

9.2.4 ��Ӗ��Ч�� .............................. 160

10 DDPG �� .................... 163

10.1 DDPG ��ԭ�� ....... 163

10.2 Python Դ�a�� ....... 167

10.2.1 ��򞾏�� 167

10.2.2 ��ԾW�j� .... 169

10.2.3 Ӗ��͜yԇ .... 173

10.2.4 ��Ӗ��Ч�� ............................ 175

��3 ƪ ��ģ�͵ď��W�� ............. 177

11 ��ģ��A�y��Ƶď��W��㷨 ..................... 178

11.1 ��ģ�͵ď��W��㷨�Ļ��ԭ�� ........ 178

11.1.1 �񽛾W�j�M�τ��Wģ�� ................ 179

11.1.2 ģ��A�y�� 179

11.1.3 ��ģ�͵ď��W��㷨�δ��a .... 180

11.2 Python Դ�a��F�� ............................... 181

11.2.1 ��ռ�� .... 181

11.2.2 ��ɘ�� .... 181

11.2.3 ��W�W�j� 182

11.2.4 ģ��A�y�� ............................ 185

11.2.5 ģ��Ӗ��A�y�� ........................ 186

11.2.6 �� ............ 188

12 AlphaZero ԭ��\�� ....... 190

12.1 ��AlphaGo ��AlphaZero ............................ 191

12.2 ��ؿ��㷨 ................................... 196

12.2.1 ��Ę�͘OС�O�� .................... 196

12.2.2 ��Փ��ϻ��C��} ........................ 198

12.2.3 UCT �㷨 ....... 200

12.3 ��Ҍ��ĵď��W�� ........................... 206

12.3.1 ��MCTS ��Ҍ�� ................... 206

12.3.2 ��ԃrֵ�W�j��Ӗ�� ........................ 210

13 AlphaZero ��𣺏��W�� ...................... 214

13.1 ��׵��h�� ............................... 215

13.2 ��w�㷨�� ... 223

13.3 ��F��ؿ�� ................................... 229

13.4 ��F��ԃrֵ�W�j ... 235

13.5 Ӗ��cЧ��u�� ................................... 240

��A PyTorch ��T ........... 246

A.1 PyTorch ��A֪�R ...... 246

A.1.1 Tensor .............. 246

A.1.2 ��A�� ......... 247

A.1.3 Tensor ��NumPy array �g��D�� ...... 249

A.1.4 Autograd��Ԅ��ݶ� .......................... 249

A.2 PyTorch �е��񽛾W�j .................................. 250

A.2.1 ��ζ��x�񽛾W�j ............................. 251

A.2.2 ��Ӗ��񽛾W�j ............................. 254

A.2.3 ��CIFAR-10 ��M��Ӗ��͜yԇ ............................... 256

A.2.4 ģ�͵ı��ͼ��d ............................. 259

��īI ................................ 261

��ӛ ... 263

չ�_ȫ��

��\��W��:��̌�� ߺ��

��_��W�˹��܌WԺ�v��2009�ꮅ�I��A�пƼ��W�Cе�OӋ��켰�Ԅӻ��I��ͬ�걣�͵��Ї��ƌWԺ��Ԅӻ��о��M�дT��B�x��2016��1�«@�ù��W��ʿ�Wλ��_��W��²�ʿ��о��2018��7��ν��_��W��Ŀǰ��Ҫ�о��dȤ�Ƿ��C��\�ӿ��ơ��W��͙C��˲��ġ� �ο��t��ۿƼ��W��ʿ��Ŀǰ��چ�Ԫ��磬��о��ƌW�ң��ע�ڛQ��P�㷨��о��c�_�l��ʿ��g�ڇ��H֪��ڿ��͕��h�l��Փ��9ƪ��2015�꣬�@�ð��Ͱ��ش󔵓��S��ِ��ȵ�1��(��ِ��鿂Ӌ15154֧)��ھW��Α򣬓��Y���ھ��о��T��ؓ؟��Ի��]�㷨��ȏ��W��Α�AI��g��̽��о��Ϋ@�ù�˾��ļ��g�M�� ¼��_��W�˹��܌WԺԺ�L��ڡ��ʿ��ҽܳ��@��(2013��)��L��W��Ƹ��(2017��)��1992~1994��㽭��W��ϰ�(��Ӱ�)�W��@��ϰ��s�u�C��1996��1999��֫@�㽭��W�Wʿ�ʹTʿ�Wλ��2002��@��Rķɭ��W(Clemson University)늙C��̲�ʿ�Wλ��2002��2003��ڿ��ˠ��W(Cornell University)��²�ʿ��о��2003��ν��_��W��Ŀǰ��Ҫ�о��C��ҕ�X��ơ��o�˙C��Ƿ�ӵ�܇ϵ�y��΢�{�ײ��

��Ʒ�uՓ(0�l)

��u ٍ��

��o�uՓ��

��]

>
��c�؉�
��c�؉�
ʷ�F��
¥17.2~~¥28.0~~
>
��c�ƴ��Ļ�
��c�ƴ��Ļ�
�𾰴�
¥12.2~~¥29.8~~
>
�Ї��ڞ��K��߅��^:�vʷ�c��W��
�Ї��ڞ��K��߅��^:�vʷ�c��W��
[�K]��x��Ү�� g
¥21.6~~¥48.0~~
>
��Ҏ��x��Ѹ:��Ϧʰ
��Ҏ��x��Ѹ:��Ϧʰ
��Ѹ ��
¥11.1~~¥21.0~~
>
�ƴ��Mʿ�
�ƴ��Mʿ�
��
¥16.1~~¥39.8~~
>
��䳣Մ
��䳣Մ
��
¥15.5~~¥39.8~~
>
С��Ĺ��-��b��3��
С��Ĺ��-��b��3��
[��] ��}��֠� ��ƽ �g
¥36.7~~¥68.0~~
>
�Ї��vʷ��˲�g
�Ї��vʷ��˲�g
��
¥16.7~~¥38.0~~

����N

��gԭ��(��4��)/��

��

¥29.3~~¥45~~
�ĳ��T��ܘ�� 󔵓��桢�߲��l��΢��ա��Fꠅfͬ�Ⱥ��Ĉ��

��

¥58.9~~¥89~~
�ܘ��ޟ�:��g��ܘ��δ��:technology, architecture and the future

��ǻ��

¥58.9~~¥89~~
�㺢��Scratch:��Α򾎳��BӋ��˼�S(ȫ��)

�x��

¥45.8~~¥128~~
��_ʼ�W�ܘ�:��Ҳ�ܳɞ�ܘ��

��\�A

¥63.4~~¥99~~
Python�O��Ŀ��

�ؿ��ؿ�ķ

¥25.8~~¥69~~

中图网(原中国图书网)：网上书店，中文字幕在线一区二区三区，尾货特色书店，中文字幕在线一区，30万种特价书低至2折！

��] ��\��W��:��̌��

��\��W��:��̌�� Ϣ

��\��W��:��̌�� ɫ

��\��W��:��̌�� ݺ��

��\��W��:��̌�� Ŀ�

��\��W��:��̌�� ߺ��

��c�؉�

��c�ƴ��Ļ�

�Ї��ڞ��K��߅��^:�vʷ�c��W��

��Ҏ��x��Ѹ:��Ϧʰ

�ƴ��Mʿ�

��䳣Մ

С��Ĺ��-��b��3��

�Ї��vʷ��˲�g

��gԭ��(��4��)/��

�ĳ��T��ܘ�� 󔵓��桢�߲��l��΢��ա��Fꠅfͬ�Ⱥ��Ĉ��

�ܘ��ޟ�:��g��ܘ��δ��:technology, architecture and the future

�㺢��Scratch:��Α򾎳��BӋ��˼�S(ȫ��)

��_ʼ�W�ܘ�:��Ҳ�ܳɞ�ܘ��

Python�O��Ŀ��

��ǧ��xӛ

��ꮋ:��Մ

�B��ƪ-��ƪ��Ď�

��ӛ��N

߅��-��D��

ÿ��Փ�Z

���] ����\�������W��:���̌���

����\�������W��:���̌��� �����Ϣ

����\�������W��:���̌��� ������ɫ

����\�������W��:���̌��� ���ݺ���

����\�������W��:���̌��� Ŀ�

����\�������W��:���̌��� ���ߺ���

��] ��\��W��:��̌��

��\��W��:��̌�� Ϣ

��\��W��:��̌�� ɫ

��\��W��:��̌�� ݺ��

��\��W��:��̌�� Ŀ�

��\��W��:��̌�� ߺ��