第1 章 開啓Python 之旅1
1.1 為何學習Python.1
1.1.1 繁忙的工作場景1
1.1.2 常用的效率工具4
1.1.3 Python 的優勢. 11
1.2 Python 的開發環境配置.11
1.2.1 通過官方安裝包安裝.. 11
1.2.2 通過Anaconda 套件安裝.. 12
1.3 開始編程—輸齣“Hello,
World!” ..13
1.3.1 使用Python 命令行. 13
1.3.2 使用IDLE.. 14
1.3.3 Anaconda Prompt 命令窗口. 15
1.3.4 Jupyter Notebook 15
1.3.5 Spyder 集成開發環境.. 16
1.3.6 IPython 命令窗口.. 18
1.4 Python 程序編寫風格..19
1.4.1 大小寫敏感 19
1.4.2 換行與注釋 19
1.4.3 代碼塊與縮進.. 20
案例:輸齣100 次“Hello,
World!” . 21
第2 章 Python 的基本語法.23
2.1 數據類型與變量.. 23
2.1.1 數字23
2.1.2 字符串..24
2.1.3 變量27
2.1.4 組閤數據類型..27
2.2 程序流程控製 30
2.2.1 if 語句..30
2.2.2 for 語句31
2.2.3 while 語句..32
2.3 函數(function) 33
2.3.1 函數的定義與調用33
2.3.2 函數的應用舉例.33
2.4 類(class) . 35
2.4.1 類的基礎用法..35
2.4.2 類的高級用法..39
2.5 Python 程序文檔結構.. 41
2.5.1 模塊41
2.5.2 包.43
2.5.3 安裝庫..45
第3 章 高效辦公文件管理..48
3.1 文件基礎知識.. 48
2 目 錄
3.1.1 文件存儲.48
3.1.2 文件的編碼49
3.1.3 文件的類型50
3.2 文件讀寫..51
3.2.1 open 函數51
3.2.2 讀取文本文件..51
案例:統計漢字齣現的頻率..53
3.2.3 寫入文本文件..53
案例:讀取文件頭識彆文件類型54
3.3 文件和目錄操作..56
3.3.1 使用os 庫..56
案例:刪除小文件60
案例:批量更名.60
3.3.2 使用shutil 庫60
案例:整理壓縮文件..63
3.3.3 文件查找.65
案例:清理文件“迷宮”66
案例:第三方庫探索..68
第4 章 網絡信息自動獲取..70
4.1 藉用Excel 實現簡單的爬蟲..70
4.2 瀏覽網頁的基本原理72
4.2.1 瀏覽器調試工具.72
4.2.2 Fiddler 抓包方法75
4.3 requests 庫與爬蟲開發.77
4.3.1 發送請求.77
4.3.2 構造網址.79
案例:采集數據.82
4.3.3 爬蟲攻防策略..84
4.4 網頁解析工具87
4.4.1 正則錶達式87
4.4.2 lxml 庫.89
4.4.3 BeautifulSoup4 庫..90
案例:獲取上市公司數據91
4.5 用selenium 爬取復雜頁麵93
4.5.1 網頁截圖.93
4.5.2 定位元素.96
4.5.3 按鍵與單擊.. 97
4.5.4 頁麵等待 98
4.5.5 調用JavaScript 代碼 99
4.5.6 獲取頁麵cookies 100
4.5.7 無界麵模式 101
第5 章 Python 與Excel 自動操作. 102
5.1 從VBA 說起..102
5.1.1 一個VBA 示例 102
5.1.2 Excel 中的對象 103
5.1.3 自定義函數 105
5.2 從VBA 過渡到Python.106
5.2.1 win32com 庫. 107
5.2.2 免費庫xlwings..116
5.2.3 商業庫DataNitro 124
5.3 Excel 文檔分析庫.125
5.3.1 自動化思路 125
5.3.2 .xls 格式文檔. 126
5.3.3 .xlsx 格式文檔.. 134
5.4 pandas 庫與Excel.143
5.4.1 讀入Excel 文檔.. 143
5.4.2 導齣Excel 文檔.. 147
5.4.3 數據匯總. 147
案例:提取某列文本中的數字. 151
案例:Excel 報錶匯總和拆分大全. 151
案例:自動生成Excel 版研究報告 156
第6 章 Python 與Word 自動操作.. 159
6.1 用win32com 庫操作Word 文檔159
6.1.1 Word 對象模型 159
6.1.2 常用文檔操作方法 174
案例:長文檔自動處理. 189
案例:自動生成公文格式 193
6.2 Word 文檔的底層結構..195
6.2.1 .doc 格式文檔.. 195
6.2.2 .docx 格式文檔 198
6.3 用python-docx 庫操作Word 文檔..201
6.3.1 Document 對象. 201
目 錄 3
6.3.2 Styles 對象.. 204
6.3.3 Paragraph/Run 對象 210
6.3.4 Table 對象 213
6.3.5 Section 對象 215
案例:自動生成報告 218
案例:從簡曆中提取數據. 219
第7 章 Python 與PowerPoint 自動操作 223
7.1 用win32com 庫操作PPT 文檔..223
7.1.1 PowerPoint 的對象. 223
7.1.2 動畫設計.. 234
案例:批量設置文本格式. 238
案例:批量設置動畫 239
7.2 PowerPoint 文檔的底層結構240
7.2.1 .ppt 格式文檔. 240
7.2.2 .pptx 格式文檔.. 242
7.3 用python-pptx 庫操作
PowerPoint 文檔247
7.3.1 創建演示文稿 247
7.3.2 幻燈片版式. 253
7.3.3 讀取與編輯. 258
案例:自動生成PPT 版研究報告 265
案例:信息的自動化提取. 268
第8 章 Python 與PDF 文檔操作. 270
8.1 PDF 文檔簡介.270
8.1.1 用記事本打開PDF
文檔 270
8.1.2 PDF 文檔的結構. 271
8.1.3 如何解析PDF 文檔.. 272
8.2 Python 自動創建PDF 文檔273
8.2.1 用ReportLab 庫創建
PDF 文檔. 273
案例:製作精美的封麵.. 275
案例:製作帶目錄的PDF 格式
報告 286
8.2.2 用PyFPDF 庫創建PDF
文檔 292
8.3 自動讀寫PDF 文檔295
8.3.1 用PyPDF2 庫讀寫PDF
文檔.295
8.3.2 用pdfrw 庫讀寫PDF 文檔299
8.3.3 用PyMuPDF 庫讀寫PDF
文檔.301
8.3.4 用PDFMiner 庫提取文字..305
8.3.5 用Camelot 和pdfplumber 庫
提取錶格..306
第9 章 Python 與圖形圖像處理310
9.1 圖片文件簡介.310
9.1.1 常用圖像格式310
9.1.2 BMP 格式圖像的文件結構312
9.2 用Pillow 庫處理圖像315
9.2.1 圖像打開與信息讀取316
9.2.2 嚮圖像中添加圖形和文字.317
9.2.3 圖像的增強效果..318
9.3 Python 圖形繪製..319
9.3.1 用Matplotlib 庫繪圖.319
9.3.2 用pandas 庫繪圖.321
9.3.3 用Python 繪製詞雲圖..323
9.4 在Python 中使用OpenCV 庫.324
9.4.1 OpenCV 庫的基本操作324
9.4.2 OpenCV 庫的高級操作329
9.5 圖片識彆333
9.5.1 使用Tesseract 係統333
9.5.2 使用百度AI 開放平颱.335
案例:識彆審計報告中的錶格..338
第10 章 鼠標、鍵盤控製與程序自動化341
10.1 Windows 程序的運行機製.341
10.1.1 窗口、句柄、消息..341
10.1.2 鼠標、鍵盤操作343
案例:自動畫圖..347
10.2 鼠標與鍵盤操控庫348
10.2.1 PyUserInput 庫348
10.2.2 pynput 庫349
4 目 錄
案例:另類爬蟲..351
10.2.3 PyAutoGUI 庫.354
10.3 Pywinauto 庫與GUI 自動化.357
10.3.1 簡單示例:操控記事本357
10.3.2 Pywinauto 庫的主要用法.358
案例:將GD 文檔轉為PDF 文檔361
案例:將掃描版PDF 文檔轉成
文字型363
10.4 命令行界麵程序控製..366
10.4.1 使用os.system 函數366
10.4.2 使用subprocess 模塊.369
第11 章 自動化運行管理..370
11.1 如何運行腳本文件370
11.1.1 通過CMD 命令窗口運行370
11.1.2 將程序打包成.exe 可執行
文件..371
11.1.3 設計圖形界麵.372
11.2 按計劃自動運行程序..374
11.2.1 使用datetime 模塊..374
11.2.2 使用schedule 庫.. 375
11.2.3 使用Windows 係統計劃
任務. 376
11.3 多任務同時運行.377
11.3.1 單綫程 378
11.3.2 多綫程 378
11.3.3 多進程 382
案例:爬蟲下載文件.. 384
11.4 程序異常及處理.387
11.4.1 常見的程序異常.. 388
11.4.2 捕獲異常並處理.. 388
11.5 收發郵件與遠程控製..390
11.5.1 POP3、SMTP 和IMAP 390
11.5.2 用smtplib 模塊自動發郵件 391
11.5.3 用imaplib 模塊自動收郵件.. 393
11.5.4 用imapclient、pyzmail 庫
自動收郵件. 394
案例:使用Python 遠程控製計算機 395
· · · · · · (
收起)