《Pandas數(shù)據(jù)處理》是Python數(shù)據(jù)分析入門書,每個概念都通過簡單實例來闡述,便于讀者理解與上手。具體內(nèi)容包括:Python及Pandas基礎知識,加載和查看數(shù)據(jù)集,Pandas的DataFrame對象和Series對象,使用matplotlib、seaborn和Pandas提供的繪圖方法為探索性數(shù)據(jù)分析作圖,連接與合并數(shù)據(jù)集,處理缺失數(shù)據(jù),清理數(shù)據(jù),轉換數(shù)據(jù)類型,處理字符串,應用函數(shù),分組操作,擬合及評估模型,正則化方法與聚類技術,等等。
項目一 處理單個數(shù)據(jù)框
任務一 統(tǒng)計數(shù)據(jù)框中的數(shù)據(jù)
活動一 創(chuàng)建學生成績表
活動二 統(tǒng)計各學科的得分信息
活動三 查價高的10個訂單
任務二 查詢和篩選數(shù)據(jù)框中的數(shù)據(jù)
活動一 篩選出計算機老師
活動二 查找聯(lián)考專業(yè)成績在350分以上的計算機專業(yè)男生
任務三 處理數(shù)據(jù)框中的字符串
活動一 找出姓張的同學
活動二 計算老師的上課時間
項目二 清洗數(shù)據(jù)
任務一 處理數(shù)據(jù)中的缺失值和重復值
活動一 處理訂單數(shù)據(jù)中的缺失值
活動二 處理銷售數(shù)據(jù)中的重復值
任務二 轉換數(shù)據(jù)
活動一 規(guī)范化學生考試成績
活動二 為學生評獎
活動三 規(guī)范化成績表標題
項目三 分組統(tǒng)計數(shù)據(jù)
任務一 使用內(nèi)置函數(shù)對數(shù)行分組統(tǒng)計
活動一 為各類同學準備獎金
活動二 找出銷量少的產(chǎn)品
活動三 統(tǒng)計各行業(yè)每年的上市公司數(shù)量
任務二 使用自定義函數(shù)對數(shù)行分組統(tǒng)計
活動一 統(tǒng)計職位信息
活動二 清洗網(wǎng)店銷售數(shù)據(jù)
活動三 統(tǒng)計各班的成績結構
項目四 從多個數(shù)據(jù)框獲取信息
任務一 合并多個數(shù)據(jù)框
活動一 去掉停用詞
活動二 選取男喜歡的電影
任務二 拼接多個數(shù)據(jù)框
活動一 統(tǒng)計各競賽項目的人數(shù)
活動二 統(tǒng)計各年新生兒的男女比例
項目五 改變數(shù)據(jù)框結構
任務一 展開和收折數(shù)據(jù)列
活動一 按年級統(tǒng)計各參賽項目的男女生人數(shù)
活動二 查詢學生成績
任務二 創(chuàng)建數(shù)據(jù)透視表和交叉表
活動一 按班級分析成績結構
活動二 統(tǒng)計各地區(qū)不同風格的電影數(shù)量
項目六 繪制圖表
任務一 繪制單個圖表
活動一 繪制各班專業(yè)均成績柱狀圖
活動二 繪制股票收益率折線圖
任務二 繪制多個圖表
活動一 在不同子圖繪制各班的成績統(tǒng)計圖
活動二 按分數(shù)段繪制各班的人數(shù)占比
項目七 處理時間序列
任務一 對時間序列采樣
活動一 統(tǒng)計上證指數(shù)月度收益率
活動二 按季度統(tǒng)計股均交易量和交易額
任務二 處理移動窗口
活動一 制作股票的移均線
活動二 制作股票價格與上證指數(shù)間的收益相關圖
項目八 綜合應用
任務一 使用數(shù)據(jù)透視表統(tǒng)計數(shù)據(jù)
活動一 統(tǒng)均錄取分數(shù)高的前10所學校
活動二 統(tǒng)計文理科歷均錄取分數(shù)和高錄取分數(shù)
任務二 使用分組統(tǒng)計數(shù)據(jù)
活動一 統(tǒng)計各專業(yè)歷均錄取分數(shù)
活動二 統(tǒng)計各地區(qū)高錄取分數(shù)均值