update python related notes' format

loveunk · loveunk · commit a718a9be1dd1 · 2019-02-14T01:21:20.000+08:00
diff --git a/README.md b/README.md
@@ -28,3 +28,6 @@
 * 机器学习工具
   * [Google Colaboratory](https://colab.research.google.com)：机器学习Jupyter环境
   * [IBM Cognitive Class Lab](https://labs.cognitiveclass.ai)：机器学习环境
+
+
+[回到目录](#numpy)
diff --git a/python/numpy/README.md b/python/numpy/README.md
@@ -297,7 +297,7 @@ array([[False, False, False, False],
 array([ 5,  6,  7,  8,  9, 10, 11])
 ```
 
-选择性负值：
+选择性赋值：
 ``` python
 >>> a[b] = 0
 >>> a
diff --git a/python/pandas/README.md b/python/pandas/README.md
@@ -1,45 +1,44 @@
 # Pandas
 
+Pandas是Python中用于数据处理和分析的库，尤其对于大数据行业的数据清洗很有帮助。
+> 通过带有标签的列和索引，Pandas 使我们可以以一种所有人都能理解的方式来处理数据。它可以让我们毫不费力地从诸如 csv 类型的文件中导入数据。我们可以用它快速地对数据进行复杂的转换和过滤等操作。
+
 <!-- TOC depthFrom:1 depthTo:6 withLinks:1 updateOnSave:1 orderedList:0 -->
 
 - [Pandas](#pandas)
-	- [First step 开始使用Pandas](#first-step-开始使用pandas)
-	- [Data types 数据类型](#data-types-数据类型)
-	- [Read and write data 文件操作](#read-and-write-data-文件操作)
-		- [Read data 导入数据](#read-data-导入数据)
-		- [Write data 保存数据](#write-data-保存数据)
-	- [Data operations 数据操作](#data-operations-数据操作)
-		- [Column operations 列操作](#column-operations-列操作)
-		- [Row operations 行操作](#row-operations-行操作)
-		- [Cell operations 单元格操作](#cell-operations-单元格操作)
-		- [Filter data 数据筛选](#filter-data-数据筛选)
-		- [Index 索引](#index-索引)
-			- [Sort 排序](#sort-排序)
-		- [Applying functions to datasets 对数据集应用函数](#applying-functions-to-datasets-对数据集应用函数)
-		- [Manipulating a dataset's structure 操作数据集的结构](#manipulating-a-datasets-structure-操作数据集的结构)
-		- [Combining datasets 合并数据集](#combining-datasets-合并数据集)
-	- [Plot graphs quickly 快速画图](#plot-graphs-quickly-快速画图)
-	- [References:](#references)
+	- [开始使用Pandas](#开始使用pandas)
+	- [数据类型 Data types](#数据类型-data-types)
+	- [文件操作](#文件操作)
+		- [从文件导入数据](#从文件导入数据)
+		- [保存数据](#保存数据)
+	- [数据操作](#数据操作)
+		- [列操作 Column operations](#列操作-column-operations)
+		- [行操作 Row operations](#行操作-row-operations)
+		- [单元格操作 Cell operations](#单元格操作-cell-operations)
+		- [数据筛选](#数据筛选)
+		- [索引 Index](#索引-index)
+			- [排序 Sort](#排序-sort)
+		- [对数据集应用函数](#对数据集应用函数)
+		- [操作数据集的结构](#操作数据集的结构)
+		- [合并数据集](#合并数据集)
+	- [快速画图](#快速画图)
+	- [References](#references)
 
 <!-- /TOC -->
 
-Pandas是Python中的一个库，主要用于清洗数据。
-
-> 通过带有标签的列和索引，Pandas 使我们可以以一种所有人都能理解的方式来处理数据。它可以让我们毫不费力地从诸如 csv 类型的文件中导入数据。我们可以用它快速地对数据进行复杂的转换和过滤等操作。
-
-## First step 开始使用Pandas
+## 开始使用Pandas
+对于使用 _Python_ 库，第一步必然是`import`：
 ``` python
 import pandas as pd
-df = pd.read_csv(csv_path)
 ```
 
-## Data types 数据类型
+## 数据类型 Data types
 Pandas 基于两种数据类型，`series` 和 `dataframe`。
 * **`series`** 是一种一维的数据类型，其中的每个元素都有各自的标签。可以当作一个由带标签的元素组成的 numpy 数组。标签可以是数字或者字符。
 * **`dataframe`** 是一个二维的、表格型的数据结构。`Pandas` 的 `dataframe` 可以储存许多不同类型的数据，并且每个轴都有标签。你可以把它当作一个 `series` 的字典。
 
-## Read and write data 文件操作
-### Read data 导入数据
+## 文件操作
+### 从文件导入数据
 * `read_csv()`：读取csv文件为`dataframe`
   ``` python
   # Reading a csv into Pandas.
@@ -49,15 +48,15 @@ Pandas 基于两种数据类型，`series` 和 `dataframe`。
 * `df.head()`：查看前5行数据
 * `df.tail()`：查看前最后5行数据
 
-### Write data 保存数据
+### 保存数据
 * `to_csv()`：`dataframe`存入csv文件
   ``` python
   # Reading a csv into Pandas.
   df.to_csv('new.csv')
   ```
 
-## Data operations 数据操作
-### Column operations 列操作
+## 数据操作
+### 列操作 Column operations
 * 获取一列，返回的是`series`：
   * `df['rain_octsep']`
   * `df.rain_octsep`：也像访问属性一样访问列
@@ -69,15 +68,15 @@ df.columns = ['water_year','rain_octsep', 'outflow_octsep',
               'rain_junaug', 'outflow_junaug']
 ```
 
-### Row operations 行操作
+### 行操作 Row operations
 * `len(df)`：返回数据集的总行数
 
-### Cell operations 单元格操作
+### 单元格操作 Cell operations
 * `df.ix[i, j]`：返回`i`行`j`列的单元格数据，`i`、`j`可以是`index`或者`label`
 * `df.ix[i0:i1, j0:j1]`：支持`slicing`，返回一个sub-dataframe
 * `df.['label'].unique()`：获得唯一的值列表
 
-### Filter data 数据筛选
+### 数据筛选
 * 根据column范围筛选数据（`布尔过滤 boolean masking`）：
   * **注意**：条件里不能用 and 关键字，因为会引发操作顺序的问题。必须用 & 和圆括号。
   * 当使用字符串过滤时，需要用`.str.[string method]`，而不能直接在字符串上调用字符方法。
@@ -87,7 +86,7 @@ df[(df.rain_octsep < 1000) & (df.outflow_octsep < 4000)]
 df[df.water_year.str.startswith('199')] # 使用字符串过滤
 ```
 
-### Index 索引
+### 索引 Index
 可以根据索引来获取某一行，而且获取行数据的方法是根据标签的类型变化而变化的。
 
 * 如果标签是数字型的，可以通过 iloc 来引用：
@@ -105,15 +104,15 @@ df[df.water_year.str.startswith('199')] # 使用字符串过滤
   ```
 * 还有一个引用列的常用常用方法 `ix` 。`loc` 是基于标签的，而 `iloc` 是基于数字的，而 `ix` 是基于标签的查询方法，但它同时也支持数字型索引作为备选。**注意**：`ix` 具有轻微的不可预测性，它所支持的数字型索引只是备选，可能会导致 `ix` 产生一些奇怪的结果，比如将一个数字解释为一个位置。而使用 `iloc` 和 `loc` 会很安全、可预测。但 `ix` 比 `iloc` 和 `loc` 要快一些。
 
-#### Sort 排序
+#### 排序 Sort
 将索引排序通常会很有用，在 Pandas 中，我们可以对 dataframe 调用 sort_index 方法进行排序。
 ``` python
 df.sort_index(ascending=False)
 ```
 
 当将一列设置为索引的时候，它就不再是数据的一部分了。如果你想将索引恢复为数据，调用`set_index` 相反的方法 `reset_index` 即可：
 
-### Applying functions to datasets 对数据集应用函数
+### 对数据集应用函数
 有时你想对数据集中的数据进行改变或者某种操作。比方说，你有一列年份的数据，你需要新的一列来表示这些年份对应的年代。_Pandas_ 中有两个非常有用的函数， `apply` 和 `applymap` 。
 ``` python
 def base_year(year):
@@ -125,13 +124,13 @@ df['year'] = df.water_year.apply(base_year)
 df.head(5)
 ```
 
-### Manipulating a dataset's structure 操作数据集的结构
+### 操作数据集的结构
 * groupby()
 * max() 、 min() 、mean()
 * unstack()
 * pivot()：旋转
 
-### Combining datasets 合并数据集
+### 合并数据集
 将有两个相关联的数据集放在一起：
 ``` python
 rain_jpn = pd.read_csv('jpn_rain.csv')
@@ -142,14 +141,16 @@ uk_jpn_rain.head(5)
 
 需要通过 on 关键字来指定需要合并的列。通常你可以省略这个参数，Pandas 将会自动选择要合并的列。
 
-## Plot graphs quickly 快速画图
+## 快速画图
 Matplotlib 很棒，但是想要绘制出还算不错的图表却要写不少代码，而有时你只是想粗略的做个图来探索下数据，搞清楚数据的含义。Pandas 通过 plot 来解决这个问题：
 ``` python
 uk_jpn_rain.plot(x='year', y=['rain_octsep', 'jpn_rainfall'])
 ```
 <p align="center">
-<img src="http://liubj2016.github.io/Akuan/images/tu.png" />
+<img src="https://liubj2016.github.io/Akuan/images/tu.png" />
 </p>
 
-## References:
+## References
 * [An Introduction to Scientific Python – Pandas](http://www.datadependence.com/2016/05/scientific-python-pandas/)
+
+[回到目录](#pandas)
diff --git a/python/python-basic/README.md b/python/python-basic/README.md
@@ -331,3 +331,5 @@ with open("example.txt", "w") as file:
 ### Delete a File or Folder 删除文件或目录
 * 删除一个文件或目录：
 	* `os.remove("filename_or_foldername")`
+
+[回到目录](#python基础)