```markdown

使用 `pd.read_excel` 读取 Excel 文件并设置第一列为索引

在使用 pandas 处理 Excel 数据时，常常需要将某一列设定为数据框（DataFrame）的索引。pandas 提供了非常方便的 read_excel 函数来读取 Excel 文件，并且可以通过 index_col 参数将特定列设为索引。

本文将介绍如何使用 pd.read_excel 函数，将 Excel 文件的第一列作为索引列。

基本用法

假设我们有一个 Excel 文件 data.xlsx，其内容如下：

| ID | Name | Age | City | | --- | ---- | --- | ----- | | 1 | Tom | 22 | Beijing | | 2 | Lucy | 25 | Shanghai | | 3 | John | 28 | Shenzhen |

在这个例子中，ID 列是我们想要设定为索引的列。

pd.read_excel 的 index_col 参数用于指定哪一列作为索引。它接受列的名称或者列的索引（从 0 开始的整数）。

```python import pandas as pd

df = pd.read_excel('data.xlsx', index_col=0)

print(df) ```

text Name Age City ID 1 Tom 22 Beijing 2 Lucy 25 Shanghai 3 John 28 Shenzhen

在这个例子中，ID 列被设定为索引，数据框中的行现在是基于 ID 进行标识的。

如果 Excel 文件中有多个工作表，并且我们希望读取其中一个工作表并将其第一列设置为索引，可以按如下方式操作：

python df = pd.read_excel('data.xlsx', sheet_name='Sheet1', index_col=0)

在这个例子中，我们指定了读取 Sheet1 工作表，并将第一列 ID 作为索引。

使用 pd.read_excel 的 index_col 参数，可以方便地将 Excel 文件中的某一列设置为索引。这在数据清洗和预处理时是非常有用的技巧。通过合理使用该参数，可以直接在读取数据时避免后续的索引设置步骤，提高代码的简洁性和执行效率。 ```