一、Pandas之to_numeric函数
pandas.to_numeric参数含义
pandas.to_numeric 是 Pandas 提供的用于将对象类型的数据转换为数值类型的函数。它可以处理 Series 或一维数组,并尝试将数据转换为整数或者浮点数。如果数据中包含无法转换的值,可以根据参数设置不同的处理方式。
pandas.to_numeric(arg, errors='raise', downcast=None)
参数解释
- arg: 类型:list, tuple, 1-d array, or Series。说明:待转换为数值类型的数据。
- errors: 类型:{‘ignore’, ‘raise’, ‘coerce’}, default ‘raise’。说明:指定错误处理方式。
- - 'raise': 如果无法转换,将抛出错误。
- - 'coerce': 将无法转换的值替换为NaN。
- - 'ignore': 保留无法转换的值,结果仍为原始输入类型。
- downcast: 类型:{‘integer’, ‘signed’, ‘unsigned’, ‘float’}, default None。说明:将结果向下转换为指定类型。
二、示例代码
将字符串转换为数值类型
import pandas as pd
# 创建一个示例 Series
data = pd.Series(['1', '2', None, '4', '5'])
# 使用 pandas.to_numeric 将对象类型数据转换为数值类型
numeric_data = pd.to_numeric(data)
print("Original Series:")
print(data)
print("\nConverted to Numeric:")
print(numeric_data)
输出结果如下
Original Series:
0 1
1 2
2 None
3 4
4 5
dtype: object
Converted to Numeric:
0 1.0
1 2.0
2 NaN
3 4.0
4 5.0
dtype: float64