在 Pandas 中转换 SAS 日期时间

2022-01-08 00:00:00 python pandas datetime sas

问题描述

我正在使用 Pandas 通过 read_sas

SAS 数据集中有一个 datetime 变量,在 Pandas 中显示为:

There is a datetime variable in the SAS dataset, which appears in Pandas as:

1.775376e+09

将其转换为 str 后,日期为:

Once I convert it to str the date is:

1775376002.0

SAS 中的相应日期(不在我的 Pandas 数据集中)似乎是 DATETIME21.2

The corresponding date in SAS (not in my Pandas dataset) appears to be a DATETIME21.2

04APR2016:08:00:02.00

我尝试使用转换它

pd.to_datetime(df.mysasdate,format='%d%m%Y%H%M%S') 没有成功

TypeError: 'float' object is unsliceable

有什么想法吗?谢谢!


解决方案

SAS 日期值

是一个值,表示从 1960 年 1 月 1 日到指定日期之间的天数.链接

is a value that represents the number of days between January 1, 1960, and a specified date. link

所以你可以转换数字 to_timedelta 并添加 date 1960-01-01 00:00:00

So you can convert number to_timedelta and add date 1960-01-01 00:00:00

df = pd.DataFrame({'mysasdate':[1775376002.0, 1775377002.0]})
print (df)
      mysasdate
0  1.775376e+09
1  1.775377e+09

print (pd.to_timedelta(df['mysasdate'], unit='s') + pd.datetime(1960, 1, 1)) 
0   2016-04-04 08:00:02
1   2016-04-04 08:16:42
Name: mysasdate, dtype: datetime64[ns]

相关文章