是否可以忽略引号中的分隔符(获取错误)?

2022-04-14 00:00:00 python postgresql psycopg2

问题描述

我正在尝试使用COPY_FROM命令(在Postgres中使用COPY命令的函数)以类似CSV的结构将数据行加载到postgres中。我的数据用逗号分隔(不幸的是,因为我不是数据所有者,所以不能只更改分隔符)。当我尝试加载行时遇到问题,该行的值用引号引起来,其中包含逗号(即该逗号不应视为分隔符)。

例如,此行数据没有问题:

",Madrid,SN,,SEN,,,SN,173,157"

此行数据不正确:

","Dominican, Republic of",MC,,YUO,,,MC,65,162",

部分代码:

    conn = get_psycopg_conn()
    cur = conn.cursor()

    _io_buffer.seek(0) #This buffer is holding the csv-like data
    cur.copy_from(_io_buffer, str(table_name), sep=',', null='', columns=column_names)
    conn.commit()

解决方案

It looks like copy_from doesn't expose the csv mode or quote options,其中are available form the underlying PostgreSQL COPY command。因此,您需要打补丁2来添加它们,或者use copy_expert

我还没有试过,但类似于

curs.copy_expert("""COPY mytable FROM STDIN WITH (FORMAT CSV)""", _io_buffer)

可能就足够了。

相关文章