将存储过程SELECT结果读入PANAS数据帧

已给予:

CREATE PROCEDURE my_procedure
    @Param INT
AS
    SELECT Col1, Col2
    FROM Table
    WHERE Col2 = @Param

我希望能够将其用作:

import pandas as pd
import pyodbc

query = 'EXEC my_procedure @Param = {0}'.format(my_param)
conn = pyodbc.connect(my_connection_string)

df = pd.read_sql(query, conn)

但这会引发错误:

ValueError: Reading a table with read_sql is not supported for a DBAPI2 connection. Use an SQLAlchemy engine or specify an sql query

SQLAlChemy也不起作用:

import sqlalchemy
engine = sqlalchemy.create_engine(my_connection_string)
df = pd.read_sql(query, engine)

抛出:

ValueError: Could not init table 'my_procedure'

我实际上可以直接使用pyodbc执行该语句:

cursor = conn.cursor()
cursor.execute(query)
results = cursor.fetchall()
df = pd.DataFrame.from_records(results)

是否有办法将这些过程结果直接发送到DataFrame?


解决方案

改用Read_SQL_Query()。

看起来@joris(+1)已经在问题正下方的评论中看到了这一点,但我没有看到,因为它不在回答部分中。

使用SQLA引擎--除了SQLAlChemy之外,Pandas只支持SQLite。然后使用read_sql_query()而不是Read_SQL()。后者试图自动检测您正在传递的是表名还是成熟的查询,但它在使用关键字‘exec’时似乎做得不是很好。使用READ_SQL_QUERY()跳过自动检测,并允许您显式指示您正在使用查询(还有一个READ_SQL_TABLE())。

import pandas as pd
import sqlalchemy

query = 'EXEC my_procedure @Param = {0}'.format(my_param)
engine = sqlalchemy.create_engine(my_connection_string)
df = pd.read_sql_query(query, engine)

相关文章