将存储过程SELECT结果读入PANAS数据帧

2022-04-24 00:00:00 pandas sqlalchemy pyodbc sql-server stored-procedures

已给予：

CREATE PROCEDURE my_procedure
    @Param INT
AS
    SELECT Col1, Col2
    FROM Table
    WHERE Col2 = @Param

我希望能够将其用作：

import pandas as pd
import pyodbc

query = 'EXEC my_procedure @Param = {0}'.format(my_param)
conn = pyodbc.connect(my_connection_string)

df = pd.read_sql(query, conn)

但这会引发错误：

ValueError: Reading a table with read_sql is not supported for a DBAPI2 connection. Use an SQLAlchemy engine or specify an sql query

SQLAlChemy也不起作用：

import sqlalchemy
engine = sqlalchemy.create_engine(my_connection_string)
df = pd.read_sql(query, engine)

抛出：

ValueError: Could not init table 'my_procedure'

我实际上可以直接使用pyodbc执行该语句：

cursor = conn.cursor()
cursor.execute(query)
results = cursor.fetchall()
df = pd.DataFrame.from_records(results)

是否有办法将这些过程结果直接发送到DataFrame？

解决方案

改用Read_SQL_Query()。

看起来@joris(+1)已经在问题正下方的评论中看到了这一点，但我没有看到，因为它不在回答部分中。

使用SQLA引擎--除了SQLAlChemy之外，Pandas只支持SQLite。然后使用read_sql_query()而不是Read_SQL()。后者试图自动检测您正在传递的是表名还是成熟的查询，但它在使用关键字‘exec’时似乎做得不是很好。使用READ_SQL_QUERY()跳过自动检测，并允许您显式指示您正在使用查询(还有一个READ_SQL_TABLE())。

import pandas as pd
import sqlalchemy

query = 'EXEC my_procedure @Param = {0}'.format(my_param)
engine = sqlalchemy.create_engine(my_connection_string)
df = pd.read_sql_query(query, engine)

相关文章