PL/Python 编写用户自定义函数:在 SQL 中运行机器学习推理
使用 PL/Python 语言扩展创建 UDF,在数据库内部直接调用 scikit-learn 等 Python 库进行模型预测,避免数据搬运。 · 难度:入门 · +10XP
PL/Python 与机器学习推理
PL/Python 是 PostgreSQL 的过程语言扩展,允许在 SQL 函数中嵌入 Python 代码。你可以加载预训练的机器学习模型(pickle 文件),在数据库内直接对行数据进行预测,无需将数据传输到外部应用。这对于实时评分、推荐系统非常高效。注意:需要安装 plpython3u 扩展,并配置数据库允许非超级用户创建语言。
CREATE EXTENSION plpython3u;
CREATE FUNCTION predict_risk(income NUMERIC, age INT) RETURNS TEXT AS $$
import pickle
import os
model_path = '/var/lib/postgresql/model.pkl'
with open(model_path, 'rb') as f:
model = pickle.load(f)
prob = model.predict_proba([[income, age]])[0][1]
return 'high' if prob > 0.5 else 'low'
$$ LANGUAGE plpython3u;
-- 使用函数
SELECT predict_risk(75000, 45);