
SAS与R如何连接Oracle、DB2
职业是数据分析师,近2年给商业银行做数据分析和数据挖掘。在商业银行中,数据库多用Oracle和DB2,分析工具多使用SAS和R。如何将分析工具SAS、R与数据库Oracle、DB2建立连接,是数据分析和数据挖掘的第一步。本文聚焦“连接”这个主题,分析了四种不同的“相互连接”情况。
一、SAS与Oracle连接
(一)方式1:直接连接
第一步:先找到tnsnames.ora(配置文件),一般存在放在:app\orcl\product\12.1.0\dbhome_1\NETWORK\ADMIN下。查看红色部分,
ORCL =
(DESCRIPTION =
(ADDRESS = (PROTOCOL = TCP)(HOST = localhost)(PORT = 1521))
(CONNECT_DATA =
(SERVER = DEDICATED)
(SERVICE_NAME = orcl)
)
)
'orcl'就是数据库的一个TNS service name。
第二步:打开SAS basic。有两种方式在SAS中新建逻辑库,从而将SAS与oracle连接:
1、使用libname命令:
libname orclib oralcle user='c##liulihua' pw='liulihua21' path='orcl';
备注:(1)oralib是新建SAS逻辑库的名称,可以自由命名;(2)oracle是关键字,不能改;(3)user和pw就是登录oracle数据库的用户名和密码;(4)'orcl'就是上面的TNS service name。
查看下连接效果:在SAS的左边的“SAS资源管理器—逻辑库—当前逻辑库"中,看到了orclib,说明连接成功。
查看数据的情况:
data cust_asset_info;
set orclib.cust_asset_info;
drop is_marriage etl_dt;/*丢弃两个变量*/
run;
proc print data=cust_asset_info;/*输出结果*/
run;
如果需要断开连接,删除逻辑库就成,在SAS编辑器中输入如下命令即可:libname orclib; 。
2、使用菜单栏:
在“SAS——工具——新建逻辑库”。输入相应的逻辑库名称,选择引擎,输入用户名、密码、TNS service name等,就能实现跟上面libname命令一样的效果。
(二)方式2:通过ODBC。分两步:
第一步:配置ODBC。
在“控制面板——管理工具——数据源(ODBC)——用户DSN”,点击右边的“添加”,选择“Oralce in OraDB12Home1”,如下图,点击“完成”。
再选择右边的“配置”,如下图:
备注:(1)Data Source Name(数据源名称),自己随意填写;(2)TNS Service Name就是上面的 orcl,不能是别的;(3)User ID就是登录oralce数据库的用户名。将上面三项填写完了后,点击右边的“Test Connection”,输入完登录密码后,就会提示连接成功。
第二步:用ODBC将SAS与Oracle连接。也有两种方式:
1、使用libname命令:
libname mylib odbc user='c##liulihua' pw='liulihua21' datasrc='oracle';
与上面libname的命令有两点不同:(1)逻辑库mylib后面是odbc,不是oracle;(2)datasrc是数据源名称,是上面配置的oracle,不是orcl。
2、使用菜单栏:
在“SAS——工具——新建逻辑库”中,输入新建逻辑库的名称,选择引擎ODBC、数据源,输入用户名和密码后,就将SAS与Oracle连接上了。
ODBC
小结:SAS与oracle数据库连接有两种方式:直接连接和使用ODBC。而每一种方式下,都可以通过使用libname命令和菜单栏两种方式来新建逻辑库,从而实现SAS与oracle的连接。
二、R语言与Oracle连接
目前R语言连接Oracle,主要通过RODBC包来实现,分两步来实现:
第一步:配置ODBC。
方式见本文一(二)部分,配置完成后的界面如下:
第二步:使用RODBC包。
install.packages("RODBC") ##下载程序包
library(RODBC) ##加载程序包
##创建数据库连接,填写用户名和密码,此处的oracle为上图中配置的数据源名称
myconn<- odbcConnect("oracle",uid="c##liulihua",pwd="liulihua21")
##访问cust_asset_info表
asset<- sqlQuery(myconn,"select * from cust_asset_info")
head(asset)
##关闭数据库连接
close(myconn)
运行完成后,输出的结果如下:
三、SAS与DB2连接
目前SAS连接DB2的主要方式也是通过ODBC。
第一步:配置ODBC。
在“控制面板——管理工具——数据源(ODBC)——用户DSN”,点击右边的“添加”,选择“IBM DB2 ODBC DRIVER - DB2COPY1”,如下图,点击“完成”。
再选择右边的“配置”,输入相应的数据源名称、用户名后,点击“Test Connection”,测试成功后,配置完成后界面如下:
第二步:连接。有菜单栏和使用libname命令两种方式:
1、使用libname命令来连接:
libname icrmapp db2 user='db2_llh' pw='liulihua21' datasrc='ICRM' schema='ADMINISTRATOR' ;
备注:(1)icrmapp是新建的逻辑库名称,自己随意命名;(2)db2是关键字;(3)user和pw是登录DB2的用户名和密码;(4)datasrc是上图中配置ODBC的数据库源名称;(5) schema是在数据库中存放数据的模式名。
2、通过菜单栏的方式建立连接:
在“SAS——工具——新建逻辑库”中,输入相应的逻辑库名称、数据源名称、用户名、密码等,点击“完成”即可。
如此就将SAS与DB2连接上了,可以在逻辑库icrmapp中查看、修改DB2的数据了。
四、R语言与DB2连接
方式同与oracle连接一样,先配置好ODBC,再使用RODBC连接。
##R语言连接DB2数据库
library(RODBC) #加载程序包
##创建数据库连接,填写用户名和密码,此处的icrm为上图中配置的数据源名称icrm
connect<-odbcConnect("icrm",uid="db2_llh",pwd="liulihua21")
##读取cust_asset_info表
asset2<- sqlQuery(connect,"select * from cust_asset_info")
head(asset2)
##关闭数据库连接
close(connect)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
MySQL 执行计划中 rows 数量的准确性解析:原理、影响因素与优化 在 MySQL SQL 调优中,EXPLAIN执行计划是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 对象的 text 与 content:区别、场景与实践指南 在 Python 进行 HTTP 网络请求开发时(如使用requests ...
2025-09-15CDA 数据分析师:激活表格结构数据价值的核心操盘手 表格结构数据(如 Excel 表格、数据库表)是企业最基础、最核心的数据形态 ...
2025-09-15Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05