Oracle链接服务器导致SQL Server异常终止

现象

首先该链接服务器是使用 OraOLEDB provider (OLEDB Provider for Oracle)创建的,在使用该链接服务器的SQL语句中出现特殊字符 “–”时,例如,SELECT * FROM OPENQUERY(LINKEDSERVER_OA,‘SELECT * FROM student WHERE name = ‘’王‘’ –一些注释’),就会导致SQL Server服务异常终止。 在Windows 系统事件日志中看到“SQL Server (MSSQLSERVER) 服务意外终止,它已执行此操作 X 次”的错误消息。另外SQL Server会生成DUMP文件。  注意,软硬件故障、杀毒软件、安全软件等都会导致SQL Server进程异常终止并生成EXCEPTION_ACCESS_VIOLATION的DUMP。因此一定要通过WinDbg分析DUMP文件,只有看到下面的程序运行堆栈才能确定是链接服务器导致的。

原因

首先这是Oracle的链接服务器提供程序(OraOLEDB Provider)的BUG,当遇到特殊字符“–”时,错误地修改了不属于它的堆内存,如果进程内的堆函数不稳定,为了防止数据损坏,操作系统会自动关闭该进程。 当该链接服务器提供程序配置为“允许进程内”,SQL Server进程将一起关闭。详细请参考微软官方文档:https://learn.microsoft.com/en-US/troubleshoot/sql/database-engine/linked-servers/crashes-run-oracle-linked-server-query。

解决

  1. 去掉SQL语句中的特殊字符,如果是为了注释用的,可以替换成“/**/”;
  2. Oracle官网上下载最新的链接服务器提供程序,https://www.oracle.com/database/technologies/odac-downloads.html;
  3. 禁用该提供程序的“允许进程内”选项(重启SQL Server服务后生效)。链接服务器提供程序进程作为独立的进程运行,被终止时不会导致SQL Server进程的终止,把影响控制在局部。