« Oracle自动存储管理 ASMLib的支持变化 | Blog首页 | DBA手记:OEM罪几何?-空间监控的性能问题 »
DBA手记:Failed Login Count带来的性能问题
链接:https://www.eygle.com/archives/2011/02/failed_login_count.html
在《Oracle DBA手记 I》中,最后一则案例中,曾经提到关于Failed Login
Count的问题,简要的引用一下用来承前启后。
在Oracle Database 10g中,默认的用户管理上有个小的改进,就是对默认的失败登录次数的限制,用户的PROFILE中,FAILED_LOGIN_ATTEMPTS设置口令失败尝试次数为10,如果连续进行了10次口令失败的登录尝试,用户账号将被锁定。
SQL> select * from dba_profiles where resource_name=' FAILED_LOGIN_ATTEMPTS';
PROFILE RESOURCE_NAME RESOURCE LIMIT
---------------- -------------------------------- -------- ------------------------------
DEFAULT FAILED_LOGIN_ATTEMPTS PASSWORD 10
那么这里的10次登陆失败计数是如何完成的呢?查看底层表USER$的字段,其中LCOUNT字段就是用来完成这个功能的:
SQL> desc user$
Name Null? Type
----------------------------- -------- --------------------
USER# NOT NULL NUMBER
NAME NOT NULL VARCHAR2(30)
TYPE# NOT NULL NUMBER
PASSWORD VARCHAR2(30)
DATATS# NOT NULL NUMBER
TEMPTS# NOT NULL NUMBER
DEFROLE NOT NULL NUMBER
DEFGRP# NUMBER
DEFGRP_SEQ# NUMBER
ASTATUS NOT NULL NUMBER
LCOUNT NOT NULL NUMBER
。。。。。。。。
可以通过sql.bsq文件来进一步确认,这个文件提示lcount正是失败的登录尝试计数(count of failed login
attempts):
在最近的一次客户数据库性能优化中,再次遇到了类似的一个案例。这是一个Oracle Database 11g 11.1.0.6的数据库环境:
在这个数据库的SQL ordered by Gets诊断中,发现了一条可疑的SQL,如下图所示,这个SQL的逻辑读排在第三位,占整体数据库逻辑读的14.23%,其SQL Module是: Oracle
Enterprise Manager.Metric Engine:
在这里我想强调一点的是,很多时候DBA在遇到数据库系统自身调用的内部SQL时,常常下意识的选择回避,认为数据库的自身功能不会存在太大的问题,而事实往往相反。我的一个座右铭是,决不放过任何一句可疑的SQL代码。这里的Module显示,该SQL是OEM的Metric引擎发起的,一个数据库的内部功能在任何时候都不应该消耗大量的系统资源。
格式化一下该SQL代码得到如下完整输出:
SELECT TO_CHAR(current_timestamp AT TIME ZONE 'GMT',
'YYYY-MM-DD HH24:MI:SS TZD') AS curr_timestamp,
COUNT(username) AS failed_count
FROM sys.dba_audit_session
WHERE returncode != 0
AND TO_CHAR(timestamp, 'YYYY-MM-DD HH24:MI:SS') >=
TO_CHAR(current_timestamp - TO_DSINTERVAL('0 0:30:00'), 'YYYY-MM-DD HH24:MI:SS')
从这段代码可以看到,该SQL是用于监控和计算失败登陆次数(failed_count)的,这一监控结果可以在某用户发生失败登陆尝试时给出告警。这里的DBA_AUDIT_SESSION用于记录审计对于数据库所有的CONNECT和DISCONNECT操作,底层表为AUD$。在Database / Grid Control中如果启用了Failed Login Count Metric监控,就可能遇到这个问题,一个建议的解决方案就是停用这个监控。
但是为什么会出现这样的问题呢?检查这个SQL的执行计划,可以发现一些端倪,如下图所示,对于AUD$表的访问出现了一个全表扫描,然后进行NESTED LOOPS OUTER连接:
如果此处AUD$表的数据量较大,就可能产生非常大量的逻辑读,影响性能,恰恰AUD$表经常会存在大量的数据,这就是原因所在。在新版本中,Oracle正在尝试通过对该表进行分区,提升数据清理效率,并通过适当的索引提升访问性能。
对于DBA_AUDIT_SESSION的各种访问都可能遇到类似的问题,另外一则报告的问题SQL如下:
select a.CURRENT_AUDIT_SETTING, b.TOTAL_SUCC_LOGINS
from (select value as CURRENT_AUDIT_SETTING
from v$parameter
where name = 'audit_trail') a,
(select count(*) as TOTAL_SUCC_LOGINS
from dba_audit_session
where (action_name = 'LOGON' and returncode = 0 or
action_name like 'LOGOFF%')
and timestamp > EMIP_BIND_START_DATE
and timestamp < EMIP_BIND_END_DATE) b
这段SQL在客户环境中的执行计划如下图所示,类似的执行计划和全表访问,导致了SQL执行成本的上升,极大的影响了性能:
任何时候,我们都应当对系统的功能与SQL心存警惕,不能掉以轻心。
历史上的今天...
>> 2008-02-18文章:
>> 2006-02-18文章:
>> 2005-02-18文章:
By eygle on 2011-02-18 10:31 | Comments (1) | Case | SQL.PLSQL | 2730 |
心思够缜密的,学习受教了