tbordaz commented 8 years ago

Debug session {{{ (gdb) thread 3 [Switching to thread 3 (Thread 0x7fbc34ff9700 (LWP 27716))] #0 __lll_lock_wait () at ../nptl/sysdeps/unix/sysv/linux/x86_64/lowlevellock.S:136 136 2: movl %edx, %eax (gdb) where #0 __lll_lock_wait () at ../nptl/sysdeps/unix/sysv/linux/x86_64/lowlevellock.S:136 #1 0x0000003bee409c8c in _L_lock_1024 () from /lib64/libpthread.so.0 #2 0x0000003bee409c35 in __pthread_mutex_lock (mutex=mutex@entry=0x1ff0ce8) at pthread_mutex_lock.c:105 #3 0x0000003c530233b9 in PR_Lock (lock=lock@entry=0x1ff0ce8) at ../../../nspr/pr/src/pthreads/ptsynch.c:174 #4 0x0000003c530239ab in PR_EnterMonitor (mon=0x1ff0ce0) at ../../../nspr/pr/src/pthreads/ptsynch.c:529 #5 0x00007fbc563ee811 in dblayer_lock_backend (be=0x1ff2b80) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/back-ldbm/dblayer.c:3904 #6 0x00007fbc563ede82 in dblayer_txn_begin (be=0x1ff2b80, parent_txn=0x0, txn=0x7fbc34ff62c0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/back-ldbm/dblayer.c:3623 #7 0x00007fbc5643f4f2 in ldbm_back_modify (pb=0x7fbc080025d0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/back-ldbm/ldbm_modify.c:532 #8 0x00007fbc59b5b80e in op_shared_modify (pb=0x7fbc080025d0, pw_change=0, old_pw=0x0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:1054 #9 0x00007fbc59b5a431 in modify_internal_pb (pb=0x7fbc080025d0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:599 #10 0x00007fbc59b59fb1 in slapi_modify_internal_pb (pb=0x7fbc080025d0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:454 #11 0x00007fbc568a1712 in dna_update_shared_config (config_entry=0x225a4b0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:2555 #12 0x00007fbc5689fa43 in dna_notice_allocation (config_entry=0x225a4b0, new=200, last=0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:1707 #13 0x00007fbc568a5b8f in dna_release_range (range_dn=0x7fbc080008e0 "ou=ranges,dc=example,dc=com", lower=0x7fbc34ff88a8, upper=0x7fbc34ff88b0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:4530 #14 0x00007fbc568a53f1 in dna_extend_exop (pb=0x7fbc34ff8ae0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:4311 #15 0x00007fbc59b6f646 in plugin_call_exop_plugins (pb=0x7fbc34ff8ae0, oid=0x7fbc08001660 "2.16.840.1.113730.3.5.10") at ../workspaces/389-master-branch/ds/ldap/servers/slapd/plugin.c:510 #16 0x00000000004220b7 in do_extended (pb=0x7fbc34ff8ae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/extendop.c:337 #17 0x00000000004167f9 in connection_dispatch_operation (conn=0x7fbc50180800, op=0x225cb50, pb=0x7fbc34ff8ae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/connection.c:680 #18 0x00000000004188b6 in connection_threadmain () at ../workspaces/389-master-branch/ds/ldap/servers/slapd/connection.c:1743 #19 0x0000003c53028b46 in _pt_root (arg=0x22808a0) at ../../../nspr/pr/src/pthreads/ptthread.c:204 #20 0x0000003bee407d14 in start_thread (arg=0x7fbc34ff9700) at pthread_create.c:309 #21 0x0000003bee0f168d in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:115 # It acquired DNA config lock in read (gdb) frame 13 #13 0x00007fbc568a5b8f in dna_release_range (range_dn=0x7fbc080008e0 "ou=ranges,dc=example,dc=com", lower=0x7fbc34ff88a8, upper=0x7fbc34ff88b0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:4530 (gdb) list dna_release_range,4399 4384 { 4385 int ret = 0; 4386 int match = 0; ... 4396 if (range_dn) { 4397 range_sdn = slapi_sdn_new_dn_byref(range_dn); 4398 4399 dna_read_lock(); # Then update the shared config entry on main suffix (gdb) frame 11 #11 0x00007fbc568a1712 in dna_update_shared_config (config_entry=0x225a4b0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:2555 2555 slapi_modify_internal_pb(pb); (gdb) list 2550,2555 2550 ret = LDAP_OPERATIONS_ERROR; 2551 } else { 2552 slapi_modify_internal_set_pb(pb, config_entry->shared_cfg_dn, 2553 mods, NULL, NULL, getPluginID(), 0); 2554 2555 slapi_modify_internal_pb(pb); (gdb) print config_entry->shared_cfg_dn $6 = 0x22507b0 "dnaHostname=localhost.localdomain+dnaPortNum=42389,ou=ranges,dc=example,dc=com" # But the backend lock is acquired by Thread 4 (LWP 27712) (gdb) frame 5 #5 0x00007fbc563ee811 in dblayer_lock_backend (be=0x1ff2b80) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/back-ldbm/dblayer.c:3904 3904 PR_EnterMonitor(inst->inst_db_mutex); (gdb) print *inst->inst_db_mutex $3 = {name = 0x0, lock = {mutex = {__data = {__lock = 2, __count = 0, __owner = 27712, __nusers = 1, __kind = 3, __spins = 5, __list = {__prev = 0x0, __next = 0x0}}, __size = "\002\000\000\000\000\000\000\000@l\000\000\001\000\000\000\003\000\000\000\005", '\000' <repeats 18 times>, __align = 2}, notified = {length = 0, cv = {{cv = 0x0, times = 0}, {cv = 0x0, times = 0}, {cv = 0x0, times = 0}, {cv = 0x0, times = 0}, {cv = 0x0, times = 0}, {cv = 0x0, times = 0}}, link = 0x0}, locked = 1, owner = 140446353315584}, owner = 140446353315584, cvar = 0x207f760, entryCount = 1} (gdb) thread 4 [Switching to thread 4 (Thread 0x7fbc36ffd700 (LWP 27712))] #0 pthread_rwlock_wrlock () at ../nptl/sysdeps/unix/sysv/linux/x86_64/pthread_rwlock_wrlock.S:86 86 subq $WRITERS_WAKEUP, %rdi (gdb) where #0 pthread_rwlock_wrlock () at ../nptl/sysdeps/unix/sysv/linux/x86_64/pthread_rwlock_wrlock.S:86 #1 0x00007fbc59b9fab1 in slapi_rwlock_wrlock (rwlock=0x207b8d0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/slapi2nspr.c:238 #2 0x00007fbc5689ce34 in dna_write_lock () at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:370 #3 0x00007fbc5689d7e4 in dna_load_shared_servers () at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:736 #4 0x00007fbc568a5168 in dna_config_check_post_op (pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/plugins/dna/dna.c:4231 #5 0x00007fbc59b72820 in plugin_call_func (list=0x1f922b0, operation=561, pb=0x7fbc36ffcae0, call_one=0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/plugin.c:1920 #6 0x00007fbc59b72681 in plugin_call_list (list=0x1f7b100, operation=561, pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/plugin.c:1864 #7 0x00007fbc59b6f443 in plugin_call_plugins (pb=0x7fbc36ffcae0, whichfunction=561) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/plugin.c:438 #8 0x00007fbc5644028e in ldbm_back_modify (pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/back-ldbm/ldbm_modify.c:821 #9 0x00007fbc59b5b80e in op_shared_modify (pb=0x7fbc36ffcae0, pw_change=0, old_pw=0x0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:1054 #10 0x00007fbc59b59dcf in do_modify (pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:387 #11 0x0000000000416667 in connection_dispatch_operation (conn=0x7fbc50180410, op=0x229b370, pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/connection.c:627 #12 0x00000000004188b6 in connection_threadmain () at ../workspaces/389-master-branch/ds/ldap/servers/slapd/connection.c:1743 #13 0x0000003c53028b46 in _pt_root (arg=0x229e050) at ../../../nspr/pr/src/pthreads/ptthread.c:204 #14 0x0000003bee407d14 in start_thread (arg=0x7fbc36ffd700) at pthread_create.c:309 #15 0x0000003bee0f168d in clone () at ../sysdeps/unix/sysv/linux/x86_64/clone.S:115 # It is processing a replicated update of shared config entry (gdb) frame 10 #10 0x00007fbc59b59dcf in do_modify (pb=0x7fbc36ffcae0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/modify.c:387 #warning: Source file is more recent than executable. #387 op_shared_modify ( pb, pw_change, old_pw ); (gdb) print pb->pb_op->o_params.target_address.udn $14 = 0x7fbc18018640 "dnaHostname=localhost.localdomain+dnaPortNum=41389,ou=ranges,dc=example,dc=com" (gdb) print pb->pb_op->o_flags $9 = 968 # dna_config_check_post_op is a BETXN_POSTOP so backend lock is acquired # But tries to recreate the config, that needs the config lock in Write (gdb) frame 1 #1 0x00007fbc59b9fab1 in slapi_rwlock_wrlock (rwlock=0x207b8d0) at ../workspaces/389-master-branch/ds/ldap/servers/slapd/slapi2nspr.c:238 warning: Source file is more recent than executable. 238 ret = pthread_rwlock_wrlock((pthread_rwlock_t *)rwlock); (gdb) print *rwlock $4 = {__data = {__lock = 0, __nr_readers = 1, __readers_wakeup = 0, __writer_wakeup = 0, __nr_readers_queued = 0, __nr_writers_queued = 1, __writer = 0, __shared = 0, __pad1 = 0, __pad2 = 0, __flags = 0}, __size = "\000\000\000\000\001", '\000' <repeats 15 times>, "\001", '\000' <repeats 34 times>, __align = 4294967296} }}}

tbordaz commented 8 years ago

attachment
ticket48342_test.py

tbordaz commented 8 years ago

Note: actually with the attached testcase, the deadlock is systematic. But it depends how fast the update is replicated so I guess it should not be as systematic as it was on my box.

389-ds-base

Source Code

#48342 DNA: deadlock during DNA_EXTEND_EXOP_REQUEST_OID Closed: wontfix None Opened 8 years ago by tbordaz.

slapi_modify_internal_pb

dna_extend_exop

plugin_call_exop_plugins

dblayer_txn_begin

do_extended

Metadata

#48342 DNA: deadlock during DNA_EXTEND_EXOP_REQUEST_OID

Closed: wontfix None Opened 8 years ago by tbordaz.