Cancelando pthread_cond_wait () trava com mutex PRIO_INHERIT
Atualização, 4/10 2012: Corrigido pelo patch libc
Eu tenho um problema ao cancelar threads empthread_cond_wait
, que usam mutexes com oPTHREAD_PRIO_INHERIT
conjunto de atributos. Isso só acontece em certas plataformas embora.
O seguinte exemplo mínimo demonstra isso: (compilar comg++ <filename>.cpp -lpthread
)
#include <pthread.h>
#include <iostream>
pthread_mutex_t mutex;
pthread_cond_t cond;
void clean(void *arg) {
std::cout << "clean: Unlocking mutex..." << std::endl;
pthread_mutex_unlock((pthread_mutex_t*)arg);
std::cout << "clean: Mutex unlocked..." << std::endl;
}
void *threadFunc(void *arg) {
int ret = 0;
pthread_mutexattr_t mutexAttr;
ret = pthread_mutexattr_init(&mutexAttr); std::cout << "ret = " << ret << std::endl;
//Comment out the following line, and everything works
ret = pthread_mutexattr_setprotocol(&mutexAttr, PTHREAD_PRIO_INHERIT); std::cout << "ret = " << ret << std::endl;
ret = pthread_mutex_init(&mutex, &mutexAttr); std::cout << "ret = " << ret << std::endl;
ret = pthread_cond_init(&cond, 0); std::cout << "ret = " << ret << std::endl;
std::cout << "threadFunc: Init done, entering wait..." << std::endl;
pthread_cleanup_push(clean, (void *) &mutex);
ret = pthread_mutex_lock(&mutex); std::cout << "ret = " << ret << std::endl;
while(1) {
ret = pthread_cond_wait(&cond, &mutex); std::cout << "ret = " << ret << std::endl;
}
pthread_cleanup_pop(1);
return 0;
}
int main() {
pthread_t thread;
int ret = 0;
ret = pthread_create(&thread, 0, threadFunc, 0); std::cout << "ret = " << ret << std::endl;
std::cout << "main: Thread created, waiting a bit..." << std::endl;
sleep(2);
std::cout << "main: Cancelling threadFunc..." << std::endl;
ret = pthread_cancel(thread); std::cout << "ret = " << ret << std::endl;
std::cout << "main: Joining threadFunc..." << std::endl;
ret = pthread_join(thread, NULL); std::cout << "ret = " << ret << std::endl;
std::cout << "main: Joined threadFunc, done!" << std::endl;
return 0;
}
Toda vez que eu corro,main()
travapthread_join()
. Um backtrace de gdb mostra o seguinte:
Thread 2 (Thread 0xb7d15b70 (LWP 257)):
#0 0xb7fde430 in __kernel_vsyscall ()
#1 0xb7fcf362 in __lll_lock_wait () at ../nptl/sysdeps/unix/sysv/linux/i386/i686/../i486/lowlevellock.S:142
#2 0xb7fcc9f9 in __condvar_w_cleanup () at ../nptl/sysdeps/unix/sysv/linux/i386/i686/../i486/pthread_cond_wait.S:434
#3 0x08048fbe in threadFunc (arg=0x0) at /home/pthread_cond_wait.cpp:22
#4 0xb7fc8ca0 in start_thread (arg=0xb7d15b70) at pthread_create.c:301
#5 0xb7de73ae in clone () at ../sysdeps/unix/sysv/linux/i386/clone.S:130
Thread 1 (Thread 0xb7d166d0 (LWP 254)):
#0 0xb7fde430 in __kernel_vsyscall ()
#1 0xb7fc9d64 in pthread_join (threadid=3083950960, thread_return=0x0) at pthread_join.c:89
#2 0x0804914a in main () at /home/pthread_cond_wait.cpp:41
E sePTHREAD_PRIO_INHERIT
não está definido no mutex, tudo funciona como deveria, e o programa sai limpo.
Plataformas com problemas:
Placa AMD Fusion incorporada, executandoPTXDist baseado em Linux de 32 bits 3.2.9-rt16 (comRTpatch 16). Estamos usando o mais novoOSELAS i686 cross toolchain (2011.11.1), usando gcc 4.6.2, glibc 2.14.1, binutils 2.21.1a, kernel 2.6.39.Mesma placa com o toolchain 2011.03.1 também (gcc 4.5.2 / glibc 2.13 / binutils 2.18 / kernel 2.6.36).Plataformas sem problemas:
Nossa própria placa ARM, também rodando um PTXDist Linux (32-bit 2.6.29.6-rt23), usando o toolchain cruzado OSELAS arm-v4t (1.99.3) com gcc 4.3.2 / glibc 2.8 / binutils 2.18 / kernel 2.6.27 .Meu laptop (Intel Core i7), rodando o Ubuntu 11.04 de 64 bits (virtualizado / kernel 2.6.38.15-genérico), gcc 4.5.2 / eglibc 2.13-0ubuntu13.1 / binutils 2.21.0.20110327.Eu tenho procurado em torno da rede por soluções e me deparei com alguns patches que eu tentei, mas sem qualquer efeito:
Tornando as variáveis de condição prioridade de herança ciente.Manipulando EAGAIN de FUTEX_WAIT_REQUEUE_PIEstamos fazendo algo errado em nosso código, que por acaso funciona em certas plataformas, ou isso é um bug nos sistemas subjacentes? Se alguém tem alguma idéia sobre onde procurar, ou sabe de algum patch ou similar para experimentar, eu ficaria feliz em ouvir sobre isso.
Obrigado!
Atualizações:
discussão da lista de discussão da libc-helprelatório de bug da glibc