Computando o espaço nulo de uma matriz o mais rápido possível

Preciso calcular o espaço nulo de vários milhares de matrizes pequenas (8x9, não 4x3, como escrevi anteriormente) em paralelo (CUDA). Todas as referências apontam para SVD, mas o algoritmo nas receitas numéricas parece muito caro e me oferece muitas outras coisas além do espaço nulo que realmente não preciso. A eliminação gaussiana realmente não é uma opção? Existem outros métodos comumente usados?

questionAnswers(7)

yourAnswerToTheQuestion