Como usar o endereçamento relativo RIP em um programa de montagem de 64 bits?

Como uso o endereçamento relativo RIP em um programa de montagem Linux para a arquitetura AMD64? Estou procurando um exemplo simples (um programa Hello world) que use o modo de endereço relativo AMD64 RIP.

Por exemplo, o seguinte programa de montagem de 64 bits funcionaria com normal (endereçamento absoluto):

.text
    .global _start

_start:
    mov $0xd, %rdx

    mov $msg, %rsi
    pushq $0x1
    pop %rax
    mov %rax, %rdi
    syscall

    xor %rdi, %rdi
    pushq $0x3c
    pop %rax
    syscall

.data
msg:
    .ascii    "Hello world!\n"

Estou supondo que o mesmo programa usando o RIP Relative Addressing seria algo como:

.text
    .global _start

_start:
    mov $0xd, %rdx

    mov msg(%rip), %rsi
    pushq $0x1
    pop %rax
    mov %rax, %rdi
    syscall

    xor %rdi, %rdi
    pushq $0x3c
    pop %rax
    syscall

msg:
    .ascii    "Hello world!\n"

A versão normal funciona bem quando compilada com:

as -o hello.o hello.s && ld -s -o hello hello.o && ./hello

Mas não consigo fazer a versão RIP funcionar.

Alguma ideia?

--- editar ----

A resposta de Stephen Canon faz a versão RIP funcionar.

Agora, quando desmonto o executável da versão RIP, recebo:

objdump -d olá

0000000000400078 <.text>:
  400078: 48 c7 c2 0d 00 00 00  mov    $0xd,%rdx
  40007f: 48 8d 35 10 00 00 00  lea    0x10(%rip),%rsi        # 0x400096
  400086: 6a 01                 pushq  $0x1
  400088: 58                    pop    %rax
  400089: 48 89 c7              mov    %rax,%rdi
  40008c: 0f 05                 syscall 
  40008e: 48 31 ff              xor    %rdi,%rdi
  400091: 6a 3c                 pushq  $0x3c
  400093: 58                    pop    %rax
  400094: 0f 05                 syscall 
  400096: 48                    rex.W
  400097: 65                    gs
  400098: 6c                    insb   (%dx),%es:(%rdi)
  400099: 6c                    insb   (%dx),%es:(%rdi)
  40009a: 6f                    outsl  %ds:(%rsi),(%dx)
  40009b: 20 77 6f              and    %dh,0x6f(%rdi)
  40009e: 72 6c                 jb     0x40010c
  4000a0: 64 21 0a              and    %ecx,%fs:(%rdx)

O que mostra o que eu estava tentando realizar: lea 0x10 (% rip),% rsi carrega o endereço 17 bytes após a instrução lea, que é o endereço 0x400096 onde a cadeia Hello world pode ser encontrada e, portanto, resultando em código independente de posição.

questionAnswers(1)

yourAnswerToTheQuestion