¿Cómo utilizar el direccionamiento relativo RIP en un programa de ensamblaje de 64 bits?

¿Cómo uso el direccionamiento relativo RIP en un programa de ensamblaje de Linux para la arquitectura AMD64? Estoy buscando un ejemplo simple (un programa Hello world) que utiliza el modo de direccionamiento relativo AMD64 RIP.

Por ejemplo, el siguiente programa de ensamblaje de 64 bits funcionaría con normal (direccionamiento absoluto):

.text
    .global _start

_start:
    mov $0xd, %rdx

    mov $msg, %rsi
    pushq $0x1
    pop %rax
    mov %rax, %rdi
    syscall

    xor %rdi, %rdi
    pushq $0x3c
    pop %rax
    syscall

.data
msg:
    .ascii    "Hello world!\n"

Supongo que el mismo programa que usa el direccionamiento relativo RIP sería algo como:

.text
    .global _start

_start:
    mov $0xd, %rdx

    mov msg(%rip), %rsi
    pushq $0x1
    pop %rax
    mov %rax, %rdi
    syscall

    xor %rdi, %rdi
    pushq $0x3c
    pop %rax
    syscall

msg:
    .ascii    "Hello world!\n"

La versión normal funciona bien cuando se compila con:

as -o hello.o hello.s && ld -s -o hello hello.o && ./hello

Pero no puedo hacer que la versión RIP funcione.

¿Algunas ideas?

--- editar ----

La respuesta de Stephen Canon hace que la versión RIP funcione.

Ahora cuando desarmo el ejecutable de la versión RIP obtengo:

objdump -d hola

0000000000400078 <.text>:
  400078: 48 c7 c2 0d 00 00 00  mov    $0xd,%rdx
  40007f: 48 8d 35 10 00 00 00  lea    0x10(%rip),%rsi        # 0x400096
  400086: 6a 01                 pushq  $0x1
  400088: 58                    pop    %rax
  400089: 48 89 c7              mov    %rax,%rdi
  40008c: 0f 05                 syscall 
  40008e: 48 31 ff              xor    %rdi,%rdi
  400091: 6a 3c                 pushq  $0x3c
  400093: 58                    pop    %rax
  400094: 0f 05                 syscall 
  400096: 48                    rex.W
  400097: 65                    gs
  400098: 6c                    insb   (%dx),%es:(%rdi)
  400099: 6c                    insb   (%dx),%es:(%rdi)
  40009a: 6f                    outsl  %ds:(%rsi),(%dx)
  40009b: 20 77 6f              and    %dh,0x6f(%rdi)
  40009e: 72 6c                 jb     0x40010c
  4000a0: 64 21 0a              and    %ecx,%fs:(%rdx)

Lo que muestra lo que estaba tratando de lograr: lea 0x10 (% rip),% rsi carga la dirección 17 bytes después de la instrucción lea que es la dirección 0x400096 donde se puede encontrar la cadena Hello world y, por lo tanto, se obtiene un código independiente de la posición.

Respuestas a la pregunta(1)

Su respuesta a la pregunta