Как получить доступ к структуре / переменным C из встроенного asm?

Рассмотрите следующий код:

    int bn_div(bn_t *bn1, bn_t *bn2, bn_t *bnr)
  {
    uint32 q, m;        /* Division Result */
    uint32 i;           /* Loop Counter */
    uint32 j;           /* Loop Counter */

    /* Check Input */
    if (bn1 == NULL) return(EFAULT);
    if (bn1->dat == NULL) return(EFAULT);
    if (bn2 == NULL) return(EFAULT);
    if (bn2->dat == NULL) return(EFAULT);
    if (bnr == NULL) return(EFAULT);
    if (bnr->dat == NULL) return(EFAULT);


    #if defined(__i386__) || defined(__amd64__)
    __asm__ (".intel_syntax noprefix");
    __asm__ ("pushl %eax");
    __asm__ ("pushl %edx");
    __asm__ ("pushf");
    __asm__ ("movl %eax, (bn1->dat[i])");
    __asm__ ("xorl %edx, %edx");
    __asm__ ("divl (bn2->dat[j])");
    __asm__ ("movl (q), %eax");
    __asm__ ("movl (m), %edx");
    __asm__ ("popf");
    __asm__ ("popl %edx");
    __asm__ ("popl %eax");
    #else
    q = bn->dat[i] / bn->dat[j];
    m = bn->dat[i] % bn->dat[j];
    #endif
    /* Return */
    return(0);
  }

Типы данных uint32 в основном представляют собой unsigned long int или 32-разрядное целое число без знака uint32_t. Тип bnint является либо беззнаковым коротким int (uint16_t), либо uint32_t в зависимости от того, доступны ли 64-битные типы данных или нет. Если доступно 64-битное значение, то bnint - это uint32, в противном случае - uint16. Это было сделано для того, чтобы захватить перенос / переполнение в других частях кода. Структура bn_t определяется следующим образом:

typedef struct bn_data_t bn_t;
struct bn_data_t
  {
    uint32 sz1;         /* Bit Size */
    uint32 sz8;         /* Byte Size */
    uint32 szw;         /* Word Count */
    bnint *dat;         /* Data Array */
    uint32 flags;       /* Operational Flags */
  };

Функция начинается в строке 300 в моем исходном коде. Поэтому, когда я пытаюсь скомпилировать / сделать это, я получаю следующие ошибки:

system:/home/user/c/m3/bn 1036 $$ ->make
clang -I. -I/home/user/c/m3/bn/.. -I/home/user/c/m3/bn/../include  -std=c99 -pedantic -Wall -Wextra -Wshadow -Wpointer-arith -Wcast-align -Wstrict-prototypes  -Wmissing-prototypes -Wnested-externs -Wwrite-strings -Wfloat-equal  -Winline -Wunknown-pragmas -Wundef -Wendif-labels  -c /home/user/c/m3/bn/bn.c
/home/user/c/m3/bn/bn.c:302:12: warning: unused variable 'q' [-Wunused-variable]
    uint32 q, m;        /* Division Result */
           ^
/home/user/c/m3/bn/bn.c:302:15: warning: unused variable 'm' [-Wunused-variable]
    uint32 q, m;        /* Division Result */
              ^
/home/user/c/m3/bn/bn.c:303:12: warning: unused variable 'i' [-Wunused-variable]
    uint32 i;           /* Loop Counter */
           ^
/home/user/c/m3/bn/bn.c:304:12: warning: unused variable 'j' [-Wunused-variable]
    uint32 j;           /* Loop Counter */
           ^
/home/user/c/m3/bn/bn.c:320:14: error: unknown token in expression
    __asm__ ("movl %eax, (bn1->dat[i])");
             ^
<inline asm>:1:18: note: instantiated into assembly here
        movl %eax, (bn1->dat[i])
                        ^
/home/user/c/m3/bn/bn.c:322:14: error: unknown token in expression
    __asm__ ("divl (bn2->dat[j])");
             ^
<inline asm>:1:12: note: instantiated into assembly here
        divl (bn2->dat[j])
                  ^
4 warnings and 2 errors generated.
*** [bn.o] Error code 1

Stop in /home/user/c/m3/bn.
system:/home/user/c/m3/bn 1037 $$ ->

Что я знаю

Я считаю себя достаточно хорошо разбирающимся в ассемблере x86 (как видно из кода, который я написал выше). Однако последний раз, когда я смешивал язык высокого уровня и ассемблер, использовал Borland Pascal около 15-20 лет назад при написании графических драйверов для игр (до Windows 95). Я знаком с синтаксисом Intel.

Что я не знаю:

Как мне получить доступ к членам bn_t (особенно * dat) из asm? Поскольку * dat является указателем на uint32, я обращаюсь к элементам в виде массива (например, bn1-> dat [i]).

Как получить доступ к локальным переменным, объявленным в стеке?

Я использую push / pop, чтобы восстановить забитые регистры до их предыдущих значений, чтобы не нарушать компилятор. Однако нужно ли мне также включать ключевое слово volatile в локальные переменные?

Или есть лучший способ, о котором я не знаю? Я не хочу помещать это в отдельный вызов функции из-за накладных расходов на вызов, так как эта функция критична к производительности.

Additional:

Прямо сейчас, я только начинаю писать эту функцию, поэтому она не завершена. Отсутствуют циклы и другой подобный код поддержки / склеивания. Но основная суть заключается в доступе к локальным переменным / элементам структуры.

EDIT 1:

Синтаксис, который я использую, кажется, единственный, который поддерживает Clang. Я попробовал следующий код и Clang дал мне всевозможные ошибки:

__asm__ ("pushl %%eax",
    "pushl %%edx",
    "pushf",
    "movl (bn1->dat[i]), %%eax",
    "xorl %%edx, %%edx",
    "divl ($0x0c + bn2 + j)",
    "movl %%eax, (q)",
    "movl %%edx, (m)",
    "popf",
    "popl %%edx",
    "popl %%eax"
    );

Он хочет, чтобы я поместил закрывающую скобку в первой строке, заменив запятую. Я переключился на использование %% вместо%, потому что где-то читал, что для встроенной сборки требуется %% для обозначения регистров процессора, и clang говорил мне, что я использовал недопустимую escape-последовательность.

Ответы на вопрос(1)

Ваш ответ на вопрос