explicação para a implementação alinhada do malloc

Isso não é lição de casa, é puramente para minha própria educação pessoal.

Eu não conseguia descobrir como implementar um malloc alinhado, então procurei on-line e encontreiesse site. Para facilitar a leitura, postarei o código abaixo:

#include <stdlib.h>
#include <stdio.h>

void* aligned_malloc(size_t required_bytes, size_t alignment)
{
    void* p1; // original block
    void** p2; // aligned block
    int offset = alignment - 1 + sizeof(void*);
    if ((p1 = (void*)malloc(required_bytes + offset)) == NULL)
    {
       return NULL;
    }
    p2 = (void**)(((size_t)(p1) + offset) & ~(alignment - 1));
    p2[-1] = p1;
    return p2;
}

void aligned_free(void *p)
{
    free(((void**)p)[-1]);
}

void main (int argc, char *argv[])
{
    char **endptr;
    int *p = aligned_malloc (100, strtol(argv[1], endptr, 10));

    printf ("%s: %p\n", argv[1], p);
    aligned_free (p);
}

A implementação funciona, mas honestamente não consigo descobrir como funciona.

Aqui está o que eu não consigo entender:

Por que precisamos de um deslocamento?O que faz anding com~(alignment - 1) realizarp2 é um ponteiro duplo. Como podemos devolvê-lo de uma função que deve retornar apenas um ponteiro?Qual é a abordagem geral para resolver esse problema?

Qualquer ajuda é realmente apreciada.

EDITAR

Esta não é uma duplicata deComo alocar memória alinhada apenas usando a biblioteca padrão? porque eu também preciso saber como liberar memória alinhada.

questionAnswers(1)

yourAnswerToTheQuestion