MP4 / ISO 14496-12: Como você encontra as unidades de acesso a vídeo e áudio?

stou escrevendo uma ferramenta para inspecionar arquivos MP4 (também conhecido como formato de arquivo de mídia base ISO, ISO 14496 parte 12

Eu consigo interpretar a maioria das caixas listadas na ISO 14496-12 geradas pelo OSS. Ainda tenho que descobrir como extrair unidades de acesso a vídeo e unidades de acesso a áudi

Estou razoavelmente confiante de que o vídeo H.264 na caixa 'mdat' não possui o prefixo ISO 14496-10 Anexo B "0x000001" nas unidades NA

Eu experimentei interpretar o SampleToChunkBox ('stsc'), SampleSizeBox ('stsz') e ChunkOffsetBox ('stco') para localizar amostras de mídia dentro do 'mdat', mas não consigo encontrar nada que possa encontrar interprete como uma nal_unit () (ISO 14496-10, seção 7.3.1) ou uma slice_header () (seção 7.3.3).

Também estou curioso para saber onde o SPS (7.3.2.1) e o PPS (7.3.2.2) vivem. Suspeito que eles morem em algum lugar dentro da caixa 'trak', mas ainda não descobri ond

Ponteiros para aplicativos ou bibliotecas são de utilidade limitada. Estou escrevendo um aplicativo, e o código fonte externo é mais difícil de entender (sendo sobrecarregado por sua própria estrutura) quando comparado a uma explicação matemática.

questionAnswers(1)

yourAnswerToTheQuestion