Analizowanie i generowanie plików Microsoft Office 2007 (.docx, .xlsx, .pptx)

Mam projekt internetowy, w którym muszę zaimportować tekst i obrazy z dokumentu dostarczonego przez użytkownika, a jednym z możliwych formatów jest Microsoft Office 2007. Istnieje również potrzeba generowania dokumentów w tym formacie.

Serwer uruchamia CentOS 5.2 i ma zainstalowany PHP / Perl / Python. Mogę wykonać lokalne pliki binarne i skrypty powłoki, jeśli muszę. Używamy Apache 2.2, ale po uruchomieniu przełączymy się na Nginx.

Jakie mam opcje? Czy ktoś miał z tym doświadczenie?

questionAnswers(4)

yourAnswerToTheQuestion