linux curl zapisz jako utf-8
Próbuję użyć linux curl, aby pobrać plik xml z adresu URL.
Całkiem pewien, że xml jest zakodowany w UTF-8,
podejrzenie, że curl -o nie zapisuje jako UTF-8.
Czy istnieje wymuszenie zapisu na UTF-8 za pomocą curl?
Dziękujemy za sugestię, co odkryłem:
Ponieważ kanał XML jest dynamiczny, nie cały czas zawiera dowolne znaki utf-8. Czasami nie ma znaku utf-8 w całej treści, nawet jeśli jest ustawiony jako utf-8 w kodowaniu xml i typie zawartości nagłówka: charset = utf-8. Jeśli zawiera przynajmniej znak utf-8, zostanie zapisany jako utf-8.
Gdy tak się stanie, curl nie pobiera się jako utf-8, co ma sens, ponieważ nie ma znaków utf-8, dlaczego trzeba przechowywać jako utf-8.
To jest cholernie trudne, niektóre walidatory muszą działać przeciwko utf-8, dlatego wciąż potrzebuję rozwiązania, aby zmusić je do utf8, ponieważ domyślnie wszystkie moje xml byłyby w kodowaniu utf8.
spróbowałem zasugerować używając iconv f iso8859-1 utf-8 nie działa w tym przypadku, ponieważ podejrzewam, że nie ma go również w iso8859-1.
Wciąż potrzebuję lepszego rozwiązania.