Jak dopasować wszystkie umiędzynarodowione teksty?
Jestem na misji wyszukiwania i niszczenia wszystkiego, co Amazon uważa za niesmaczne. W przeszłości zajmowałem się tym za pomocąiconv
przekonwertować z „UTF-8” na „latin1”, ale nie mogę tego zrobić, ponieważ jest zakodowany jako „nieznany”:
test <- "Gwena\xeblle M"
> gsub("\xeb","", df[306,"primauthfirstname"] )
[1] "Gwenalle M"
> Encoding(df[306,"primauthfirstname"])
[1] "unknown"
Więc co regex eliminuje wszystkie kody x ##?