NUL-Byte zwischen jedem anderen Zeichen in der Ausgabe
Ich verwende Ruby, um eine Datei zu lesen und dann auf stdout zu drucken und die Ausgabe in eine Datei in Windows PowerShell umzuleiten.
Wenn ich jedoch die Dateien inspiziere, erhalte ich Folgendes für die Eingabe:
PS D:> head -n 1 .\inputfile
<text id="http://observer.guardian.co.uk/osm/story/0,,1009777,00.html"> <s> Hooligans NNS hooligan
, , , unbridled JJ unbridled passion NN passion
- : - and CC and no DT no executive JJ executiv
e boxes NNS box . SENT . </s>
... doch dies für die Ausgabe:
PS D:> head -n 1 .\outputfile
ÿ_< t e x t i d = " h t t p : / / o b s e r v e r . g u a r d i a n . c o . u k / o s m / s t o r y / 0 , , 1 0 0 9 7 7 7 , 0
0 . h t m l " > < s > H o o l i g a n s N N S h o o l i g a n , ,
, u n b r i d l e d J J u n b r i d l e d p a s s i o n N N p a s s i o n
- : - a n d C C a n d n o D T n o e x e c u t i v e J J
e x e c u t i v e b o x e s N N S b o x . S E N T . < / s >
Wie kann das passieren?
Bearbeiten: Da mein Problem nichts mit Ruby zu tun hatte, habe ich den Ruby-Code entfernt und meine Verwendung der Windows-Shell aufgenommen.