Zliczanie zdarzeń każdego słowa w pliku tekstowym [zamknięte]

Biorąc pod uwagę duży plik tekstowy z wieloma łańcuchami, jaki byłby najbardziej wydajny sposób na odczyt pliku tekstowego i policzenie, ile wystąpień każdego słowa jest w C ++? Rozmiar pliku tekstowego jest nieznany, więc nie mogę po prostu użyć prostej tablicy. Jest też inny haczyk. Każda linia tego pliku tekstowego zaczyna się od słowa kluczowego kategorii, a następujące słowa są cechami tej kategorii. Muszę być w stanie policzyć, ile wystąpień każdego słowa należy do tej kategorii.

Na przykład:

colors red blue green yellow orange purple
sky blue high clouds air empty vast big
ocean wet water aquatic blue
colors brown black blue white blue blue

W tym przykładzie muszę policzyć to w „zabarwienie„kategoria, występują 4 wystąpienia”niebieski„, mimo że w sumie występuje łącznie 6 niebieskich wystąpień.

questionAnswers(3)

yourAnswerToTheQuestion