Подсчет слов для всех слов, встречающихся в столбце в SQL Server 2008 [дубликат]
На этот вопрос уже есть ответ:
Получить частоты слов из SQL Server Полнотекстовый поиск 2 ответа У меня есть стол с именем'ticket_diary_comment'
с колонкой под названием'comment_text'
. Этот столбец заполнен текстовыми данными. Я хотел бы получить частоту всех слов, встречающихся во всем этом столбце. Пример:
Comment_Text
I am a good guy
I am a bad guy
I am not a guy
Что я хочу
Word Frequency
I 3
good 1
bad 1
not 1
guy 3
Обратите внимание, что я также удалил стоп-слова в выводе. Я знаю, что вычисление частоты конкретного слова не сложно, но я ищу что-то, что подсчитывает все слова, появляющиеся в столбце, удаляя стоп-слова.
Буду признателен за любую помощь в этом вопросе. Я также хотел бы отметить, что я должен применить этот запрос к набору данных большого размера (около 1 ТБ), поэтому производительность является проблемой.